![]()
编辑推荐 本书理论联系实践,深入浅出,知识点全面,通过阅读本书,读者不仅可以理解自然语言处理的知识,还能通过实战项目案例更好地将理论融入实际工作中。 内容推荐 \t本书从自然语言处理基础开始,逐步深入各种自然语言处理的热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。 全书共19章,详细讲解中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注、文本相似度算法、语义相似度计算等内容,同时提供配套完整实战项目,例如对话机器人实战、搜索引擎项目实战、推荐算法系统实战。 本书理论联系实践,深入浅出,知识点全面。通过阅读本书,读者不仅可以理解自然语言处理知识,还能通过实战项目案例更好地将理论融入实际工作中。 本书适合自然语言处理的初学者阅读,有一定经验的算法工程师也可从书中获取很多有价值的知识,并通过实战项目更好地理解自然语言处理的核心内容。
目录 第1章自然语言处理技术概述 1.1自然语言处理介绍 1.1.1自然语言处理的定义及其在实际工作中的定位 1.1.2自然语言处理的经典应用场景 1.2自然语言处理的技能要求和职业发展路径 1.2.1大数据部门组织架构和自然语言处理职位所处位置 1.2.2自然语言处理的职位介绍和技能要求 1.2.3自然语言处理的职业生涯规划和发展路径 1.2.4自然语言处理的市场平均薪资水平 第2章中文分词 2.1中文分词原理 2.2规则分词 2.2.1正向优选匹配法 2.2.2逆向优选匹配法 2.2.3双向优选匹配法 2.3机器学习统计分词 2.3.1隐马尔可夫模型分词 2.3.2感知器分词 2.3.3CRF分词 2.4分词工具实战 2.4.1CRF++工具包实战 2.4.2Python的Jieba分词 2.4.3Java的HanLP分词 2.4.4Java的IK分词 2.4.5Java的mmseg4j分词 第3章词性标注 3.1词性标注原理 3.1.1词性介绍 3.1.2HMM词性标注 3.1.3感知器词性标注 3.1.4CRF词性标注 3.2词性标注工具实战 3.2.1Python的Jieba词性标注 3.2.2Java的HanLP词性标注 …… |