![]()
内容推荐 让计算机自动处理文字一直以来都是我们工作中的重要诉求,而文字的表现形式是多样的,目前,单纯使用自然语言处理技术已无法满足复杂的实际工作场景的需求。本书详细介绍了达观数据多年来在智能文本处理领域的实战经验,从核心技术、相关产品、行业场景案例等多角度出发,帮助读者全面理解智能文本处理技术的意义和价值。全书分为三大部分:第一部分介绍智能文本处理的基础知识、意义和相关核心技术;第二部分介绍智能文本处理项目实施经验以及在不同场景和产品中的应用;第三部分总结达观智能文本处理技术与不同行业场景的结合,供各行业有智能文本处理需求的读者参考。 本书面向人工智能行业从业者、企业信息化负责人等。 作者简介 达观数据,中国智能RPA领域的龙头企业,独立开发了全套“RPA+AI”系统,拥有核心知识产权。达观智能RPA产品是业界唯一不依赖微软底层开发框架、未使用第三方开源框架的RPA产品。 接连荣获权威媒体评选的“年度最佳RPA行业贡献企业”“年度最佳RPA+AI产品”奖项、“吴文俊人工智能奖”,被评为“国家高新技术企业”和“科技小巨人企业”。 达观RPA团队已成功服务近千家大型知名企业客户,积累了丰富的RPA实战落地经验,总结了一套自己的实施方法论,并全部融入本书中。 目录 第一部分 基础知识 第1章 智能文本处理概览 1.1 什么是智能文本处理 1.1.1 智能文本处理概念 1.1.2 智能文本处理技术 1.1.3 智能文本处理的价值 1.2 NLP技术简介 1.2.1 基本概念 1.2.2 文本自动处理层次划分 1.2.3 研究现状及主要方法 1.3 书面文本处理和短文本处理 1.3.1 不同处理类型 1.3.2 书面文本应用举例 1.3.3 短文本应用举例 1.3.4 处理差异比较 1.4 机器学习与NLP 1.4.1 机器学习的基本概念与历史 1.4.2 常见的机器学习任务与方法 1.4.3 常见机器学习问题与NLP 1.4.4 实战:如何使用机器学习方法检测垃圾邮件 1.5 深度学习与NLP 1.5.1 深度学习和传统机器学习的差别 1.5.2 深度学习对NLP的推进 1.5.3 深度学习研究在NLP中的局限性 第2章 NLP技术概览 2.1 语言模型 2.1.1 语言模型基本概念 2.1.2 N-gram语言模型 2.1.3 神经网络语言模型 2.1.4 大规模预训练语言模型 2.2 分词与词性标注 2.2.1 概述 2.2.2 分词技术详解 2.2.3 词性识别详解 2.3 NER 2.3.1 基本概念 2.3.2 基于规则的NER 2.3.3 基于序列标注的NER 2.3.4 数据增强方法 2.4 文本分类概述 2.4.1 文本分类任务的基本定义 2.4.2 基于机器学习的文本分类 2.4.3 基于深度学习的文本分类 2.4.4 文本分类算法评估 2.4.5 实践经验与技术进阶 2.5 指代消解 2.5.1 基本概念 …… 第二部分 项目覆盖场景 第三部分 行业案例经验 |