![]()
内容推荐 自然语言处理是人工智能的重要方向之一,被誉为人工智能皇冠上的“明珠”。它融合了语言学、计算机科学、机器学习等多学科内容。本书主要包含基础技术、核心技术以及模型分析三个部分。基础技术部分主要介绍自然语言处理的基础任务和底层技术,包含词汇分析、句法分析、语义分析、篇章分析和语言模型;核心技术部分主要介绍自然语言处理应用任务和相关技术,主要包括信息抽取、机器翻译、情感分析、智能问答、文本摘要、知识图谱;模型分析部分主要介绍基于机器学习的自然语言处理模型的稳健性和可解释性问题。 作者简介 黄萱菁,复旦大学计算机科学技术学院教授、博士生导师。主要从事自然语言处理、信息检索和社会媒体分析研究。兼任中国中文信息学会常务理事、社会媒体专委会副主任,中国计算机学会自然语言处理专委会副主任、学术工作委员会委员、AACL执委。在高水平国际学术期刊和会议上发表了百余篇论文,负责的多个科研项目受到国家自然科学基金、科技部、教育部、上海市科委的支持。入选2020年度人工智能全球女性、2020年度AI 2000人工智能全球最具影响力提名学者及福布斯中国2020科技女性榜。 目录 第1部分 基础技术 第1章 绪论 1.1 自然语言处理的基本概念 1.1.1 自然语言处理简史 1.1.2 自然语言处理的主要研究内容 1.1.3 自然语言处理的主要难点 1.2 自然语言处理的基本范式 1.2.1 基于规则的方法 1.2.2 基于机器学习的方法 1.2.3 基于深度学习的方法 1.2.4 基于大模型的方法 1.3 本书内容安排 第2章 词汇分析 2.1 语言中的词汇 2.1.1 词的形态学 2.1.2 词的词性 2.2 词语规范化 2.2.1 词语切分 2.2.2 词形还原 2.2.3 词干提取 2.3 中文分词 2.3.1 中文分词概述 2.3.2 基于最大匹配的中文分词算法 2.3.3 基于线性链条件随机场的中文分词算法 2.3.4 基于感知器的中文分词算法 2.3.5 基于双向长短期记忆网络的中文分词算法 2.3.6 中文分词评测方法 2.3.7 中文分词语料库 2.4 词性标注 2.4.1 基于规则的词性标注 2.4.2 基于隐马尔可夫模型的词性标注 2.4.3 基于卷积神经网络的词性标注 2.4.4 词性标注评测方法 2.4.5 词性标注语料库 2.5 延伸阅读 2.6 习题 第3章 句法分析 3.1 句法概述 3.1.1 成分语法理论概述 3.1.2 依存语法理论概述 3.2 成分句法分析 3.2.1 基于上下文无关语法的成分句法分析 3.2.2 基于概率上下文无关语法的成分句法分析 3.2.3 成分句法分析评测方法 3.3 依存句法分析 3.3.1 基于图的依存句法分析 3.3.2 基于神经网络的图依存句法分析 3.3.3 基于转移的依存句法分析 3.3.4 基于神经网络的转移依存句法分析 3.3.5 依存句法分析评测方法 3.4 句法分析语料库 3.5 延伸阅读 3.6 习题 第4章 语义分析 4.1 语义学概述 4.1.1 词汇语义学 4.1.2 句子语义学 4.2 语义表示 4.2.1 谓词逻辑表示 4.2.2 框架表示 …… 第2部分 核心技术 第3部分 模型分析 参考文献 索引 |