内容推荐 本书在简要介绍自然语言处理代表性模型和方法的基础上,通过具体案例详细展现了相关模型和算法的实现过程,并给出了可执行的程序代码、数据集和运行结果。全书内容既有经典的统计语言模型,也有神经网络基础模型和大语言模型前沿技术。应用案例从情感分析、信息抽取、自动摘要和文本语义匹配,到阅读理解、意图理解、文本生成和机器翻译,全方位地展示自然语言处理从理论到实践的全貌。书中提供的所有代码都已通过调试,并以Jupyter Notebook形式托管在百度AI Studio星河社区上。读者按照书中的说明就可以直接使用AI Studio提供的免费计算资源在线编译运行书中的程序代码,为读者实践练习提供了极大的便利。 本书可作为高等院校相关专业高年级本科生和研究生学习自然语言处理课程的教学辅导书,也可供对自然语言处理技术感兴趣的初学者或者从事相关技术研发的工程技术人员参考。 目录 第1章 绪论 1.1 自然语言处理方法概述 1.2 本书的内容组织 1.3 本书的实践平台 1.3.1 本地运行 1.3.2 AI Studio星河社区运行 1.3.3 本书使用的API 1.3.4 本书使用的数据集 第2章 神经网络基础 2.1 概述 2.2 神经元与感知机 2.2.1 神经元 2.2.2 感知机 2.2.3 常见的激活函数 2.3 前馈神经网络 2.4 卷积神经网络 2.4.1 卷积 2.4.2 池化 2.4.3 卷积神经网络 2.5 循环神经网络 2.5.1 简单循环神经网络 2.5.2 长短时记忆网络 2.5.3 门控循环单元 2.5.4 循环神经网络拓展知识 第3章 分布式表示 3.1 词的分布式表示 3.1.1 静态词向量 3.1.2 动态词向量 3.2 短语的分布式表示 3.3 句子的分布式表示 3.3.1 基于循环神经网络的表示方法 3.3.2 基于预训练语言模型的表示方法 第4章 序列生成模型 4.1 基于循环神经网络的Seq2Seq模型 4.1.1 基于RNN的Seq2Seq模型原理 4.1.2 解码策略 4.2 融合注意力机制的Seq2Seq模型 4.3 基于Transformer的Seq2Seq模型 4.3.1 自注意力模型 4.3.2 Transformer的网络结构 4.3.3 Transformer编码器 4.3.4 Transformer解码器 4.3.5 知识延伸:基于Transformer结构的模型 第5章 基础语言模型 5.1 统计语言模型 5.1.1 模型定义 5.1.2 数据平滑方法 5.1.3 语言模型评价 5.2 神经网络语言模型 5.2.1 前馈神经网络语言模型 5.2.2 循环神经网络语言模型 5.2.3 语言模型与词向量 第6章 预训练大模型 6.1 GPT语言模型 6.1.1 GPT模型预训练 6.1.2 GPT在下游任务中的应用 6.2 BERT语言模型 6.2.1 BERT模型的预训练任务 6.2.2 BERT在下游任务中的应用 6.3 ERNIE语言模型 6.4 预训练大模型 6.4.1 基础大模型 6.4.2 指令微调 6.4.3 基于人类反馈的强化学习 第7章 词语切分 7.1 基于BERT实现中文分词 7.1.1 任务目标 7.1.2 实现思路及流程 7.1.3 数据处理 7.1.4 模型构建 7.1.5 训练配置 7.1.6 模型训练 7.1.7 模型评估 7.1.8 模型预测 7.2 基于BPE算法实现子词切分 7.2.1 任务目标 7.2.2 实现思路及流程 7.2.3 构建BPE词表 7.2.4 文本子词切分 7.2.5 语料还原 7.3 实验思考 第8章 文本情感分类方法实践 8.1 基于LSTM模型的情感分类方法 8.1.1 任务目标 8.1.2 实现思路及流程 8.1.3 数据处理 8.1.4 模型构建 8.1.5 训练配置 8.1.6 模型训练 8.1.7 模型评估 8.1.8 模型预测 8.2 基于BERT模型实现情感分类 8.2.1 数据处理 8.2.2 模型构建 8.2.3 训练配置 8.2.4 模型训练 8.2.5 模型评估 8.2.6 模型预测 8.3 基于BERT的属性级情感分类 8.3.1 任务目标 8.3.2 实现思路及流程 8.3.3 属性和观点抽取 8.3.4 属性级情感分类 8.3.5 全流程模型推理 8.4 实验思考 第9章 信息抽取实践 9.1 基于Bi-LSTM和CRF的命名实体识别方法 9.1.1 任务目标和实现流程 9.1.2 数据处理 9.1.3 模型构建 9.1.4 训练配置 9.1.5 模型训练 9.1.6 模型评估 9.1.7 模型预测 9.2 基于ERNIE-UIE实现实体关系抽取 9.2.1 任务目标和实现流程 9.2.2 数据处理 9.2.3 模型构建 9.2.4 训练配置 9.2.5 模型训练 9.2.6 模型评估 9.2.7 模型预测 9.3 实验思考 第10章 文本语义匹配实践 10.1 基于SimNet的文本语义匹配 10.1.1 任务目标和实现流程 10.1.2 数据处理 10.1.3 模型构建 10.1.4 训练配置 10.1.5 模型训练 10.1.6 模型评估 10.1.7 模型预测 10.2 基于RocketQA的文本语义匹配 10.2.1 任务目标和实现流程 10.2.2 数据处理 10.2.3 模型构建 10.2.4 训练配置 10.2.5 模型训练 10.2.6 模型评估 10.2.7 模型预测 10.3 实验思老 第11章 基于PEGASUS的中文文本摘要实践 11.1 任务目标和实现流程 11.2 数据处理 11.2.1 数据集确定 11.2.2 数据加载 11.2.3 将数据转换成特征形式 11.2.4 构造DataLoader 11.3 模型构建 11.4 训练配置 11.4.1 BLEU算法 11.4.2 ROUGE算法 11.5 模型训练 11.6 模型评估 11.7 模型预测 11.8 实验思考 第12章 基于ERNIE3.0实现意图识别 12.1 任务目标和实现流程 12.2 数据处理 12.2.1 数据集确定 12.2.2 数据加载 12.2.3 将 |