![]()
编辑推荐 1)入门友好:本书特别注重基础知识的讲解,避免了深奥难懂的技术细节,使得即使是大模型领域的初学者也能轻松理解核心概念,快速进入实践阶段,避免了学习初期的迷茫和挫败感。 2)理论够用:提供了对大模型工作流程、Transformer架构、提示工程技术、模型微调技巧等关键技术的深度剖析。通过详细的案例分析和操作指南,帮助读者深刻理解这些技术背后的原理和应用场景,提高解决问题的能力。 3)实战导向:强调提示工程的实际应用,介绍了一系列经过验证的提示设计和优化方法。通过实战演练,读者不仅能学到理论知识,更能掌握如何利用这些知识来改善大模型的性能,实现预期的输出结果。 4)案例丰富:涵盖了多个行业的实际应用案例,包括但不限于金融、医疗、教育等领域。这些案例不仅展示了大模型的广泛应用前景,也为读者提供了丰富的参考和借鉴,帮助他们在自己的项目中找到合适的解决方案。 5)全程指导:每个案例都从需求分析开始,到环境搭建、代码实现,最后到测试和部署,提供了一站式的全流程指导。读者可以在每个环节中获得具体的建议和支持,确保项目的顺利进行,最终达到很好的应用效果。 内容推荐 本书由科大讯飞与中国科大的大模型的资深专家联合撰写,一本书打通大模型的技术原理与应用实践壁垒,深入大模型3步工作流程,详解模型微调、对齐优化、提示工程等核心技术及不同场景的微调方案,全流程讲解6个典型场景的应用开发实践。本书共10章,从逻辑上分为“基础知识”“原理与技术”“应用开发实践”三部分。基础知识(第1章)介绍大模型定义、应用现状、存在的问题,以及发展趋势。原理与技术(第2和3章)详细讲解大模型的构建流程、Transformer模型,以及模型微调、对齐优化、提示工程等核心技术,之后介绍了推理优化、大模型训练、大模型评估、大模型部署等拓展技术。应用开发实践(第4~10章)详细讲解大模型插件应用开发、RAG实践,以及智能客服问答、学科知识问答、法律领域应用、医疗领域应用、智能助写平台等多领域的实践。 目录 前言 第1章 大模型概述 / 1 1.1 大模型的概念 / 1 1.2 大模型的应用现状 / 4 1.2.1 国外的大模型 / 4 1.2.2 国内的大模型 / 7 1.2.3 大模型的应用情况 / 9 1.3 大模型存在的问题 / 10 1.3.1 机器幻觉 / 11 1.3.2 安全伦理 / 12 1.3.3 选择错误目标 / 13 1.3.4 难以监督 / 14 1.4 大模型的发展趋势 / 14 1.4.1 多模态能力 / 14 1.4.2 AI Agent / 15 1.4.3 端侧应用 / 15 1.4.4 可信任性及可解释性 / 16 1.4.5 自我学习 / 16 1.5 本章小结 / 17 第2章 大模型核心技术 / 18 2.1 大模型构建流程 / 18 2.1.1 预训练语言模型 / 20 2.1.2 模型微调 / 22 2.1.3 对齐优化 / 24 2.2 Transformer模型 / 25 2.2.1 Transformer模型概述 / 25 2.2.2 编码器与解码器 / 28 2.2.3 注意力机制 / 32 2.2.4 词向量 / 36 2.2.5 位置编码 / 37 2.2.6 规范化 / 40 2.2.7 激活函数 / 41 2.2.8 优化器 / 41 2.2.9 基于Transformer的大模型架构选择 / 42 2.3 模型微调 / 43 2.3.1 指令微调数据集 / 43 2.3.2 调优策略 / 46 2.4 对齐优化 / 60 2.4.1 反馈 / 60 2.4.2 偏好模型 / 61 2.4.3 RLHF / 62 2.5 提示工程 / 64 2.5.1 提示工程开发流程 / 65 2.5.2 提示设计开发 / 66 2.6 本章小结 / 73 第3章 大模型技术拓展 / 74 3.1 推理优化技术 / 74 3.1.1 解码优化算法 / 74 3.1.2 推理加速策略 / 78 3.2 大模型训练技术 / 81 3.2.1 并行训练 / 81 3.2.2 训练容错 / 87 3.2.3 混合精度训练 / 89 3.3 大模型评估 / 91 3.3.1 大模型评估概述 / 91 3.3.2 大模型评估任务 / 91 3.3.3 大模型评估数据集 / 91 3.3.4 大模型评估方法 / 93 3.4 大模型部署 / 96 3.4.1 模型环境搭建 / 96 3.4.2 模型运行测试 / 97 3.5 本章小结 / 99 第4章 插件应用开发实践 / 100 4.1 应用概述 / 100 4.1.1 ChatGPT插件 / 100 4.1.2 LangChain插件 / 101 4.1.3 通用插件调用流程 / 103 4.2 天气查询插件开发 / 103 4.2.1 基于ChatGPT的插件开发 / 103 4.2.2 基于AutoGen的插件开发 / 110 4.3 语音交互插件开发 / 114 4.4 本章小结 / 118 第5章 RAG实践 / 119 5.1 应用概述 / 119 5.2 RAG流程 / 120 5.3 环境构建 / 121 5.4 应用实践 / 122 5.4.1 知识解析 / 123 5.4.2 检索 / 127 5.4.3 增强 / 130 5.4.4 生成 / 134 5.5 本章小结 / 135 第6章 智能客服问答实践 / 136 6.1 应用概述 / 136 6.2 环境构建 / 137 6.2.1 开发环境搭建 / 137 6.2.2 开源模型下载 / 138 6.3 应用开发 / 139 6.3.1 实现多轮对话系统 / 139 6.3.2 提示优化 / 141 6.3.3 第三方工具调用 / 150 6.4 应用部署 / 152 6.5 本章小结 / 154 第7章 学科知识问答实践 / 155 7.1 应用概述 / 155 7.2 环境构建 / 155 7.2.1 开发环境搭建 / 156 7.2.2 项目参数配置 / 156 7.3 学科知识图谱 / 158 7.3.1 大模型与知识图谱 / 158 7.3.2 学科知识图谱构建流程 / 159 7.3.3 学科知识数据集 / 161 7.3.4 学科知识处理 / 162 7.4 应用开发 / 164 7.4.1 功能设置 / 164 7.4.2 知识库构建 / 165 7.4.3 基于LangChain的问答实践 / 167 7.5 本章小结 / 170 第8章 法律领域应用实践 / 171 8.1 应用概述 / 171 8.2 对话数据微调 / 172 8.2.1 法律对话数据预处理 / 172 8.2.2 对话微调工具编写 / 175 8.2.3 模型微调框架的参数配置 / 176 8.2.4 微调前后的对话问答对比 / 179 8.3 指令微调 / 181 8.3.1 法律指令数据集预处理 / 181 8.3.2 指令微调工具编写 / 182 8.3.3 法律大模型指令问答评估 / 186 8.3.4 微调前后的对话问答对比 / 189 8.4 部署验证 / 191 8.5 本章小结 / 193 第9章 医疗领域应用实践 / 194 9.1 应用概述 / 194 9.2 医疗数据集构建 / 195 9.2.1 增量预训练数据集 / 195 9.2.2 有监督微调数据集 / 195 9.2.3 直接偏好优化数据集 / 196 …… |