MINDSPORE大语言模型实战豆瓣PDF电子书bt网盘迅雷下载电子书下载-霍普软件下载网

随着ChatGPT等大语言模型的迅速发展，大语言模型已经成为人工智能领域发展的快车道，不同领域涌现出各种强大的新模型。开发者想要独立构建、部署符合自身需求的大语言模型，需要理解大语言模型的实现框架和基本原理。
本书梳理大语言模型的发展，首先介绍Transformer模型的基本原理、结构和模块及在NLP任务中的应用；然后介绍由只编码（Encoder-Only）到只解码（Decoder-Only）的技术路线发展过程中对应的 BERT、GPT等大语言模型；接下来介绍大语言模型在部署、训练、调优过程中涉及的各种关键技术，如自动并行、预训练与微调、RLHF等，并提供相应的实践指导；最后以开源大语言模型BLOOM和LLaMA为样例，介绍其架构和实现过程，帮助读者理解并构建、部署自己的大语言模型。本书还提供了基于MindSpore框架的丰富样例代码。
本书适合人工智能、智能科学与技术、计算机科学与技术、电子信息工程、自动化等专业的本科生和研究生阅读，同时也为从事大语言模型相关工作的软件开发工程师和科研人员提供翔实的参考资料。

第1章  大语言模型的发展\t001
1.1  人工智能的发展阶段\t002
1.2  从深度学习到大语言模型\t004
第2章  Transformer模型\t006
2.1  Transformer模型的基本原理\t007
2.1.1  注意力机制 \t007
2.1.2  自注意力机制\t010
2.1.3  多头注意力机制 \t011
2.2  Transformer模型的结构和模块\t013
2.2.1  位置编码\t014
2.2.2  编码器\t016
2.2.3  解码器\t020
2.2.4  模型代码\t024
2.3  Transformer模型在NLP任务中的应用\t025
2.4  使用MindSpore实现基于Transformer模型的文本机器翻译模型\t026
2.4.1  数据集准备与数据预处理\t026
2.4.2  模型构建\t033
2.4.3  模型训练与评估\t034
2.4.4  模型推理\t037
2.5参考文献\t040
第3章  BERT实践\t041
3.1  BERT基本原理\t042
3.2  BERT结构\t043
3.3  BERT预训练\t045
3.4  BERT微调\t046
3.5  使用MindSpore实现数据并行的BERT预训练\t047
3.6  参考文献\t050
第4章  GPT实践\t051
4.1  GPT基本原理\t052
4.2  GPT训练框架\t053
4.2.1  无监督预训练\t054
4.2.2  有监督微调\t054
4.2.3  GPT下游任务及模型输入\t055
4.3  使用MindSpore实现GPT的微调\t056
4.3.1  数据预处理\t056
4.3.2  模型定义\t059
4.3.3  模型训练\t066
4.3.4  模型评估\t067
4.4  参考文献\t067
第5章  GPT-2实践\t068
5.1  GPT-2的基本原理\t069
5.2  GPT-2的技术创新与改进\t070
5.3  GPT-2的优缺点\t071
5.4  使用MindSpore实现GPT-2的微调\t072
5.5  参考文献\t076
第6章  自动并行\t077
6.1数据并行原理\t078
6.2  算子并行原理\t080
6.3  优化器并行原理\t082
6.3.1  背景及意义\t082
6.3.2  基本原理\t083
6.4  流水线并行原理\t085
6.4.1  背景及意义\t085
6.4.2  基本原理\t085
6.5  MoE并行原理\t086
6.5.1  背景及意义\t086
6.5.2  算法原理\t088
6.6  自动并行策略搜索\t089
6.6.1  策略搜索定位\t090
6.6.2  策略搜索算法\t091
6.6.3  MindSpore实践\t092
6.7  异构计算\t092
6.7.1  计算流程\t092
6.7.2  优化器异构\t093
6.7.3  词表异构\t094
6.7.4  参数服务器异构\t095
6.7.5  多层存储\t096
6.8  大语言模型性能分析\t097
6.8.1  缩短单个模块耗时\t097
6.8.2  提高不同模块任务间的并行度\t097
6.9  MindFormers接口\t099
6.9.1  准备工作\t099
6.9.2  Trainer高阶接口快速入门\t099
6.9.3  Pipeline推理接口快速入门\t101
6.9.4  AutoClass快速入门\t101
6.9.5  Transformer接口介绍\t102
6.10  参考文献\t103
第7章  大语言模型预训练与微调\t106
7.1  预训练大语言模型代码生成\t107
7.1.1  多语言代码生成模型CodeGeeX\t107
7.1.2  多语言代码生成基准HumanEval-X\t109
7.2  提示调优\t111
7.2.1  提示流程\t111
7.2.2  提示模板\t114
7.2.3  优缺点分析\t115
7.3  指令调优\t116
7.3.1  基本流程\t116
7.3.2  指令模板\t117
7.3.3  优缺点分析\t118
7.4  参考文献\t119
第8章  基于人类反馈的强化学习\t121
8.1  基本原理\t122
8.2  强化学习\t122
8.2.1  核心思想\t122
8.2.2  关键元素\t123
8.2.3  策略与价值函数\t123
8.2.4  PPO算法\t124
8.3  InstructGPT和ChatGPT中的RLHF\t126
8.3.1  训练流程\t126
8.3.2  训练任务\t127
8.3.3  模型效果\t128
8.4  优缺点分析\t129
8.5  参考文献\t130
第9章  BLOOM和LLaMA模型实践\t131
9.1  BLOOM介绍\t132
9.1.1  模型结构\t132
9.1.2  预训练数据集\t134
9.2  BLOOM实现\t136
9.2.1  BLOOM架构实现 \t136
9.2.2  BLOOM总结\t142
9.3  基于BLOOM的微调\t142
9.3.1  数据集准备\t142
9.3.2  Checkpoint转换\t142
9.3.3  生成集群通信表\t143
9.3.4  启动预训练或微调\t143
9.3.5  微调后的对话效果\t144
9.4  LLaMA模型介绍\t148
9.4.1  模型结构\t148
9.4.2  预训练\t152
9.4.3  SFT与RLHF\t152
9.5  LLaMA模型实现\t153
9.5.1  LLaMA模型模块实现 \t153
9.5.2  LLaMA模型结构实现 \t155
9.6  基于LLaMA模型的微调\t159
9.6.1  数据集准备\t159
9.6.2  ckpt转换\t159
9.6.3  生成集群通信表\t159
9.6.4  启动微调\t160
9.6.5  微调效果\t160
9.7  参考文献\t161

电子书	MINDSPORE大语言模型实战
分类	电子书下载
作者	陈雷
出版社	人民邮电出版社
下载		暂无下载资源
介绍	编辑推荐 1、本书以MindSpore人工智能框架在大语言模型领域的应用为主要内容，详尽阐述了MindSpore框架在大语言模型中的应用。 2、无论是开发者、从业者还是学生，希望能够快速理解并构建大模型，本书以实践为主，能够帮助开发者快速理解并打造自己的大模型。 3、本书强调实战应用，提供了丰富的实战案例和代码示例，助力读者在实践中掌握构建和优化大语言模型的关键技术。内容推荐随着ChatGPT等大语言模型的迅速发展，大语言模型已经成为人工智能领域发展的快车道，不同领域涌现出各种强大的新模型。开发者想要独立构建、部署符合自身需求的大语言模型，需要理解大语言模型的实现框架和基本原理。本书梳理大语言模型的发展，首先介绍Transformer模型的基本原理、结构和模块及在NLP任务中的应用；然后介绍由只编码（Encoder-Only）到只解码（Decoder-Only）的技术路线发展过程中对应的 BERT、GPT等大语言模型；接下来介绍大语言模型在部署、训练、调优过程中涉及的各种关键技术，如自动并行、预训练与微调、RLHF等，并提供相应的实践指导；最后以开源大语言模型BLOOM和LLaMA为样例，介绍其架构和实现过程，帮助读者理解并构建、部署自己的大语言模型。本书还提供了基于MindSpore框架的丰富样例代码。本书适合人工智能、智能科学与技术、计算机科学与技术、电子信息工程、自动化等专业的本科生和研究生阅读，同时也为从事大语言模型相关工作的软件开发工程师和科研人员提供翔实的参考资料。目录第1章大语言模型的发展\t001 1.1 人工智能的发展阶段\t002 1.2 从深度学习到大语言模型\t004 第2章 Transformer模型\t006 2.1 Transformer模型的基本原理\t007 2.1.1 注意力机制 \t007 2.1.2 自注意力机制\t010 2.1.3 多头注意力机制 \t011 2.2 Transformer模型的结构和模块\t013 2.2.1 位置编码\t014 2.2.2 编码器\t016 2.2.3 解码器\t020 2.2.4 模型代码\t024 2.3 Transformer模型在NLP任务中的应用\t025 2.4 使用MindSpore实现基于Transformer模型的文本机器翻译模型\t026 2.4.1 数据集准备与数据预处理\t026 2.4.2 模型构建\t033 2.4.3 模型训练与评估\t034 2.4.4 模型推理\t037 2.5参考文献\t040 第3章 BERT实践\t041 3.1 BERT基本原理\t042 3.2 BERT结构\t043 3.3 BERT预训练\t045 3.4 BERT微调\t046 3.5 使用MindSpore实现数据并行的BERT预训练\t047 3.6 参考文献\t050 第4章 GPT实践\t051 4.1 GPT基本原理\t052 4.2 GPT训练框架\t053 4.2.1 无监督预训练\t054 4.2.2 有监督微调\t054 4.2.3 GPT下游任务及模型输入\t055 4.3 使用MindSpore实现GPT的微调\t056 4.3.1 数据预处理\t056 4.3.2 模型定义\t059 4.3.3 模型训练\t066 4.3.4 模型评估\t067 4.4 参考文献\t067 第5章 GPT-2实践\t068 5.1 GPT-2的基本原理\t069 5.2 GPT-2的技术创新与改进\t070 5.3 GPT-2的优缺点\t071 5.4 使用MindSpore实现GPT-2的微调\t072 5.5 参考文献\t076 第6章自动并行\t077 6.1数据并行原理\t078 6.2 算子并行原理\t080 6.3 优化器并行原理\t082 6.3.1 背景及意义\t082 6.3.2 基本原理\t083 6.4 流水线并行原理\t085 6.4.1 背景及意义\t085 6.4.2 基本原理\t085 6.5 MoE并行原理\t086 6.5.1 背景及意义\t086 6.5.2 算法原理\t088 6.6 自动并行策略搜索\t089 6.6.1 策略搜索定位\t090 6.6.2 策略搜索算法\t091 6.6.3 MindSpore实践\t092 6.7 异构计算\t092 6.7.1 计算流程\t092 6.7.2 优化器异构\t093 6.7.3 词表异构\t094 6.7.4 参数服务器异构\t095 6.7.5 多层存储\t096 6.8 大语言模型性能分析\t097 6.8.1 缩短单个模块耗时\t097 6.8.2 提高不同模块任务间的并行度\t097 6.9 MindFormers接口\t099 6.9.1 准备工作\t099 6.9.2 Trainer高阶接口快速入门\t099 6.9.3 Pipeline推理接口快速入门\t101 6.9.4 AutoClass快速入门\t101 6.9.5 Transformer接口介绍\t102 6.10 参考文献\t103 第7章大语言模型预训练与微调\t106 7.1 预训练大语言模型代码生成\t107 7.1.1 多语言代码生成模型CodeGeeX\t107 7.1.2 多语言代码生成基准HumanEval-X\t109 7.2 提示调优\t111 7.2.1 提示流程\t111 7.2.2 提示模板\t114 7.2.3 优缺点分析\t115 7.3 指令调优\t116 7.3.1 基本流程\t116 7.3.2 指令模板\t117 7.3.3 优缺点分析\t118 7.4 参考文献\t119 第8章基于人类反馈的强化学习\t121 8.1 基本原理\t122 8.2 强化学习\t122 8.2.1 核心思想\t122 8.2.2 关键元素\t123 8.2.3 策略与价值函数\t123 8.2.4 PPO算法\t124 8.3 InstructGPT和ChatGPT中的RLHF\t126 8.3.1 训练流程\t126 8.3.2 训练任务\t127 8.3.3 模型效果\t128 8.4 优缺点分析\t129 8.5 参考文献\t130 第9章 BLOOM和LLaMA模型实践\t131 9.1 BLOOM介绍\t132 9.1.1 模型结构\t132 9.1.2 预训练数据集\t134 9.2 BLOOM实现\t136 9.2.1 BLOOM架构实现 \t136 9.2.2 BLOOM总结\t142 9.3 基于BLOOM的微调\t142 9.3.1 数据集准备\t142 9.3.2 Checkpoint转换\t142 9.3.3 生成集群通信表\t143 9.3.4 启动预训练或微调\t143 9.3.5 微调后的对话效果\t144 9.4 LLaMA模型介绍\t148 9.4.1 模型结构\t148 9.4.2 预训练\t152 9.4.3 SFT与RLHF\t152 9.5 LLaMA模型实现\t153 9.5.1 LLaMA模型模块实现 \t153 9.5.2 LLaMA模型结构实现 \t155 9.6 基于LLaMA模型的微调\t159 9.6.1 数据集准备\t159 9.6.2 ckpt转换\t159 9.6.3 生成集群通信表\t159 9.6.4 启动微调\t160 9.6.5 微调效果\t160 9.7 参考文献\t161
截图
随便看	《一书一课付费课程资料合集》[MP4][93.4GB] 《让人相见恨晚的科普读物》(套装共12册)[PDF] 《高中语数英物化生史地政》新教材版精品全套一本涂书[pdf] 《日本ASMR美女主播【Momota】角色扮演5》自费购买可爱女友扮演各种角色哄睡助眠高清合集持续更新 [2.5G] 《全网VIP小说排行榜Top100》必读热门网文书单合集[TXT] 《精校200W字以上长篇小说100部》质量高口碑好可以一追[txt] 《各类养生酒配方大全》[PDF] 《高情商撩妹秘籍》（珍藏版）[MP4][3.32 GB] 《潮与虎》漫画藤田和日郎单行本1-34卷完结超清[PDF][5.7G] 《爱情真相：爱的51种姿势》柯云路作品[pdf] 《民国奇人》民国风云变幻，奇人纷呈辈出[全10册] [PDF] 《260126套装书合集分享》[EPUB] 十点课堂《厉害了！用手机拍出高逼格的照片》[MP4][5.0GB] 《追女神顶级教学:揭秘吸引力法则与约会技巧》 [MP4][3.20 GB] 《中国古代房中养生秘笈》（上、中、下卷）[pdf] 《圆明园四十景图咏原画超清 24000像素分帧图片》[JPG][3.22GB] 《日本藏中国古籍超全合集》[PDF] 《260123套装书合集分享》[PDF] 《兵器少女》伊咲宇多漫画 1-20卷完结超清 [PDF][1.8G] 《私人珍藏的畅销好书合集》精品资源系列[PDF] 《60多门编程语言学习书籍超级大合集》（700+本）[PDF] 《2016-2025近10年出版的电子书大合集》(3万册）[PDF/mobi/epub][182GB] 《长篇历史小说书单》[PDF][0.7G] 《260122套装书合集分享》[PDF] 《0123新书四本分享》[EPUB] 《中国历代珍稀钱币鉴赏》第一次见这么多铜钱开眼了[pdf] 《人间清醒恋爱指南》：关系博弈的现代情感法则[PDF] 《个人收藏电子书216》[PDF] 《付费群流出：得到全课程（2025）》[MP4][1080p][364GB］《夫妇以上，恋人未满》漫画连载中 1-79话 [PDF]