大模型应用开发：RAG入门与实战陈明明人民邮电出版社豆瓣PDF电子书bt网盘迅雷下载教育考试-考试-计算机类-霍普软件下载网

第 1章  RAG概述\t001
1.1 人工智能和自然语言处理概述\t001
1.1.1  人工智能的定义和发展历史\t001
1.1.2  自然语言处理的概念和基本任务\t001
1.2  自然语言处理在大数据时代的挑战与机遇\t003
1.2.1  大数据时代对自然语言处理的影响\t003
1.2.2  大数据时代的自然语言处理技术发展趋势\t004
1.3  基于RAG的大模型文档搜索概述\t006
1.3.1  RAG模型的含义和基本原理\t006
1.3.2  大模型文档搜索在信息检索领域的重要性\t007
1.4  基于RAG的大模型文档搜索的工作原理\t008
1.4.1  Retriever模块的工作原理\t008
1.4.2  Generator模块的工作原理\t009
1.4.3  Ranker模块的工作原理\t011
1.5  基于RAG的大模型文档搜索的优势和应用场景\t012
1.5.1  优势\t012
1.5.2  应用场景\t014
第 2章  PyTorch编程基础\t017
2.1  PyTorch简介\t017
2.2  PyTorch安装与环境配置\t018
2.2.1  安装PyTorch\t018
2.2.2  环境配置\t019
2.2.3  常见安装问题及解决方法\t019
2.3  PyTorch张量\t020
2.3.1  张量的创建\t020
2.3.2  张量的基本运算\t023
2.3.3  张量的索引和切片\t026
2.3.4  张量的形状操作\t029
2.4  PyTorch自动微分\t032
2.4.1  梯度计算\t032
2.4.2  反向传播\t033
2.4.3  停止梯度传播\t035
2.5  PyTorch模型构建\t037
2.5.1  搭建神经网络模型\t037
2.5.2  模型参数的访问和初始化\t039
2.6  PyTorch数据加载与预处理\t041
2.6.1  数据加载\t041
2.6.2  数据预处理\t043
2.7  PyTorch模型训练与评估\t045
2.7.1  模型训练\t045
2.7.2  模型评估\t049
2.8  PyTorch模型保存与加载\t053
2.8.1  模型的保存\t053
2.8.2  模型的加载\t054
2.9  小结\t056
第3章  深度学习基础\t057
3.1  感知机和多层感知机\t057
3.1.1  感知机的原理和结构\t057
3.1.2  多层感知机的结构和前向传播\t058
3.1.3  多层感知机的训练算法\t059
3.2  卷积神经网络\t061
3.2.1  卷积层和池化层\t061
3.2.2  CNN的典型结构：LeNet、AlexNet、VGG、ResNet\t064
3.3  循环神经网络\t073
3.3.1  RNN的结构和原理\t073
3.3.2  长短期记忆网络\t075
3.3.3  门控循环单元\t076
3.4  Transformer模型\t078
3.4.1  Self-Attention机制\t078
3.4.2  Transformer架构\t080
3.4.3  Transformer在机器翻译、语言建模等任务中的应用\t084
3.5  BERT模型\t084
3.5.1  BERT的预训练任务和目标\t084
3.5.2  BERT的结构、原理和应用\t088
3.6  GPT大模型\t089
3.6.1  GPT的预训练任务和目标\t089
3.6.2  GPT的结构、原理和应用\t090
3.7  深度学习的优化算法\t091
3.7.1  梯度下降和反向传播\t091
3.7.2  SGD和Adam\t094
3.7.3  学习率调整策略\t096
3.8  深度学习的正则化和防止过拟合方法\t099
3.8.1  L1和L2正则化\t099
3.8.2  Dropout和Batch Normalization\t101
第4章  自然语言处理基础\t103
4.1  基础知识\t103
4.1.1  分词算法\t103
4.1.2  关键词提取\t106
4.1.3  摘要提取\t110
4.2  模型如何看懂文字\t113
4.3  ChatGPT大模型\t117
4.3.1  GPT模型的发展历程\t118
4.3.2  ChatGPT模型概述\t119
4.3.3  ChatGPT模型的原理和发展方向\t120
第5章  Web可视化\t121
5.1  Streamlit介绍\t121
5.1.1  概述\t121
5.1.2  主要功能\t122
5.1.3  应用场景\t132
5.2  Gradio介绍\t145
5.2.1  概述\t145
5.2.2  主要功能\t147
5.2.3  应用场景\t153
第6章  RAG文档分块和向量化\t164
6.1  文档分块概述\t164
6.1.1  文档分块的定义和作用\t164
6.1.2  常见的文档分块算法\t166
6.1.3  文档分块在信息检索和自然语言处理中的应用\t168
6.2  文档分块方法\t171
6.2.1  基于规则的文档分块方法\t171
6.2.2  基于机器学习的文档分块方法\t173
6.2.3  基于深度学习的文档分块方法\t174
6.3  文档向量化概述\t178
6.3.1  文档向量化的定义和作用\t178
6.3.2  文档向量化在自然语言处理中的应用场景\t179
6.3.3  文档向量化的评估指标\t181
6.4  基于词袋模型的文档向量化方法\t183
6.4.1  词频矩阵\t183
6.4.2  TF-IDF矩阵       \t185
6.4.3  Hot编码\t187
6.4.4  哈希编码\t188
6.5  基于词嵌入模型的文档向量化方法\t190
6.5.1  Word2Vec\t190
6.5.2  fastText\t191
6.5.3  Doc2Vec\t193
6.6  基于预训练模型的文档向量化方法\t195
6.6.1  BERT文档向量化\t195
6.6.2  GPT文档向量化\t197
第7章  RAG向量检索技术\t199
7.1  向量检索技术的定义和应用场景\t199
7.1.1  向量检索技术的定义\t199
7.1.2  向量检索技术的应用场景\t200
7.2  向量间距离的计算\t204
7.2.1  内积距离\t204
7.2.2  欧式距离\t206
7.2.3  汉明距离\t207
7.2.4  杰卡德距离\t208
7.3  基于树的方法\t210
7.3.1  KNN算法\t210
7.3.2  KD-树\t211
7.3.3  Annoy\t212
7.4  基于哈希的方法\t214
第8章  RAG中的Prompt技术\t216
8.1  特定指令模式\t217
8.2  指令模板模式\t223
8.3  代理模式\t227
8.4  示例模式\t231
8.5  零样本提示模式\t231
8.6  少样本提示模式\t233
8.7  思维链提示模式\t234
8.7.1  零样本CoT\t235
8.7.2  少样本CoT\t237
第9章  动手实现PDF阅读器\t239
9.1  PDF内容提取\t239
9.2  PDF文档分块\t241
9.3  PDF文档向量化\t243
9.4  PDF文档相似度计算\t244
9.5  大模型回答\t246

书名	大模型应用开发：RAG入门与实战
分类	教育考试-考试-计算机类
作者	陈明明
出版社	人民邮电出版社
下载
简介	编辑推荐解锁大语言模型和RAG技术的秘密，带读者深入理解文档搜索的应用深入浅出地介绍了从文档分块到向量检索的全过程结合实践案例，帮助读者将RAG技术快速应用于实际工作中本书全面剖析了RAG（检索增强生成）技术，从文档的分块与向量化，到利用深度学习模型进行高效检索，再结合Prompt技术实现精准响应，每一步骤都通过清晰的逻辑与实例展示。书中不仅详细介绍了大语言模型的核心原理，还涵盖了PyTorch编程基础、深度学习理论与NLP技术。配合实际项目，如PDF阅读器的构建、Streamlit与Gradio可视化工具的使用，帮助读者将理论应用于实践，是学习RAG技术与大语言模型应用的推荐指南。内容推荐本书详细解析了RAG（Retrieval-Augmented Generation，检索增强生成）技术及其应用，从文档的分块与向量化，到利用深度学习模型进行向量检索，再到结合Prompt技术以实现精准响应，每个知识点都有清晰的逻辑阐述与实践案例；同时，介绍了PyTorch编程基础与深度学习核心概念。此外，本书还涵盖了一系列实用技术，如Web可视化工具Streamlit与Gradio的使用，以及如何利用这些工具快速构建交互式界面，直观展示RAG技术的效果。最后，通过动手实现PDF阅读器的实例，读者能亲自体验从理论到实践的过程，加深对RAG技术的理解与掌握。本书内容通俗易懂，适合对文档搜索和RAG应用感兴趣的读者阅读，也可以作为从事大语言模型相关工作的人员的参考书。目录第 1章 RAG概述\t001 1.1 人工智能和自然语言处理概述\t001 1.1.1 人工智能的定义和发展历史\t001 1.1.2 自然语言处理的概念和基本任务\t001 1.2 自然语言处理在大数据时代的挑战与机遇\t003 1.2.1 大数据时代对自然语言处理的影响\t003 1.2.2 大数据时代的自然语言处理技术发展趋势\t004 1.3 基于RAG的大模型文档搜索概述\t006 1.3.1 RAG模型的含义和基本原理\t006 1.3.2 大模型文档搜索在信息检索领域的重要性\t007 1.4 基于RAG的大模型文档搜索的工作原理\t008 1.4.1 Retriever模块的工作原理\t008 1.4.2 Generator模块的工作原理\t009 1.4.3 Ranker模块的工作原理\t011 1.5 基于RAG的大模型文档搜索的优势和应用场景\t012 1.5.1 优势\t012 1.5.2 应用场景\t014 第 2章 PyTorch编程基础\t017 2.1 PyTorch简介\t017 2.2 PyTorch安装与环境配置\t018 2.2.1 安装PyTorch\t018 2.2.2 环境配置\t019 2.2.3 常见安装问题及解决方法\t019 2.3 PyTorch张量\t020 2.3.1 张量的创建\t020 2.3.2 张量的基本运算\t023 2.3.3 张量的索引和切片\t026 2.3.4 张量的形状操作\t029 2.4 PyTorch自动微分\t032 2.4.1 梯度计算\t032 2.4.2 反向传播\t033 2.4.3 停止梯度传播\t035 2.5 PyTorch模型构建\t037 2.5.1 搭建神经网络模型\t037 2.5.2 模型参数的访问和初始化\t039 2.6 PyTorch数据加载与预处理\t041 2.6.1 数据加载\t041 2.6.2 数据预处理\t043 2.7 PyTorch模型训练与评估\t045 2.7.1 模型训练\t045 2.7.2 模型评估\t049 2.8 PyTorch模型保存与加载\t053 2.8.1 模型的保存\t053 2.8.2 模型的加载\t054 2.9 小结\t056 第3章深度学习基础\t057 3.1 感知机和多层感知机\t057 3.1.1 感知机的原理和结构\t057 3.1.2 多层感知机的结构和前向传播\t058 3.1.3 多层感知机的训练算法\t059 3.2 卷积神经网络\t061 3.2.1 卷积层和池化层\t061 3.2.2 CNN的典型结构：LeNet、AlexNet、VGG、ResNet\t064 3.3 循环神经网络\t073 3.3.1 RNN的结构和原理\t073 3.3.2 长短期记忆网络\t075 3.3.3 门控循环单元\t076 3.4 Transformer模型\t078 3.4.1 Self-Attention机制\t078 3.4.2 Transformer架构\t080 3.4.3 Transformer在机器翻译、语言建模等任务中的应用\t084 3.5 BERT模型\t084 3.5.1 BERT的预训练任务和目标\t084 3.5.2 BERT的结构、原理和应用\t088 3.6 GPT大模型\t089 3.6.1 GPT的预训练任务和目标\t089 3.6.2 GPT的结构、原理和应用\t090 3.7 深度学习的优化算法\t091 3.7.1 梯度下降和反向传播\t091 3.7.2 SGD和Adam\t094 3.7.3 学习率调整策略\t096 3.8 深度学习的正则化和防止过拟合方法\t099 3.8.1 L1和L2正则化\t099 3.8.2 Dropout和Batch Normalization\t101 第4章自然语言处理基础\t103 4.1 基础知识\t103 4.1.1 分词算法\t103 4.1.2 关键词提取\t106 4.1.3 摘要提取\t110 4.2 模型如何看懂文字\t113 4.3 ChatGPT大模型\t117 4.3.1 GPT模型的发展历程\t118 4.3.2 ChatGPT模型概述\t119 4.3.3 ChatGPT模型的原理和发展方向\t120 第5章 Web可视化\t121 5.1 Streamlit介绍\t121 5.1.1 概述\t121 5.1.2 主要功能\t122 5.1.3 应用场景\t132 5.2 Gradio介绍\t145 5.2.1 概述\t145 5.2.2 主要功能\t147 5.2.3 应用场景\t153 第6章 RAG文档分块和向量化\t164 6.1 文档分块概述\t164 6.1.1 文档分块的定义和作用\t164 6.1.2 常见的文档分块算法\t166 6.1.3 文档分块在信息检索和自然语言处理中的应用\t168 6.2 文档分块方法\t171 6.2.1 基于规则的文档分块方法\t171 6.2.2 基于机器学习的文档分块方法\t173 6.2.3 基于深度学习的文档分块方法\t174 6.3 文档向量化概述\t178 6.3.1 文档向量化的定义和作用\t178 6.3.2 文档向量化在自然语言处理中的应用场景\t179 6.3.3 文档向量化的评估指标\t181 6.4 基于词袋模型的文档向量化方法\t183 6.4.1 词频矩阵\t183 6.4.2 TF-IDF矩阵 \t185 6.4.3 Hot编码\t187 6.4.4 哈希编码\t188 6.5 基于词嵌入模型的文档向量化方法\t190 6.5.1 Word2Vec\t190 6.5.2 fastText\t191 6.5.3 Doc2Vec\t193 6.6 基于预训练模型的文档向量化方法\t195 6.6.1 BERT文档向量化\t195 6.6.2 GPT文档向量化\t197 第7章 RAG向量检索技术\t199 7.1 向量检索技术的定义和应用场景\t199 7.1.1 向量检索技术的定义\t199 7.1.2 向量检索技术的应用场景\t200 7.2 向量间距离的计算\t204 7.2.1 内积距离\t204 7.2.2 欧式距离\t206 7.2.3 汉明距离\t207 7.2.4 杰卡德距离\t208 7.3 基于树的方法\t210 7.3.1 KNN算法\t210 7.3.2 KD-树\t211 7.3.3 Annoy\t212 7.4 基于哈希的方法\t214 第8章 RAG中的Prompt技术\t216 8.1 特定指令模式\t217 8.2 指令模板模式\t223 8.3 代理模式\t227 8.4 示例模式\t231 8.5 零样本提示模式\t231 8.6 少样本提示模式\t233 8.7 思维链提示模式\t234 8.7.1 零样本CoT\t235 8.7.2 少样本CoT\t237 第9章动手实现PDF阅读器\t239 9.1 PDF内容提取\t239 9.2 PDF文档分块\t241 9.3 PDF文档向量化\t243 9.4 PDF文档相似度计算\t244 9.5 大模型回答\t246
随便看	科学梦与成才路--院士的故事中药药理学(供长学期制本科生及研究生使用第2版全国高等中医药院校教材) 全球气候变化治理中的中美欧三边关系/欧盟与世界丛书近代中外关系史治要/近代中国研究书系学术与社会(近代中国社会重心的转移与读者书人新的角色)/近代中国研究书系大革命与现代文明闪亮的心灵/新世纪未成年人素养成长丛书上海滑稽与上海闲话(附光盘)(精)/上海滑稽丛书跟钱程学上海闲话(附光盘) 上海滑稽三大家(精)/上海滑稽丛书魔神的游戏末日爱国者一秒之后机械制造技术(高职高专十二五规划教材) 病理学与病理生理学(供护理康复等专业使用全国高等中医药院校教材) 植物分泌结构解剖学(精) 三相异步电动机绕组嵌接线实用图集(第2版) 中医筋伤学(供中医骨伤专业中西医结合临床专业用全国普通高等教育中医药类精编教材) 电工与电子技术教程(普通高等教育十二五规划教材) 粉墨江湖(卞家班暨杭嘉湖水路京班纪略) 汪建伟(附光盘黄灯)(精) 全球多边贸易体制的未来与中国(贸易评论) 自由的开端(美国立宪的政治哲学) 疏通知译史/近代中国研究书系信史立国(瞥观中国近现代历史的新探寻)/近代中国研究书系家庭版系统开启组策略工具 v1.0 Pix4D v4.5.6 Trimble Tekla Tedds v2.69 ModHeader插件 v3.1.20 购物党自动比价工具插件 v5.11.96 易达石场称重开单打印软件 v30.6.5 二年级两位数加减除听算软件 v1.0 图书借阅系统 v1.6.3.0 U盘量产工具万能版3.1 v3.3 MaxSunLED铭瑄灯效控制软件 v1.0.0.0 环世界动物扩展v1.2MOD v1.36 纪元2070十三项修改器 v3.3 怪物猎人世界冰原女用男铸锭头盔MOD v2.03 巫师3狂猎更多的血液MOD v2.3 怪物猎人ol捏脸辣妹捏脸数据濡ゅ倹蓱缁旂笨1.2 模拟人生4超可爱的花边短裙MOD v1.49 星露谷物语怪物雕像家具MOD v2.15 上古卷轴5野生动物价格MOD v1.101 怪物猎人世界冰原丰满的激情护甲MOD v1.14 极品飞车17十四项修改器 v1.3 Wednesday wee weed weedkiller Weed Whacker weedy week weekday weekend weekly [BT下载][丹道至尊][第111集][WEB-MKV/0.40G][国语配音/中文字幕][4K-2160P][H265][流媒体][ColorTV] [BT下载][丹道至尊][第111集][WEB-MKV/1.09G][国语配音/中文字幕][4K-2160P][H265][流媒体][ColorTV] [BT下载][丹道至尊][第111集][WEB-MKV/0.84G][国语配音/中文字幕][4K-2160P][HDR版本][H265][流媒体][Color [BT下载][掩耳盗邻.第一季][第03集][WEB-MKV/3.72G][简繁英字幕][1080P][流媒体][ZeroTV] [BT下载][掩耳盗邻.第一季][第03集][WEB-MKV/7.39G][简繁英字幕][4K-2160P][H265][流媒体][ZeroTV] [BT下载][掩耳盗邻.第一季][第03集][WEB-MKV/8.73G][简繁英字幕][4K-2160P][杜比视界版本][H265][流媒体][Z [BT下载][掩耳盗邻.第一季][第03集][WEB-MKV/8.72G][简繁英字幕][4K-2160P][HDR版本][H265][流媒体][ZeroTV] [BT下载][掩耳盗邻.第一季][第03集][WEB-MKV/8.73G][简繁英字幕][4K/HDR+杜比/H265/流媒体][ZeroTV] [BT下载][博斯：传承.第三季][全10集][WEB-MKV/29.02G][简繁英字幕][1080P][流媒体][ZeroTV] [BT下载][天命大主宰][第33集][WEB-MP4/0.44G][国语配音/中文字幕][1080P][流媒体][ColorTV] 惠普Win10改Win7系统BIOS设置怎么弄？华硕笔记本装Win10还是Win11？华硕笔记本应该装哪个版本的系统好？《诺斯费拉图》曝剧照德普女儿深陷吸血鬼恋情《刺猬索尼克3》曝预告蓝色闪电遇劲敌“暗影” 黑木华《互帮互助》曝剧照展现生死相隔的友谊第十九届中国长春电影节开幕式晚会明星阵容曝光《让子弹飞》编剧郭俊立新作曝光为喜剧公路题材聚焦虐童问题！中国版《白》将于2025年开拍定为R级！斯科特称《角斗士2》为他个人最佳之一 Excel数字变成了小数点+E+17怎么办？