网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 大语言模型通识(注重AI思维与提高,建构大模型的基本观念与技术)
分类
作者 赵建勇, 周苏著
出版社 机械工业出版社
下载
简介
编辑推荐
浙江省普通本科高校“十四五”重点立项建设教材。深入浅出介绍与分析,易于理解和掌握知识与应用场景。注重AI思维与提高,建构大模型的基本观念与技术。针对性的“实践与思考”环节,融入大模型发展进程。
内容推荐
本书介绍的大模型知识主要包括: 概述、大模型基础、大模型的架构、数据标注、大模型预训练数据、大模型的开发组织、分布式训练、提示工程与微调等方面。
目录
前言课程教学进度表第1章 概述11.1 人工智能基础11.1.1 人工智能的定义11.1.2 人工智能的实现途径21.1.3 机器学习和深度学习31.1.4 监督学习与无监督学习41.2 大语言模型的定义51.3 大语言模型形成基础61.3.1 Blockhead思维实验71.3.2 大模型的历史基础71.3.3 基于Transformer模型81.3.4 大模型的学习能力91.3.5 大模型的世界模型问题91.3.6 文化知识传递和语言支持101.4 通用人工智能111.4.1 什么是通用人工智能111.4.2 大模型与通用人工智能111.4.3 人工智能生成内容12【作业】13【实践与思考】了解典型的开源大语言模型14第2章 大模型基础172.1 什么是语言模型172.1.1 语言模型的定义172.1.2 注意力机制182.1.3 开源还是闭源192.2 大模型发展三阶段212.2.1 基础模型阶段212.2.2 能力探索阶段212.2.3 突破发展阶段222.3 Transformer模型222.3.1 Transformer过程222.3.2 Transformer结构252.3.3 Transformer模块262.4 生成式预训练语言模型GPT272.5 大模型的结构282.5.1 LLaMA的模型结构282.5.2 LLaMA的注意力机制28【作业】30【实践与思考】基于ChatGPT的免费工具:ChatAI小组件31第3章 大模型的架构353.1 大模型生成原理353.1.1 上下文学习363.1.2 指令微调373.1.3 零样本/少样本373.1.4 深度学习架构373.1.5 训练策略及优化技术383.2 多模态语言模型383.2.1 多模态指令微调393.2.2 多模态上下文学习393.2.3 多模态思维链403.2.4 大模型辅助视觉推理403.3 应用技术架构413.3.1 指令工程413.3.2 函数调用423.3.3 检索增强生成423.3.4 微调423.4 OpenAI的Sora大模型423.4.1 Sora技术报告分析433.4.2 Sora主要技术特点433.4.3 Sora的模型训练过程433.5 谷歌的新款大模型频发443.5.1 Gemini 1.0大模型443.5.2 Gemini 1.5多模态大模型453.5.3 Gemma开源大模型483.5.4 Genie基础世界模型483.5.5 什么是世界模型48【作业】49【实践与思考】熟悉阿里云大模型—通义千问51第4章 数据标注544.1 知识与知识表示544.1.1 知识的概念544.1.2 知识表示方法564.1.3 表示方法的选择574.2 什么是数据标注594.3 数据标注的分类604.3.1 图像标注604.3.2 语音标注614.3.3 3D点云标注614.3.4 文本标注624.4 制定标注规则624.5 执行数据标注634.6 标注团队管理65【作业】66【实践与思考】熟悉百度大模型—文心一言68第5章 大模型预训练数据725.1 数据来源725.1.1 通用数据725.1.2 专业数据735.2 数据处理745.2.1 质量过滤745.2.2 冗余去除755.2.3 隐私消除755.2.4 词元切分755.3 数据影响分析765.3.1 数据规模775.3.2 数据质量775.4 典型的开源数据集785.4.1 Pile785.4.2 ROOTS795.5 数据集面临的挑战815.5.1 数据集规模和质量待提升815.5.2 大模型与数据集相辅相成815.5.3 数据集标准规范需健全825.5.4 数据存储性能待提高83【作业】83【实践与思考】熟悉Globe Explorer智能搜索引擎86第6章 大模型的开发组织886.1 大模型开发流程886.2 大模型的数据组织906.2.1 数据采集916.2.2 数据清洗和预处理916.2.3 数据标注926.2.4 数据集划分936.2.5 模型设计936.2.6 模型初始化946.2.7 模型训练946.2.8 模型验证956.2.9 模型保存956.2.10 模型测试966.2.11 模型部署966.3 训练集、验证集、测试集的不同之处976.3.1 目的与功能不同976.3.2 数据交互频率不同976.3.3 数据划分与比例不同986.3.4 使用时机不同986.4 训练集、验证集、测试集的相似之处986.4.1 数据来源一致996.4.2 相似的数据预处理996.4.3 目标一致,各具独立性996.4.4 保证数据质量和代表性99【作业】100【实践与思考】熟悉科大讯飞大模型—讯飞星火认知102第7章 分布式训练1067.1 分而治之1067.1.1 消息传递接口MPI1077.1.2 MapReduce1077.1.3 批处理和流处理1087.2 什么是分布式处理1097.2.1 分布式处理的特点1097.2.2 分布式处理的发展过程1107.2.3 分布式构成方式1107.2.4 分布式处理系统1117.3 分布式训练概述1117.4 分布式并行训练策略1127.4.1 数据并行性1137.4.2 模型并行性1147.4.3 流水线并行性1157.4.4 混合并行1157.5 分布式训练的集群架构116【作业】117【实践与思考】大模型背后的“芯片行业巨头”—英伟达119第8章 提示工程与微调1218.1 什么是提示工程1218.1.1 提示工程的本质1218.1.2 提示工程的原理1228.1.3 提示工程应用技术1238.1.4 提示的通用技巧1248.2 大模型为什么要微调1258.3 提示学习和语境学习1268.3.1 提示学习1268.3.2 语境学习1278.4 上下文窗口扩展1288.5 指令数据的构建1288.5.1 手动构建指令1288.5.2 自动构建指令1288.5.3 开源指令数据集1308.6 微调及其PEFT流行方案1308.6.1 微调技术路线1308.6.2 提示微调1308.6.3 前缀微调1318.6.4 LoRA1318.6.5 QLoRA131【作业】131【实践与思考】熟悉文生图大模型—Midjourney133第9章 强化学习方法1369.1 什么是强化学习1369.1.1 强化学习的定义1369.1.2 强化学习的发展历史1379.2 强化学习与监督和无监督学习的 比较1389.2.1 与监督和无监督学习的不同1389.2.2 大模型环境下的强化学习1399.2.3 学习方式不同1409.2.4 先验知识与标注数据1419.3 强化学习的基础1419.3.1 基于模型与免模型环境1419.3.2 探索与利用1429.3.3 片段还是连续性任务1439.3.4 网络模型设计1439.3.5 数据依赖性1459.4 强化学习分类1469.4.1 从奖励中学习1469.4.2 被动强化学习1479.4.3 主动强化学习1479.4.4 强化学习中的泛化1479.4.5 学徒学习147【作业】148【实践与思考】熟悉文生视频大模型—Sora149第10章 基于大模型的智能体15410.1 智能体和环境15410.2 智能体的良好行为15510.2.1 性能度量15510.2.2 理性15610.2.3 全知、学习和自主15610.3 环境的本质15710.3.1 指定任务环境15710.3.2 任务环境的属性15810.4 智能体的结构16010.4.1 智能体程序16010.4.2 学习型智能体16110.4.3 智能体组件的工作16310.5 构建大模型智能体16410.5.1 基于大模型的智能体16410.5.2 观测与感知16410.5.3 记忆与检索16510.5.4 推理和规划16610.5.5 行动和执行167【作业】168【实践与思考】人形机器人创业独角兽Figure AI170第11章 大模型应用框架17211.1 大模型哲学问题17211.1.1 组成性17211.1.2 天赋论与语言习得17311.1.3 语言理解与基础17311.1.4 世界模型17411.1.5 知识传递和语言支持17511.2 大模型的构建流程17511.2.1 确定需求大小17611.2.2 数据收集17611.2.3 数据预处理17711.2.4 大模型预训练17711.2.5 任务微调17811.2.6 模型部署17811.3 大模型的应用场景17811.3.1 机器翻译、文本理解与分析17911.3.2 恶意软件分析17911.3.3 自然语言生成17911.3.4 搜索与知识提取18011.3.5 代码开发18111.3.6 检测和预防网络攻击18111.3.7 虚拟助理和客户支持18111.3.8 转录18111.3.9 市场调研18111.3.10 SEO关键词优化18111.4 案例:Magic突破Q算法182【作业】183【实践与思考】精通垃圾分类的ZenRobotics机器人185第12章 技术伦理与18712.1 人工智能面临的伦理挑战18712.1.1 人工智能与人类的关系18712.1.2 人与智能机器的沟通18812.2 大数据伦理问题18912.2.1 数据主权和数据权问题18912.2.2 隐私权和自主权问题19012.2.3 数据利用失衡问题19012.3 大模型的知识产权保护19012.3.1 大模型的诉讼案例19112.3.2 大模型生成内容的知识产权保护19412.3.3 尊重隐私,保障安全,促进开放19412.3.4 边缘群体的数字平等19512.4 算法歧视19512.4.1 算法透明之争19512.4.2 算法透明的实践19712.4.3 算法透明的算法说明19812.4.4 算法公平的保障措施199【作业】200【实践与思考】完全由人工智能生成的视觉艺术品无法获得版权201第13章 大模型的评估20413.1 模型评估概述20413.2 大模型评估体系20513.2.1 知识与能力20513.2.2 伦理与安全20713.2.3 垂直领域评估20913.3 大模型评估方法21013.3.1 评估指标21013.3.2 评估方法21113.4 大模型评估实践21213.4.1 基础模型评估21213.4.2 监督学习和强化学习的模型评估214【作业】215【实践与思考】开展典型大模型评估 实践217第14章 大模型的健康未来22014.1 人工智能新发展22014.1.1 “人工智能+”成为新质生产力重要引擎22014.1.2 人工智能改变自动驾驶未来22114.1.3 重视人工智能治理政策22214.1.4 人工智能音乐的立法实践22214.1.5 防止人工智能误导民众22314.1.6 生成式人工智能产出的版权224 14.2 数据隐私保护对策22514.2.1 构建隐私保护伦理准则22514.2.2 注重隐私保护伦理教育22614.2.3 健全道德伦理约束机制22614.3 人工智能伦理原则22614.3.1 职业伦理准则的目标22714.3.2 创新发展道德伦理宣言22714.3.3 百度四大伦理原则22914.3.4 欧盟可信赖的伦理准则22914.4 大模型的大趋势23014.5 通用人工智能涌现231【作业】232【课程学习与实践总结】234附录 作业参考答案238参考文献241
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/1/19 8:09:39