![]()
内容推荐 作为通用人工智能的重要进展,ChatGPT的出现引起了学术界和产业界人士的广泛关注。本书系统地论述了ChatGPT的发展历程、核心技术和基本原理等内容。全书共15章。第1章介绍了ChatGPT的前世今生;第2~6章论述了ChatGPT相关的基础理论与发展应用;第7~10章论述了ChatGPT的核心技术,包括Transformer、基于人类反馈的强化学习、提示学习以及模型学习与优化;第11章和第12章论述了ChatGPT的重要应用场景;第13~15章论述了以ChatGPT为代表的通用大模型范式面临的挑战和对各行业领域的影响,并对下一代人工智能重大场景战略进行了解读。 本书内容新颖,通俗易懂,适合作为人工智能、智能科学与技术、计算机科学与技术、智能机器人技术、控制科学与工程、物联网工程等专业本科生及研究生的通识教材,也可供相关科研人员、政府工作人员参考学习。 作者简介 焦李成,男,汉族,1959年10月生,1992年起任西安电子科技大学教授。现任智能感知与计算国际联合研究中心主任、智能感知与图像理解教育部重点实验室主任、智能感知与计算国际合作联合实验室主任、“智能信息处理科学与技术”高等学校学科创新引智基地(“111计划”)主任、教育部科技委国际合作部学部委员、中国人工智能学会副理事长、IET西安分会主席、IEEE西安分会奖励委员会主席、IEEE计算智能协会西安分会主席、IEEEGRSS西安分会主席,IEEETGRS副主编、教育部创新团队首席专家。国务院学位委员会学科评议组成员、教育部本科教学水平评估专家。1991年被批准为享受国务院政府津贴的专家,1996年首批入选国家“百千万”人才工程。当选为全国模范教师、陕西省师德标兵和曾任第八届全国人大代表。 焦李成教授的主要研究方向为智能感知与计算、图像理解与目标识别、深度学习与类脑计算,培养的十余名博士获全国优秀博士学位论文奖、提名奖及陕西省优秀博士论文奖。研究成果获包括国家自然科学奖二等奖及省部级一等奖以上科技奖励十余项,出版学术专著十余部,五次获国家优秀科技图书奖励及全国首届三个一百优秀图书奖。所发表的论著被他人引用超过25000余篇次,H指数为65。 目录 第1章 ChatGPT的前世今生 1.1 什么是 ChatGPT 1.2 从波士顿动力机器人到ChatGPT 1.3 ChatGPT的使用说明 1.3.1 ChatGPT的注册 1.3.2 ChatGPT的使用 1.3.3 如何与ChatGPT交流 1.4 ChatGPT 的优势与缺点 1.4.1 ChatGPT的优势 1.4.2 ChatGPT的缺点 1.5 ChatGPT的应用场景 1.5.1 办公领域 1.5.2 搜索引擎 1.5.3 教育领域 1.5.4 会计领域 1.5.5 其他领域 第2章 自然语言处理 2.1 语义理解 2.2 机器翻译 2.3 自动问答 2.3.1 自动问答系统的基础架构 2.3.2 自动问答系统的实现技术 2.3.3 自动问答技术面临的挑战和发展趋势 2.4 文本生成 2.4.1 基于规则驱动的文本生成 2.4.2 基于机器学习的文本生成 2.5 情感分析 第3章 ChatGPT深度学习基础理论 3.1 神经网络的基本原理 3.2 卷积神经网络 3.3 Word2Vec 3.3.1 连续词袋模型 3.3.2 SkipGram模型 3.4 循环神经网络 3.5 长短期记忆网络 第4章 GPT系列大模型 4.1 大规模预训练模型 4.1.1 发展历程 4.1.2 大模型的优势 4.1.3 应用场景 4.2 大型预训练语言模型 4.3 GPT 4.3.1 GPT1的结构 4.3.2 GPT1的数据集及参数量 4.3.3 GPT1的预训练 4.3.4 GPT1的微调 4.3.5 GPT1的优势及局限性 4.4 BERT 4.4.1 BERT的结构 4.4.2 BERT的数据集及参数量 4.4.3 BERT的预训练 4.4.4 BERT的微调 4.4.5 BERT的优势及局限性 4.5 GPT 4.6 GPT 4.7 ChatGPT 4.8 GPT 4.8.1 GPT4的基本信息 4.8.2 GPT4的亮点 第5章 人工智能基础大模型 5.1 谷歌的ViT22B视觉大模型 5.2 Meta的Segment Anything Model(SAM)分割大模型 5.3 微软的VisualGPT模型 5.4 华为的盘古大模型 5.5 阿里的“通义千问”大模型 5.6 百度的“文心一言”大模型 5.7 商汤的“日日新SenseNova”大模型 5.8 西电的“西电遥感脑”大模型 5.9 西电的“智瞳医行”大模型 第6章 扩散深度网络模型 6.1 简介与背景 6.2 扩散模型的基本原理 6.3 扩散模型的改进方法 6.3.1 改进的扩散模型 6.3.2 更大规模的扩散模型 6.3.3 用文本引导的扩散模型 6.3.4 DALL·E 6.3.5 更稳定的扩散模型 第7章 ChatGPT核心技术——Transformer 7.1 整体结构 7.2 编码器 7.3 解码器 7.4 嵌入 7.5 模型优缺点 第8章 ChatGPT核心技术——基于人类反馈的强化学习 8.1 强化学习 8.1.1 基本定义 8.1.2 强化学习的分类 8.2 近端策略优化 8.2.1 策略梯度 8.2.2 信赖域策略优化算法 8.2.3 PPO算法 8.3 基于人类反馈的强化学习 8.4 强化学习Transformer 第9章 ChatGPT核心技术——提示学习 9.1 提示学习的基本流程 9.2 提示学习主要构造 9.2.1 预训练模型的选择 9.2.2 提示工程 9.2.3 答案工程 9.3 提示学习示例 9.3.1 ZeroShot提示学习 9.3.2 FewShot提示学习 9.3.3 CoT提示学习 9.3.4 自一致性提示学习 第10章 ChatGPT核心技术——模型学习与优化 10.1 有监督学习 10.2 无监督学习 10.3 少样本学习与多任务学习 10.4 迁移学习 10.5 深度学习优化方法 10.5.1 梯度下降算法 10.5.2 动量法 10.5.3 牛顿法 10.5.4 启发式学习优化算法 第11章 ChatGPT的主要应用实例 11.1 让 ChatGPT 成为我们生活中的帮手 11.1.1 写文章 11.1.2 机器翻译 11.1.3 对话聊天与提问 11.2 让 ChatGPT 成为我们工作中的顾问 11.2.1 关键信息提取 11.2.2 检查语法 11.2.3 SQL语言生成 11.3 让ChatGPT成为我们科研中的助理 11.3.1 提供文献检索 11.3.2 提供研究背景 11.3.3 写代码 11.3.4 证明 11.4 让ChatGPT为我们提供创作灵感 11.4.1 作曲 11.4.2 作词 11.4.3 绘画 第12章 ChatGPT智能教育大模型 12.1 教育大模型介绍 12.2 教育大模型的原理 12.3 教育大模型的应用 12.4 教育大模型的优势和落地案例 12.4.1 教育大模型的优势 12.4.2 教育大模型的落地案例 第13章 通用大模型范式面临的挑战 13.1 通用大模型范式面临的十大挑战 13.2 ChatGPT挑战问题实例 13.2.1 图灵测试 13.2.2 基础数学计算 13.2.3 语义创新 13.2.4 模型偏见 13.2.5 语音识别难题 13.2.6 环境感知 13.3 NLP技术挑战 13.4 NLP大模型应用发展挑战 13.5 风险与应对战略 13.5.1 技术风险及其应对策略 |