内容推荐 根据深度学习技术发展速度快、理论性与实践性强、应用广泛等特点,结合教学、科研及应用需求,本书按照“原理、技术、应用”三位一体原则,注重基础性、系统性、前沿性和实用性的统一,对深度学习理论与方法进行全面深入阐述。全书分成三部分:第一部分是机器学习与深度学习基础,包括机器学习理论基础、深度学习基础和深度学习网络优化技巧;第二部分是经典深度学习网络与关键技术,主要包括卷积神经网络、循环神经网络、神经网络的区分性训练、序列到序列模型;第三部分是实用高级深度学习技术,主要包括自编码器、迁移学习、终身学习、生成对抗网络、深度强化学习、元学习、自监督学习等。 本书在深入浅出的讲解中将最新理论成果与实际问题解决过程相结合,培养学生的创新思维和解决复杂工程问题能力,适合人工智能、网络安全、通信工程、信息工程等不同专业高年级本科生、研究生教学,适合作为人工智能相关领域的科研人员、工程师的重要参考书。 目录 第1章 人工智能技术概览 1.1 人工智能的概念 1.1.1 智能的基本概念 1.1.2 人类智能的度量 1.1.3 人工智能的概念 1.2 人工智能的发展历程 1.2.1 人工智能诞生前的50年 1.2.2 人工智能发展的第一阶段 1.2.3 人工智能发展的第二阶段 1.2.4 人工智能发展的第三阶段 1.3 人工智能的学术流派 1.3.1 戴维·阿兰格里尔的学术流派划分 1.3.2 佩德罗·多明戈斯的学术流派划分 1.3.3 人工智能学术流派的重新划分 1.4 人工智能的未来发展 1.4.1 无监督学习、元学习正在突破通用智能 1.4.2 实时强化学习技术趋于成熟 1.4.3 可解释性知识推理技术成为研究重点 1.4.4 开放式持续学习技术受到广泛关注 1.4.5 不同流派人工智能技术融合认知开辟新的技术路径 1.4.6 应用场景朝小数据量、恶劣环境、非完整数据方向发展 1.5 本章小结 参考文献 第2章 机器学习理论基础 2.1 机器学习基本概念 2.1.1 学习与机器学习 2.1.2 机器学习的分类 2.1.3 感知机及其学习算法 2.2 可能近似正确学习理论 2.2.1 机器学习的不可行性 2.2.2 概率近似正确学习理论 2.3 VC维理论 2.3.1 假设的有效数量 2.3.2 突破点 2.3.3 上限函数 2.3.4 VC维 2.4 三个最基本机器学习模型 2.4.1 线性分类 2.4.2 线性回归 2.4.3 逻辑回归 2.4.4 三种基本机器学习算法对比分析 2.5 本章小结 参考文献 第3章 深度学习基础 3.1 深度学习的基本定义和特点 3.1.1 神经元与生物神经网络 3.1.2 人工神经元及其分类能力 3.1.3 单隐含层神经网络的能力 3.1.4 深度学习 3.2 深度学习网络设计的三个核心问题 3.2.1 定义网络结构 3.2.2 目标函数选择 3.2.3 优化算法选择 3.3 后向传播算法 3.3.1 输出端的损失梯度 3.3.2 隐含层的损失梯度 3.3.3 神经网络参数的损失梯度 3.3.4 算法整理流图 3.4 本章小结 参考文献 第4章 深度学习网络优化技巧 4.1 深度学习网络优化学习 4.1.1 定义网络结构 4.1.2 目标函数选择 4.1.3 优化算法选择 4.1.4 深度学习算法检查 4.2 新激活函数选择 4.2.1 梯度消失问题 4.2.2 ReLU函数 4.2.3 ReLU函数的变形 4.2.4 其他激活函数 4.3 优化算法 4.3.1 基本优化算法 4.3.2 梯度方向调整优化算法 4.3.3 自适应学习率 4.3.4 步长和方向联合优化算法 4.4 测试集性能优化技巧 4.4.1 提前终止策略 4.4.2 正则化 4.4.3 丢弃法 4.5 本章小结 参考文献 第5章 卷积神经网络 5.1 卷积神经网络概述 5.1.1 卷积神经网络的历史 5.1.2 卷积神经网络的结构 5.2 卷积神经网络与全连接网络的关系 5.2.1 连接稀疏性 5.2.2 参数共享机制 5.3 典型的卷积神经网络 5.3.1 LeNet-5网络 5.3.2 AlexNet网络 5.3.3 ZFNet网络 5.3.4 VGGNet网络 5.3.5 GoogLeNet网络 5.3.6 残差网络 5.3.7 挤压激励网络 5.3.8 区域卷积神经网络及其拓展版本 5.4 本章小结 参考文献 本章知识点补充 第6章 循环神经网络 6.1 循环神经网络的引入 6.2 循环神经网络的结构 6.3 循环神经网络的训练 6.3.1 循环神经网络的前向传播 6.3.2 循环神经网络的依时间反向传播 6.3.3 循环神经网络的梯度消失与梯度爆炸问题 6.4 长短时记忆单元与门循环单元 6.4.1 长短时记忆单元 6.4.2 门循环单元 6.5 循环神经网络的扩展 6.5.1 深层循环神经网络 6.5.2 双向循环神经网络 6.6 循环神经网络的应用 6.6.1 多到一模式 6.6.2 一到多模式 6.6.3 同步多到多模式 6.6.4 异步多到多模式 6.7 本章小结 参考文献 第7章 神经网络的区分性训练 7.1 最小交叉熵与最大似然估计 7.2 区分性训练准则 7.3 序列模型的区分性训练 7.3.1 最大互信息准则 7.3.2 增强型MMI 7.3.3 最小音素错误/状态级最小贝叶斯风险 7.3.4 序列区分性训练准则的一般形式 7.4 序列区分性训练准则应用实例 7.4.1 基于词图的序列区分性训练 7.4.2 词图无关的序列区分性训练 7.5 本章小结 参考文献 第8章 序列到序列模型 8.1 序列到序列模型基本原理 8.1.1 序列到序列模型的引入 8.1.2 序列到序列模型构成 8.2 连续时序分类准则 8.2.1 连续时序分类准则定义 8.2.2 连续时序分类准则的解码 8.3 注意力模型 8.3.1 注意力模型定义与原理 8.3.2 自注意力机制 8.4 Transfor |