![]()
内容推荐 大约在一百年前,电气化改变了交通运输行业、制造业、医疗行业、通信行业,如今AI带来了同样巨大的改变。AI的各个分支中发展最为迅速的方向之一就是深度学习。 本书主要涉及以下内容:第1部分是神经网络的基础,学习如何建立神经网络,以及如何在数据上面训练它们。第2部分进行深度学习方面的实践,学习如何构建神经网络与超参数调试、正则化以及一些高级优化算法。第3部分学习卷积神经网络(CNN),以及如何搭建模型、有哪些经典模型。它经常被用于图像领域,此外目标检测、风格迁移等应用也将涉及。最后在第4部分学习序列模型,以及如何将它们应用于自然语言处理等任务。序列模型讲到的算法有循环神经网络(RNN)、长短期记忆网络(LSTM)、注意力机制。 通过以上内容的学习,读者可以入门深度学习领域并打下扎实基础,为后续了解和探索人工智能前沿科技做知识储备。 本书配有电子课件,需要配套资源的教师可登录机械工业出版社教育服务网www.cmpedu.com免费注册后下载。 目录 前言 第1部分 神经网络和深度学习 第1章 深度学习简介 1.1 神经网络 1.2 神经网络的监督学习应用 1.3 为什么深度学习会兴起 第2章 神经网络的编程基础 2.1 二分类 2.2 逻辑回归 2.3 逻辑回归的代价函数 2.4 梯度下降法 2.5 计算图 2.6 使用计算图求导数 2.7 逻辑回归中的梯度下降 2.8 m个样本的梯度下降 2.9 向量化 2.10 向量化逻辑回归 2.11 向量化逻辑回归的输出 2.12 Python中的广播 2.13 numpy向量 2.14 logistic损失函数的解释 第3章 浅层神经网络 3.1 神经网络概述 3.2 神经网络的表示 3.3 计算一个神经网络的输出 3.4 多样本向量化 3.5 激活函数 3.6 激活函数的导数 3.7 神经网络的梯度下降 3.8 理解反向传播 3.9 随机初始化 第4章 深层神经网络 4.1 深层神经网络概述 4.2 前向传播和反向传播 4.3 深层网络中矩阵的维数 4.4 为什么使用深层表示 4.5 超参数 第2部分 改善深层神经网络:超参数调试、正则化以及优化 第5章 深度学习的实践 5.1 训练、验证、测试集 5.2 偏差、方差 5.3 机器学习基础 5.4 正则化 5.5 正则化如何降低过拟合 5.6 dropout正则化 5.7 理解dropout 5.8 其他正则化方法 5.9 归一化输入 5.10 梯度消失/梯度爆炸 5.11 梯度的数值逼近 5.12 梯度检验 第6章 优化算法 6.1 mini-batch梯度下降 6.2 理解mini-batch梯度下降法 6.3 动量梯度下降法 6.4 RMSprop 6.5 Adam优化算法 6.6 学习率衰减 6.7 局部最优问题 第7章 超参数调试、正则化 7.1 调试处理 7.2 超参数的合适范围 7.3 归一化网络的激活函数 7.4 将batch norm拟合进神经网络 7.5 batch归一化分析 7.6 softmax回归 7.7 训练一个aofmax分类器 7.8 TensorFlow 第3部分 卷积神经网络及应用 第8章 卷积神经网络 8.1 计算机视觉 8.2 边缘检测示例 8.3 边缘检测内容 8.4 填充 8.5 卷积步长 8.6 三维卷积 8.7 单层卷积网络 8.8 简单卷积网络示例 8.9 池化层 8.10 卷积神经网络示例 8.11 为什么使用卷积 第9章 深度卷积网络:实例探究 9.1 经典网络 9.2 残差网络 9.3 残差网络为什么有用 9.4 网络中的1×1卷积 9.5 谷歌Inception网络 9.6 迁移学习 9.7 数据增强 第10章 目标检测 10.1 目标定位 10.2 特征点检测 10.3 目标检测 10.4 滑动窗口的卷积实现 10.5 Bounding Box预测 10.6 交并比 10.7 非极大值抑制 10.8 Anchor Boxes 10.9 YOLO算法 第11章 特殊应用:人脸识别和神经风格迁移 11.1 One-Shot学习 11.2 Siamese网络 11.3 Triplet损失 11.4 人脸验证与二分类 11.5 神经风格迁移 11.6 深度卷积网络学习什么 11.7 代价函数 11.8 内容代价函数 11.9 风格代价函数 11.10 一维到三维推广 第4部分 序列模型 第12章 循环序列模型 12.1 为什么选择序列模型 12.2 数学符号 12.3 循环神经网络模型 12.4 通过时间的反向传播 12.5 不同类型的循环神经网络 12.6 语言模型和序列生成 12.7 对新序列采样 12.8 循环神经网络的梯度消失 12.9 GRU单元 12.10 长短期记忆 12.11 双向循环神经网络 12.12 深层循环神经网络 第13章 序列模型和注意力机制 13.1 序列结构的各种序列 13.2 选择最可能的句子 13.3 集束搜索 13.4 改进集束搜索 13.5 集束搜索的误差分析 13.6 注意力模型直观理解 13.7 注意力模型 附录 附录A 深度学习符号指南 A.1 数据标记与上下标 A.2 神经网络模型 A.3 正向传播方程示例 A.4 通用激活公式 A.5 损失函数 A.6 深度学习图示 附录B 线性代数 B.1 基础概念和符号 B.2 矩阵乘法 |