前言
第1章 机器学习回顾
1.1 学习的机器
1.1.1 机器如何学习
1.1.2 生物学的启发
1.1.3 什么是深度学习
1.1.4 钻进奇幻的兔子洞
1.2 提出问题
1.3 机器学习背后的数学:线性代数
1.3.1 标量
1.3.2 向量
1.3.3 矩阵
1.3.4 张量
1.3.5 超平面
1.3.6 相关数学运算
1.3.7 将数据转换成向量
1.3.8 方程组求解
1.4 机器学习背后的数学:统计学
1.4.1 概率
1.4.2 条件概率
1.4.3 后验概率
1.4.4 分布
1.4.5 样本与总体
1.4.6 重采样方法
1.4.7 选择性偏差
1.4.8 似然
1.5 机器学习如何工作
1.5.1 回归
1.5.2 分类
1.5.3 聚类
1.5.4 欠拟合与过拟合
1.5.5 优化
1.5.6 凸优化
1.5.7 梯度下降
1.5.8 SGD
1.5.9 拟牛顿优化方法
1.5.10 生成模型与判别模型
1.6 逻辑回归
1.6.1 逻辑函数
1.6.2 理解逻辑回归的输出
1.7 评估模型
1.8 建立对机器学习的理解
第2章 神经网络基础与深度学习
2.1 神经网络
2.1.1 生物神经元
2.1.2 感知器
2.1.3 多层前馈网络
2.2 训练神经网络
2.3 激活函数
2.3.1 线性函数
2.3.2 sigmoid函数
2.3.3 tanh函数
2.3.4 hard tanh函数
2.3.5 softmax函数
2.3.6 修正线性函数
2.4 损失函数
2.4.1 损失函数的符号
2.4.2 用于回归的损失函数
2.4.3 用于分类的损失函数
2.4.4 用于重建的损失函数
2.5 超参数
2.5.1 学习率
2.5.2 正则化
2.5.3 动量
2.5.4 稀疏
第3章 深度网络基础
3.1 定义深度学习
3.1.1 什么是深度学习
3.1.2 本章结构
3.2 深度网络的通用构建原则
3.2.1 参数
3.2.2 层
3.2.3 激活函数
3.2.4 损失函数
3.2.5 优化算法
3.2.6 超参数
3.2.7 小结
3.3 深度网络的构造块
3.3.1 RBM
3.3.2 自动编码器
3.3.3 变分自动编码器
第4章 深度网络的主要架构
4.1 UPN
4.1.1 DBN
4.1.2 GAN
4.2 CNN
4.2.1 生物学启发
4.2.2 思路
4.2.3 CNN架构概要
4.2.4 输入层
4.2.5 卷积层
4.2.6 池化层
4.2.7 全连接层
4.2.8 CNN的其他应用
4.2.9 CNN列表
4.2.10 小结
4.3 RNN
4.3.1 时间维度建模
4.3.2 三维空间输入
4.3.3 为什么不是马尔可夫模型
4.3.4 常见的RNN架构
4.3.5 LSTM网络
4.3.6 特定领域应用与混合网络
4.4 递归神经网络
4.4.1 网络架构
4.4.2 递归神经网络的变体
4.4.3 递归神经网络的应用
4.5 小结与讨论
4.5.1 深度学习会使其他算法过时吗
4.5.2 不同的问题有不同的最佳方法
4.5.3 什么时候需要深度学习
第5章 建立深度网络
5.1 将深度网络与适合的问题匹配
5.1.1 列式数据与多层感知器
5.1.2 图像与CNN
5.1.3 时间序列与RNN
5.1.4 使用混合网络
5.2 DL4J工具套件
5.2.1 向量化与DataVec
5.2.2 运行时与ND4J
5.3 DL4J API的基本概念
5.3.1 加载与保存模型
5.3.2 为模型获取输入
5.3.3 建立模型架构
5.3.4 训练与评估
5.4 使用多层感知器网络对CSV数据建模
5.4.1 建立输入数据
5.4.2 确定网络架构
5.4.3 训练模型
5.4.4 评估模型
5.5 利用CNN对手写图像建模
5.5.1 使用LeNet CNN的Java代码示例
5.5.2 加载及向量化输入图像
5.5.3 DL4J中用于LeNet的网络架构
5.5.4 训练CNN网络
5.6 基于RNN的序列数据建模
5.6.1 通过LSTM生成莎士比亚风格作品
5.6.2 基于LSTM的传感器时间序列分类
5.7 利用自动编码器检测异常
5.7.1 自动编码器示例的Java代码列表
5.7.2 设置输入数据
5.7.3 自动编码器的网络结构与训练
5.7.4 评估模型
5.8 使用变分自动编码器重建MNIST数字
5.8.1 重建MNIST数字的代码列表
5.8.2 VAE模型的检验
5.9 深度学习在自然语言处理中的应用
5.9.1 使用Word2Vec的学习词嵌入
5.9.2 具有段落向量的句子的分布式表示
5.9.3 使用段落向量进行文档分类
第6章 深度网络调优
6.1 深度网络调优的基本概念
6.1.1 建立深度网络的思路
6.1.2 构建思路的步骤
6.2 匹配输入数据与网络架构
6.3 模型目标与输出层的关系
6.3.1 回归模型的输出层
6.3.2 分类模型的输出层
6.4 处理层的数量、参数的数量和存储器
6.4.1 前馈多层神经网络
6.4.2 控制层和参数的数量