第1章 绪论
1.1 什么是机器学习
1.2 不同类型的学习
1.2.1 监督学习
1.2.2 非监督学习
1.2.3 半监督学习
1.2.4 强化学习
1.3 监督学习是如何工作的
1.4 为什么模型可以应用于新数据
第2章 符号和定义
2.1 符号
2.1.1 数据结构
2.1.2 大写西格玛符号
2.1.3 大写派符号
2.1.4 集合运算
2.1.5 向量运算
2.1.6 函数
2.1.7 max和argmax
2.1.8 赋值运算符
2.1.9 导数和梯度
2.2 随机变量
2.3 无偏估计值
2.4 贝叶斯准则
2.5 参数估计
2.6 参数与超参数
2.7 分类vs.回归
2.8 基于模型学习vs.基于实例学习
2.9 浅层学习vs.深度学习
第3章 基本算法
3.1 线性回归
3.1.1 问题陈述
3.1.2 解决方案
3.2 对数几率回归
3.2.1 问题陈述
3.2.2 解决方案
3.3 决策树学习
3.3.1 问题陈述
3.3.2 解决方案
3.4 支持向量机
3.4.1 处理噪声
3.4.2 处理固有非线性
3.5 k近邻
第4章 算法剖析
4.1 一个算法的组成部分
4.2 梯度下降
4.3 机器学习工程师如何工作
4.4 学习算法的特性
第5章 基本实践
5.1 特征工程
5.1.1 独热编码
5.1.2 装箱
5.1.3 归一化
5.1.4 标准化
5.1.5 处理特征缺失值
5.1.6 数据补全技术
5.2 选择学习算法
5.3 3个数据集
5.4 欠拟合与过拟合
5.5 正则化
5.6 模型效果评估
5.6.1 混淆矩阵
5.6.2 查准率/查全率
5.6.3 准确率
5.6.4 代价敏感准确率
5.6.5 ROC曲线下面积
5.7 超参数调试
交叉验证
第6章 神经网络和深度学习
6.1 神经网络
6.1.1 多层感知机例子
6.1.2 前馈神经网络
6.2 深度学习
6.2.1 卷轴神经网络
6.2.2 循环神经网络
第7章 问题与解决方案
7.1 核回归
7.2 多类别分类
7.3 单类别分类
7.4 多标签分类
7.5 集成学习
7.5.1 提升法与装袋法
7.5.2 随机森林
7.5.3 梯度提升
7.6 学习标注序列
7.7 序列到序列学习
7.8 主动学习
7.9 半监督学习
7.10 单样本学习
7.11 零样本学习
第8章 进阶操作
8.1 处理不平衡的数据集
8.2 组合模型
8.3 训练神经网络
8.4 进阶正则化
8.5 处理多输入
8.6 处理多输出
8.7 迁移学习
8.8 算法效率
第9章 非监督学习
9.1 密度预估
9.2 聚类
9.2.1 k均值
9.2.2 DBSCAN和HDBSCAN
9.2.3 决定聚类簇个数
9.2.4 其他聚类算法
9.3 维度降低
9.3.1 主要成分分析
9.3.2 UMAP
9.4 异常值检测
第10章 其他学习形式
10.1 质量学习
10.2 排序学习
10.3 推荐学习
10.3.1 因子分解机
10.3.2 去噪自编码器
10.4 自监督学习:词嵌入
第11章 结论
11.1 主题模型
11.2 高斯过程
11.3 广义线性模型
11.4 概率图模型
11.5 马尔可夫链蒙特卡洛算法
11.6 基因算法
11.7 强化学习
术语表