第1章 绪论
1.1 基本概念
1.2 常用学习算法
1.2.1 线性判别分析
1.2.2 决策树
1.2.3 神经网络
1.2.4 朴素贝叶斯
1.2.5 k-近邻
1.2.6 支持向量机和核方法
1.3 评估和对比
1.4 集成学习方法
1.5 集成学习方法的应用
1.6 拓展阅读
第2章 Boosting
2.1 Boosting过程
2.2 AdaBoost算法
2.3 说明性举例
2.4 理论探讨
2.4.1 基本分析
2.4.2 间隔解释
2.4.3 统计视角
2.5 多分类问题
2.6 容噪能力
2.7 拓展阅读
第3章 Bagging
3.1 两种集成范式
3.2 Bagging算法
3.3 说明性举例
3.4 理论探讨
3.5 随机树集成
3.5.1 随机森林
3.5.2 随机化谱
3.5.3 随机森林用于密度估计
3.5.4 随机森林用于异常检测
3.6 拓展阅读
第4章 结合方法
4.1 结合带来的益处
4.2 均值法
4.2.1 简单平均法
4.2.2 加权平均法
4.3 投票法
4.3.1 绝对多数投票法
4.3.2 相对多数投票法
4.3.3 加权投票法
4.3.4 软投票法
4.3.5 理论探讨
4.4 学习结合法
4.4.1 Stacking
4.4.2 无限集成
4.5 其他结合方法
4.5.1 代数法
4.5.2 行为知识空间法
4.5.3 决策模板法
4.6 相关方法
4.6.1 纠错输出编码法
4.6.2 动态分类器选择法
4.6.3 混合专家模型
4.7 拓展阅读
第5章 多样性
5.1 集成多样性
5.2 误差分解
5.2.1 误差-分歧分解
5.2.2 偏差-方差-协方差分解
5.3 多样性度量
5.3.1 成对度量
5.3.2 非成对度量
5.3.3 小结和可视化
5.3.4 多样性度量的局限
5.4 信息论多样性
5.4.1 信息论和集成
5.4.2 交互信息多样性
5.4.3 多信息多样性
5.4.4 估计方法
5.5 多样性增强
5.6 拓展阅读
第6章 集成修剪
6.1 何谓集成修剪
6.2 多比全好
6.3 修剪方法分类
6.4 基于排序的修剪
6.5 基于聚类的修剪
6.6 基于优化的修剪
6.6.1 启发式优化修剪
6.6.2 数学规划修剪
6.6.3 概率修剪
6.7 拓展阅读
第7章 聚类集成
7.1 聚类
7.1.1 聚类方法
7.1.2 聚类评估
7.1.3 为什么要做聚类集成
7.2 聚类集成方法分类
7.3 基于相似度的方法
7.4 基于图的方法
7.5 基于重标记的方法
7.6 基于变换的方法
7.7 拓展阅读
第8章 进阶议题
8.1 半监督学习
8.1.1 未标记数据的效用
8.1.2 半监督学习的集成学习方法
8.2 主动学习
8.2.1 人为介入的效用
8.2.2 基于集成的主动学习
8.3 代价敏感学习
8.3.1 不均等代价下的学习
8.3.2 代价敏感学习的集成方法
8.4 类别不平衡学习
8.4.1 类别不平衡
8.4.2 类别不平衡学习的性能评估
8.4.3 类别不平衡学习的集成方法
8.5 提升可解释性
8.5.1 集成约简
8.5.2 规则抽取
8.5.3 可视化
8.6 未来的研究方向
8.7 拓展阅读
参考文献
索引