内容推荐 本书全面而透彻地介绍了元学习和AutoML的几乎所有方面,涵盖了基本概念和架构、评估、数据集、超参数优化、集成和工作流,以及如何使用这些知识来选择、组合、调整和配置算法和模型,以更快更好地解决数据挖掘和数据科学问题。因此,它可以帮助开发人员开发可以通过经验改进自己的系统。 本书是2009年第一版的重大更新,共18章,内容几乎是上一版的两倍。这是作者能够更深入地涵盖最相关的主题,并结合各自领域最新研究的概述。本书适用于对机器学习、数据挖掘、数据科学和人工智能领域感兴趣的研究人员、研究生及该领域的从业人员。 作者简介 帕维尔·布拉兹迪尔,波尔图,波尔图人工智能与决策支持实验室;波尔图大学商学院。 目录 前言 本书的基本架构 致谢 第一部分 基本概念与架构 第1章 简介 1.1 本书的结构 1.2 基本概念与架构(第一部分) 1.2.1 基本概念 1.2.2 问题类型 1.2.3 元学习与AutoML系统的基本架构 1.2.4 使用来自先验数据集的元数据进行算法选择(第2、5章) 1.2.5 不同系统的评价与比较(第3章) 1.2.6 数据集特征/元特征的作用(第4章) 1.2.7 不同类型的元级模型(第5章) 1.2.8 超参数优化(第6章) 1.2.9 工作流设计的自动化方法(第7章) 1.3 先进技术和方法(第二部分) 1.3.1 设置构形空间和实验(第8章) 1.3.2 集成学习与数据流的自动化方法 1.3.3 元模型的跨任务迁移(第12章) 1.3.4 深度神经网络的元学习(第13章) 1.3.5 数据科学自动化与复杂系统设计 1.4 实验结果的储存库(第三部分) 1.4.1 元数据的储存库(第16章) 1.4.2 学习储存库中的元数据(第17章) 1.4.3 结束语(第18章) 参考文献 第2章 算法选择的元学习方法(一)(排序设置) 2.1 简介 2.2 不同形式的推荐 2.2.1 算法集中的最佳算法 2.2.2 最优算法子集 2.2.3 线性排序 2.2.4 准线性(弱)排序 2.2.5 不完全排序 2.2.6 在特定的预算范围内寻找最佳算法 2.3 算法选择所需的排序模型 2.3.1 以排序的形式生成元模型 2.3.2 使用排序元模型进行预测(top-n策略) 2.3.3 对建议排序的评价 2.4 实施精度与运行时间的组合测度 2.5 扩展及其他方法 2.5.1 采用平均排序法推荐工作流 2.5.2 排序可能会降低数据集专家级算法的等级 2.5.3 基于DEA多准则分析的方法 2.5.4 利用数据集的相似性来识别元数据的相关部分 2.5.5 处理不完全排序 参考文献 第3章 学习/自动机器学习(AutoML)系统评价建议 3.1 简介 3.2 基础算法的评估方法 3.2.1 泛化误差 3.2.2 评估策略 3.2.3 损失函数和损失 3.3 基础算法的性能归一化 3.4 元学习与AutoML系统的评估方法 3.4.1 留出策略下的一次通过性评估 3.4.2 采用交叉验证的元级评估 3.5 根据相关度评估推荐 3.6 评估推荐的效果 3.6.1 性能损失和损失曲线 3.6.2 用曲线下面积表征损失曲线 …… 第二部分 先进技术和方法 第三部分 组织和利用元数据 插图 |