内容推荐 本书由基础理论和应用实践两大部分组成,书中分析了计算学习理论及PAC可学习框架,剖析了PAC-Bayes理论的内涵,并在阐述统计学习理论和支持向量机基本原理的基础上,论述了PAC-Bayes边界应用于支持向量机算法的相关推论。书中讨论了结合再生核希尔伯特空间和马尔科夫链蒙特卡洛方法,实现PAC-Bayes边界的计算。同时,介绍了目前各种机器学习算法上的PAC-Bayes泛化误差边界,以及PAC-Bayes理论在机器学习中的各种应用。最后,将机器学习算法与PAC-Bayes理论运用于Web文档评价、蛋白质预测、空气质量预测、京津冀一体化研究、高校科研人才评价、中国货币供应量等研究实例中。 本书具有较强的理论性和系统性,对重要的理论和方法进行了分析;同时具有较强的逻辑性,突出重点,条理清晰,由浅入深,从理论到实践。本书剖析了算法实现,给出了实验设计与结果,具有较强的实践特色。 本书可以作为计算机、信息科学等相关专业高年级本科生和研究生的参考书或教材,也可以作为教师、科研人员和相关培训机构的参考书。本书定位于希望快速学习机器学习,人工智能,模式识别,计算学习理论的初、中级用户和自学者。同时,本书对于机器学习、人工智能、模式识别等领域的研发人员也具有很好的参考价值。 目录 上篇 基础理论 第1章 机器学习及模型评估 1.1 机器学习概述 1.2 机器学习的模型评估 1.2.1 模型评估的性能度量指标 1.2.2 数据集的划分方法 1.2.3 机器学习算法的泛化能力 1.3 小结 第2章 计算学习理论与PAC—Bayes理论 2.1 计算学习理论 2.1.1 计算学习理论中的常用模型 2.1.2 VC维 2.2 PAC学习模型与Bayes学习 2.2.1 PAC学习模型的基本概念 2.2.2 PAc学习模型的样本复杂度 2.2.3 贝叶斯学习 2.2.4 PAC理论与贝叶斯学习的评价 2.3 PAC-Bayes理论 2.3.1 PAC-Bayesian定理 2.3.2 PAC-Bayes边界定理 2.4 小结 第3章 统计学习理论与SVM 3.1 统计学习理论 3.1.1 统计学习理论概述 3.1.2 结构风险最小化原则 3.2 支持向量机原理 3.2.1 最大间隔算法 3.2.2 软间隔算法 3.2.3 核算法 3.3 支持向量机上的PAC-Bayes理论 3.4 小结 第4章 机器学习算法的PAC—Bayes理论评价 4.1 监督学习算法的PAC-Bayes理论评价 4.2 无监督学习算法的PAC—Bayes理论评价 4.3 半监督学习算法的PAC—Bayes理论评价 4.4 其他学习算法的PAC-Bayes理论评价 4.5 小结 第5章 再生核希尔伯特空间与采样 5.1 PAGBayes边界在应用和计算中的问题 5.2 再生核希尔伯特空间的构造 5.2.1 再生核希尔伯特空间的概念 5.2.2 概念空间构造 5.3 采样方法 5.3.1 随机采样 5.3.2 MCMC采样 5.4 小结 第6章 基于MCMC方法的PAC—Bayes理论实现 6.1 基于MCMC方法的PAC-Bayes算法实现 6.1.1 MCMC方法的算法实现 6.1.2 MCMC方法的收敛性 6.1.3 KL相对熵的算法实现 6.1.4 基于MCMC方法的PAC—Bayes理论的算法实现 6.1.5 基于MCMC方法的PAC—Bayes实验结果与分析 6.1.6 MCMC优化的算法实现 6.1.7 MCMC优化方法的PAC—Bayes实验结果与分析 6.2 基于改进MCMC方法的PAC—Bayes理论实现 6.2.1 改进的MCMC方法理论分析 6.2.2 核密度估计方法 6.2.3 基于改进MCMC方法的PAC-Bayes理论算法实现 6.2.4 基于改进MCMC方法的PAC-Bayes实验结果与分析 6.3 综合对比实验 6.3.1 实验设计及实现 6.3.2 综合对比实验结果与分析 6.4 小结 下篇 应用实践 第7章 PAC-Bayes理论的应用 7.1 PAC-Bayes理论指导模型选择和性能评价 7.2 利用PAC-Bayes边界推导更紧的风险边界 7.3 PAC—Bayes边界指导设计新的学习算法 7.4 PAC-Bayes边界的计算问题 7.5 非独立同分布数据的PADBayes边界分析 7.6 小结 第8章 PAC—Bayes理论应用于SVM算法评价 8.1 PAC-Bayes理论评价SVM算法的泛化性能 8.1.1 评价泛化性能的算法实现 8.1.2 实验设计 8.1.3 实验结果与分析 8.2 PAC-Bayes理论应用于SVM的模型选择 8.2.1 SVM模型选择的理论分析 8.2.2 实验设计 8.2.3 实验结果与分析 8.3 PAC—Bayes理论与交叉验证方法 8.3.1 实验设计 8.3.2 实验结果与分析 8.4 小结 第9章 SVM及PAC—Bayes理论在web文档上的应用 9.1 Web文档的研究现状 9.2 理论分析 9.2.1 建立模型 9.2.2 特征提取 9.2.3 性能度量 9.2.4 算法实现 9.3 实验结果与分析 9.3.1 五折交叉验证方法的实验结果及分析 9.3.2 核函数的实验结果及分析 9.3.3 模型选择的实验结果及分析 9.3.4 开放测试和封闭测试的实验结果及分析 9.4 小结 第10章 SVM及PAC—Bayes理论在蛋白质预测上的应用 10.1 蛋白质结构的研究现状 10.2 理论分析 10.3 实验结果与分析 10.4 小结 第11章 机器学习算法在空气质量上的应用 11.1 空气质量预测的研究现状 11.2 京津冀空气质量的理论分析 11.3 京津冀空气质量的实验结果与分析 11.3.1 基于SVM与回归分析的京津冀空气质量研究 11.3.2 基于SVM算法的京津冀2017年空气质量预测研究 11.4 全国空气质量的理论分析 11.5 全国空气质量的实验结果与分析 11.5.1 基于K—Means聚类算法的全国空气质量研究 11.5.2 每月聚类结果与分析 11.6 小结 第12章 Bayes算法在京津冀一体化研究上的应用 12.1 研究现状 12.2 理论分析 12.2.1 京津冀区域一体化程度分析 12.2.2 贝叶斯定理 12.2.3 朴素贝叶斯分类算法 12.2.4 基于朴素贝叶斯算法的京津冀一体化程度预测 12.3 算法实现与实验结果 12.3.1 朴素贝叶斯算法实现及实验结果 12.3.2 朴素贝叶斯算法的不足 12.3.3 朴素贝叶斯算法的改进 12.4 小结 第13章 SVM算法在高校科研人才评价上的应用 13.1 高校科研人才评价的研究现状 13.2 理论分析与 |