内容推荐 机器学习是数据科学不可或缺的重要组成部分,是数据科学人才培养的核心内容之一。本书以机器学习理论+Python编程+应用实践的“三位一体”讲解方式,引领读者进入Python机器学习领域。理论上,突出机器学习理论讲解的可读性并兼具知识的深度和广度,旨在指导Python编程调参和实践应用;Python编程上,突出以数据和问题为导向的Python学习路径,借助基于模拟数据的编程直观展示理论背后的朴素道理反刍理论理解,借助基于案例的编程完成机器学习的应用落地;应用实践上,突出案例选择的典型性、综合性和多样性,面向案例问题凸显机器学习理论的指导作用,面向案例实现提升Python编程能力。 本书提供配套数据集、Python源代码等学习资源,可作为高等院校数据科学、人工智能等相关专业的机器学习教学用书,也可作为Python 机器学习应用研究人员的参考用书。 目录 第1章 机器学习概述 1.1 机器学习的发展:人工智能中的机器学习 1.1.1 符号主义人工智能 1.1.2 基于机器学习的人工智能 1.2 机器学习中的数据 1.2.1 数据集和相关概念 1.2.2 结构化、半结构化和非结构化数据 1.3 机器学习的任务 1.3.1 数据预测 1.3.2 数据聚类 第2章 Python机器学习基础 2.1 Python机器学习的优选工具 2.2 Python的集成开发环境:Anaconda 2.2.1 Anaconda的简介 2.2.2 Anaconda Prompt的使用 2.2.3 Spyder的使用 2.2.4 Jupyter Notebook 的使用 2.3 Python第三方程序包的引用 2.4 NumPy使用示例 2.4.1 NumPy数组的创建和访问 2.4.2 NumPy的计算功能 2.5 Pandas 使用示例 2.5.1 Pandas的序列和索引 2.5.2 Pandas的数据框 2.5.3 Pandas的数据加工处理 2.6 NumPy和Pandas的综合应用:空气质量监测数据的预处理和基本分析 2.6.1 空气质量监测数据的预处理 2.6.2 空气质量监测数据的基本分析 2.7 Matplotlib的综合应用:空气质量监测数据的图形化展示 2.7.1 AQI的时序变化特点 2.7.2 AQI的分布特征及相关性分析 第3章 数据预测中的相关问题 3.1 线性回归预测模型 3.1.1 线性回归预测模型的含义 3.1.2 线性回归预测模型的几何理解 3.1.3 线性回归预测模型的评价 3.1.4 Python应用实践:PM2.5浓度预测 3.2 认识线性分类预测模型 3.2.1 线性分类模型的含义 3.2.2 线性分类模型的几何理解 3.2.3 分类预测模型的评价 3.2.4 Python应用实践:空气质量等级预测 3.3 从线性预测模型到非线性预测模型 3.4 预测模型的参数估计 3.4.1 损失函数与有监督学习 3.4.2 参数搜索策略 3.5 预测模型的选择 3.5.1 泛化误差的估计 3.5.2 Python 模拟和启示:理解泛化误差 3.5.3 预测模型的过拟合问题 3.5.4 模型选择:偏差和方差 …… 第4章 数据预测建模:贝叶斯分类器 第5章 数据预测建模:近邻分析 第6章 数据预测建模:决策树 第7章 数据预测建模:集成学习 第8章 数据预测建模:人工神经网络 第9章 数据预测建模:支持向量机 第10章 特征选择:过滤式、包裹式和嵌入式策略 第11章 特征提取:空间变换策略 第12章 揭示数据内在结构:聚类分析 |