![]()
内容推荐 本书将引领读者进入Python机器学习领域。机器学习是一套先进、深刻且内容丰富的算法集合,已成为数据科学中数据建模与分析的重要方法。Python是一款简明、高效且功能强大的开源工具,也是数据科学实践中最常用的计算机语言。学好机器学习的理论方法,掌握Python这个实用工具,是成长为数据科学人才所必需的。 本书采用理论与实践相结合的方式,理论上突出可读性并兼具知识深度和广度,实践上强调可操作性并兼具应用广泛性,对机器学习的原理部分进行了深入透彻的讲解,对机器学习的算法部分给出了Python代码,并且在各章中设置了Python编程示例。全彩呈现机器学习的数据建模可视化图例(80多幅彩图),扫描书中相应二维码即可查看。提供配套数据集、源代码、教学PPT等学习资源,登录华信教育资源网(www.hxedu.com.cn)即可免费下载。 本书可作为高等院校机器学习、数据分析等专业课程的教材,也可作为数据科学应用研究者及对Python机器学习感兴趣的数据建模与分析从业者的参考书。 作者简介 薛薇,博士,中国人民大学应用统计研究中心专职研究员,中国人民大学统计学院副教授。主要开设课程:机器学习,计量经济学,统计软件,统计学。研究方向:机器学习与深度学习算法研究。基于顾客消费行为大数据的客户终身价值统计建模,以及营销与品牌大数据的机器学习算法应用。 目录 第1章 机器学习概述 1.1 机器学习的发展:人工智能中的机器学习 1.1.1 符号主义人工智能 1.1.2 基于机器学习的人工智能 1.2 机器学习的核心:数据和数据建模 1.2.1 机器学习的对象:数据集 1.2.2 机器学习的任务:数据建模 1.3 机器学习的典型应用 1.3.1 机器学习的典型行业应用 1.3.2 机器学习在客户细分中的应用 1.3.3 机器学习在客户流失分析中的应用 1.3.4 机器学习在营销响应分析中的应用 1.3.5 机器学习在交叉销售中的应用 1.3.6 机器学习在欺诈甄别中的应用 本章总结 本章习题 第2章 Python机器学习基础 2.1 Python:机器学习的首选工具 2.2 Python的集成开发环境:Anaconda 2.2.1 Anaconda的简介 2.2.2 Anaconda Prompt的使用 2.2.3 Spyder的使用 2.2.4 Jupyter Notebook的使用 2.3 Python第三方包的引用 2.4 NumPy使用示例 2.4.1 NumPy数组的创建和访问 2.4.2 NumPy的计算功能 2.5 Pandas使用示例 2.5.1 Pandas的序列和索引 2.5.2 Pandas的数据框 2.5.3 Pandas的数据加工处理 2.6 NumPy和Pandas的综合应用:空气质量监测数据的预处理和基本分析 2.6.1 空气质量监测数据的预处理 2.6.2 空气质量监测数据的基本分析 2.7 Matplotlib的综合应用:空气质量监测数据的图形化展示 2.7.1 AQI的时间序列变化特点 2.7.2 AQI的分布特征及相关性分析 本章总结 本章相关函数列表 本章习题 第3章 数据预测与预测建模 3.1 从线性回归模型说起 3.1.1 线性回归模型的含义 3.1.2 线性回归模型的几何理解 3.1.3 线性回归模型的评价 3.1.4 Python应用实践:PM2.5浓度预测 3.2 认识线性分类模型 3.2.1 线性分类模型的含义 3.2.2 线性分类模型的几何理解 3.2.3 线性分类模型的评价 3.2.4 Python应用实践:空气质量等级预测 3.3 从线性预测模型到非线性预测模型 3.4 预测模型的参数估计 3.4.1 损失函数与有监督学习 3.4.2 参数搜索策略 3.5 预测模型的选择 3.5.1 泛化误差的估计 3.5.2 Python模拟和启示:理解泛化误差 3.5.3 预测模型过拟合问题 3.5.4 模型选择:偏差和方差 本章总结 本章相关函数列表 本章习题 第4章 数据预测建模:贝叶斯分类器 4.1 贝叶斯概率和贝叶斯法则 4.1.1 贝叶斯概率 4.1.2 贝叶斯法则 4.2 朴素贝叶斯分类器 4.2.1 从顾客行为分析角度看朴素贝叶斯分类器 4.2.2 Python模拟和启示:认识朴素贝叶斯分类器的分类边界 4.2.3 Python应用实践:空气质量等级预测 4.3 朴素贝叶斯分类器在文本分类中的应用 …… 第5章 数据预测建模:近邻分析 第6章 数据预测建模:决策树 第7章 数据预测建模:集成学习 第8章 数据预测建模:人工神经网络 第9章 数据预测建模:支持向量机 第10章 特征选择:过滤、包裹和嵌入策略 第11章 特征提取:空间变换策略 第12章 揭示数据内在结构:聚类分析 第13章 揭示数据内在结构:特色聚类 |