内容推荐 本书通过对大量实际案例的分析以及部分相关理论的适当解读,帮助读者使用Python语言进行程序设计,同时能够利用Python语言实现基础的机器学习算法。 全书包含三大部分:机器学习概念和编程基础、数据预处理基础、机器学习方法及案例,每一部分都结合大量实际例程进行解读。本书共13章,具体内容包括机器学习概述、Python机器学习基础库、数据预处理、K近邻算法、朴素贝叶斯、决策树、随机森林、AdaBoost模型、支持向量机、人工神经网络、K均值聚类、财政收入影响因素分析及预测案例、偷税漏税行为识别分析案例。书末给出两个附录,分别为Python的安装与环境配置和Python开发工具的安装。 本书适合作为电子信息类专业的教材,希望学习机器学习技术的读者均可使用。学习本书需要具备Python程序设计基础知识。 本书免费提供书中程序代码和部分数据集、PPT及部分案例讲解视频、Python的安装与环境配置、Python开发工具的安装等资源,需要的读者可以扫描扉页二维码或从出版社网站查看。 作者简介 郭奕,工学博士,2013年毕业于电子科技大学,现就职于西华大学电气与电子信息学院,同时兼任成都纬视科技有限公司技术研发总工程师。目前主要研究内容为智慧家园、数字标牌、物联网等。在学校主要负责计算机通信网络、移动互联网技术、大数据与云计算等课程的教学和科研工作。 目录 第1章 机器学习概述 1.1 什么是机器学习 1.2 机器学习的应用 1.2.1 图像和计算机视觉 1.2.2 日常生活及消费 1.2.3 金融领域 1.2.4 医疗领域 1.2.5 自然语言处理 1.2.6 安全和异常行为监测 1.2.7 工业和商业领域 1.2.8 娱乐领域 1.3 机器学习的主要研究内容 1.4 机器学习问题的常规处理方法 1.4.1 开发机器学习应用的一般步骤 1.4.2 选择合适的算法 1.4.3 使用Python开发机器学习应用 1.4.4 机器学习模型的评价 1.5 机器学习、模式识别、数据挖掘和人工智能的关系 本章小结 思考题 第2章 Python机器学习基础库 2.1 Numpy 2.1.1 Numpy库的安装 2.1.2 Numpy库的导入 2.1.3 创建数组 2.1.4 查询数组类型 2.1.5 数组的其他创建方式 2.1.6 数组元素的存取 2.1.7 ufunc运算 2.1.8 矩阵的运算 2.2 Pandas 2.2.1 Pandas的安装 2.2.2 Pandas的导入 2.2.3 Series 2.2.4 DataFrame 2.3 Matplotlib 2.3.1 Matplotlib的安装 2.3.2 Matplotlib的导入 2.3.3 基本绘图命令plot 2.3.4 绘制多窗口图形 2.3.5 文本注释 2.4 Scipy 2.4.1 Scipy的安装 2.4.2 Scipy的导入 2.4.3 最小二乘法 2.4.4 非线性方程求解 2.5 Scikit-Learn 2.5.1 Scikit-Learn的安装 2.5.2 Scikit-Learn的数据集 2.6 TensorFlow 2.6.1 TensorFlow的安装 2.6.2 TensorFlow的使用 2.7 PyTorch 2.8 PaddlePaddle 本章小结 思考题 第3章 数据预处理 3.1 数据预处理概述 3.2 数据预分析 3.2.1 统计特性分析 3.2.2 数据质量分析 3.3 数据清理 3.3.1 异常值处理 3.3.2 缺失值处理 3.4 数据集成 3.4.1 实体识别 3.4.2 冗余属性识别 3.5 数据变换 3.5.1 简单函数变换 3.5.2 归一化 3.5.3 连续属性离散化 3.6 数据规约 3.6.1 属性规约 3.6.2 数值规约 3.7 Python的主要数据预处理函数 本章小结 思考题 第4章 K近邻算法 4.1 模型介绍 4.1.1 算法概述 4.1.2 算法基本原理 4.1.3 算法实现代码 4.2 案例一 约会网站配对 4.2.1 问题介绍 4.2.2 数据准备 4.2.3 算法实现 4.2.4 算法测试 4.2.5 算法应用 4.3 案例二 手写数字识别 4.3.1 问题介绍 4.3.2 数据准备 4.3.3 算法实现 4.4 案例三 鸢尾花品种识别 4.4.1 问题介绍 4.4.2 数据准备 4.4.3 算法实现 本章小结 思考题 第5章 朴素贝叶斯 5.1 模型介绍 5.1.1 贝叶斯决策理论基础 5.1.2 使用朴素贝叶斯进行分类 5.1.3 朴素贝叶斯分类器的特点 5.2 案例四 社区留言板文本分类 5.2.1 案例介绍 5.2.2 数据准备 5.2.3 概率计算 5.2.4 算法改进 5.2.5 改进后的朴素贝叶斯分类器应用 5.3 案例五 旧金山犯罪分类预测 5.3.1 案例介绍 5.3.2 数据准备 5.3.3 模型实现 本章小结 思考题 第6章 决策树 6.1 模型介绍 6.1.1 决策树概述 6.1.2 决策树数学基础 6.1.3 决策树算法 6.2 案例六 鱼类和非鱼类判定 6.2.1 案例介绍 6.2.2 案例实现 6.3 案例七 贷款权限判定 6.3.1 案例介绍 6.3.2 案例实现 本章小结 思考题 第7章 随机森林 7.1 模型介绍 7.1.1 随机森林的历史 7.1.2 随机森林原理 7.1.3 构建随机森林 7.1.4 随机森林模型的性能评估 7.1.5 随机森林的应用 7.1.6 随机森林的Python常用库 7.2 案例八 声呐信号分类 7.2.1 案例介绍 7.2.2 案例实现 7.3 案例九 泰坦尼克号幸存者预测 7.3.1 案例介绍 7.3.2 案例实现 本章小结 思考题 第8章 AdaBoost模型 8.1 模型介绍 8.1.1 AdaBoost原理 8.1.2 AdaBoost的算法流程 8.1.3 AdaBoost的Python常用库 8.2 案例十 马疝病预测 8.2.1 案例介绍 8.2.3 案例实现 8.3 案例十一 学生课程成绩预测 8.3.1 案例介绍 8.3.2 案例实现 本章小结 思考题 第9章 支持向量机 9.1 线性支持向量机 9.1.1 间隔与支持向量 9.1.2 对偶问题 9.1.3 SMO算法 9.2 非线性分类 9.2.1 核函数概述 9.2.2 高斯径向基核函数 9.3 案例十二 手写数字识别 本章小结 思考题 第10章 人工神经网络 10.1 从感知机到多层感知机 10.1.1 神经元和感知机 10.1.2 多层感知机 10.2 激活函数和损失 |