网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | PYTHON数据挖掘与机器学习实战:机器学习与数据挖掘十大经典案例 |
分类 | 科学技术-工业科技-机械工业 |
作者 | 方巍 |
出版社 | 机械工业出版社 |
下载 | |
简介 | 目录 前言章 机器学习基础11.1 机器学习概述21.2 机器学习的发展历程21.3 机器学习分类31.3.1 监督学习31.3.2 无监督学习31.3.3 强化学习41.3.4 深度学习41.4 机器学习的应用41.5 开发机器学习的步骤71.6 Python语言的优势81.6.1 可执行伪代码81.6.2 Python语言使用广泛81.6.3 Python语言特色81.6.4 Python语言的缺点91.7 Python开发工具介绍91.7.1 IDLE简介101.7.2 IPython简介111.7.3 PyCharm简介111.7.4 Jupyter Notebook简介121.7.5 Anaconda和Spyder简介131.8 本章小结15第2章 Python语言简介162.1 搭建Python开发环境162.1.1 安装Anaconda162.1.2 安装Spyder182.1.3 运行和保存Python程序192.2 Python计算与变量192.2.1 用Python做简单的计算202.2.2 Python的运算符202.2.3 Python的变量212.3 Python的字符串222.4 Python的列表232.5 Python的元组252.6 Python的字典272.7 网络爬虫的发展历史和分类282.7.1 网络爬虫的发展历史282.7.2 网络爬虫的分类302.8 网络爬虫的原理302.8.1 理论概述302.8.2 爬虫的工作流程312.9 爬虫框架介绍362.9.1 Scrapy介绍362.9.2 XPath介绍392.10 网络爬虫的设计与实现402.10.1 网络爬虫的总体设计402.10.2 具体实现过程402.10.3 爬虫结果与分析452.11 本章小结49第3章 回归分析503.1 回归分析概述503.1.1 基本概念503.1.2 可以解决的问题513.1.3 回归分析的步骤513.2 线性回归513.2.1 简单线性回归分析513.2.2 多元线性回归分析523.2.3 非线性回归数据分析523.3 用Python实现一元线性回归533.4 用Python实现多元线性回归563.4.1 使用pandas读取数据563.4.2 分析数据573.4.3 线性回归模型583.5 基于线性回归的股票预测623.5.1 数据获取623.5.2 数据预处理633.5.3 编码实现643.5.4 结果分析653.6 逻辑回归663.6.1 构造预测函数673.6.2 构造损失函数J683.6.3 梯度下降法求解最小值693.7 基于逻辑回归的环境数据检测713.7.1 数据来源713.7.2 数据处理723.7.3 异常数据分析723.7.4 数据预测743.8 本章小结76第4章 决策树与随机森林774.1 决策树774.1.1 决策树的基本原理774.1.2 决策树的分类784.1.3 决策树的优缺点814.2 使用决策树对鸢尾花分类824.2.1 Iris数据集简介824.2.2 读取数据834.2.3 鸢尾花类别834.2.4 数据可视化844.2.5 训练和分类854.2.6 数据集多类分类864.2.7 实验结果864.3 随机森林874.3.1 随机森林的基本原理874.3.2 随机森林的收敛性884.3.3 随机森林的OOB估计894.3.4 随机森林的随机特征选取894.3.5 随机森林的优缺点904.4 葡萄酒数据集的随机森林分类914.4.1 数据收集914.4.2 相关库函数简介924.4.3 数据基本分析934.4.4 使用随机森林构建模型974.4.5 实验结果984.5 本章小结99第5章 支持向量机1005.1 SVM的工作原理及分类1005.1.1 支持向量机的原理1005.1.2 线性可分的支持向量机1015.1.3 非线性可分的支持向量机1025.2 核函数1035.2.1 核函数简介1035.2.2 几种常见的核函数1045.2.3 核函数如何处理非线性数据1045.2.4 如何选择合适的核函数1055.3 SVR简介1065.3.1 SVR原理1065.3.2 SVR模型1065.4 时间序列曲线预测1075.4.1 生成训练数据集1075.4.2 运用不同的核函数进行支持向量回归1085.4.3 生成测试数据集1095.4.4 预测并生成图表1105.4.5 获取预测误差1115.4.6 创建数据集1125.4.7 选取最优参数1125.4.8 预测并生成图表1125.4.9 获取预测误差1135.5 本章小结114第6章 隐马尔可夫模型1156.1 隐马尔可夫模型简介1156.1.1 隐马尔可夫模型的概念1156.1.2 详例描述1166.1.3 HMM流程1176.2 Viterbi算法1176.3 HMM模型用于中文分词1196.3.1 UI界面1196.3.2 数据及其编码1196.3.3 HMM模型1216.3.4 实验结果1226.4 本章小结124第7章 BP神经网络模型1257.1 背景介绍1257.2 结构特点1267.3 网络模型1267.4 人工神经网络简介1277.4.1 神经元1277.4.2 单层神经网络1287.4.3 双层神经网络1297.4.4 多层神经网络1307.5 BP神经网络1317.6 通过TensorFlow实现BP神经网络1327.7 本章小结134第8章 卷积神经网络1358.1 传统图像识别技术1358.1.1 图像预处理1358.1.2 图像特征提取1368.1.3 图像分类方法1368.2 卷积神经网络结构简介1378.2.1 卷积神经网络发展历程1378.2.2 卷积神经网络结构简介1378.3 卷积神经网络的结构及原理1398.3.1 卷积层1398.3.2 池化层1408.3.3 激活函数1428.3.4 全连接层1448.3.5 反馈运算1448.4 卷积神经网络的优点1468.5 雷达剖面图识别模型1488.5.1 数据准备1488.5.2 构建模型1508.6 模型测试分析1578.6.1 部署基本模块1578.6.2 创建项目结构1578.6.3 训练网络1588.6.4 自动化测试1588.7 本章小结160第9章 循环神经网络1619.1 自然语言处理1619.1.1 自然语言处理概述1619.1.2 自然语言处理应用1629.2 对话系统1639.2.1 对话系统分类1639.2.2 聊天机器人分类1649.3 基于LSTM结构的循环神经网络1659.3.1 循环神经网络1659.3.2 通过时间反向传播1669.3.3 长短期记忆网络(LSTM)1699.4 Seq2Seq模型1729.4.1 Encoder-Decoder框架1739.4.2 Attention机制1749.5 聊天机器人的程序实现1769.5.1 准备数据1769.5.2 创建模型1789.5.3 训练模型1799.5.4 测试模型1809.6 本章小结1810章 聚类与集成算法18210.1 聚类方法简介18210.1.1 聚类定义18310.1.2 聚类要求18310.2 聚类算法18410.2.1 划分方法18410.2.2 层次方法18410.2.3 基于密度的方法18410.2.4 基于网格的方法18510.2.5 基于模型的方法18510.3 K-Means算法18510.3.1 K-Means算法概述18510.3.2 K-Means算法流程18510.3.3 K-Means算法实现18610.3.4 实验结果及分析18810.3.5 K-Means算法存在的问题18810.4 K-Means++算法18910.4.1 K-Means++的基本思想18910.4.2 K-Means++的数学描述19010.4.3 K-Means++算法流程19010.5 K-Means++的实现19110.5.1 数据集19110.5.2 代码实现19210.5.3 K-Means++实验结果19310.6 Adaboost集成算法的原理19410.6.1 Boosting算法的基本原理19410.6.2 Adaboost算法介绍19510.6.3 Adaboost分类问题的损失函数优化19710.6.4 Adaboost二元分类问题的算法流程19810.6.5 Adaboost回归问题的算法流程19910.6.6 Adaboost算法的正则化20010.6.7 Adaboost的优缺点20010.7 Adaboost算法实现20110.7.1 数据集处理20110.7.2 实现过程20110.7.3 实验结果分析20610.8 本章小结2081章 其他机器学习算法20911.1 贝叶斯分类器21011.1.1 概率基础知识21011.1.2 贝叶斯决策准则21111.1.3 极大似然估计21211.2 贝叶斯分类模型21311.2.1 朴素贝叶斯分类模型21311.2.2 半朴素贝叶斯分类模型21611.2.3 贝叶斯网络分类模型21711.3 朴素贝叶斯分类器在破产预测中的应用21911.3.1 数据集21911.3.2 训练多项式朴素贝叶斯模型22011.4 在线学习22211.4.1 线性模型的在线学习22211.4.2 非线性模型的在线学习22411.5 Bandit在线学习算法22511.5.1 Bandit算法与推荐系统22611.5.2 常用Bandit算法22611.6 Bandit算法原理及实现22811.7 GAN网络22911.7.1 GAN产生的背景23011.7.2 模型结构23011.7.3 GAN的实现原理23211.8 DCGAN网络23611.8.1 模型结构23611.8.2 反卷积23711.9 DCGAN人脸生成24011.9.1 实验准备24011.9.2 关键模块的实现24011.9.3 实验结果展示24311.10 本章小结245附录A 机器学习常见面试题246附录B 数学基础257B.1 常用符号257B.2 数学基础知识259B.2.1 线性代数259B.2.2 概率论261B.2.3 信息论262参考文献264 内容推荐 本书作为数据挖掘入门读物,基于真实数据集进行案例实战,使用Python数据科学库,从数据预处理开始一步步介绍数据建模和数据挖掘的过程。主要介绍了数据挖掘的基础知识、基本工具和实践方法,通过循序渐进地讲解算法,带领读者轻松踏上数据挖掘之旅。本书采用理论与实践相结合的方式,呈现了如何使用逻辑回归进行环境数据检测,如何使用HMM进行中文分词,如何利用卷积神经网络识别雷达剖面图,如何使用循环神经网络构建聊天机器人,如何使用朴素贝叶斯算法进行破产预测,如何使用DCGAN网络进行人脸生成等。本书也涉及神经网络、在线学习、强化学习、深度学习、大数据处理等内容。 本书适合对传统数据挖掘和机器学习算法开发感兴趣的读者阅读,也适合需要系统掌握深度学习的开发人员阅读。 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。