![]()
内容推荐 本书共分为两大部分:第一部分为数据分析与挖掘,包括第1~15章,介绍了数据分析与挖掘简介、爬虫、Scrapy爬虫框架、NumPy基本用法、Pandas基本用法、Matplotlib基本用法、各种常用的回归和分类模型等;第二部分为机器学习,包括第16~19章,介绍了主成分分析法、集成学习、模型评估和初识深度学习框架Ke,-as。本书从初学者的角度进行编写,易于理解,内容比较全面。本书注重实践,书中的每个知识点都有相应的Python实现代码和案例。 本书是一本针对爱好数据分析与挖掘、机器学习等相关知识的读者而编写的基础教程,尤其适用于全国高等学校的教师、在读学生及相关领域的爱好者。 目录 第一部分 数据分析与挖掘 第1章 数据分析与挖掘简介 1.1 Python数据分析和挖掘任务中重要的库与工具 1.1.1 NumPy 1.1.2 SciPy 1.1.3 Pandas 1.1.4 Matplotlib 1.1.5 Jupyter Notebook 1.1.6 Seikit-learn 1.2 Anaconda安装 1.3 Jupyter Notebook 第2章 爬虫 2.1 爬虫的基本流程 2.2 HTTP 2.3 安装PyCharm 2.4 应用举例 习题 第3章 Scrapy爬虫框架 3.1 基本原理 3.2 应用举例 习题 第4章 NumPy基本用法 4.1 NumPy创建数组 4.1.1 使用np.array()由Python列表创建 4.1.2 使用np的方法创建 4.2 NumPy查看数组属性 4.3 数组的基本操作 4.4 NumPy运算 4.5 排序 习题 第5章 Pandas基本用法 5.1 Series 5.2 DataFrame 5.2.1 创建DataFrame对象 5.2.2 查看DataFrame对象 5.2.3 DataFrame对象的索引与切片 5.3 应用举例 5.3.1 数据读取 5.3.2 数据清洗 5.3.3 数据规整 习题 第6章 Matplotlib基本用法 6.1 线型图 6.2 散点图 6.3 直方图 6.4 条形图 6.5 饼图 6.6 Seaborn 6.6.1 Seaborn基本操作 6.6.2 Seaborn绘制的图 6.6.3 Seaborn用法示例 6.7 Pandas中的绘图函数 习题 第7章 线性回归、岭回归、Lasso回归 7.1 原理 7.1.1 普通线性回归 7.1.2 岭回归 7.1.3 Lasso回归 7.2 应用举例 习题 第8章 Logistic回归分类模型 8.1 原理 8.1.1 模型简介 8.1.2 ROC曲线和AUC 8.1.3 梯度下降法 8.1.4 Scikit-learn中predict()与predict_proba()用法区别 8.2 应用举例 习题 第9章 决策树与随机森林 9.1 原理 9.1.1 决策树 9.1.2 随机森林 9.2 应用举例 习题 第10章 KNN模型 10.1 原理 10.2 应用举例 习题 第11章 朴素贝叶斯模型 11.1 原理 11.1.1 贝叶斯定理 11.1.2 朴素贝叶斯 11.1.3 Scikit-learn中三种不同类型的朴素贝叶斯模型 11.2 应用举例 习题 第12章 SVM模型 12.1 原理 12.2 应用举例 习题 第13章 K-means聚类 13.1 原理 13.2 应用举例 习题 第14章 关联规则——Apriori算法 14.1 原理 14.2 应用举例 习题 第15章 数据分析与挖掘项目实战 15.1 贷款预测问题 15.1.1 数据导入及查看 15.1.2 数据预处理 15.1.3 建立预测模型 15.2 客户流失率问题 15.2.1 数据导入及查看 15.2.2 数据预处理 15.2.3 建立预测模型 习题 第二部分 机器学习 第16章 主成分分析法 16.1 原理 16.2 应用举例 习题 第17章 集成学习 17.1 原理 17.2 应用举例 习题 第18章 模型评估 18.1 分类评估 18.2 回归评估 18.3 聚类评估 18.4 Seikit-learn中的评估函数 第19章 初识深度学习框架Keras 19.1 关于Keras 19.2 神经网络简介 19.3 Keras神经网络模型 19.4 用Keras实现线性回归模型 19.5 用Keras实现鸢尾花分类 19.6 Keras目标函数、性能评估函数、激活函数说明 习题 参考文献 |