网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | PYTHON数据分析与可视化实践 |
分类 | 教育考试-考试-计算机类 |
作者 | 孙玉林、余本国 |
出版社 | 清华大学出版社 |
下载 | |
简介 | 内容推荐 Python 数据分析与可视化实践基于 Python 语言,结合实际的数据集,介绍如何对数据进行可视化分析。Python 数据分析与可视化实践主要包含 3 个 部分。第一部分为 Python 数据可视化基础篇:主要介绍 Python 基础内容、Numpy 和 Pandas 数据操作, 以及 Matplotlib 数据可视化内容;第二部分为 Python 数据可视化提高篇:主要介绍 Python 的 Seaborn、 plotnine、Networkx、igraph、plotly、Bokeh、pyecharts 库中的数据可视化功能;第三部分为 Python 数据 可视化分析实战篇:通过 4 个完整的数据可视化分析案例,详细地介绍了 Python 中数据分析、机器学习 与可视化相结合的应用等内容。 本书为读者提供了 Notebook 形式的源程序和使用的数据集,方便读者对程序的使用和运行。本书适 合有一定数据分析或统计分析基础的读者阅读,可作为 Python 数据分析、机器学习、数据可视化的入门 及实践教材,也可供数据分析与可视化相关专业的师生,以及对数据分析与可视化感兴趣的 Python 用户 目录 目.录 第一部分.Python数据可视化基础篇 第1章.Python快速入门........................2 1.1 安装Python …………………………………………………………………………2 1.1.1 安装Anaconda ………………………………………………………………2 1.1.2 安装Python库 ………………………………………………………………5 1.2 Python的基础知识 …………………………………………………………………5 1.2.1 列表 …………………………………………………………………………6 1.2.2 元组 …………………………………………………………………………8 1.2.3 字典 …………………………………………………………………………9 1.2.4 集合 …………………………………………………………………………10 1.2.5 字符串 ………………………………………………………………………11 1.3 Python的语法结构 …………………………………………………………………12 1.3.1 条件判断语句 ………………………………………………………………12 1.3.2 循环语句 ……………………………………………………………………13 1.3.3 try/except语句 ………………………………………………………………14 1.4 Python函数 …………………………………………………………………………15 1.4.1 函数 …………………………………………………………………………15 1.4.2 lambda函数 …………………………………………………………………16 1.5 数据可视化分析 ……………………………………………………………………16 1.5.1 什么是好的数据可视化 ……………………………………………………16 1.5.2 数据可视化图像的基本类型 ………………………………………………17 1.5.3 数据可视化分析基本流程 …………………………………………………18 1.5.4 Python进行数据可视化分析的优势 ………………………………………18 1.6 本章小结 ……………………………………………………………………………19 第2章 Numpy与Pandas的数据操作和可视化.............20 2.1 Numpy数据操作 ……………………………………………………………………21 2.1.1 生成数组的方式 ……………………………………………………………21 2.1.2 数组的基础操作 ……………………………………………………………23 2.1.3 Numpy的常用函数 …………………………………………………………27 2.2 Pandas数据的生成和读取 …………………………………………………………34 2.2.1 序列和数据表的生成 ………………………………………………………34 2.2.2 数据索引 ……………………………………………………………………36 2.2.3 数据读取 ……………………………………………………………………38 2.3 Pandas数据操作 ……………………………………………………………………39 2.3.1 数据表的合并 ………………………………………………………………39 2.3.2 数据表的转换 ………………………………………………………………40 2.3.3 数据表的聚合和分组计算 …………………………………………………42 2.3.4 处理时间数据 ………………………………………………………………43 2.4 Pandas数据可视化 …………………………………………………………………44 2.4.1 Pandas的数据可视化函数 …………………………………………………45 2.4.2 Pandas数据可视化实战 ……………………………………………………45 2.5 本章小结 ……………………………………………………………………………50 第3章 Matplotlib数据可视化.....................51 3.1 Matplotlib的两种数据可视化方式 …………………………………………………52 3.1.1 类似Matlab风格的数据可视化方式 ………………………………………52 3.1.2 面向对象风格的数据可视化方式 …………………………………………53 3.1.3 设置正确显示中文的方法 …………………………………………………55 3.2 Matplotlib的图表组成元素 …………………………………………………………57 3.2.1 plot函数的使用 ………………………………………………………………58 3.2.2 设置坐标系取值范围和类型 ………………………………………………60 3.2.3 设置坐标轴刻度标签 ………………………………………………………62 3.2.4 设置网格线和参考线 ………………………………………………………63 3.2.5 添加注释和文本、使用公式、设置图例 …………………………………64 3.3 Matplotlib可视化子图 ………………………………………………………………66 3.3.1 plt.axes函数设置子图位置 …………………………………………………66 3.3.2 plt.subplot函数创建网格子图 ………………………………………………67 3.3.3 plt.subplots函数创建网格子图 ……………………………………………70 3.3.4 plt.GridSpec函数对网格进行更复杂排列 …………………………………71 3.4 Matplotlib可视化函数 ………………………………………………………………72 3.4.1 类别比较图形可视化函数 …………………………………………………72 3.4.2 数据关系图形可视化函数 …………………………………………………78 3.4.3 数据分布图形可视化函数 …………………………………………………80 3.4.4 其他图形可视化函数 ………………………………………………………83 3.5 Matplotlib可视化三维图像 …………………………………………………………88 3.5.1 三维点图和三维线图 ………………………………………………………88 3.5.2 三维等高线图 ………………………………………………………………90 3.5.3 三维曲面图和曲线图 ………………………………………………………90 3.6 本章小结 ……………………………………………………………………………91 第二部分.Python数据可视化提高篇 第4章 Python经典的静态数据可视化库.................93 4.1 Seaborn数据可视化 …………………………………………………………………93 4.1.1 关系型数据可视化函数 ……………………………………………………95 4.1.2 分布型数据可视化函数 …………………………………………………101 4.1.3 分类型数据可视化函数 …………………………………………………105 4.1.4 热力图数据可视化函数 …………………………………………………108 4.1.5 网格数据可视化 …………………………………………………………110 4.2 plotnine数据可视化 ………………………………………………………………110 4.2.1 几何图层 …………………………………………………………………111 4.2.2 图表美化 …………………………………………………………………116 4.2.3 位置调整 …………………………………………………………………118 4.2.4 图像分面与子图 …………………………………………………………120 4.3 本章小结 …………………………………………………………………………124 第5章 网络图可视化........................125 5.1 网络图的形式 ……………………………………………………………………125 5.2 Networkx网络图可视化 …………………………………………………………126 5.2.1 Networkx生成网络图 ……………………………………………………126 5.2.2 Networkx设置节点和边 …………………………………………………132 5.2.3 Networkx设置布局方式 …………………………………………………135 5.2.4 Networkx可视化复杂网络图 ……………………………………………138 5.3 igraph网络图可视化 ……………………………………………………………143 5.3.1 igraph生成并可视化网络图 ………………………………………………143 5.3.2 igraph设置节点和边 ………………………………………………………145 5.3.3 igraph设置节点的布局方式 ………………………………………………148 5.3.4 igraph可视化特定的路线 …………………………………………………149 5.4 本章小结 …………………………………………………………………………152 第6章 plotly交互式数据可视化...................153 6.1 plotly简介 …………………………………………………………………………154 6.2 plotly数值型变量数据可视化 ……………………………………………………154 6.2.1 单个数值型变量数据可视化 ……………………………………………154 6.2.2 两个数值型变量数据可视化 ……………………………………………156 6.2.3 三个数值型变量数据可视化 ……………………………………………159 6.2.4 多个连续数值型变量数据可视化 ………………………………………163 6.3 plotly分类型变量数据可视化 ……………………………………………………167 6.3.1 单个分类型变量数据可视化 ……………………………………………167 6.3.2 多个分类型变量数据可视化 ……………………………………………168 6.4 plotly数值型和分类型变量数据可视化 …………………………………………171 6.4.1 单个数值型和单个分类型变量数据可视化 ……………………………171 6.4.2 多个数值型和单个分类型变量数据可视化 ……………………………173 6.4.3 单个数值型和多个分类型变量数据可视化 ……………………………177 6.5 plotly其他类型数据可视化 ………………………………………………………180 6.5.1 可交互网络图可视化 ……………………………………………………180 6.5.2 时序数据可视化 …………………………………………………………185 6.6 本章小结 …………………………………………………………………………186 第7章 Python其他交互式数据可视化库................187 7.1 Bokeh交互式数据可视化 ………………………………………………………187 7.1.1 Bokeh的简介与设置 ……………………………………………………187 7.1.2 Bokeh数据可视化 ………………………………………………………188 7.2 pyecharts交互式数据可视化 ……………………………………………………196 7.2.1 pyecharts的简介与设置 …………………………………………………196 7.2.2 pyecharts数据可视化 ……………………………………………………198 7.3 本章小结 …………………………………………………………………………211 第三部分.Python数据可视化分析实战篇 第8章 足球运动员数据可视化分析..................213 8.1 数据清洗与预处理 ………………………………………………………………214 8.2 数据探索性可视化分析 …………………………………………………………218 8.2.1 可视化分析足球运动员年龄与价值之间的关系 ………………………219 8.2.2 可视化分析足球运动员年龄和综合评分之间的关系 …………………224 8.2.3 可视化分析联盟和俱乐部的足球运动员信息 …………………………225 8.2.4 可视化分析多个变量之间的关系 ………………………………………231 8.2.5 与球场位置相关的数据可视化分析 ……………………………………233 8.3 数据降维可视化分析 ……………………………………………………………238 8.3.1 主成分降维 ………………………………………………………………238 8.3.2 可视化主成分得分 ………………………………………………………240 8.4 数据聚类可视化分析 ……………………………………………………………242 8.4.1 寻找合适的聚类数目 ……………………………………………………242 8.4.2 K均值聚类可视化 ………………………………………………………243 8.4.3 利用主成分特征进行聚类分析 …………………………………………244 8.5 本章小结 …………………………………………………………………………247 第9章 抗乳腺癌候选药物可视化分析.................248 9.1 数据特征探索性可视化分析 ……………………………………………………251 9.1.1 药物的性质特征探索性可视化分析 ……………………………………252 9.1.2 药物的生物活性探索性可视化分析 ……………………………………254 9.1.3 药代动力学性质和安全性探索性可视化分析 …………………………257 9.2 数据特征选择 ……………………………………………………………………257 9.2.1 根据回归互信息筛选特征 ………………………………………………257 9.2.2 通过随机森林回归模型选择特征 ………………………………………259 9.3 回归模型预测生物活性 …………………………………………………………260 9.3.1 建立多元线性回归模型 …………………………………………………262 9.3.2 建立支持向量机回归模型 ………………………………………………267 9.3.3 建立GBDT回归模型 ……………………………………………………268 9.4 分类模型预测药代动力学性质和安全性 ………………………………………269 9.4.1 心脏毒性预测 ……………………………………………………………270 9.4.2 遗传毒性预测 ……………………………………………………………273 9.5 本章小结 …………………………………………………………………………277 第10章 时序数据的异常值检测和预测.................278 10.1 时序数据探索性可视化分析 ……………………………………………………279 10.1.1 时序数据的分布情况可视化分析 ………………………………………280 10.1.2 时序数据的波动情况可视化分析 ………………………………………281 10.2 异常值检测 ………………………………………………………………………284 10.2.1 ADTK检测单列时序数据的异常值 ……………………………………284 10.2.2 ADTK检测多列时序数据的异常值 ……………………………………287 10.2.3 Prophet检测单列时序数据的异常值 …………………………………289 10.2.4 基于VAR模型检测多列时序数据的异常值 …………………………291 10.3 异常值预测 ………………………………………………………………………297 10.3.1 Prophet算法检测数据中的异常值 ……………………………………297 10.3.2 提取异常值数据特征 ……………………………………………………299 10.3.3 异常值预测分类模型 ……………………………………………………301 10.3.4 数据平衡后建立分类模型 ………………………………………………303 10.4 趋势预测 …………………………………………………………………………305 10.4.1 单变量预测的SARIMA模型 …………………………………………306 10.4.2 单变量预测的Prophet模型 ……………………………………………308 10.4.3 多变量预测的VAR模型 ………………………………………………310 10.5 本章小结 …………………………………………………………………………312 第11章 中药材鉴别数据可视化分析..................313 11.1 无监督学习算法鉴别中药材类别 ………………………………………………314 11.1.1 数据特征探索性可视化分析 ……………………………………………315 11.1.2 使用数据原始的特征进行聚类 …………………………………………317 11.1.3 使用数据降维后的特征进行聚类 ………………………………………320 11.2 有监督学习算法鉴别中药材产地 ………………………………………………324 11.2.1 不同产地的中药材特征可视化分析 ……………………………………325 11.2.2 利用选择的特征进行分类 ………………………………………………325 11.3 半监督学习算法鉴别中药材类别 ………………………………………………330 11.3.1 数据预处理和可视化分析 ………………………………………………330 11.3.2 数据主成分降维 …………………………………………………………332 11.3.3 使用标签传播算法进行分类 ……………………………………………334 11.3.4 半监督学习分类——利用SelfTrainingClassi.er ………………………336 11.4 本章小结 …………………………………………………………………………338 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。