网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | Python数据分析 |
分类 | 教育考试-考试-计算机类 |
作者 | 江雪松,邹静 编 |
出版社 | 清华大学出版社 |
下载 | |
简介 | 内容推荐 这是一个数据驱动的时代,如何解读数据,将数据转变为知识、利用知识做出决策将是所有企业必不可少的能力。在数据分析过程中我们清洗数据,探索数据,利用数据进行决策。本书将以当前z流行数据科学分析工具Python为基础介绍如何构建基于Python的数据科学环境,利用Pandas处理与分析数据,如何利用Matplotlib以及Seaborn进行数据可视化。同时本书还将以商业应用为目标,通过学习还将掌握何利用学习到的Python数据分析知识来完成客户留存分析,同期群分析,时间序列分析,产品销售数据的关联分析,客户聚类,统计检验等数据分析。 目录 上篇Pandas数据分析基础 章数据分析初探 1.1“数据+”时代的到来 1.2什么是数据分析 1.2.1数据分析的目标 1.2.2数据分析分类 1.2.3典型的数据分析方法 1.3数据分析的基本流程 1.3.1问题定义 1.3.2收集数据 1.3.3数据处理 1.3.4数据分析 1.3.5结果解读与应用 1.4硝烟中的数据分析 1.4.1数据分析的产生 1.4.2验证问题 1.4.3寻找原因 1.4.4数据怎么说 1.4.5数据分析中应该避免的典型问题 第2章搭建数据科学开发环境 2.1为什么选择Python 2.1.1人生苦短,我用Python 2.1.2为何Python是数据科学家的最佳选择 2.2Python数据科学开发栈 2.2.1Cython 2.2.2NumPy 2.2.3IPython 2.2.4Jupyter 2.2.5SciPy 2.2.6Matplotlib 2.2.7Pandas 2.2.8Scikitlearn 2.2.9NetworkX 2.2.10PyMC3 2.2.11数据科学领域中最新的一些Python包 2.3Anaconda的安装与使用 2.3.1安装Anaconda 2.3.2利用Conda管理Python环境 2.3.3利用Conda管理Python包 2.3.4安装本书所需的包 2.4使用JupyterNotebook进行可重复数据分析 2.4.1JupyterNotebook的配置 2.4.2JupyterNotebook中的单元格 2.4.3JupyterNotebook中的命令模式与编辑模式键 2.4.4使用JupyterNotebook进行数据分析 第3章Pandas基础 3.1什么是DataFrame 3.1.1DataFrame的基本要素 3.1.2数据类型 3.1.3了解Series 3.1.4链式方法 3.2索引与列 3.2.1修改索引与列 3.2.2添加、修改或删除列 3.3选择多列 第4章数据筛选 4.1使用.loc和.iloc筛选行与列数据 4.1.1选择Series和DataFrame中的行 4.1.2同时选择行与列 4.2布尔选择 4.2.1计算布尔值 4.2.2多条件筛选数据 第5章开始利用Pandas进行数据分析 5.1了解元数据 5.2数据类型转换 5.3缺失数据与异常数据处理 5.3.1缺失值与重复值 5.3.2处理缺失数据 5.3.3NumPy与Pandas对缺失数据的不同处理方式 5.3.4填充缺失值 5.4处理重复数据 5.5异常值 5.6描述性统计 第6章数据整理 6.1什么是数据整理 6.1.1数据的语义 6.1.2整齐的数据 6.2数据整理实战 6.2.1列标题是值,而非变量名 6.2.2多个变量存储在一列中 6.2.3变量既在列中存储,又在行中存储 6.2.4多个观测单元存储在同一表中 6.2.5一个观测单元存储在多个表中 6.2.6思考 第7章分组统计 7.1分组、应用和聚合 7.2Pandas中的GroupBy操作 7.2.1单列数据分组统计 7.2.2多列数据分组统计 7.2.3使用自定义函数进行分组统计 7.2.4数据过滤与变换 第8章数据整合 8.1数据读入 8.1.1基本数据读入方法 8.1.2文件读取进阶 8.1.3读取其他格式文件 8.2数据合并 8.2.1认识merge操作 8.2.2merge进阶 8.2.3join与concat 第9章数据可视化 9.1Matplotlib 9.1.1绘制个散点图 9.1.2理解figure与axes 9.1.3Matplotlib中面向对象与类Matlab语法的区别 9.1.4修改坐标轴属性 9.1.5修改图形属性 9.1.6定制图例,添加标注 9.1.7子图 9.1.8利用Matplotlib绘制各种图形 9.2Pandas绘图 9.2.1Pandas基础绘图 9.2.2整合Pandas绘图与Matplotlib绘图 9.3Seaborn 9.3.1Seaborn中的样式 9.3.2Seaborn绘制统计图形 9.4可视化进阶 9.4.1其他可视化工具 9.4.2推荐读物 0章探索性数据分析——某电商销售数据分析 10.1数据清洗 10.1.1分析准备 10.1.2了解数据 10.2数据清洗与整理 10.2.1数据类型转换与错误数据删除 10.2.2添加新数据 10.3探索性数据分析 10.3.1客户分析 10.3.2订单趋势分析 10.3.3客户国家分析 10.3.4留给读者的问题 下篇Python数据分析实战 1章群组分析 11.1群组分析概述 11.1.1从AARRR到RARRA的转变 11.1.2什么是群组分析 11.2群组分析实战 11.2.1定义群组以及周期 11.2.2群组分析具体过程 11.2.3思考 2章利用RFM分析对用户进行分类 12.1RFM分析简介 12.1.1RFM模型概述 12.1.2理解RFM 12.2RFM实战 12.2.1R、F、M值的计算 12.2.2利用RFM模型对客户进行细分 12.2.3思考 3章购物篮分析 13.1购物篮分析概述 13.1.1什么是购物篮分析 13.1.2购物篮分析在超市中的应用 13.1.3购物篮分析实现 13.2购物篮分析案例 13.2.1Mlxtend库中Apriori算法使用介绍 13.2.2在线销售数据购物篮分析 13.3留给读者的思考 4章概率分布 14.1随机数 14.2常见的概率分布 14.2.1均匀分布 14.2.2正态分布 14.2.3二项分布 14.2.4泊松分布 14.2.5几何分布与指数分布 14.3点估计与置信区间 14.3.1点估计 14.3.2抽样分布与中心极限定理 14.3.3置信区间 14.4留给读者的思考 5章假设检验 15.1假设检验概述 15.1.1初识假设检验 15.1.2假设检验的步骤 15.1.3假设检验中的Ⅰ类错误与Ⅱ类错误 15.2Python中的假设检验 15.2.1单样本ttest 15.2.2双样本ttest 15.2.3配对ttest 15.2.4卡方检验 15.3留给读者的思考 6章一名数据分析师的游戏上线之旅 16.1游戏启动时间是否超过目标 16.1.1启动时间是否超过3秒 16.1.2构造启动时间监测图 16.2次日留存率是否大于30% 16.3应该在游戏第几关加入关联微信提示 16.3.1A/B测试 16.3.2贝叶斯解决方案 16.4如何定价 16.5留给读者的思考 7章利用数据分析找工作 17.1设定分析目标 17.1.1问题定义 17.1.2获取数据 17.2准备分析数据 17.2.1数据准备 17.2.2数据清洗 17.3开始数据分析 17.3.1职位来自哪里 17.3.2职位薪酬如何 17.3.3岗位要求 17.3.4思考 8章用数据解读成都房价 18.1设定分析目标 18.1.1问题定义 18.1.2获取数据 18.2解读成都二手房 18.2.1数据准备 18.2.2列名调整 18.2.3数据类型转换 18.2.4数据解读 18.2.5思考 9章时间序列分析 19.1认识时间序列数据 19.1.1读入时间序列数据 19.1.2时间序列数据的可视化 19.2时间序列数据的分解 19.2.1认识时间序列数据中的模式 19.2.2Python中进行时间序列数据的分解 19.3时间序列的平稳性 19.3.1认识平稳与非平稳时间序列 19.3.2如何让时间序列平稳 19.4利用ARIMA模型分析家具销售 19.4.1ARIMA模型简介 19.4.2数据准备 19.4.3ARIMA模型中的参数 19.5留给读者的思考 第20章股票数据分析 20.1股票收益分析 20.1.1获取股票数据 20.1.2计算每日收益 20.1.3多只股票收益比较 20.1.4股价相关性分析 20.2CAPM资产定价模型选股 20.2.1CAPM公式 20.2.2在Python中实现CAPM 20.3留给读者的思考 第21章大规模数据处理 21.1不同规模数据处理工具的选择 21.2利用Pandas处理大规模数据 21.2.1文件分块读入 21.2.2使用数据库 21.2.3使用DASK 21.3其他可选方法 21.4留给读者的思考 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。