网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 Pandas数据分析(第2版)
分类
作者 (美)斯蒂芬妮·莫林
出版社 清华大学出版社
下载
简介
内容推荐
《Pandas数据分析》详细阐述了与Pandas数据分析相关的基本解决方案,主要包括数据分析导论、使用Pandas DataFrame、使用Pandas进行数据整理、聚合Pandas DataFrame、使用Pandas和Matplotlib可视化数据、使用Seaborn和自定义技术绘图、金融分析、基于规则的异常检测、Python机器学习入门、做出更好的预测、机器学习异常检测等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。
本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学用书和参考手册。
作者简介
斯蒂芬妮·莫林(Stefanie Molin)是纽约彭博有限合伙企业(Bloomberg LP)的数据科学家和软件工程师,负责解决信息安全方面的棘手问题,特别是围绕异常检测、构建数据收集工具和知识共享等方面的工作。她在数据科学、设计异常检测解决方案以及在广告技术(AdTech)和金融科技(FinTech)行业中利用R和Python的机器学习方面拥有丰富的经验。
她拥有哥伦比亚大学傅氏基金工程和应用科学学院运筹学学士学位,辅修经济学、创业与创新。在闲暇时间,她喜欢环游世界、发明新食谱、学习人与计算机之间使用的新语言。
目录
第1篇 Pandas入门
第1章 数据分析导论
1.1 章节材料
1.2 数据分析基础知识
1.2.1 数据收集
1.2.2 数据整理
1.2.3 探索性数据分析
1.2.4 得出结论
1.3 统计基础知识
1.3.1 采样
1.3.2 描述性统计
1.3.3 集中趋势的度量
1.3.4 均值
1.3.5 中位数
1.3.6 众数
1.3.7 数据散布的度量
1.3.8 全距
1.3.9 方差
1.3.10 标准差
1.3.11 变异系数
1.3.12 四分位距
1.3.13 四分位离散系数
1.3.14 汇总数据
1.3.15 常见分布
1.3.16 缩放数据
1.3.17 量化变量之间的关系
1.3.18 汇总统计的陷阱
1.3.19 预测
1.3.20 推论统计
1.4 设置虚拟环境
1.4.1 虚拟环境
1.4.2 使用venv
1.4.3 Windows中的操作
1.4.4 Linux/macOS中的操作
1.4.5 使用conda
1.4.6 安装所需的Python包
1.4.7 关于Pandas
1.4.8 JupyterNotebook
1.4.9 启动JupyterLab
1.4.10 验证虚拟环境
1.4.11 关闭JupyterLab
1.5 小结
1.6 练习
1.7 延伸阅读
第2章 使用PandasDataFrame
2.1 章节材料
2.2 Pandas数据结构
2.2.1 Series
2.2.2 Index
2.2.3 DataFrame
2.3 创建PandasDataFrame
2.3.1 从Python对象中创建DataFrame
2.3.2 从文件中创建DataFrame
2.3.3 从数据库中创建DataFrame
2.3.4 从API中获取数据以创建DataFrame
2.4 检查DataFrame对象
2.4.1 检查数据
2.4.2 描述数据
2.5 抓取数据的子集
2.5.1 选择列
2.5.2 切片
2.5.3 索引
2.5.4 过滤
2.6 添加和删除数据
2.6.1 创建新数据
2.6.2 删除不需要的数据
2.7 小结
2.8 练习
2.9 延伸阅读
第2篇 使用Pandas进行数据分析
第3章 使用Pandas进行数据整理
3.1 章节材料
3.2 关于数据整理
3.2.1 数据清洗
3.2.2 数据转换
3.2.3 宽数据格式
3.2.4 长数据格式
3.2.5 数据充实
3.3 探索API以查找和收集温度数据
3.4 清洗数据
3.4.1 重命名列
3.4.2 类型转换
3.4.3 按值排序
3.4.4 索引排序
3.4.5 设置索引
3.4.6 重置索引
3.4.7 重新索引
3.5 重塑数据
3.5.1 转置DataFrame
3.5.2 旋转DataFrame
3.5.3 融合DataFrame
3.6 处理重复、缺失或无效的数据
3.6.1 查找有问题的数据
3.6.2 处理潜在的问题
3.7 小结
3.8 练习
3.9 延伸阅读
第4章 聚合PandasDataFrame
4.1 章节材料
4.2 在DataFrame上执行数据库风格的操作
4.2.1 查询DataFrame
4.2.2 合并DataFrame
4.3 使用DataFrame操作充实数据
4.3.1 算术和统计
4.3.2 分箱
4.3.3 应用函数
4.3.4 窗口计算
4.3.5 滚动窗口
4.3.6 扩展窗口
4.3.7 指数加权移动窗口
4.3.8 管道
4.4 聚合数据
4.4.1 汇总DataFrame
4.4.2 按组聚合
4.4.3 数据透视表和交叉表
4.5 处理时间序列数据
4.5.1 基于日期选择和过滤数据
4.5.2 基于时间选择和过滤数据
4.5.3 移动滞后数据
4.5.4 差分数据
4.5.5 重采样
4.5.6 合并时间序列
4.6 小结
4.7 练习
4.8 延伸阅读
第5章 使用Pandas和Matplotlib可视化数据
5.1 章节材料
5.2 Matplotlib简介
5.2.1 基础知识
5.2.2 绘图组件
5.2.3 其他选项
5.3 使用Pandas绘图
5.3.1 随时间演变
5.3.2 变量之间的关系
5.3.3 分布
5.3.4 计数和频率
5.4 pandas.plotting模块
5.4.1 散点图矩阵
5.4.2 滞后图
5.4.3 自相关图
5.4.4 自举图
5.5 小结
5.6 练习
5.7 延伸阅读
第6章 使用Seaborn和自定义技术绘图
6.1 章节材料
6.2 使用Seaborn进行高级绘图
6.2.1 分类数据
6.2.2 相关性和热图
6.2.3 回归图
6.2.4 分面
6.3 使用Matplotlib格式化绘图
6.3.1 标题和标签
6.3.2 图例
6.3.3 格式化轴
6.4 自定义可视化
6.4.1 添加参考线
6.4.2 区域着色
6.4.3 注解
6.4.4 颜色
6.4.5 颜色表
6.4.6 条件
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/3/27 12:39:45