![]()
内容推荐 本书分为两大部分:第一部分介绍依赖Python基本模块的编程基础,包括常用表达式、数据类型、表格处理、数据可视化等;第二部分介绍常用的统计模型和方法,包括假设检验、置信区间、参数估计、线性回归、分类、聚类等。不同于以概率论出发的数理统计教材,本书以丰富的实际案例为引子,逐步引入统计概念并利用Python实现统计方法。 目录 第一章 引言 1.1 什么是大数据 1.2 什么是数据科学 1.3 教学内容和目的 第二章 因果推断 2.1 观察性数据 2.2 随机化双盲试验 2.3 随机化试验的其他例子 2.4 结论 第三章 Python入门 3.1 Python安装指南 3.2 表达式 3.3 数值类型 3.4 字符串 3.5 赋值语句 3.6 其他运算符 3.7 调用函数 3.8 结论 第四章 复杂数据类型 4.1 列表 4.2 元组 4.3 字典 4.4 数组 第五章 复杂代码组 5.1 条件语句 5.2 循环语句 5.3 函数 第六章 表格处理 6.1 模拟数据 6.2 案例1:俄法1812年战争数据 6.3 案例2:2010年中国人口普查资料 第七章 数据可视化 7.1 基础语法 7.2 散点图和折线图 7.3 柱状图、饼图、箱线图和概率图 第八章 概率、条件概率及贝叶斯公式 8.1 概率 8.2 条件概率 8.3 贝叶斯公式 8.4 随机变量和概率分布 第九章 经验分布 9.1 总体概率分布的直方图 9.2 经验分布的直方图 9.3 大数定律 9.4 总体 9.5 从总体中抽样及样本的经验分布 9.6 参数 9.7 模拟统计量 9.8 案例1:NBA周明星球员的年龄 9.9 案例2:估计敌军飞机的数量 第十章 假设检验 10.1 案例1:第十二届全国人民代表大会少数民族人大代表比例问题/19l 10.2 案例2:孟德尔的豌豆花 10.3 案例3:某附属中学学生的平均分数 10.4 错误概率 10.5 简单的假设检验 第十一章 参数估计 11.1 百分位数 11.2 自助法 11.3 置信区间 第十二章 均值与中心极限定理 12.1 均值的定义 12.2 0/l数据的均值是数据中1的比例 12.3 均值和直方图 12.4 一些例子 12.5 数据波动性 12.6 标准差和正态曲线 12.7 中心极限定理 12.8 样本均值的波动 12.9 样本均值的中心极限定理 第十三章 预测 13.1 相关性 13.2 回归直线 13.3 均方根误差 第十四章 回归中的统计推断 14.1 回归模型 14.2 对于真实斜率的推断 14.3 对于散点图的重抽样 14.4 预测的波动性 14.5 总结 第十五章 机器学习常用方法 15.1 回归模型 15.2 分类方法 15.3 非监督学习——聚类 |