![]()
内容推荐 数据科学和机器学习已经深度融合到我们生活的方方面面,而数学正是开启未来大门的钥匙。不是所有人生来都握有一副好牌,但是掌握“数学+编程+机器学习”的知识绝对是品牌。这一次,学习数学不再是为了考试、分数、升学,而是投资时间、自我实现、面向未来。为了让大家学数学、用数学,甚至爱上数学,在创作时,作者尽量克服传统数学教材的各种弊端,让大家学习时有兴趣、看得懂、有思考、更自信、用得着。 《统计至简:概率统计全彩图解+微课+Python编程》是“鸢尾花数学大系—从加减乘除到机器学习”丛书中数学版块—“数学三剑客”的第三册,也是最后一本。“数学”板块的第一本《数学要素》是各种数学工具的“大杂烩”,可谓数学基础;《矩阵力量》专门讲解机器学习中常用的线性代数工具;本册《统计至简》则介绍机器学习和数据分析中常用的概率统计工具。《统计至简:概率统计全彩图解+微课+Python编程》的核心是“多元统计”,离不开第二册《矩阵力量》中介绍的线性代数工具。《统计至简:概率统计全彩图解+微课+Python编程》内容又可以归纳为7大板块——统计、概率、高斯、随机、频率派、贝叶斯派、椭圆。《统计至简:概率统计全彩图解+微课+Python编程》在讲解概率统计工具时,会穿插介绍其在数据科学和机器学习领域的应用场景,让大家学以致用。 《统计至简:概率统计全彩图解+微课+Python编程》读者群包括所有在工作中应用概率统计的朋友,尤其适用于初级程序员进阶、大学本科数学开窍、高级数据分析师、机器学习开发者。 目录 绪论 1 第1板块 统计 5 第1章 概率统计全景 7 1.1 推荐数学工具:一个线性代数小测验 8 1.2 统计描述 9 1.3 概率 10 1.4 高斯 16 1.5 随机 19 1.6 频率派 19 1.7 贝叶斯派 20 1.8 椭圆三部曲 21 第2章 统计描述 23 2.1 统计两大工具:描述、推断 25 2.2 直方图:单特征数据分布 26 2.3 散点图:两特征数据分布 31 2.4 有标签数据的统计可视化 33 2.5 集中度:均值、质心 36 2.6 分散度:极差、方差、标准差 38 2.7 分位:四分位、百分位等 40 2.8 箱型图:小提琴图、分布散点图 42 2.9 中心距:均值、方差、偏度、峰度 44 2.10 多元随机变量关系:协方差矩阵、相关性系数矩阵 47 第2板块 概率 49 第3章 古典概率模型 51 3.1 无处不在的概率 52 3.2 古典概率:离散均匀概率律 56 3.3 回顾:杨辉三角和概率 64 3.4 事件之间的关系:集合运算 65 3.5 条件概率:给定部分信息做推断 67 3.6 贝叶斯定理:条件概率、边缘概率、联合概率关系 70 3.7 全概率定理:穷举法 73 3.8 独立、互斥、条件独立 76 第4章 离散随机变量 79 4.1 随机:天地不仁,以万物为刍狗 80 4.2 期望值:随机变量的可能取值加权平均 89 4.3 方差:随机变量离期望距离平方的平均值 91 4.4 累积分布函数(CDF):累加 94 4.5 二元离散随机变量 95 4.6 协方差、相关性系数 97 4.7 边缘概率:偏求和,相当于降维 100 4.8 条件概率:引入贝叶斯定理 101 4.9 独立性:条件概率等于边缘概率 104 4.10 以鸢尾花数据为例:不考虑分类标签 107 4.11 以鸢尾花数据为例:考虑分类标签 116 4.12 再谈概率1:展开、折叠 120 第5章 离散分布 123 5.1 概率分布:高度理想化的数学模型 124 5.2 离散均匀分布:不分厚薄 125 5.3 伯努利分布:非黑即白 128 5.4 二项分布:杨辉三角 129 5.5 多项分布:二项分布推广 132 5.6 泊松分布:建模随机事件的发生次数 135 5.7 几何分布:滴水穿石 136 5.8 超几何分布:不放回 138 第6章 连续随机变量 141 6.1 一元连续随机变量 142 6.2 期望、方差和标准差 145 6.3 二元连续随机变量 147 6.4 边缘概率:二元PDF偏积分 149 6.5 条件概率:引入贝叶斯定理 151 6.6 独立性:比较条件概率和边缘概率 153 6.7 以鸢尾花数据为例:不考虑分类标签 154 6.8 以鸢尾花数据为例:考虑分类标签 162 第7章 连续分布 171 7.1 连续均匀分布:离散均匀分布的连续版 172 7.2 高斯分布:最重要的概率分布,没有之一 173 7.3 逻辑分布:类似高斯分布 177 7.4 学生t-分布:厚尾分布 179 7.5 对数正态分布:源自正态分布 181 7.6 指数分布:泊松分布的连续随机变量版 183 7.7 卡方分布:若干IID标准正态分布平方和 184 7.8 F-分布:和两个服从卡方分布的独立随机变量有关 185 7.9 Beta分布:概率的概率 187 7.10 Dirichlet分布:多元Beta分布 190 第8章 条件概率 197 8.1 离散随机变量:条件期望 198 8.2 离散随机变量:条件方差 204 8.3 离散随机变量的条件期望和条件方差:以鸢尾花为例 206 8.4 连续随机变量:条件期望 215 8.5 连续随机变量:条件方差 216 8.6 连续随机变量:以鸢尾花为例 217 8.7 再谈如何分割“1” 221 第3板块 高斯 229 第9章 一元高斯分布 231 9.1 一元高斯分布:期望值决定位置,标准差决定形状 232 9.2 累积概率密度:对应概率值 234 9.3 标准高斯分布:期望为0,标准差为1 236 9.4 68-95-99.7 法则 239 9.5 用一元高斯分布估计概率密度 243 9.6 经验累积分布函数 244 9.7 QQ图:分位-分位图 245 9.8 从距离到一元高斯分布 249 …… |