对统计了解、为数据着迷,
你听到的将是机遇的敲门声!
这并不难,仅需要你有初中以上数学程度!
《你一定爱读的极简统计学》是一本零基础统计学读物,在日本被称为“可完全自学的统计学入门书”,到目前为止已加印18次。小岛宽之教授以最浅显的文字,采用深入浅出的方式,结合生活中的实际现象,向我们描绘了统计学的原理、方法与应用。最为难能可贵的是,学习本书几乎不用概率的知识,也完全不需要微积分和高等数学的基础,让零基础读者一看就懂,一学就会!
网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | 你一定爱读的极简统计学 |
分类 | 经济金融-金融会计-会计 |
作者 | (日)小岛宽之 |
出版社 | 台海出版社 |
下载 | ![]() |
简介 | 编辑推荐 对统计了解、为数据着迷, 你听到的将是机遇的敲门声! 这并不难,仅需要你有初中以上数学程度! 《你一定爱读的极简统计学》是一本零基础统计学读物,在日本被称为“可完全自学的统计学入门书”,到目前为止已加印18次。小岛宽之教授以最浅显的文字,采用深入浅出的方式,结合生活中的实际现象,向我们描绘了统计学的原理、方法与应用。最为难能可贵的是,学习本书几乎不用概率的知识,也完全不需要微积分和高等数学的基础,让零基础读者一看就懂,一学就会! 内容推荐 《你一定爱读的极简统计学》是一本零基础统计学读物,在日本被称为“可完全自学的统计学入门书”。作者小岛宽之教授以最精简的计算工具、最浅显的文字写成,并配以图解,让零基础读者一看就懂,一学就会! 统计学是应用最广泛、最没有偏见的一门科学知识。大数据时代,我们缺的不是数据,而是正确分析数据的路径,如何从海量数据中撷取有用信息、产生新价值,甚至用以推估未知的事物,已经成为个人和企业的关键竞争力。 目录 序章 为了高效地、一步步理解“统计学”——本书的立场 第1部分 速学!从标准差到检验、区间估计 第1章 用频率分布表和直方图刻画数据的特征 1 根据原始数据什么也搞不明白,所以使用统计 2 做直方图 第2章 平均值是挑担人偶玩具的支点 ——平均值的作用和把握方法 1 统计量是概括数据的数值 2 平均值 3 频率分布表上的平均值 4 平均值在直方图中的作用 5 该怎样捕捉平均值 第3章 由数据分散程度估计统计量 ——方差和标准差 1 想要知道数据的分散和波动 2 以公交车到达时刻的例子来理解方差 3 标准差的意义 4 从频率分布表求标准差 第4章 这个数据是“平常”还是“特殊”,以标准差(S.D.)来评价 1 标准差是浪涌的激烈程度 2 明确了S.D.就可以评价数据的“特殊性” 3 复数的数据组的比较 4 加工后的数据的平均值和标准差 第5章 标准差(S.D.)可以灵活运用于股票风险指标(波动率) 1 股票的平均收益率是什么 2 仅凭平均收益率不能判断是不是优良的投资 3 波动率的意义 第6章 标准差(S.D.)也可用于理解高风险、高回报(夏普比率) 1 高风险、高回报和低风险、低回报 2 金融商品优劣的衡量方法 3 衡量金融商品优劣的数值:夏普比率 第7章 身高、掷硬币等最常见的分布、正态分布 1 最常见的数据分布 2 一般正态分布的观察方法 3 身高数据是正态分布的 第8章 推论统计的出发点,使用正态分布进行“预测” 1 使用正态分布的知识,可以进行“预测” 2 标准正态分布的95%预测命中区间 3 一般正态分布的95%预测命中区间 第9章 从一个数据推出母群体 ——假设检验的思维方法 1 所谓推论统计即从部分推出整体 2 推测差不多可行的母群体 3 判断95%预测命中区间是否妥当 第10章 以测定温度为例,探寻95%置信区间 ——区间估计 1 反过来利用预测命中区间的估计 2 置信区间的“95%”的意义 3 对标准差的已知正态母群体的平均值的区间估计 第2部分 从观测数据推测其背后的广阔世界 第11章 根据“部分”推论“总体” ——母群体和统计的估计 1 母群体是假想之潭 2 随机抽样法和总体均值 第12章 表示母群体数据分散程度的统计量 ——总体方差和总体标准差 1 搞清数据的分散程度 2 总体方差和总体标准差的计算 第13章 复数数据的平均值比1个数据接近总体均值 ——样本均值的思维方法 1 从观测到的1个数据可以推测出什么 2 为什么要做样本均值 第14章 随着观测数据增加,预测区间变窄 ——正态母群体的便利商品、样本均值 1 正态分布样本均值的性质很美 2 关于正态母群体样本均值的95%预测命中区间 第15章 已知总体方差,求正态母群体的总体均值 ——使用样本均值进行总体均值的区间估计 1 推测总体均值和总体方差 2 使用样本均值进行总体均值的区间估计 第16章 卡方分布登场 ——样本方差的求法和卡方分布 1 样本方差的求法 2 卡方分布是什么 第17章 用卡方分布推算总体方差 ——推算正态母群体的总体方差 1 卡方分布的95%预测命中区间 2 终于开始正态母群体总体方差的估计了 第18章 样本方差呈卡方分布 ——与样本方差成正比的统计量W的做法 1 与样本方差成正比的统计量W的做法 2 样本方差的卡方分布自由度下降1 第19章 即使未知总体均值仍能推算总体方差 ——总体均值未知时对正态母群体进行区间估计 1 未知总体均值推算总体方差 2 估计总体方差的具体例子 第20章 t分布登场 ——总体均值以外的以“实际观测样本”可计算的统计量 1 终于登场的t分布 2 t分布的直方图 3 统计量T的计算 4 关于t分布的正式定义 第21章 根据t分布进行区间估计 ——未知总体方差时以正态母群体推算总体均值 1 最自然的区间估计——t分布 2 根据t分布的区间估计方法 后记 练习题解答 索引 试读章节 第1部分解说过的“母群体”非常重要,所以这里让我们再次回顾一下。 我们以数据的形式,观测相同的不确定现象生出的各种数字的情况。比如,观测相同种类的蝴蝶各不相同的体长数值,或者在选举中选民对各个人物进行投票。更具体一些,比如投掷36枚硬币时,正面枚数是从0枚到36枚各不相同的数值。再举例子的话,比如同一家店铺营业额每天都不同,还有股票的日经平均指数每天反复涨跌。 我们可以假想出一个潭子,相同现象的数据都从相同的潭子中出现。这个假想之潭叫作“母群体”。可以这样想,蝴蝶体长的数据,从装满蝴蝶体长数值的潭中出现,店铺营业额的数据从装满店铺营业额数值的潭中出现。 选举的情况,将“开票处整体”比作潭子会更容易理解。因为某人投了谁的票,与观测开票处1张投票用纸是完全相同的。一次选举的全部数据,是与(包括弃权的)选民人数一致的,这是有限的数,因此叫作“有限母群体”。 与此相对,(像神一样超常存在地)计测古今中外、现在未来所有蝴蝶的体长,将写有计测结果的无限张数的纸投入潭中,就有了无限个的数据数,因此叫作“无限母群体”。对于投掷硬币的情况,无限次投掷36枚硬币,将出现正面枚数的全部数据放入潭中(从0到36的37种数字各有无限个被放入其中),这也是无限母群体。假设进行了无限次交易,那么店铺的营业额和股票的日经平均指数也属于无限母群体。 本书考虑的是一般性的问题,所以不针对有限母群体,而只针对无限母群体来思考(出现选举例子的时候,也请当作无限母群体来看待)。 推论统计的目标,是从(无限)母群体得出的几个数据中,对母群体总体进行推测。第1部分中解说过,这是“从部分推论总体”。慎重的读者也许会觉得不可思议:怎么可能有这种事情? 但是,好好回想一下我们日常生活就会发现,这些事情平时就有。比如下面这件事。我们做酱汤的时候,需要判断味道(咸味等)是否合适。当然把一锅酱汤全都喝掉确实可以进行判断,但就没有了尝味道的意义。于是,我们用勺子喝一点,没问题的话就说明可以。这就是根据部分判断总体。 为什么以此就能大概知道味道如何呢?因为可以认为“经过充分混合,一汤勺可以反映全体”。 推论统计也是同样。从母群体这一假想之潭中出现的数据,不是谁都可以随意控制的,而是反映母群体总体情况的,所以在从部分判断总体上与尝酱汤的例子相同。 但是,尝酱汤的时候,必须想到偶尔会尝到“稍有些浓”的地方,或是“稍有些淡”的地方,所以酱汤总体的味道与尝到的味道多少有些偏差也是正常的。同样,也必须做好推论统计也并非“完全一致”,而是有一定的偏差的思想准备。 2.随机抽样法和总体均值 我们已经将母群体当作潭子一样的东西。那么让我们详细地说一下潭子里面的内容。 (无限)母群体的一例如图11-1。数据数值只有①、⑤、⑨3种,每个数据在潭中有无数个。 请想象一下这种情况。潭中有3种池子:“有无数数据①在池子里游泳”“有无数数据⑤在池子里游泳”“有无数数据⑨在池子里游泳”。 池子的大小(幅度)不同,假设面积各为0.6、0.3、0.1(以后母群体中“池子”面积必须像这样按照合计为l来设定)。请将池子大小的差别看作各数据是否容易从母群体这个潭子中出来的差别。对母群体来说,观测到的数据是①、⑤、⑨中的任意一个,观测到的相对频数是池子大小的数字(面积)0.6、0.3、0.1。 就是说,数字①的出现比数字⑨容易6倍,数字⑤的出现比数字⑨容易3倍。 实际上为了明白地说明此问题,必须用到“概率”的表达。就是说,观测到①、⑤、⑨的概率分别为0.6、0.3、0.1,它们每次按照各自的概率独立(不影响其他观测值的出现)出现。 但像序章说过的,本书会避开概率,只谈数据分布,毕竟本书只是统计学入门读本。P107-109 序言 让统计学成为一种大众数据分析工具 清华大学经济管理学院 肖勇波 副教授 在信息技术高度发达的今天,电子商务、社交网络、云计算等新兴应用已经渗透到人们生活的每一个角落,我们正在进入一个大数据的时代。如何有效发挥出大数据的价值?如何有效应对大数据带来的挑战?这恐怕是当今世界各行各业最为关心的问题之一。诚然,大数据的价值并不在于数据本身,而在于隐藏在数据背后的有用的知识。如何发现这些看不见的知识?这是一个仁者见仁、智者见智的事情,也是目前企业界和学术界正在全力探索的问题。 大数据的商务分析貌似是一个“高大上”的事物,其实它与我们每一个大众的生活和工作都息息相关。不管你是大型企业的高层领导或普通职员,夫妻店或淘宝店店主,或是准备创业的年轻人,都能够利用基于数据分析的方法来帮助发现新的商机,提升你的管理,从而增强你的市场竞争力。比如,利用历史的销售记录,可以识别出对你最有价值的顾客,从而通过精准营销等手段来实现最有效的客户关系管理。 要获得数据分析的能力,统计学是一把必须拥有的钥匙:数据分析最基础的工具非统计学莫属了。可以毫不夸张的说,统计学是应用最广泛、最具普适性的一门科学知识。它是人们把握不确定的世界里的基本规律,从而将客观的数据转化为有用的信息和知识的一把钥匙。只要你会一点统计分析的方法,也许会形成一套完全不同的看待问题的思维模式,从而帮助你更加聪慧地制定各种管理决策。 长久以来,统计学一直是大学课堂中的专利产品,好像与我们的大众没有丝毫的关系;因为它涉及到非常严谨的数理知识,对于没有系统学习微积分、概率论和线性代数的人来说只能是一种奢侈品。为了让大众都能充分享受统计分析带来的优势,日本帝京大学经济学系的小岛宽之教授结合自己长期的教学和科研心得,撰写了一本“可完全自学的统计学入门书”——《你一定爱读的极简统计学》。它面向数理基础薄弱的大众,在日本被誉为零基础的入门读物,已经热印18次,深受广大读者的喜爱。 一口气读完小岛宽之教授的专著,让我对大学教授这个职业的使命有了新的认识:从事国际前沿的学术研究固然是教授不可推卸的责任,向广大群众传播知识、让大众享受知识的红利同样重要。小岛宽之教授以最浅显的文字,采用深入浅出的方式,结合生活中的实际现象,向我们描绘了统计学的原理、方法与应用。最为难能可贵的是,学习本书几乎不用概率的知识,也完全不需要微积分和高等数学的基础,让零基础读者一看就懂,一学就会!只要读者有兴趣探索统计学的乐趣,就能通过自学的方式在很短的时间内理解统计学中标准差、置信区间、样本估计、样本比较等深奥的理论与方法,并能将该方法与身边的实际问题有效地联系起来。 我强烈推荐零基础的读者从这本书开始进入统计学和数据分析的神奇世界。也许你会发现,科学的管理和有效的决策并不是受过高等教育的人才能享受的专利;也许这本书会影响甚至改变你的一生。 2014年夏于清华园 后记 我大学的专业是数学,当时对概率、统计完全不关心,甚至觉得与“现实”相关的概率、统计根本不是数学。在我看来,数学完全是观念上抽象的东西,没有与现实的接点。 而这样的我最初与统计学结缘,是在35岁以后要进行研究生院的经济学研究科考试的时候。看到考试要考的知识范围时,我觉得自己大学没有学习过经济学,所以选择经济学研究方向一定会很不利,既然都没有学过,那么选择统计学方向想必会好一点吧。 于是我就买了好几本统计学的教科书并一一读完。但是,不管怎么读,总是有些地方明白,有些地方不明白,只能模糊理解,我因此深感焦虑。而直到阅读P.G.霍尔的《入门数理统计学》之后,我才好不容易对统计学有了模糊的概念。这是因为霍尔的书与其他书千篇一律的写法明显不同,所以才能解答我的一部分疑问。 虽然在研究生考试中我运气很好及格了,但那绝不能说是已经掌握了统计学。对于统计学,我总有一种牙齿塞了东西一样别扭的感觉,但又说不清疑问到底是什么,于是就在大学院中听了一部分统计学的课程。而这是我学习统计学的第二阶段。 那些课程不愧是由专业统计学家讲授的研究生院课程,我从中学到了很多东西,在此过程中我搞清了自己“牙齿里塞的东西”到底是什么。 一言以蔽之,那是统计学理论中有某种秘诀的“飞跃”。本文中也写过,推论统计的方法是“从部分推论整体”的“归纳法”。而习惯了数学中完美无缺的“演绎法”的我,领悟到为了接受“到处都是飞跃的理论体系”,必须将头脑从已经习惯的思考方法中切换出来。在这个阶段,我对统计学的理解终于达到了教科书的水平。 我达到统计学的第三阶段,是作为帝京大学的教师教授学生统计学的时候。当然,虽然当时我已经可以好好讲授教科书的内容了,但只限于能理解教科书,而学生们却无法理解到跟我同样的程度。我认为,学生们之所以一知半解,不是因为他们不努力,而是作为讲授方的我对统计学理解得不彻底。 于是这次,我想要“以自己的头脑、自己的流派”从根本上重新思考统计学。 想要将统计学“飞跃”的内涵,更自然、更明快、更直观地解释出来。幸运的是,当时,作为经济学者的我正在进行数理经济学中“概率论的意志决定理论”这一领域的研究。这其中,我认真思考了“概率论是什么”,并对统计学“飞跃”有了自己的解释。 这在本书中被称为“预测命中区间”。这是在思考“概率的时态的本质是什么”的过程中,作为副产品产生的解释。这个思路,是我过去读过的教科书从未写过的,也许是个“异端”。但是,这个解释终于让我对推论统计不再感到别扭,本书也全面推出了这个解释。当然,因为只是单纯的“解释”,所以即使不能完全了解,也不会对统计的计算和操作造成障碍,读者尽可以放心。 我这样写也许会被认为对统计学的方法论持批判态度,实际上完全相反。 我认为,统计学正是因为这样的“飞跃”,才有了更加密切联系“现实”的可能,这也正是使得统计学变得有活力之处。这样的想法正是我终于离开了数学的世界,在鲜活而又现实的经济学上找到了立足之地的表现。也祝愿读者们能通过此书对统计学产生兴趣,享受这种“飞跃”,丰富自己的人生。 我勉强可以算是概率论的专家,却不是统计学的专家,所以保险起见,我请驹泽大学的计量经济学专家饭田泰之对本书进行了审查校对。十分感谢他欣然接受了这个有些贸然的请求。不过,因为日程紧张,想必饭田也会有漏看之处,因此还是难免多少有些错误。当然,出现这些错误责任都在于我。 最后,感谢钻石社的和田史子女士,本书从企划到编辑都是由她全权负责的。和田曾毫不留情地对原稿提出质疑:这本书能有多易懂?这些提问都源自于和田“希望从根本上理解统计学”的热情,而我也十分希望能与读者们共享这种热情。如果本书能够满足作为读者的你的期待,请对这一饱含编辑者热情的读物给予赞赏。 小岛宽之 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。