![]()
内容推荐 在大数据时代,我们常常以为自己拥有做出正确决策所需的所有信息。但事实上,我们拥有的信息从来都不完整,可能只是冰山一角。正如宇宙大部分是由暗物质组成的,尽管我们看不见,但它们仍然存在。在信息的世界中,则充满了暗数据。如果我们忽视了暗数据,就可能面临各种风险。 汉德教授以一个引人入胜、充满启迪和智慧的统计学视角,巧妙洞察我们现在可获得的大量信息,并对文中总结的15种暗数据机制进行阐述。这些案例来源于社会生活的方方面面,富含鲜活细节,包括人口普查、火箭发射、总统选举、飓风灾难、道路维修、地方治安、海难事件、历史考古、分数膨胀、学术造假、金融诈骗、财务管理等专业领域里的各种故事。作者不仅揭示了深深埋藏在数据背后世界本来的样貌,提示我们要警惕未知事物带来的风险,还阐述了如何利用暗数据并从中获益,从而引导我们更好地理解和做出更好的决定。 本书将带领我们开启了一段奇妙而富有启蒙性的旅程,进入我们看不到的数据世界。 作者简介 戴维·汉德(David Hand),伦敦帝国学院数学荣誉教授、资深研究员,英国皇家统计学会前主席,英国科学院院士。汉德教授学术成就非凡,曾出版著作7部。 目录 前言 第一部分 暗数据:原因与结果 第1章 暗数据:塑造世界的无形力量 幽灵数据 你真的拥有全部数据吗? 被忽略的“无事发生” 暗数据的力量 就在我们身边 第2章 探索暗数据:收集到的与没收集到的 来自各方的暗数据 数据废气、选择和自我选择 以小见大 实验数据 注意人性的弱点 第3章 定义与暗数据:你想知道什么? 定义差异与错误测量 你不能测量所有事物 筛查 基于过往表现的选择 第4章 非故意的暗数据:说一套,做一套 大视界 汇总 人为差错 仪器限制 连接数据集 第5章 方略性暗数据:博弈、反馈和信息不对称 博弈 反馈 信息不对称 逆向选择和算法 第6章 故意的暗数据:欺诈与欺骗 欺诈 身份盗用与网络诈骗 个人财务诈骗 金融市场欺诈与内幕交易 保险诈骗 其他欺诈形式 第7章 科学与暗数据:科学发现的本质 科学的本质 早知道就好了 暗数据碰出新世界 暗数据打开大视野 隐瞒事实 撤回 出处和可信度:谁告诉你的? 第二部分 阐明和使用暗数据 第8章 处理暗数据:让光照进来 希望 在已观测数据与缺失的数据之间建立关联 识别数据缺失机制 利用已有数据开展工作 超越数据:如果你先死怎么办? 超越数据:插补 迭代 错误数据 第9章 从暗数据中获益:重构问题 隐藏数据 对自己隐藏数据:随机对照试验 可能发生的事 复制的数据 想象的数据:贝叶斯先验性 隐私与机密保护 从暗处收集数据 第10章 暗数据分类:走出迷宫之路 暗数据分类法 启示 参考文献 译者后记 发自暗处的光 导语 书中为读者展现了一般人不易观察到的统计学分析角度:在备受推崇的大数据时代,大多数人都沉浸在只要掌握足够多的数据就行的幻觉中。这本书指出其中的盲点,翻转视角,开辟另一片视野。 数据不可能体现完全客观,也并非真理。这本书告诉读者在阅读任何资料时,如何避免掉进“客观”的陷阱,对已获取、看似可掌握的资料,保有怀疑精神。 作者深入剖析生活中实例,从耳熟能详或耸人听闻的经典案例入手,案例丰富鲜活且耐人寻味;作者写作经验丰富,以生动有条理的叙事,引导读者进入主题,阅读体验深刻且烧脑。 涉及医疗、制药、政府治理、社会政策、金融业、制造业等各领域的暗数据现象,揭示问题的解决之道,就在于了解信息中不为人知的黑暗边角是如何扭曲我们的认知。 |