内容推荐 数据陷阱无处不在,任何处理过数据的人都会在不知不觉中多次陷入其中。我们大多数人都还没有学会如何使用现代工具和所掌握的数据类型,从而导致了一些本可以轻易避免的常见的错误。 在本书中,作者为我们展示了以下七种在数据处理过程中常见的数据陷阱: 陷阱1:认识误差 我们如何看待数据; 陷阱2:技术陷阱 我们如何对数据进行处理; 陷阱3:数学失误 我们如何对数据进行计算; 陷阱4:统计疏忽 我们如何对数据进行比较; 陷阱5:分析偏差 我们如何对数据进行分析; 陷阱6:绘图乌龙 我们如何对数据进行可视化; 陷阱7:设计风险 我们如何对数据进行修饰。 同时也向我们展示了这些数据陷阱是如何产生、如何变得如此常见的,指导我们如何从一开始就避免它们,并针对上述数据陷阱,提供了与之相对应的真实示例,以及数据可视化的实用指导。阅读本书,你将: 深入了解随着我们对数据的依赖而增长的“数据与现实的差距”; 了解如何使用正确的工具简化可视化过程; 避免数据分析、可视化和演示中的常见错误; 创建并呈现清晰、准确、有效的数据可视化。 作者简介 陈天皓,工商管理和信息技术双硕士,项目管理专业人士。曾译有《商业仪表盘可视化解决方案》《人类未来进化史》等书,长期关注科技发展趋势与数据应用领域。 目录 第1章 七类数据陷阱 七种特定类型的数据陷阱 避免七种数据陷阱 “我掉进陷阱里,爬不出来了” 第2章 陷阱1:认知误差 我们如何看待数据 陷阱1A:数据与现实的差距 陷阱1B:过度依赖手工的数据 陷阱1C:前后矛盾的评分 陷阱1D:黑天鹅陷阱 陷阱1E:可证伪性与上帝陷阱 避免天鹅陷阱和上帝陷阱 第3章 陷阱2:技术陷阱 我们如何对数据进行处理 陷阱2A:脏数据 陷阱2B:糟糕的混合和连接 第4章 陷阱3:数学失误 我们如何对数据进行计算 陷阱3A:多重汇总 陷阱3B:缺失值 陷阱3C:汇总数 陷阱3D:荒谬的百分比 陷阱3E:不匹配的单位 第5章 陷阱4:统计疏忽 我们如何对数据进行比较 陷阱4A:描述性错误 陷阱4B:推断陷阱 陷阱4C:狡猾的抽样 陷阱4D:对样本量不敏感 第6章 陷阱5:分析偏差 我们如何对数据进行分析 陷阱5A:错误地认为直觉和分析相互对立 陷阱5B:浮夸的外推 陷阱5C:欠考虑的插值 陷阱5D:不靠谱的预测 陷阱5E:不过脑子的衡量指标 第7章 陷阱6:绘图乌龙 我们如何对数据进行可视化 陷阱6A:棘手的图表 陷阱6B:数据教条主义 陷阱6C:错误地认为“最优”和“满意”相互对立 第8章 陷阱7:设计风险 我们如何对数据进行修饰 陷阱7A:令人困惑的颜色 陷阱7B:遗漏的机会 陷阱7C:可用性 第9章 结语 避免陷入数据陷阱的检查单 “未被听见的声音”陷阱 译者后记 |