内容推荐 本书提供了一个框架,从整体上介绍与大数据项目开发相关的基本概念,帮助读者评估大数据项目,理解成功的现代数据项目的基本要素。全书共8章,内容包括现代数据项目的主要类型、生命周期、风险管理、接口设计、分布式存储系统、元数据管理、数据处理等。本书旨在让读者厘清思路,顺利地从数据项目的规划阶段走到执行阶段,实现健壮、可维护的架构和解决方案。 目录 第 1章 数据项目的主要类型及考虑因素 1 1.1 数据项目的主要类型 1 1.2 数据管道和数据暂存 3 1.2.1 主要考虑因素和风险管理 4 1.2.2 数据管道和数据暂存团队的人员组成 13 1.3 数据的处理和分析 14 1.3.1 主要考虑因素和风险管理 14 1.3.2 数据处理和分析团队的人员组成 17 1.4 应用程序开发 17 1.4.1 主要考虑因素和风险管理 18 1.4.2 应用程序开发团队的人员组成 22 1.5 小结 22 第 2章 评估和选择数据管理解决方案 25 2.1 开源项目的阶段 26 2.1.1 孵化阶段 27 2.1.2 发布阶段 27 2.1.3 “治愈癌症”阶段 27 2.1.4 打破承诺阶段 28 2.1.5 强化阶段 29 2.1.6 企业阶段 30 2.1.7 终结阶段 30 2.2 开源项目的常见生命周期 31 2.2.1 使产品起死回生 32 2.2.2 追随者 33 2.3 评估基准测试 34 2.4 技术选型的考虑因素 35 2.4.1 了解构建块 36 2.4.2 寻求建议 37 2.4.3 从分析师那里获得见解 37 2.4.4 研究市场趋势 37 2.5 小结 39 第3章 数据项目的风险管理 41 3.1 风险类型 41 3.1.1 技术风险 41 3.1.2 团队风险 42 3.1.3 需求风险 42 3.2 风险管理 42 3.2.1 对架构中的风险进行分类 42 3.2.2 技术风险 45 3.2.3 团队的优势 45 3.2.4 外部团队风险 47 3.2.5 需求风险 47 3.2.6 融会贯通 47 3.3 使用原型和PoC 50 3.3.1 找到两三种方法 50 3.3.2 进行PoC,然后丢弃 50 3.3.3 部署的注意事项 50 3.4 使用接口 51 3.5 尽早开始构建 52 3.6 频繁测试并保留记录 52 3.7 监控和警报 53 3.8 沟通风险 54 3.8.1 合作并获得信任 54 3.8.2 公开风险 54 3.9 将风险作为谈判工具 55 3.10 小结 55 第4章 接口设计 57 4.1 人体 57 4.1.1 人体与数据架构 57 4.1.2 解耦 61 4.1.3 解耦的注意事项 63 4.1.4 专门化 64 4.2 什么造就了好的接口设计 64 4.2.1 合约 64 4.2.2 抽象 64 4.2.3 版本控制 65 4.2.4 防御 65 4.2.5 接口的文档和命名 66 4.3 非功能性考虑因素 67 4.3.1 可用性 导语 大数据项目的“孙子兵法”,助你拥有软件开发大局观 |