![]()
内容推荐 本书主要论述分布式流数据处理的容错技术方法。通过深入分析和探讨,从理论模型、容错策略、容错机制和协议等方面开展相关研究工作,通过建立理论方法和核心技术,提升分布式流处理系统的可靠性,为分布式流处理容错技术提供了一种新的思路和解决方案。本书共6章,主要内容包括绪论、支持分布式流处理的低开销容错机制、支持弹性流处理的自适应容错机制、负载感知的最佳检查点间隔策略、负载感知的近似备份策略和总结与展望。本书通过理论建模、仿真分析及实验验证等手段,对分布式流数据处理的容错技术进行了有意义的探索。 本书可作为高等工科院校计算机科学与技术、自动化、电子信息等专业研究生的参考书,也可供从事分布式处理系统容错技术设计的工程技术人员自学参考。 目录 第1章 绪论 1.1 研究背景与意义 1.1.1 分布式流数据处理 1.1.2 系统可靠性问题与容错机制 1.1.3 流数据处理容错技术的挑战 1.2 国内外研究现状 1.2.1 分布式流数据处理系统 1.2.2 流处理自动并行化技术 1.2.3 容错技术 1.3 本书的主要内容 1.4 本书的组织结构 第2章 支持分布式流处理的低开销容错机制 2.1 引言 2.2 相关工作 2.3 通用分布式流处理框架 2.4 系统模型 2.4.1 流数据处理作业 2.4.2 节点运行状态 2.5 结合检查点的上游备份模型 2.5.1 异步检查点 2.5.2 上游数据备份 2.6 容错协议及算法 2.6.1 上游备份协议 2.6.2 协议开销分析 2.6.3 快速恢复算法 2.7 实验结果与性能分析 2.7.1 系统原型实现 2.7.2 实验设置 2.7.3 容错通信开销 2.7.4 容错延迟开销 2.7.5 容错内存开销 2.7.6 故障恢复测试 2.8 本章小结 第3章 支持弹性流处理的自适应容错机制 3.1 引言 3.2 相关工作 3.3 弹性流处理下容错问题建模 3.3.1 问题概述 3.3.2 备份调整函数 3.3.3 问题模型假设 3.4 支持弹性流处理的自适应容错机制实现 3.4.1 弹性数据备份单元 3.4.2 数据依赖关系追踪 3.4.3 在线检查点调整机制 3.5 自适应容错协议 3.6 实验与结果分析 3.6.1 系统原型实现 3.6.2 实验设置 3.6.3 容错开销测试 3.6.4 故障恢复测试 3.6.5 综合性能比较 3.7 本章总结 第4章 负载感知的最佳检查点间隔策略 4.1 引言 4.2 相关工作 4.3 最佳检查点问题建模 4.3.1 系统模型 4.3.2 处理效率 4.3.3 问题定义 4.4 动态最佳检查点间隔(DOCI)模型 4.4.1 在线恢复时间预测 4.4.2 最佳检查点间隔 4.5 DOCI调整策略 4.5.1 DOCI调整算法 4.5.2 缓存对最佳检查点间隔的影响 4.6 实验与结果分析 4.6.1 模拟方法 4.6.2 恒定输入速率下的效率测试 4.6.3 工作负载波动下的效率测试 4.6.4 备份缓存区容量的影响测试 4.7 应用场景 4.8 本章总结 第5章 负载感知的近似备份策略 5.1 引言 5.2 相关工作 5.3 系统模型介绍 5.3.1 流处理模型 5.3.2 近似备份模型 5.3.3 前提假设 5.4 容错问题建模 5.4.1 备份开销 5.4.2 恢复质量 5.4.3 问题描述 5.5 近似备份算法 5.5.1 单节点故障算法 5.5.2 级联故障算法 5.5.3 负载倾斜备份算法 5.6 实验结果与分析 5.6.1 实验设置 5.6.2 综合性能测试 5.6.3 系统性能与故障恢复精度的影响测试 5.6.4 负载倾斜下的性能测试 5.6.5 可扩展性测试 5.7 结论 第6章 总结与展望 6.1 总结 6.2 未来研究展望 参考文献 |