全球首部HadoopYARN专著,资深Hadoop技术专家根据最新版本撰写,ChinaHadoop和51CTO等专业技术社区联袂推荐!
董西成所著的《Hadoop技术内幕(深入解析YARN架构设计与实现原理)》从应用角度系统讲解YARN的基本库和组件用法、应用程序设计方法、YARN上流行的各种计算框架,以及多个类YARN的开源资源管理系统。
从源代码角度深入分析YARN的设计理念与基本架构、各个组件的实现原理,以及各种计算框架的实现细节。
董西成所著的《Hadoop技术内幕(深入解析YARN架构设计与实现原理)》是“Hadoop技术内幕”系列的第3本书,前面两本分别对Common、HDFS和MapReduce进行了深入分析和讲解,赢得了极好的口碑,Hadoop领域几乎人手一册,本书则对YARN展开了深入的探讨,是首部关于YARN的专著。仍然由资深Hadoop技术专家董西成执笔,根据最新的Hadoop 2.0版本撰写,权威社区ChinaHadoop鼎力推荐。
《Hadoop技术内幕(深入解析YARN架构设计与实现原理)》从应用角度系统讲解了YARN的基本库和组件用法、应用程序设计方法、YARN上流行的各种计算框架(MapReduce、Tez、Storm、Spark),以及多个类YARN的开源资源管理系统(Corona和Mesos);从源代码角度深入分析YARN的设计理念与基本架构、各个组件的实现原理,以及各种计算框架的实现细节。
全书共四部分13章:第一部分(第1~2章)主要介绍了如何获取、阅读和调试Hadoop的源代码,以及YARN的设计思想、基本架构和工作流程;第二部分(第3~7章)结合源代码详细剖析和讲解了YARN的第三方开源库、底层通信库、服务库、事件库的基本使用和实现细节,详细讲解了YARN的应用程序设计方法,深入讲解和分析了ResourceManager、资源调度器、NodeManager等组件的实现细节;第三篇(第8~10章)则对离线计算框架MapReduce、DAG计算框架Tez、实时计算框架Storm和内存计算框架Spark进行了详细的讲解;第四部分(第11~13章)首先对Facebook Corona和Apache Mesos进行了深入讲解,然后对YARN的发展趋势进行了展望。附录部分收录了YARN安装指南、YARN配置参数以及Hadoop Shell命令等非常有用的资料。
前言
第一部分 准备篇
第1章 环境准备
1.1 准备学习环境
1.1.1 基础软件下载
1.1.2 如何准备Linux环境
1.2 获取Hadoop源代码
1.3 搭建Hadoop源代码阅读环境
1.3.1 创建Hadoop工程
1.3.2 Hadoop源代码阅读技巧
1.4 Hadoop源代码组织结构
1.5 Hadoop初体验
1.5.1 搭建Hadoop环境
1.5.2 Hadoop Shell介绍
1.6 编译及调试Hadoop源代码
1.6.1 编译Hadoop源代码
1.6.2 调试Hadoop源代码
1.7 小结
第2章 YARN设计理念与基本架构
第二部分 YARN核心设计篇
第3章 YARN基础库
第4章 YARN应用程序设计方法
第5章 ResourceManager剖析
第6章 资源调度器
第7章 NodeManager剖析
第三部分 计算框架篇
第8章 离线计算框架MapReduce
第9章 DAG计算框架Tez
第10章 实时/内存计算框架Storm/Spark
第四部分 高级篇
第11章 Facebook Corona剖析
第12章 Apache Mesos剖析
第13章 YARN总结与发展趋势
附录A YARN安装指南
附录B YARN配置参数介绍
附录C Hadoop Shell命令介绍
附录D 参考资料