![]()
内容推荐 王宏志、李春静编著的《Hadoop集群程序设计与开发(数据科学与大数据技术专业系列规划教材)》系统地介绍了基于Hadoop的大数据处理和系统开发相关技术,包括初识Hadoop、Hadoop基础知识、Hadoop开发环境配置与搭建、Hadoop分布式文件系统、Hadoop的I/O操作、MapReduce编程基础、MapReduce高级编程、初识HBase、初识Hive。通过本书的学习,读者可以较全面地了解Hadoop的原理、配置和系统开发的相关知识,并且可以从Hadoop的角度学习分布式系统和MapReduce算法设计的相关知识。 本书可作为大数据技术相关专业本科生、研究生的教材,也可作为大数据技术的培训用书,还可作为大数据技术相关工作人员的参考用书。 作者简介 王宏志,哈尔滨工业大学计算机科学与技术学院副教授、博士生导师。研究方向包括大数据管理、数据质量、图数据管理。发表学术论文140余篇,出版学术专著两本,参与翻译《算法导论(第3版)》。在爱课程网、学堂在线、好大学在线上首次开设“大数据算法”在线课程,出版《大数据算法》教材。 目录 第1章 初识Hadoop 1.1 为什么要学习Hadoop 1.1.1 信息化项目衍生过程 1.1.2 Hadoop产生过程 1.1.3 Hadoop成功案例介绍 1.2 Hadoop与云计算的关系 1.2.1 什么是云计算 1.2.2 云计算演进历史 1.2.3 云计算相关技术介绍 1.2.4 Hadoop在云项目中扮演的角色 1.3 Hadoop与大数据的关系 1.3.1 什么是大数据 1.3.2 大数据的存储结构 1.3.3 大数据的计算模式 1.3.4 Hadoop在大数据中扮演的角色 1.4 学习Hadoop需要具备的知识基础 1.5 学习Hadoop需要的实验环境 1.6 Hadoop的用途 1.7 小结 第2章 Hadoop基础知识 2.1 Hadoop简介 2.1.1 Apache Hadoop项目核心模块 2.1.2 Apache Hadoop项目的其他模块 2.2 Hadoop版本演化 2.3 RPC工作原理 2.3.1 RPC简介 2.3.2 Hadoop中的 2.3.3 RPCoIB和JVM-旁路缓冲管理方案:在高性能网络InfiniBand上数据交换的改进 2.4 MapReduce工作原理 2.4.1 MapReduce计算模型 2.4.2 MapReduce经典案例 2.4.3 MapReduce应用场景 2.5 Hadoop改进 2.5.1 LATE算法:良好的适应异构性环境 2.5.2 Mantri:MapReduce异常处理 2.5.3 SkewTune:MapReduce中数据偏斜处理 2.5.4 基于RDMA的MapReduce设计:提升大数据应用的性能和规模 2.6 HDFS工作原理 2.6.1 HDFS介绍 2.6.2 HDFS体系结构 2.6.3 文件系统的命名空间 2.6.4 HDFS中Block副本放置策略 2.6.5 HDFS机架感知 2.6.6 HDFS安全模式 2.6.7 HDFS应用场景介绍 2.6.8 混合HDFS的设计:充分利用硬件能力获得最佳性能 2.7 YARN工作原理 2.7.1 YARN on HDFS的工作原理 2.7.2 MapReduce on YARN的工作原理 2.8 容错机制 2.9 安全性 2.10 小结 第3章 Hadoop开发环境配置与搭建 第4章 Hadoop分布式文件系统 第5章 Hadoop的I/O操作 第6章 MapReduce编程基础 第7章 MapReduce高级编程 第8章 初识HBase 第9章 初识Hive 附录 《Hadoop集群程序设计与开发》配套实验课程方案简介
|