网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 Hadoop构建数据仓库与实战分析
分类 教育考试-考试-计算机类
作者 小牛学堂主编
出版社 电子工业出版社
下载
简介
作者简介
小牛学堂,是在线教育平台,网站内建设有在线学习行业课程专栏体系,通过用户基础推荐合适的学习方案,关联推荐课程,并通过大数据行为轨迹定位进行学员学习跟进。主要提供以SAP项目、云计算及大数据项目、Unity3D游戏开发项目的在线学习,直播互动,免费学习课程等服务。
目录
章Hadoop简介1
1.1Hadoop相关介绍1
1.1.1Hadoop概述1
1.1.2Hadoop的历史1
1.1.3Hadoop的功能与作用1
1.1.4Hadoop的优势2
1.1.5Hadoop的应用现状与趋势2
1.2Hadoop的项目2
1.3Hadoop的体系结构4
1.4Hadoop与分布式开发5
1.5Hadoop计算模型8
1.6Hadoop的数据管理8
1.6.1HDFS的数据管理8
1.6.2HBase的数据管理10
1.6.3Hive的数据管理11
1.7Hadoop集群安全策略12
思考练习14
第2章Hadoop的安装与配置15
2.1在Linux上安装与配置Hadoop15
2.1.1安装JDK1.615
2.1.2配置SSH免密码登录16
2.1.3安装并运行Hadoop17
2.2在MacOSX上安装与配置Hadoop19
2.2.1安装Homebrew19
2.2.2使用Homebrew安装Hadoop19
2.2.3配置SSH和使用Hadoop19
2.3在Windows上安装与配置Hadoop19
2.3.1安装JDK1.6或更高版本19
2.3.2安装Cygwin20
2.3.3配置环境变量20
2.3.4安装sshd服务20
2.3.5启动sshd服务20
2.3.6配置SSH免密码登录20
2.3.7安装并运行Hadoop21
2.4安装与配置Hadoop集群21
2.4.1网络拓扑21
2.4.2定义集群拓扑22
2.4.3建立和安装Cluster22
2.5日志分析及几个小技巧28
思考练习29
第3章HDFSHA及解决方案30
3.1HDFS系统架构30
3.2HA定义31
3.3HDFSHA原因分析及应对措施31
3.3.1可靠性31
3.3.2可维护性32
3.4Hadoop的HA解决方案32
3.4.1Hadoop的元数据备份方案32
3.4.2Hadoop的SecondaryNameNode方案33
3.4.3Hadoop的CheckpointNode方案33
3.4.4Hadoop的BackupNode方案34
3.4.5DRDB方案34
3.4.6Facebook的AvatarNode方案34
3.5方案的优点与缺点比较35
思考练习36
第4章HDFS元数据解析37
4.1概述37
4.2内存元数据结构37
4.2.1INode37
4.2.2Block38
4.2.3BlockInfo和DatanodeDescriptor39
4.2.4小结39
4.2.5代码分析―元数据结构39
4.3磁盘元数据文件43
4.4format情景分析45
4.5元数据应用场景分析56
思考练习57
第5章Hadoop的元数据备份方案58
5.1运行机制分析58
5.1.1NameNode启动加载元数据情景分析59
5.1.2元数据更新及日志写入情景分析67
5.1.3Checkpoint过程情景分析73
5.1.4元数据可靠性机制95
5.2使用说明95
思考练习96
第6章Hadoop的BackupNode方案97
6.1BackupNode概述97
6.1.1系统架构97
6.1.2使用原则97
6.2运行机制分析98
6.2.1运行机制98
6.2.2元数据操作情景分析113
6.2.3日志池机制119
6.2.4故障切换机制122
6.3实验方案说明124
6.4构建实验环境124
6.4.1网络拓扑124
6.4.2系统安装及配置124
6.4.3安装JDK131
6.4.4虚拟机集群架设132
6.4.5NameNode安装及配置133
6.4.6BackupNode安装及配置133
6.4.7DataNode安装及配置134
6.4.8Clients安装及配置134
6.5异常解决方案134
6.5.1异常情况分析134
6.5.2NameNode配置134
6.5.3BackupNode配置139
6.5.4DataNode配置141
6.5.5NameNode宕机切换实验143
6.5.6NameNode宕机读/写测试148
思考练习153
第7章MapReduce设计理念与基本架构154
7.1HadoopMapReduce设计目标154
7.2MapReduce编程模型概述154
7.2.1MapReduce编程模型简介154
7.2.2MapReduce编程实例156
7.3Hadoop基本架构157
7.3.1HDFS架构158
7.3.2HadoopMapReduce架构159
7.4HadoopMapReduce作业的生命周期160
思考练习162
第8章MapReduce编程模型163
8.1MapReduce编程模型概述163
8.1.1MapReduce编程接口体系结构163
8.1.2新版与旧版MapReduceAPI比较164
8.2MapReduceAPI基本概念165
8.2.1序列化165
8.2.2Reporter参数166
8.2.3回调机制166
8.3JavaAPI解析167
8.3.1作业配置与提交167
8.3.2InputFormat接口的设计与实现170
8.3.3OutputFormat接口的设计与实现174
8.3.4Mapper与Reducer解析177
8.3.5Partitioner接口的设计与实现180
8.4非JavaAPI解析181
8.4.1HadoopStreaming的实现原理181
8.4.2HadoopPipes的实现原理184
8.5Hadoop工作流187
8.5.1JobControl的实现原理187
8.5.2ChainMapper/ChainReducer的实现原理189
8.5.3Hadoop工作流引擎191
思考练习192
第9章YARN设计理念与基本架构193
9.1YARN产生背景193
9.1.1MRv1的局限性193
9.1.2轻量级弹性计算平台194
9.2Hadoop基础知识195
9.2.1术语解释195
9.2.2Hadoop的版本变迁196
9.3YARN基本设计思想198
9.3.1基本框架对比198
9.3.2编程模型对比200
9.4YARN基本架构200
9.4.1YARN基本组成结构200
9.4.2YARN通信协议202
9.5YARN工作流程203
9.6多角度理解YARN204
9.6.1并行编程204
9.6.2资源管理系统204
9.6.3云计算204
思考练习205
0章YARN基础库206
10.1YARN基础库概述206
10.2第三方开源库206
10.2.1ProtocolBuffers206
10.2.2ApacheAvro209
10.3底层通信库211
10.3.1RPC通信模型212
10.3.2HadoopRPC的特点概述213
10.3.3RPC总体架构213
10.3.4HadoopRPC使用方法214
10.3.5HadoopRPC类详解215
10.3.6HadoopRPC参数调优219
10.3.7YARNRPC实现219
10.3.8YARNRPC应用实例221
10.4服务库与事件库225
10.4.1服务库225
10.4.2事件库226
10.4.3YARN服务库和事件库的使用方法226
10.4.4事件驱动带来的变化229
10.5状态机库230
10.5.1YARN状态转换方式230
10.5.2状态机类230
10.5.3状态机的使用方法230
10.5.4状态机可视化233
10.6源代码阅读引导233
思考练习234
参考文献235
内容推荐
本书从Hadoop背景、特性、安装等开始,逐步讲解其配置、解决方案、元数据解析等内容。本书共10章,主要内容包括:Hadoop简介,Hadoop的安装与配置,HDFS HA及解决方案,HDFS元数据解析,Hadoop的元数据备份方案,Hadoop的BackupNode方案,MapReduce设计理念与基本架构,MapReduce编程模型,YARN设计理念与基本架构,YARN基础库。本书可作为高等院校计算机等相关专业的大数据或相关课程的教材,也可供大数据领域的工程技术人员学习、参考。
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/2/23 5:22:57