内容推荐 本教材一共6个项目,项目1为Hadoop导入,主要介绍了Hadoop的作用、特点、发展情况,并详细介绍了Hadoop伪分布式搭建及使用方法;项目2主要对Hadoop的核心元素、接口操作进行了细致讲解;项目3对为实现Hadoop HA所需的Zookeeper的架构、部署等进行了解释;项目4至项目6详细介绍了Hadoop生态圈中的几个核心组件――分布式存储数据库(HBase)、数据迁移利器(Sqoop)、数据采集利器(Flume)以及数据仓库(Hive),在介绍这几个核心组件的同时也融入了对于大数据综合实验的分析。本教材具有较强实用性,教材内容以“学”和“导学”交织呈现,十分适合学习者使用。 目录 任务一:Hadoop简介 1.1.1 Hadoop介绍 1.1.2 Hadoop的发展历史及现状 1.1.3 任务回顾 1.2 任务二:搭建Hadoop伪分布式环境 1.2.1 准备工作 1.2.2 伪分布式环境搭建 1.2.3 Hadoop测试 1.2.4 任务回顾 1.3 项目总结 1.4 拓展训练 项目2:Hadoop入门及实战 2.1 任务一:HDFS体系结构与基本原理 2.1.1 HDFS概述 2.1.2 HDFS核心元素及其原理 2.1.3 任务回顾 2.2 任务二:HDFS接口操作 2.2.1 Shell接口操作 2.2.2 Java接口操作 2.2.3 任务回顾 2.3 任务三:MapReduce开发实战 2.3.1 MapReduce工作机制 2.3.2 MapReduce开发实战 2.3.3 任务回顾 2.4 项目总结 2.5 拓展训练 项目3:搭建Zookeeper运行环境 3.1 任务一:Zookeeper概述 3.1.1 Zookeeper原理 3.1.2 Zookeeper系统架构 3.1.3 任务回顾 3.2 任务二:ZooKeeper集群搭建 3.2.1 集群规划 3.2.2 安装zookeeper集群 3.2.3 任务回顾 3.3 任务三:使用Zookeeper来实现Hadoop的高可用性 3.3.1 Zookeeper集群与Hadoop高可用性 3.3.2 Hadoop高可用性集群部署 3.3.3 任务回顾 3.4 项目总结 3.5 拓展训练 项目4:分布式存储数据库 4.1 任务一:HBase概述 4.1.1 HBase简介 4.1.2 HBase表结构 4.1.3 HBase核心进程 4.1.4 HBase系统架构 4.1.5 任务回顾 4.2 任务二:HBase集群搭部署 4.2.1 HBase单节点部署 4.2.2 HBase集群部署 4.2.3 任务回顾 4.3 任务三:HBase实战 4.3.1 HBase Shell 4.3.2 HBase Java 4.3.3 任务回顾 4.4 项目总结 4.5 拓展训练 项目5:数据迁移和数据采集 5.1 任务一:数据迁移shen器-Sqoop 5.1.1 Sqoop概述 5.1.2 Sqoop部署 5.1.3 Sqoop实战 5.1.4 任务回顾 5.2 任务二:数据采集shen器-Flume 5.2.1 Flume概述 5.2.2 Flume部署 5.2.3 Flume实战 5.2.4 任务回顾 5.3 项目总结 5.4 拓展训练 项目6:数据分析 6.1 任务一:Hive概述 6.1.1 Hive简介 6.1.2 Hive架构及原理分析 6.1.3 Hive数据类型 6.1.4 Hive表类型 6.1.5 任务回顾 6.2 任务二:Hive部署与实战 6.2.1 Hive部署 6.2.2 Hive表操作 6.2.3 Hive数据分析 6.2.4 任务回顾 6.3 项目总结 6.4 拓展训练 |