第1章 概论
1.1 大数据技术简介
1.1.1 大数据技术的起源
1.1.2 大数据应用领域
1.1.3 大数据基础设施
1.2 大数据技术与大数据开发
1.2.1 什么是大数据开发
1.2.2 大数据开发的作用
1.2.3 大数据开发技术框架
1.2.4 大数据开发与大数据分析的
异同
1.3 本书中你将学习到的内容
本章小结
本章练习
第2章 Hadoop集群环境搭建
2.1 Hadoop简介
2.1.1 Hadoop的优点
2.1.2 Hadoop生态系统
2.2 Hadoop集群环境搭建
2.2.1 修改主机名
2.2.2 修改主机IP映射
2.2.3 配置SSH无密码登录
2.2.4 安装JDK
2.2.5 安装Hadoop
本章小结
本章练习
第3章 HDFS
3.1 HDFS的概念
3.2 HDFS的特点
3.3 HDFS的原理
3.3.1 HDFS体系结构
3.3.2 HDFS主要组件
3.4 HDFS中的文件读/写
3.4.1 HDFS读数据
3.4.2 HDFS写数据
3.5 HDFS的安全性措施
3.6 HDFS命令行操作
3.7 常用HDFS Java API详解
3.7.1 新建Hadoop项目
3.7.2 读取数据
3.7.3 创建目录
3.7.4 创建文件
3.7.5 删除文件
3.7.6 遍历文件和目录
3.7.7 复制上传本地文件
3.7.8 复制下载文件
本章小结
本章练习
第4章 MapRedlice
4.1 MapReduce概述
4.2 MapReduce技术特征
4.3 MapReduce 工作流程
4.3.1 MapReduce 工作原理
4.3.2 MapReduce任务流程
4.4 MapReduce工作组件
4.5 MapReduce错误处理机制
4.5.1 硬件故障处理
4.5.2 任务失败处理
4.6 案例分析一:单词计数
4.6.1 设计思路
4.6.2 程序源代码
4.6.3 程序解读
4.6.4 程序运行
4.7 案例分析二:数据去重
4.7.1 设计思路
4.7.2 程序源代码
……
第5章 ZooKeeper
第6章 HBase
第7章 Hive
第8章 storm
第9章 Sqoop
第10章 Kafka
第11章 Spark
第12章 ElasticSearch