本书面向Hadoop大数据技术,通过大量实例,循序渐进地介绍了Hadoop生态系统常用组件的安装及使用方法。
全书共15个项目,主要内容包括:在虚拟机中安装CentOS 7、安装Hadoop伪分布、配置平台基础环境、搭建Zookeeper分布式集群、搭建HDFS分布式集群、搭建YARN分布式集群、Hadoop分布式计算框架(MapReduce)、Hive的安装与部署、Hive常用命令的使用、搭建HBase分布式集群、Sqoop的安装与部署、Flume的安装与使用、搭建Kafka分布式集群、Davinci的安装与部署以及互联网金融项目的离线分析。本书内容由浅入深,涵盖了Hadoop大数据生态系统的各个主要知识点。
本书内容翔实,通俗易懂,可作为大数据初学者的学习教材,也可作为大数据应用开发人员的参考书。