编辑推荐 本书基于Hadoop 3.3.0,覆盖Hadoop、HBase、Hive的核心概念、实践应用、程序开发等方面的内容,帮你快速解决大数据是什么和怎么用的问题。本书适合Java大数据开发人员快速掌握Hadoop技术。 内容推荐 本书基于Hadoop3.3.0,覆盖Hadoop、HBase、Hive的核心概念、实践应用、程序开发等方面的内容,帮你快速解决大数据是什么和怎么用的问题,书中还利用Docker来部署Hadoop分布式集群,让你同时学会4种流行的技术。本书共9章,主要内容包括Hadoop概述、HDFS原理详解、Yarn原理详解、Hadoop系统配置、高可用Hadoop配置、HDFS编程、MapReduce编程、Hive实战、HBase实战。本书从案例入手、通俗易懂,能使读者在最短时间内迅速掌握Hadoop大数据技术。本书既适合Hadoop大数据初学者、大数据应用开发人员、大数据处理人员使用,也适合高等院校和培训机构大数据相关专业的师生教学参考。 目录 第1章概述 1.1什么是大数据 1.1.1大数据系统的定位 1.1.2与传统分布式系统的区别 1.1.3成功的大数据系统项目 1.2Hadoop的原理 1.2.1存储与资源调度 1.2.2计算框架原理 1.3总结 第2章HDFS原理详解 2.1主从节点架构 2.2数据冗余 2.3fsimage与edits 2.4SecondaryNameNode 2.5HA 2.6自动故障转移 …… |