![]()
内容推荐 胡沛、韩璞著的《大数据技术及应用探究》第一章深入探究了大数据的概念,产生的背景以及发展状况,应用案例,并针对大数据的历史机遇提出了自己的一些看法。 从第二章到第六章,通过系统研究Hadoop生态系统和基于Hadoop2.X版本架构,能够使读者对Hadoop有一个清晰直观的认识和了解;同时又探究HDFS和MapReduce Java API编程,使读者不仅能了解。Hadoop相关原理还能掌握其编程思想。 本书不仅适合计算机相关专业学生的大数据基础学习,也能够满足想继续深入了解Hadoop架构编程的学习者。 目录 1 大数据概论 1.1 大数据概述 1.2 Hadoop生态系统 1.3 大数据处理工具 1.4 大数据与云计算的关系 1.5 分布式与集群 2 大数据平台Hadoop 2.1 Hadoop架构 2.2 Hadoop1.X与Hadoop2.X的区别 2.3 Hadoop平台搭建 3 分布式文件系统HDFS 3.1 HDFS架构 3.2 HDFS读写过程解析 3.3 HDFS shell命令 3.4 HDFS Java API编程 4 分布式计算模型MapReduce 4.1 MapReduce编程模型 4.2 MapReduce工作原理 4.3 Yarn 4.4 MapReduce可编程组件 4.5 MapReduce Java API编程 5 分布式数据库HBase 5.1 HBase介绍 5.2 HBase数据模型 5.3 HBase系统架构 5.4 HBase数据读写流程 5.5 HRegion的split和compact 5.6 HBase环境搭建 5.7 HBase shell 5.8 HBase Java API 6 分布式数据库仓库Hive 6.1 Hive简介 6.2 Hive与HBase,关系型数据库的对比 6.3 Hive的数据管理 6.4 Hive的体系架构 6.5 Hive的执行流程 6.6 HQL 6.7 Hive环境搭建 6.8 Hive Java API 6.9 Hive综合案例 7 Scala编程基础 7.1 Scala简介 7.2 Scala安装 7.2 Scala语法 7.3 Scala程序控制结构 7.4 Scala容器 7.5 cala函数 7.6 面向对象编程 8 分布式计算框架Spark 8.1 Spark概述 8.2 Spark运行原理 8.3 Spark环境搭建 8.4 RDD编程 8.5 数据读写操作 8.6 Spark SQL 8.7 Spark Streaming 8.8 Spark远程开发及提交
|