![]()
内容推荐 本书从大数据的概念和特征开始讲起,首先让读者对大数据有一个感性的认识;然后结合大数据平台的各个模块,详细介绍了大数据的存储、处理、分析、可视化等方面的原理和操作;最后介绍了大数据在各行业中的应用,让读者更加充分地感受到大数据技术的优势,以及大数据应用的价值。 本书适合高等院校相关专业的学生使用,也适合参加大数据技术培训课程的人员使用,还可以作为从事ICT行业相关工作的人员和大数据技术爱好者的参考书。 目录 第 1 章 大数据概述 11 大数据的概念与价值 111 大数据的基本概念 112 大数据的来源 113 大数据的价值 114 挖掘企业大数据价值的方式 12 大数据的关键技术 121 大数据采集、预处理、存储与管理 122 大数据分析与挖掘 123 大数据可视化 13 大数据产业 131 数据提供 132 技术提供 133 服务提供 14 大数据应用场景 15 本章总结 练习题 第 2 章 Hadoop 大数据处理平台 21 Hadoop 平台概述 211 Hadoop 起源及发展 212 Hadoop 特性 213 Hadoop 应用现状 214 Hadoop 版本及相关平台 22 Hadoop 生态系统 221 HDFS 和 HBase 222 MapReduce 和 YARN 223 Hive 224 Sqoop 和 Flume 225 ZooKeeper 和 Oozie 226 Kerberos 和 LDAP 227 Impala 和 Solr 228 Kafka 23 Hadoop 安装部署 231 Hadoop 规划部署 232 Hadoop 的安装方式 24 华为 FusionInsight HD 安装部署 241 FusionInsight HD 简介 242 FusionInsight HD 集成设计 243 FusionInsight HD 安装部署 244 FusionInsight HD 重要参数配置 25 本章总结 练习题 第 3 章 HDFS 31 概述 311 DFS 的概念与作用 312 HDFS 概述 32 HDFS 的相关概念 321 HDFS 块 322 NameNode 323 Secondary NameNode 324 DataNode 33 HDFS 体系架构与原理 331 HDFS 体系架构 332 HDFS 的高可用机制 333 HDFS 的目录结构 334 HDFS 的数据读写过程 34 HDFS 接口及其在 FusionInsight HD 编程中的实践 341 HDFS 常用的 Shell 命令 342 HDFS 的 Web 界面 343 HDFS 的 Java API 及应用实例 35 本章总结 练习题 第 4 章 MapReduce 和 YARN 41 MapReduce 技术原理 411 MapReduce 概述 412 Map 函数与 Reduce 函数 42 YARN 技术原理 421 YARN 的概述与应用 422 YARN 的架构 423 MapReduce 的计算过程 424 YARN 的资源调度 43 FusionInsight HD 中 MapReduce 的应用 431 WordCount 实例分析 432 MapReduce 编程实践 44 本章总结 练习题 第 5 章 HBase 51 HBase 概述与 导语 深入浅出讲解大数据技术,结合实际案例,各章配有学习目标、总结、练习题、答案,还有视频讲解、实验手册、PPT课件、综合实训等配套资源,帮你掌握大数据技术! |