![]()
内容推荐 本书作为Hadoop大数据技术的项目化实战教材,以任务驱动为导向,深入浅出地介绍了Hadoop及其周边框架的应用,涵盖了当前Hadoop生态系统中的主流大数据技术。 全书共12个项目,包括云计算和大数据基础概论、CentOS的安装与网络配置、MPI集群部署及应用、Hadoop集群部署及应用、MapReduce基本原理及应用、HBase数据库的搭建及使用、Hive数据仓库的安装及应用、Pig数据分析、Sqoop数据迁移、Flume日志收集系统、Spark部署及数据分析、大数据技术编程实例。本书秉承“实践为主、理论够用、注重实用”原则,在任务实施中融入各个知识点与课程教学内容,以便读者能更好地学习和掌握大数据关键技术。 本书既可以作为高职高专院校和应用型本科院校计算机相关专业的教材,还可以作为IT类培训机构培训云计算和大数据技术等相关课程的实训教材,并可以作为相关技术人员的参考书。 目录 项目1 云计算和大数据基础概论 任务1 认识云计算 任务2 云计算中的虚拟化技术 任务3 云计算与大数据 任务4 大数据的技术架构 任务5 大数据的应用前景 任务6 大数据的发展历程及其面临的挑战 项目2 CentOS的安装与网络配置 任务1 Linux操作系统概述 任务2 使用VMware虚拟机安装CentOS 任务3 CentOS网络环境配置 任务4 yum源设置及使用 项目3 MPI集群部署及应用 任务1 NTP时间同步设置 任务2 SSH证书登录 任务3 使用NFS设置共享目录 任务4 MPI的安装及测试 任务5 MPI编程实战 项目4 Hadoop集群部署及应用 任务1 Hadoop集群部署前的准备工作 任务2 Hadoop的安装 任务3 Hadoop伪分布式部署及应用 任务4 Hadoop分布式部署及应用 项目5 MapReduce基本原理及应用 任务1 MapReduce工作原理及工作流程 任务2 词频统计编程实践 任务3 数据合并去重编程实践 任务4 数据排序编程实践 项目6 HBase数据库的搭建及使用 任务1 HBase安装及伪分布式部署 任务2 HBase完全分布式部署 任务3 HBase操作实践 任务4 HBase编程实践 项目7 Hive数据仓库的安装及应用 任务1 Hive基本概念 任务2 Hive安装及部署 任务3 Hive基本命令和应用 项目8 Pig数据分析 任务1 Pig基本概念 任务2 Pig安装及部署 任务3 Pig命令语法和使用 任务4 Pig简单编程 项目9 Sqoop数据迁移 任务1 Sqoop基本概念 任务2 Sqoop安装及部署 任务3 利用Sqoop工具实现MySQL与HDFS之间数据迁移 任务4 利用Sqoop工具实现MySQL与Hive/HBase之间数据迁移 项目10 Flume日志收集系统 任务1 Flume系统概述 任务2 Flume安装和部署 任务3 Flume应用案例 项目11 Spark部署及数据分析 任务1 Spark基本概念 任务2 Spark安装及部署 任务3 Spark数据分析 任务4 Spark应用案例 项目12 大数据技术编程实例 任务1 能耗数据分析及处理 任务2 餐饮大数据分析及处理 参考文献 |