![]()
内容推荐 本书以提高应用能力为目的,每个项目设置多个任务,循序渐进,再以综合实训为辅,带领读者走进大数据的世界,帮助读者在感受大数据魅力的同时掌握大数据相关技能。 目录 项目一 Hadoop大数据处理平台 【任务一】学习Linux网络的搭建 【任务二】学习Linux安全机制的配置 【任务三】完成Hadoop环境的搭建 项目二 大数据存储技术(HDFS) 【任务一】学习HDFS的相关概念 【任务二】认识HDFS体系架构与原理 项目三 大数据离线计算框架(MapReduce & YARN) 【任务一】学习MapReduce技术原理 【任务二】学习YARN技术原理 项目四 大数据数据库(HBase) 【任务一】了解HBase 【任务二】学习HBase的架构原理 【任务三】学习HBase的基本操作 项目五 大数据数据仓库(Hive) 【任务一】学习Hive基础知识 【任务二】学习Hive的架构和数据存储 【任务三】完成Hive应用实践 项目六 大数据数据转换(Sqoop) 【任务一】学习Sqoop基础知识 【任务二】完成sqoop操作 项目七 大数据日志处理(Flume) 【任务一】学习Flume基础知识 【任务二】完成Flume的应用实践 项目八 大数据实时计算框架(Spark) 【任务一】学习Spark基础知识 【任务二】学习Spark技术架构 【任务三】完成Spark应用实践 【任务四】完成Spark streaming操作 【任务五】完成Spark SQL操作 参考文献 |