内容推荐 本书是由学校教师与企业工程师合作编写的活页式新形态教材。全书以项目实战为主线,重点介绍了使用大数据平台进行项目开发的知识与技巧。项目主要包括大数据平台搭建基础及Spark集群搭建的功能,大数据平台搭建基础包括Hadoop集群搭建及HDFS文件系统访问、MapReduce、Zookeeper、HBase、Hive等功能,Spark集群搭建包括Scala安装、Spark集群部署等详细功能。通过本书读者可以掌握大数据平台开发的理论知识与技术技能,潜移默化地培养项目化思维,积累项目经验。为了便于读者更好地掌握技术,项目中涉及到的主要知识点,以知识准备和知识链接两种形式讲解,教材同时提供项目实现操作全过程视频资源。 本书即可作为高职院校计算机专业的教材,也可作为大数据技术开发人员的参考书。 目录 单元1 项目准备 任务1 Git的安装与使用 任务2 账户创建 任务3 环境搭建 单元2 Hadoop集群的搭建 任务1 Hadoop集群的搭建及配置 任务2 HDFS文件系统常用命令操作 任务3 Java访问HDFS 任务4 Java操作HDFS目录和文件 单元3 MapReduce实现 任务1 MapReduce Mapper类实现 任务2 MapReduce Reducer类实现 任务3 MapReduce提交和打包 单元4 Zookeeper部署 任务1 ZooKeeper的安装 任务2 Java实现ZooKeeper对Znode的基本操作 单元5 HBase集群的搭建 任务1 HBase集群的搭建 任务2 Java实现HBase表建立 任务3 数据的基本查询和过滤器查询 单元6 Hive部署 任务1 本地模式安装Hive 任务2 Hive的基本操作 单元7 Spark SQL处理 任务 Spark SQL下载与安装 单元8 项目结项 任务 产品发布及归档 单元9 项目评价 任务 评价及总结 参考文献 |