内容推荐 全书共9章。1-6章主要介绍了各类大数据平台的部署与应用,包括Hadoop、ZooKeeper、Hbase、Hive和Spark等大数据平台技术。7-9章聚焦数据处理和分析,涵盖数据的分布式存储、分布式计算、数据可视化和数据模型分析等大数据处理和分析方法。通过一定量的实验实践学习,培养学生大数据平台的操作能力和大数据业务的分析能力。本书可以作为各院校统计、大数据、计算机和人工智能等专业本科生和研究生的实践实训教材,也可作为大数据、机器学习和人工智能爱好者的参考用书。 目录 第1章实验环境的准备 1.1资源下载 1.2环境实现 1.3远程工具的安装和使用 1.4备份、恢复与克隆 本章小结 综合实验 课后习题 第2章Hadoop的部署与运维 2.1Hadoop简介 2.2运行环境配置 2.3单机模式Hadoop 2.4伪分布式模式Hadoop 2.5集群模式Hadoop 本章小结 综合实验 课后习题 第3章ZooKeeper与高可用模式Hadoop 3.1ZooKeeper简介 3.2高可用模式Hadoop 本章小结 综合实验 课后习题 第4章Hive数据仓库与Hbase分布式数据库 4.1Hive数据仓库 4.2HBase分布式数据库 本章小结 …… |