"本书以大数据分析全流程为主线,介绍数据采集、数据存储与管理、数据处理与分析、数据可视化等环节典型软件的安装、使用和基础编程方法,涵盖了操作系统(Linux和Windows)、开发工具(Eclipse),以及大数据相关技术、软件(Kafka、Hadoop、HDFS、MapReduce、HBase、Hive、Spark、MySQL、MongoDB、Redis、Matplotlib)等内容。同时,提供了丰富的课程实验、综合案例及大量免费的在线教学资源,可以较好地满足高等院校大数据教学实际需求。
本书是《大数据技术原理与应用——概念、存储、处理、分析与应用》(第4版)的“姊妹书”,可以作为高等院校计算机、信息管理等相关专业的大数据课程辅助教材,用于指导大数据编程实践,也可供相关技术人员参考。本书封面贴有清华大学出版社防伪标签,无标签者不得销售。
"