本书系统介绍了大数据基础知识和相关技术,全书分为大数据基础、大数据存储与管理篇、大数据采集与预处理、大数据分析与挖掘、大数据平台Hadoop实践与应用案例5篇,共17章,主要内容包括大数据基本概念、大数据平台Hadoop基础、大数据存储与管理基本概念、大数据分布式文件系统HDFS、大数据分布式数据库系统HBase、大数据分布式数据仓库系统Hive、大数据采集与预处理技术、大数据采集工具、大数据计算模式、大数据MapReduce计算模型、大数据Spark计算模型、大数据Flink计算模型、大数据MapReduce基础算法、大数据挖掘算法、Hadoop大数据平台实践、开敞式码头系泊缆力预测应用案例以及曙光XData大数据平台及应用案例。全书提供了大量应用实例,且大多章后附有习题。本书特色在于融会贯通大数据基本概念与大数据技术及应用,很好地将大数据概念、技术及应用融合在一起,便于读者更好地理解大数据基本概念,更快掌握大数据前沿技术及其应用。
本书适合作为高等院校计算机、软件工程、信息管理等相关专业的本科生及研究生大数据技术课程的教学用书,也可作为相关T工程技术人员的参考用书。