作者简介 王道平,北京科技大学经济管理学院教授、博士生导师。1989年毕业于清华大学计算机系,获硕士学位,1999年获博士学位,1999年9月至2001年8月在清华大学从事博士后研究工作,研究方向为智能管理系统。2004年8月至11月在美国德克萨斯大学工商管理学院做不错访问学者。研究方向为供应链管理、数据挖掘等。近年来,主编教材10余部,受到使用单位的广泛好评。作为主编,由北大出版社出版的《现代物流信息技术》和《供应链设计理论与方法》先后被评为北京市高等教育精品教材。 目录 章大数据处理概论 1.1大数据简介 1.1.1大数据的概念 1.1.2大数据的特征 1.1.3大数据的关键技术 1.1.4大数据的发展 1.2大数据的操作流程 1.2.1大数据采集 1.2.2大数据存储 1.2.3大数据处理 1.2.4大数据分析 1.3大数据的处理方式 1.3.1批处理 1.3.2流式计算 …… 第2章基于Hadoop的大数据处理 第3章基于Hadoop的分布式文件系统HDFS 第4章并行计算框架MapReduce 第5章分布式数据仓库Hive 第6章基于Spark的大数据处理 第7章基于Storm的大数据处理 第8章大数据处理的其他技术及应用 附录常用中英文术语对照表 参考文献 内容推荐 本书以介绍大数据处理技术为主线,详细介绍了基于Hadoop的大数据处理框架及其组成部分,并且讲述了基于Spark和Storm的大数据处理技术,同时还介绍了大数据处理的其他技术及其应用。本书既可以作为高等院校数据科学与大数据、大数据技术与应用、软件工程及相关专业的教材,也可以供系统分析师、系统架构师、软件开发工程师和项目经理,以及其他学习大数据技术的读者阅读和参考。本书符合48学时的教学要求,适合大学低年级同学使用,建议先学习本系列前置课程的教材《大数据导论》,后续课程的教材建议是《大数据分析》等,以达到系统性学习大数据知识的目的。本书加入了大量的图文、视频资源。扫描二维码可以观看。 |