![]()
内容推荐 本书围绕大数据技术的基本原理与实践,介绍了大数据获取、存储、分析,以及数据挖掘和机器学习技术,内容涵盖Hadoop、Mapreduce、关联规则、大规模监督机器学习、数据流、集群、NoSQL系统(Pig、Hive)等。 第1章重点阐述了大数据驱动的商业模式、技术生态体系,大数据的类型、特点、获取技术。第2章概要介绍了大数据的软硬件架构,包括大数据技术基础与软硬件设施、大数据存储与管理技术、大数据的分布式处理技术平台等。第3章介绍了Python编程基础,包括基本数据类型、基本控制流程,以及Numpy程序库、Scipy和Pandas模块。第4章介绍了大数据分析技术,包括MapReduce编程基础、文本大数据分析与处理技术、大数据关联分析、相似项的发现、基于大数据的推荐系统、基于大数据的图与网络分析、大数据聚类分析、时空大数据分析、非结构化大数据分析与处理、基于Storm的流数据分析技术等。第5章介绍了基于Spark MLlib/Mahout的大数据机器学习,包括机器学习基础、典型机器学习问题、机器学习评价方法、并行机器学习算法,并进行了利用MLlib解决大数据并行分类问题、利用Mahout解决大数据推荐优化问题实践。第6章介绍了基于大数据的深度学习技术与应用,包括深度学习基本原理、深度学习典型应用、Keras基础入门及应用案例。第7章介绍了带代码、数据的案例,包括材料大数据与材料热导率预测、旅游大数据分析、交通大数据分析、工业大数据分析、产品创新大数据分析等。 本书内容深入浅出,可作为数据科学与技术、人工智能、计算机科学、制造科学、机械工程等学科相关专业的本科生、研究生的教材或课程教学参考书,也是对工程技术人员、科研人员而言非常实用的工具书。 作者简介 李少波,男,1973年11月生,中共党员,工学博士,教授(专业技术二级),现任贵州大学机械工程学院院长、物联网产业发展研究中心主任。贵州大学机械工程学科博士生导师,中国科学院大学计算机软件与理论专业兼职博士生导师,长期从事智能制造、大数据、“互联网+”产业的研究。教育部新世纪优秀人才,贵州省省管专家、享受政府特殊津贴专家,贵州省高层次创新型人才(百层次)、贵州省优秀青年科技人才,贵州省制造业信息化专家组组长。已发表论文170余篇,其中SCl/EI收录70余篇;出版专著2部,译著1部;获颁软件著作权登记证书l7项,获发明专利9项。主持包括国家863计划项目、国家科技支撑计划项目、国家自然科学基金项目和教育部、工信部及贵州省科技项目在内的项目共30余个。获省部级科技进步二等奖2次、三等奖3次,获贵阳市科技进步特等奖1次、二等奖2次。 目录 第1章 大数据技术概览 1.1 大数据驱动的世界 1.2 数据的类型 1.3 大数据的特点 1.4 大数据的获取技术 1.5 大数据实战:网络爬虫抓取京东商品评论大数据 本章小结 习题 第2章 大数据的软硬件架构 2.1 大数据技术基础与软硬件设施概述 2.2 大数据存储与管理技术 2.3 大数据的分布式处理技术平台 本章小结 习题 第3章 Python编程基础 3.1 基本数据类型 3.2 基本控制流程 3.3 Numpy、Scipy和Pandas 3.4 Matplotlib软件包 本章小结 习题 第4章 大数据分析技术 4.1 MapReduce 基础编程 4.2 文本大数据分析与处理技术 4.3 大数据关联分析 4.4 相似项的发现 4.5 基于大数据的推荐系统 4.6 基于大数据的图与网络分析 4.7 大数据聚类分析 4.8 时空大数据分析 4.9 非结构化大数据分析与处理 4.10 基于Storm的流数据分析技术 习题 第5章 基于Spark MLlib/Mahout的大数据机器学习 5.1 机器学习基础 5.2 典型机器学习问题 5.3 机器学习评价方法 5.4 并行机器学习算法 5.5 利用MLlib解决大数据并行分类问题实践 5.6 利用Mahout解决大数据推荐优化问题实践 本章小结 习题 第6章 基于大数据的深度学习技术与应用 6.1 深度学习基本原理 6.2 深度学习典型应用 6.3 Keras基础入门 6.4 应用案例 本章小结 习题 第7章 带代码、数据的案例研究 7.1 材料大数据材料热导率预测 7.2 旅游大数据分析 7.3 交通大数据分析 7.4 工业大数据分析 7.5 产品创新大数据分析 习题 参考文献 |