![]()
内容推荐 娄岩主编的《大数据应用基础(高等学校大数据技术与应用规划教材)》是将大数据基本理论与基本应用有机结合的教材,按照定义、特征、技术流程和典型案例分析的方式编写,抽丝剥茧,由易到难,有助于读者理解和掌握大数据技术。 本书的一大亮点是每章中都使用图表对大数据与传统数据处理方式进行对比。另外,本书注重启发式的学习策略,便于读者理解和掌握。全书在每一章均附有实际应用案例与关键词注释,方便读者查阅和自学,同时配备了习题和参考答案。 本书适合作为普通高校大数据技术的基础教材,也可以作为职业培训教育及相关技术人员的参考用书。 作者简介 娄岩,中国医科大学计算机中心计算机教研室主任、教授,IT专家,海外引进人才,学科带头人。在海内外从事计算机和信息技术工作30余年,加拿大政府特聘Y2K问题专家。出国前:发表论文60余篇,多项成果通过部级鉴定,主编和副主编两本网络大学教材。海归3年:主持研发了中国医科大学用于教学和管理的教学资源互联网平台和教学管理局域网平台,主编了《医学大数据挖掘与应用》《医学虚拟现实技术与应用》等15本创新教材和1本专著。在国内核心专业期刊发表20余篇学术论文,主持和参与2项课题、1项国家自然科学基金课题、10项省级课题和4项校级教育课题,其中1项被评为优秀成果。社会兼职:数据中心联盟大数据发展促进委员会特聘专家,中国医药教育协会常务理事、客座教授,中国医药教育协会医学模拟教育专业委员会委员,中国工业与应用数学会医药数学专业委员会常务理事,中华医学会教育技术分会虚拟仿真组副组长,中华医学会教育技术分会网络技术组委员,清华大学出版社计算机与信息类教材编审委员会委员,南方医科大学客座教授。 目录 第1章 大数据概论 1.1 大数据技术简介 1.1.1 IT产业的发展简史 1.1.2 大数据的主要来源 1.1.3 数据生成的三种主要 方式 1.1.4 大数据的特点 1.1.5 大数据的处理流程 1.1.6 大数据的数据格式 1.1.7 大数据的基本特征 1.1.8 大数据的应用领域 1.2 大数据的技术架构 1.3 大数据的整体技术 1.4 大数据分析的四种典型工具 简介 1.5 大数据未来发展趋势 1.5.1 数据资源化 1.5.2 数据科学和数据联盟的 成立 1.5.3 大数据隐私和安全 问题 1.5.4 开源软件成为推动大数 据发展的动力 1.5.5 大数据在多方位改善人 们的生活 本章小结 习题1 第2章 大数据采集及预处理 2.1 数据采集简介 2.1.1 数据采集 2.1.2 数据采集的数据来源 2.1.3 数据采集的技术方法 2.2 大数据的预处理 2.3 数据采集及预处理的主要 工具 本章小结 习题2 第3章 大数据分析概论 3.1 大数据分析简介 3.1.1 大数据分析 3.1.2 大数据分析的基本 方法 3.1.3 大数据处理流程 3.2 大数据分析的主要技术 3.2.1 深度学习 3.2.2 知识计算 3.3 大数据分析处理系统简介 3.3.1 批量数据及处理系统 3.3.2 流式数据及处理系统 3.3.3 交互式数据及处理 系统 3.3.4 图数据及处理系统 3.4 大数据分析的应用 本章小结 习题3 第4章 大数据可视化 4.1 大数据可视化简介 4.2 大数据可视化工具 Tableau 本章小结 习题4 第5章 Hadoop概论 5.1 Hadoop简介 5.1.1 Hadoop简史 5.1.2 Hadoop应用和发展 趋势 5.2 Hadoop的架构与组成 5.2.1 Hadoop架构介绍 5.2.2 Hadoop组成模块 5.3 Hadoop应用分析 本章小结 习题5 大数据应用基础 目录 第6章 HDFS和Common概论 6.1 HDFS简介 6.1.1 HDFS的相关概念 6.1.2 HDFS特性 6.1.3 HDFS体系结构 6.1.4 HDFS的工作原理 6.1.5 HDFS的相关技术 6.2 Common简介 本章小结 习题6 第7章 MapReduce概论 7.1 MapReduce简介 7.1.1 MapReduce 7.1.2 MapReduce功能、特征和 局限性 7.2 Map和Reduce任务 7.3 MapReduce架构和工作 流程 7.3.1 MapReduce的架构 7.3.2 MapReduce的工作 流程 本章小结 习题7 第8章 NoSQL概论 8.1 NoSQL简介 8.1.1 NoSQL的含义 8.1.2 NoSQL的产生 8.1.3 NoSQL的特点 8.2 NoSQL技术基础 8.2.1 大数据的一致性策略 8.2.2 大数据的分区与放置 策略 8.2.3 大数据的复制与容错 技术 8.2.4 大数据的缓存技术 8.3 NoSQL的类型 8.3.1 键值存储 8.3.2 列存储 8.3.3 面向文档存储 8.3.4 图形存储 8.4 典型的NoSQL工具 8.4.1 Redis 8.4.2 Bigtable 8.4.3 CouchDB 本章小结 习题8 第9章 Spark概论 9.1 Spark平台 9.1.1 Spark简介 9.1.2 Spark发展 9.1.3 Scala语言 9.2 Spark与Hadoop 9.2.1 Hadoop的局限与不足 9.2.2 Spark的优点 9.2.3 Spark速度比Hadoop快的 原因分析 9.3 Spark处理架构及其生态 系统 9.3.1 底层的Cluster Manager 和Data Manager 9.3.2 中间层的Spark Runtime 9.3.3 高层的应用模块 9.4 Spark的应用 9.4.1 Spark的应用场景 9.4.2 应用Spark的成功 案例 本章小结 习题9 第10章 云计算与大数据 10.1 云计算简介 10.1.1 云计算 10.1.2 云计算与大数据的 关系 10.1.3 云计算基本特征 10.1.4 云计算服务模式 10.2 云计算核心技术 10.2.1 虚拟化技术 10.2.2 虚拟化软件及应用 10.2.3 资源池技术 10.2.4 云计算部署模式 10.3 云计算应用案例 本章小结 习题10 第11章 典型大数据解决方案 11.1 Intel大数据 11.1.1 Intel大数据解决 方案 11.1.2 Intel大数据相关 案例 11.2 百度大数据 11.2.1 百度大数据引擎 11.2.2 百度大数据+平台 11.2.3 相关应用 11.2.4 百度预测的使用 方法 11.3 腾讯大数据 11.3.1 腾讯大数据解决 方案 11.3.2 相关实例 本章小结 习题11 第12章 大数据应用案例分析(医疗 领域) 12.1 大数据在临床领域的 应用 12.1.1 基于大数据的比较效 果研究 12.1.2 基于大数据的临床决 策系统 12.1.3 医疗数据 |