(1)系统化理论建设,理论讲解与动手实践相结合。
(2)适配大数据处理主流技术,提供大量实践案例。
(3)注重教学资源建设,常规教学资源及微课同步建设。
目前国内大数据技术继续保持高速的发展态势,作者从大数据的全生命周期中涉及的大数据技术架构、基础设施、大数据采集与预处理、数据存储与文件系统、NoSQL数据库、数据分析与开发、数据可视化及应用、大数据安全等方面得到较为全面指导和帮助,并且能够在一门课程中学习与大数据有关的云计算、人工智能等与大数据息息相关的内容。
网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | 大数据技术与应用 |
分类 | 教育考试-大中专教材-大学教材 |
作者 | 孔华锋 沈青 龙雪玲 |
出版社 | 人民邮电出版社 |
下载 | |
简介 | 编辑推荐 (1)系统化理论建设,理论讲解与动手实践相结合。 (2)适配大数据处理主流技术,提供大量实践案例。 (3)注重教学资源建设,常规教学资源及微课同步建设。 目前国内大数据技术继续保持高速的发展态势,作者从大数据的全生命周期中涉及的大数据技术架构、基础设施、大数据采集与预处理、数据存储与文件系统、NoSQL数据库、数据分析与开发、数据可视化及应用、大数据安全等方面得到较为全面指导和帮助,并且能够在一门课程中学习与大数据有关的云计算、人工智能等与大数据息息相关的内容。 内容推荐 本书以大数据的全生命周期中涉及技术为线索,比较全面地介绍了大数据技术架构、基础设施、大数据采集与预处理、数据存储与文件系统、NoSQL数据库、数据分析与开发、数据可视化及应用、大数据安全等方面内容,同时针对Hadoop框架、HDFS、HBASE、Spark等技术为例进行了部署展示,并针对大数据有关的云计算、人工智能等与大数据息息相关的内容进行较为详细的介绍与说明。 本书针对相关知识点都进行较为细致的讲述,并配有与理论学习相结合的电子资源,包括教学大纲、课程PPT与实验案例等,可作为高校计算机、信息技术类大数据相关通识课程教材,也可以作为大数据相关专业的专业课程教材。 目录 第 1章\t大数据的概述\t1 本章导读 1 1.1 什么是大数据 1 1.2 大数据的来源 3 1.3 大数据的分类 5 1.4 大数据的特征 7 1.5 大数据的新思维和新理念 8 1.6 大数据系统的基础架构 13 1.6.1 基础支撑服务 14 1.6.2 数据采集及预处理服务 14 1.6.3 数据存储服务 15 1.6.4 数据引擎服务 16 1.6.5 综合应用服务 16 1.6.6 数据治理体系 16 1.6.7 支撑体系 18 1.7 大数据的技术体系 18 1.8 本章小结 19 拓展阅读 19 本章习题 20 第 2章 大数据基础设施 22 本章导读 22 2.1 虚拟化技术 23 2.1.1 虚拟化的定义 23 2.1.2 虚拟化的特征 24 2.1.3 虚拟化技术的分类 26 2.2 云计算技术 30 2.2.1 云计算的定义 30 2.2.2 云计算的特点 31 2.2.3 云计算的技术架构 32 2.2.4 云计算的部署模式 34 2.2.5 云计算平台的功能 36 2.3 Hadoop分布式系统 37 2.3.1 Hadoop简介 37 2.3.2 Hadoop发展历史 38 2.3.3 Hadoop的特点 39 2.3.4 Hadoop的版本演进 40 2.3.5 Hadoop生态组件 41 2.4 本章小结 45 拓展阅读 45 本章习题 47 第3章 大数据采集与预处理 48 本章导读 48 3.1 大数据采集 49 3.1.1 大数据采集概述 49 3.1.2 日志数据采集 52 3.1.3 网络数据采集 56 3.1.4 网络旁路的数据采集 69 3.2 大数据预处理 70 3.2.1 数据预处理概述 70 3.2.2 数据特征 71 3.2.3 数据规范化 73 3.2.4 数据抽取 73 3.2.5 数据清洗 75 3.2.6 数据集成 81 3.2.7 数据转换 82 3.2.8 数据加载 83 3.2.9 数据消减 84 3.3 本章小结 85 拓展阅读 86 Kettle 86 Sqoop 88 本章习题 90 第4章 大数据存储与分布式文件系统 91 本章导读 91 4.1 传统的存储设备 92 4.1.1 机械硬盘 92 4.1.2 固态硬盘 94 4.1.3 移动存储介质 94 4.1.4 传统存储系统 95 4.2 独立磁盘冗余阵列(RAID) 96 4.2.1 RAID概述 96 4.2.2 RAID架构 97 4.2.3 RAID 0 99 4.2.4 RAID 1 102 4.2.5 RAID 5 102 4.3 HDFS分布式文件系统 102 4.3.1 HDFS的简介 103 4.3.2 HDFS的体系架构 106 4.3.3 名称节点与数据节点 109 4.3.4 映像文件与事务日志的归并 111 4.3.5 HDFS的数据存储特性 113 4.3.6 HDFS的容错机制 114 4.3.7 HDFS的高可用机制 115 4.3.8 HDFS的联邦机制 116 4.4 本章小结 118 拓展阅读 118 本章习题 120 第5章 大数据的数据库系统 121 5.1 非关系NoSQL数据库 123 5.1.1 NoSQL的特点 123 5.1.2 NoSQL的理论基础 124 5.1.3 NoSQL的类型 130 5.2.4. NoSQL的发展趋势及挑战 136 5.3 HBase数据库 137 5.3.1 HBase的概述 137 5.3.2 HBase数据模型 138 5.3.3 Hbase体系架构 141 5.3.4 HBase运行机制 145 5.3 数据仓库 147 5.4.1 数据仓库的发展 147 5.4.2 Hive 148 5.4.3 Impala 151 5.7 本章小结 154 拓展阅读 154 数据湖的概念 154 数据湖的特点 155 本章习题 157 第6章 大数据的计算模式 158 本章导读 158 6.1 大数据计算模式的特征和分类 159 6.2 MapReduce批处理计算框架 161 6.2.1 MapReduce的思想 162 6.2.2 MapReduce的功能函数 164 6.2.3 MapReduce的体系架构 166 6.2.4 MapReduce的工作原理 170 6.2.5 MapReduce的实例 175 6.3 YARN资源管理 176 6.3.1 YARN资源管理的概述 176 6.3.2 资源管理器 178 6.3.3 节点管理器 178 6.3.4 应用程序管理器 178 6.3.5 YARN资源管理的工作流程 179 6.3.6 YARN资源管理的优势 180 6.4 Spark内存并行计算框架 181 6.4.1 Spark内存并行计算框架的概述 181 6.4.2 Spark内存并行计算框架的思想 183 6.4.3 Spark内存并行计算框架的体系架构 186 6.4.4 Spark内存并行计算框架的运行流程 188 6.4.5 Spark内存并行计算框架的RDD 190 6.4.6 Spark交互查询引擎 200 6.6 本章小结 202 拓展阅读 202 本章习题 205 第7章 大数据分析挖掘与可视化 207 本章导读 207 7.1 大数据分析挖掘 207 7.1.1 大数据挖掘概述 207 7.1.2 数据挖掘与数据分析 210 7.1.3 大数据挖掘的特点与挑战 211 7.2 数据相似性 214 7.2.1 数值属性的相似性度量 215 7.2.2 标称属性的相似性度量 216 7.2.3 文本相似性度量 217 7.3 数据挖掘方法 218 7.4 大数据挖掘工具 219 7.4.1 weka 219 7.4.2 Spark MLlib 221 7.5 数据可视化概述 223 7.5.1 大数据可视化的主要进展 224 7.5.2 大数据可视化的发展趋势 226 7.6 数据可视化流程 228 7.7 数据可视化原则 230 7.8 数据可视化工具 230 7.9 时空数据可视化 239 7.9.1 时变数据可视化 239 7.9.2 空间数据可视化 242 7.10 非时空数据可视化 242 7.10.1 文本数据可视化 242 7.10.2 复杂高维数据可视化 242 7.11 数据可视化交互 246 7.11.1 交互延时 247 7.11.2 交互分类 247 7.11.3 交互技术 248 7.12 本章小结 248 拓展阅读 248 本章习题 250 第8章 大数据应用 251 8.1 大数据的行业应用 251 8.2 智慧城市 253 8.2.1 智慧城市概述及建设内容 253 8.2.2 智能交通与大数据 254 8.2.3 环保监测与大数据 255 8.2.4 城市规划与大数据 256 8.2.5 公共安全与大数据 257 8.3 自动驾驶汽车 258 8.3.1 自动驾驶汽车的发展阶段 259 8.3.2 软件定义汽车 260 8.3.3 车联网与大数据 262 8.3.4 无人驾驶汽车与大数据 265 8.4 本章小结 267 拓展阅读: 267 本章习题: 270 第9章 大数据安全 271 9.1 物理安全 272 9.2.1 物理安全管理 273 9.2.2 物理安全技术 274 9.2 数据安全 275 9.3.1 面临的问题 276 9.3.2 安全机制和解决方案 278 9.3 虚拟化安全 281 9.4 安全监管 282 9.5 应用安全 283 9.6 业务安全 283 9.7 大数据保护 284 9.8 本章小结 285 拓展阅读: 285 本章习题: 288 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。