当下,大数据已成为互联网、人工智能和数字化转型等的基础理论,宏观了解大数据前沿理论与技术,对于大数据方向的研究人员以及从事大数据开发的工程师来讲至关重要。本书由多位大数据领域专家学者合作完成,通过10章内容,深入浅出地阐述大数据的完整前沿知识体系,帮助读者以宏观视角把握大数据的发展方向和突破口,真正从普通开发者晋升为拥有大数据思维并能解决复杂问题的技术专家。
本书既可作为大数据方向低年级研究生研究大数据技术的入门指南,也可作为从事大数据研究的科研人员的参考书。
网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | 大数据十讲/十讲系列/计算机科学前沿丛书 |
分类 | |
作者 | |
出版社 | 机械工业出版社 |
下载 | |
简介 | 内容推荐 当下,大数据已成为互联网、人工智能和数字化转型等的基础理论,宏观了解大数据前沿理论与技术,对于大数据方向的研究人员以及从事大数据开发的工程师来讲至关重要。本书由多位大数据领域专家学者合作完成,通过10章内容,深入浅出地阐述大数据的完整前沿知识体系,帮助读者以宏观视角把握大数据的发展方向和突破口,真正从普通开发者晋升为拥有大数据思维并能解决复杂问题的技术专家。 本书既可作为大数据方向低年级研究生研究大数据技术的入门指南,也可作为从事大数据研究的科研人员的参考书。 作者简介 周烜,华东师范大学数据科学与工程学院教授、副院长。2001年本科毕业于复旦大学,2005年在新加坡国立大学取得博士学位,2005年至2010年期间先后在德国L3S研究中心和澳大利亚联邦科工组织从事科研工作,随后在中国人民大学任教,于2017年加入华东师范大学。他的研究兴趣包括数据库系统和信息检索技术。他曾参与和负责多个国内外的科研项目和工业合作项目,开发各种数据管理系统,在分布式数据库上的研究成果获2019年国家科技进步二等奖。 目录 丛书序 “十讲”序 前言 第1讲 大数据存储系统 1.1 大规模云存储系统 1.1.1 云存储系统架构 1.1.2 云存储资源管理与数据布局 1.1.3 大规模索引系统 1.2 大规模文件系统 1.2.1 本地文件系统 1.2.2 网络文件系统 1.3 本讲小结与展望 参考文献 第2讲 分布式数据库 2.1 NoSQL与NewSQL 2.1.1 NoSQL发展历史 2.1.2 键值存储 2.1.3 文档数据库 2.1.4 图数据库 2.1.5 NewSQL代表 2.2 分布式数据库架构 2.2.1 共享存储型 2.2.2 无共享型 2.2.3 计算、内存与存储分离型 2.2.4 架构对比 2.3 数据分片与复制 2.3.1 数据分片 2.3.2 数据复制 2.3.3 CAP定理 2.3.4 分布式一致性协议 2.4 分布式数据处理 2.4.1 分布式事务处理 2.4.2 分布式查询处理 2.5 本讲小结与展望 参考文献 第3讲 大数据处理系统——批处理 3.1 Hadoop MapReduce 3.1.1 Hadoop MapReduce概述 3.1.2 Hadoop MapReduce架构和核心组件 3.1.3 Hadoop MapReduce执行过程 3.1.4 MapReduce编程案例 3.1.5 Hadoop生态 3.2 Apache Spark 3.2.1 Spark概述 3.2.2 Spark框架 3.2.3 Spark编程实例 3.2.4 Spark工具集 3.3 本讲小结与展望 参考文献 第4讲 流计算系统 4.1 流计算系统概述 4.1.1 流数据与流计算 4.1.2 流计算系统的演进 4.1.3 流计算系统的研究挑战 4.2 数据管理视角的流计算系统 4.2.1 编程接口 4.2.2 执行计划 4.2.3 资源调度 4.2.4 故障容错 4.3 本讲小结与展望 参考文献 第5讲 大图数据处理系统 5.1 大图数据处理系统概述 5.1.1 大图数据特点及查询 5.1.2 大图数据处理特征及挑战 5.1.3 经典大图数据处理系统 5.2 计算机制 5.2.1 以顶点为中心的计算机制 5.2.2 以边为中心的计算机制 5.2.3 以子图为中心的计算机制 5.3 通信机制 5.3.1 共享内存 5.3.2 消息传递 5.4 图划分机制 5.4.1 边切分 5.4.2 点切分 5.4.3 混合切分 5.5 任务调度机制 5.5.1 同步调度 5.5.2 异步调度 5.5.3 混合调度 5.6 新硬件加速机制 5.6.1 基于RDMA的通信优化 5.6.2 基于GPU的计算优化 5.7 本讲小结与展望 参考文献 第6讲 大数据分析——算法设计 6.1 大数据的统计特征估算算法 6.1.1 采样估算算法 6.1.2 Sketch估算算法 6.1.3 相关应用 6.2 大数据的成员查找算法 6.2.1 概率型成员查找算法 6.2.2 人工智能赋能的成员查找算法 6.2.3 相关应用 6.3 大数据的近邻查找算法 6.3.1 精确近邻查找算法 6.3.2 近似近邻查找算法 6.3.3 相关应用与潜在研究方向 6.4 本讲小结与展望 参考文献 第7讲 大数据分析——机器学习 7.1 概述 7.1.1 机器学习、深度学习和人工智能 7.1.2 大数据和机器学习的关系 7.1.3 大数据上机器学习存在的问题和挑战 7.2 BigDL:分布式大数据AI平台 7.2.1 设计目标和架构 7.2.2 BigDL-Nano:对用户透明的性能加速 7.2.3 BigDL-Orca:从笔记本电脑到分布式大数据集群的无缝扩展 7.3 大数据AI在生产实践中的真实案例 7.3.1 案例1:基于时序预测的通信网络质量KPI监测 7.3.2 案例2:基于Transformer架构的分布式AI推荐系统 7.4 本讲小结与展望 参考文献 第8讲 图数据挖掘 8.1 图的基本定义及性质 8.1.1 柯尼斯堡七桥问题 8.1.2 图的基本定义 8.1.3 图的基本性质 8.2 图节点邻近度 8.2.1 图节点邻近度的度量 8.2.2 图节点邻近度的计算 8.3 图嵌入 8.3.1 基于矩阵分解的方法 8.3.2 基于随机游走的方法 8.4 图神经网络 8.4.1 图神经网络的起源和演变 8.4.2 可扩展图神经网络 8.4.3 复杂图神经网络 8.5 本讲小结与展望 参考文献 第9讲 大数据可视化 9.1 可视化发展历史与理论模型 9.1.1 早期的可视化 9.1.2 基本流程 9.2 概念、分类及主要方法 9.2.1 数据类型及视觉映射 9.2.2 高维与表格数据可视化 9.2.3 网络(图)数据可视化 9.2.4 层次结构数据可视化 9.2.5 时空数据可视化 9.2.6 文本数据可视化 9.3 可视分析 9.3.1 基本理论 9.3.2 可视化与可视分析案例 9.4 大规模数据管理 9.4.1 数据立方体 9.4.2 其他数据管理方法 9.5 常用可视化工具与软件 9.5.1 高维数据可视化工具 9.5.2 文本可视化工具 9.5.3 网络可视化工具 9.5.4 可视 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。