内容推荐 本书以数据的概念、研究任务和技术体系为基线展开,延展出大数据的概念、研究任务、技术挑战和技术体系。本书围绕大数据独有的特点,介绍大数据表达的概念和技术、大数据存储和管理技术的基础与拓展、大数据计算的特点与新技术、大数据分析的基本方法与前沿新技术、大数据可视化技术、大数据安全范畴及应对安全机制等内容。本书系统地梳理了大数据技术谱系,可为后续学习、应用和研究大数据奠定基础。 本书可作为数据科学与大数据技术或者相关本科专业的教材,也可作为其他专业学生学习大数据的参考书,还可作为从事大数据相关工作的工程技术人员的参考书。 目录 第1章 大数据概述 1.1 认知数据 1.1.1 数据概念 1.1.2 数据研究内容 1.2 认知大数据 1.2.1 大数据形成 1.2.2 大数据概念 1.2.3 大数据技术 1.3 大数据表达 1.4 大数据面临的挑战 1.4.1 数据复杂性带来的挑战 1.4.2 计算复杂性带来的挑战 1.4.3 系统复杂性带来的挑战 思考题 第2章 大数据表达方法 2.1 元数据 2.1.1 元数据形成 2.1.2 元数据概念 2.1.3 元数据体系 2.2 大数据的元数据 2.2.1 大数据的元数据标准 2.2.2 元数据管理 2.3 知识表示 2.3.1 知识的概念 2.3.2 知识表示的概念 2.3.3 命题逻辑与谓词逻辑 2.3.4 语义网络 2.3.5 本体 2.3.6 语义Web 2.4 知识图谱 2.4.1 知识图谱概念 2.4.2 知识图谱的数据模型 2.4.3 知识图谱的向量表示 思考题 第3章 大数据存储 3.1 数据存储基础 3.1.1 数据存储概念 3.1.2 磁盘存储原理 3.1.3 磁盘阵列 3.1.4 磁盘卷 3.1.5 存储空间 3.2 数据存储系统 3.2.1 基于数据块的存储系统 3.2.2 基于文件的存储系统 3.2.3 基于对象的存储系统 3.3 大数据存储现状 3.3.1 大数据存储面对的挑战 3.3.2 云存储 思考题 第4章 大数据管理 4.1 数据管理相关知识 4.1.1 数据管理概念 4.1.2 数据管理模型 4.1.3 数据管理系统 4.2 大数据管理面临的主要问题 4.3 分布式文件系统 4.3.1 文件管理系统原理概述 4.3.2 分布式文件管理系统原理 4.3.3 典型的HDFS分布式文件系统 4.4 NoSQL数据库系统 4.4.1 关系模型 4.4.2 非关系模型 4.4.3 NoSQL数据存储 4.4.4 NoSQL基本理论 4.4.5 NoSQL体系框架 思考题 第5章 大数据计算 5.1 计算系统及其体系结构 5.2 计算服务系统及其体系结构 5.3 大数据的计算类型及特点 5.4 大数据的批量计算 5.4.1 MapReduce及其计算 5.4.2 Spark及其计算 5.5 大数据的流式计算 5.5.1 流数据概念及特点 5.5.2 SparkStreaming及其流计算 5.5.3 Storm及其流计算 5.6 大数据的图计算 5.6.1 BSP模型 5.6.2 图计算系统Pregel 思考题 第6章 大数据分析 6.1 大数据分析概念 6.2 数据分析的基本方法 6.2.1 数据分类算法 6.2.2 数据聚类方法 6.2.3 关联规则算法 6.2.4 图数据分析 6.3 数据分析的高级方法 6.3.1 深度学习 6.3.2 强化学习 6.3.3 迁移学习 思考题 第7章 大数据可视化 7.1 数据可视化概述 7.1.1 可视化与可视化技术 7.1.2 数据可视化概念 7.1.3 数据可视化作用 7.2 数据可视化技术 7.2.1 数据基本统计特征的可视化 7.2.2 高维数据的可视化 7.2.3 面向大数据主流应用的信息可视化 7.3 常用数据可视化工具 7.3.1 基于Excel的数据可视化 7.3.2 基于Tableau的数据可视化 7.3.3 基于JavaScript开发的数据可视分析 7.4 大数据可视化面临问题与挑战 思考题 第8章 大数据安全 8.1 大数据安全概览 8.1.1 大数据安全形势 8.1.2 大数据安全威胁 8.1.3 大数据安全需求 8.2 大数据安全技术 8.2.1 匿名认证技术 8.2.2 访问控制安全技术 8.2.3 数据存储完整性证明技术 8.2.4 数据处理安全技术 8.2.5 数据发布隐私保护技术 思考题 参考文献 |