内容推荐 本书为全国电力行业“十四五”规划教材。全书共分3部分12章,主要内容包括大数据基础(大数据简介、大数据来源、大数据特征、大数据研究策略、大数据技术、大数据应用)、大数据管理及分析(大数据准备、大数据管理、大数据分析)、大数据应用及实践(大数据挑战、大数据开发平台、大数据实践)。本书以培养大数据管理、分析和应用能力为主线,将理论与案例、理论与实践、理论与应用充分结合,以电力系统为应用背景精心设计了案例,为广大读者,特别是具有电力背景的读者提供解决大数据相关问题的思路。本书配套丰富的资源供读者线上学习。 本书可作为普通高等院校大数据管理与应用、数据科学与大数据技术、计算机科学与技术、信息管理与信息系统、管理科学与工程、工商管理等相关专业的本科及硕士研究生教材,也可作为相关专业师生、大数据科学家、数据分析员及工程师的参考书。 目录 前言 第1部分 大数据基础 学习目标1 第1章 大数据简介2 1.1大数据发展历程2 1.2大数据时代5 1.3大数据定义6 第2章 大数据来源7 2.1大数据的类别7 2.2机器生成的大数据8 2.3人类生成的大数据11 2.4组织生成的大数据14 2.5数据集成18 第3章 大数据特征20 3.1大数据特征综述20 3.2大数据的特征——大量性(Volume)21 3.3大数据的特征——多样性(Variety)22 3.4大数据的特征——高速性(Velocity)23 3.5大数据的特征——准确性(Veracity)25 3.6大数据的特征——关联性(Valence)27 3.7大数据的特征——价值性(Value)28 第4章 大数据研究策略30 4.1数据科学30 4.2建立大数据研究策略32 4.3大数据研究策略框架和工作流程34 第5章 大数据技术39 5.1大数据技术架构39 5.2大数据的两大关键技术40 5.3大数据平台Hadoop43 第6章 大数据应用45 6.1大数据的价值何在45 6.2大数据应用领域47 测试题及答案53 第2部分 大数据管理及分析 学习目标57 第7章 大数据准备58 7.1大数据的结构58 7.2大数据的标识62 7.3大数据的关联69 7.4大数据的注释75 第8章 大数据管理83 8.1数据集成和软件互操作性83 8.2不变性和永恒性87 第9章 大数据分析92 9.1数据验证92 9.2大数据初步分析95 9.3大数据分析方法113 9.4大数据分析中的特殊注意事项127 9.5大数据分析步骤132 9.6大数据分析的失败138 测试题及答案145 第3部分 大数据应用及实践 学习目标147 第10章 大数据挑战148 10.1法律问题148 10.2社会问题158 10.3大数据的未来164 第11章 大数据开发平台169 11.1可扩展计算的基本概念169 11.2Hadoop生态系统172 第12章 大数据实践185 12.1下载和安装Cloudera虚拟机映像185 12.2HDFS实践:将数据复制到Hadoop分布式文件系统中187 12.3MapReduce实践:运行WordCount程序189 测试题及答案192 参考文献194 |