本书主要包括数据科学与大数据概述、大数据技术基础、数据采集与预处理、大数据存储与管理、大数据计算架构、数据挖掘、数据可视化、大数据安全、大数据应用等内容。
本书是一本大数据入门指南手册,通俗、全面讲解了数据科学与大数据的基本概念、基本原理及使用技术,目的是给初学者学习大数据指引方向,适用于大数据一般的从业者,而对于数据专业人员来说,还需要结合其他教程深度学习。
本书可作为高等院校大数据、计算机、信息化相关专业学习大数据知识的通识类入门教材,也可供对数据科学与大数据知识感兴趣的读者阅读。
网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | 大数据导论(高等院校十四五信息技术基础规划教材) |
分类 | |
作者 | |
出版社 | 经济管理出版社 |
下载 | ![]() |
简介 | 内容推荐 本书主要包括数据科学与大数据概述、大数据技术基础、数据采集与预处理、大数据存储与管理、大数据计算架构、数据挖掘、数据可视化、大数据安全、大数据应用等内容。 本书是一本大数据入门指南手册,通俗、全面讲解了数据科学与大数据的基本概念、基本原理及使用技术,目的是给初学者学习大数据指引方向,适用于大数据一般的从业者,而对于数据专业人员来说,还需要结合其他教程深度学习。 本书可作为高等院校大数据、计算机、信息化相关专业学习大数据知识的通识类入门教材,也可供对数据科学与大数据知识感兴趣的读者阅读。 作者简介 董进文,男,内蒙古财经大学教授,内蒙古自治区高等学校教学名师。主要研究方向为数据库、数据挖掘与大数据技术。主讲课程为数据科学导论、分布式数据库技术等。主持国家与内蒙古自治区级项目多项,公开发表相关领域的学术论文20余篇。 目录 第1章 数据科学与大数据概述 1.1 数据科学与大数据基本概念 1.1.1 数据相关的概念 1.1.2 数据科学 1.1.3 大数据及其特征 1.2 大数据时代 1.2.1 人类信息文明的发展 1.2.2 大数据时代的来临 1.3 大数据的产生与作用 1.3.1 大数据的产生 1.3.2 大数据的作用 1.4 大数据时代的新思维 1.4.1 注重全样而非抽样 1.4.2 注重效率而非精确 1.4.3 注重相关关系而非因果关系 1.5 大数据产业 1.5.1 大数据产业构成 1.5.2 全球大数据产业发展现状与应用趋势 1.5.3 我国大数据产业市场现状与前景 1.6 大数据与云计算、人工智能 1.6.1 云计算 1.6.2 人工智能 1.6.3 大数据与云计算、人工智能的关系 本章小结 第2章 大数据技术基础 2.1 Linux操作系统 2.1.1 什么是操作系统 2.1.2 Linux操作系统的特点 2.1.3 Linux操作系统与大数据 2.2 计算机编程语言 2.2.1 Java语言 2.2.2 Python语言 2.2.3 Scala语言 2.3 数据库 2.3.1 数据库的概念 2.3.2 数据库管理系统 2.3.3 数据库系统 2.3.4 SQL数据库的发展与成热 2.3.5 NoSQL数据库及其特点 2.3.6 NewSQL数据库 2.4 大数据处理系统 2.4.1 大数据处理概述 2.4.2 Hadoop系统 2.4.3 Spark平台 2.5 大数据的基本处理流程 2.5.1 数据抽取与集成 2.5.2 数据分析和挖掘 2.5.3 数据展现 本章小结 第3章 数据采集与预处理 3.1 数据采集概述 3.1.1 大数据的数据类型 3.1.2 大数据的来源分类 3.2 数据采集方法 3.2.1 系统日志的采集方法 3.2.2 网页数据的采集方法 3.2.3 其他数据的采集 3.3 数据预处理概述 3.3.1 影响数据质量的因素 3.3.2 数据预处理的流程 3.3.3 数据预处理方法 3.3.4 ETL工具Kettle 本章小结 第4章 大数据存储与管理 4.1 传统的数据存储与管理 4.1.1 数据的存储模式 4.1.2 传统的数据存储与管理技术 4.2 大数据存储与管理 4.2.1 分布式文件系统 4.2.2 Hadoop HDFS分布式文件系统 4.2.3 NoSQL数据库 4.2.4 HBase分布式NoSQL数据库 4.2.5 云存储 本章小结 第5章 大数据计算架构 5.1 概述 5.1.1 批处理计算 5.1.2 流计算 5.1.3 查询分析计算 5.2 批计算MapReduce 5.2.1 MapReduce基本思想 5.2.2 Hadoop MapReduce架构 5.2.3 Hadoop MapReduce工作流程 5.2.4 MapReduce的工作机制 5.2.5 MapReduce实例分析:单词计数 5.2.6 MapReduce编程实践 5.2.7 新一代资源管理调度框架YARN 5.3 快速计算Spark 5.3.1 Spark概述 5.3.2 Spark生态系统 5.3.3 Spark RDD概念 5.3.4 Spark总体架构和运行流程 5.3.5 Spark编程实践 5.4 交互式计算Hive 5.4.1 Hive概述 5.4.2 Hive的体系架构 5.4.3 Hive的数据类型 5.4.4 Hive的存储模型 5.4.5 Hive的操作 本章小结 第6章 数据挖掘 6.1 数据挖掘的概念 6.2 数据挖掘的对象与价值类型 6.2.1 数据挖掘的对象 6.2.2 数据挖掘的价值类型 6.3 数据挖掘常用的算法 6.3.1 数据挖掘算法的概念 6.3.2 数据科学算法的类型 6.3.3 分类和预测 6.3.4 聚类分析 6.3.5 关联分析 6.4 数据挖掘常用的工具 6.4.1 Spark MLlib 6.4.2 RapidMiner 6.4.3 华为MLS 本章小结 第7章 数据可视化 7.1 可视化概述 7.1.1 什么是数据可视化 7.1.2 数据可视化的发展历程 7.1.3 可视化的重要作用 7.1.4 数据可视化流程的核心要素 7.1.5 可视化即服务 7.2 数据可视化工具 7.2.1 入门级工具 7.2.2 信息图表工具 7.2.3 地图工具 7.2.4 高级分析工具 7.3 数据可视化典型案例 7.3.1 互联网地图 7.3.2 实时风场可视化 7.3.3 百度迁徙 7.3.4 游客热力图 7.3.5 交通实时路况展现 本章小结 第8章 大数据安全 8.1 传统数据安全 8.1.1 传统数据安全的含义 8.1.2 传统数据安全的特点 8.1.3 传统数据安全的威胁因素 8.2 大数据安全 8.2.1 大数据安全的特征 8.2.2 大数据安全技术体系 8.2.3 大数据的数据安全 8.2.4 大数据安全运维体系 8.3 大数据安全典型案例 8.3.1 “棱镜门”事件 8.3.2 Facebook数据滥用事件 8.3.3 某网站求职简历遭泄露事件 8.3.4 手机App过度采集个人信息 本章小结 第9章 大数据应用 9.1 大数据的应用价值 9. |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。