内容推荐 本书旨在培养大学低年级本科生的大数据应用能力,使其初步建立数据思维,以满足“新工科”“新医科”“新农科”“新文科”建设背景下高校培养学生数据素养能力的新要求。 全书共3篇。基础篇(第1、2章)主要内容为大数据概述、Python及常用类库;数据分析篇(第3~7章)重点阐述数据获取、存储、预处理、可视化和分析方法;大数据平台篇(第8~11章)着重介绍Linux操作系统基础、大数据管理平台、分布式存储和分布式处理。全书提供了大量应用实例,每章后附有习题。为了便于读者在单机条件下构建分布式环境,附录中介绍了基于虚拟机的Linux系统安装、Hadoop及Spark安装。 本书适合作为高等院校非计算机专业低年级本科生大数据公共课程的教材,也可供对大数据感兴趣的广大科技工作者和研究人员参考。 目录 基础篇 第1章 大数据概述 1.1 数据和大数据 1.1.1 数据的高速增长 1.1.2 大数据 1.1.3 科学的范式 1.2 大数据从哪里来 1.3 大数据的应用场景 1.4 大数据对思维方式的影响 1.5 数据挖掘与机器学习 1.6 数据科学项目的基本流程 1.7 数据安全和大数据伦理 1.7.1 数据安全 1.7.2 大数据伦理 1.8 国家层面的大数据问题 1.8.1 数据主权 1.8.2 大数据与国家治理 1.8.3 大数据重塑世界新格局 1.8.4 中国国家大数据战略 1.9 云计算 1.9.1 云计算的特征 1.9.2 云计算的典型服务模式 1.9.3 云计算服务部署的环境 1.9.4 云计算和大数据的关系 1.10 物联网 1.11 数字经济 1.11.1 大数据与数字经济 1.11.2 进一步推动我国数字经济发展 本章小结 习题 第2章 Python及常用类库 2.1 Python简介 2.1.1 Python的诞生 2.1.2 Python社区 2.1.3 Python的版本 2.1.4 使用Python进行数据分析的原因 2.2 Python的安装与运行 2.2.1 Anaconda简介及安装 2.2.2 Python的运行 2.2.3 小结 2.3 Python语言基础 2.3.1 数据结构 2.3.2 代码结构 2.3.3 小结 2.4 Python数据分析的常用类库 2.4.1 NumPy简介 2.4.2 pandas简介 2.4.3 小结 本章小结 习题 数据分析篇 第3章 数据获取 3.1 数据来源 3.2 网络数据爬取 …… 大数据平台篇 参考文献 附录A 基于虚拟机的Linux系统安装 附录B Hadoop及Spark安装 |