![]()
内容推荐 本书是高等职业教育计算机类课程新形态一体化教材。 本书是一本面向大数据基础知识学习、基本技能训练和场景应用的项目化教程。全书共分为8个单元,内容包括初识大数据、Linux应用基础、大数据存储与计算、大数据编程基础、数据采集与预处理、数据分析与挖掘、数据可视化、大数据典型行业应用分析。本书知识点全面,融合了大数据应用开发的新技术和多个典型行业应用场景,突出情境案例导引、知识技能讲解和入门项目训练,并同步开发一个完整的企业级项目——酒店电商数据分析系统,重在培养学生的大数据思维和综合应用能力。 本书可作为高等职业院校计算机类专业的大数据基础课程教材,也可供大数据技术相关岗位工作人员参考使用,还可作为广大大数据技术爱好者的零基础入门教程。 目录 单元1 初识大数据 单元重点 案例资源 单元导引 1.1 什么是大数据 1.1.1 大数据的诞生 1.1.2 大数据的概念及特点 1.2 大数据系统组成 同步训练 训练:大数据技术体系调研分析 单元小结 单元测试 单元2 Linux应用基础 单元重点 案例资源 单元导引 2.1 Linux系统简介 2.2 Linux的安装与使用 2.2.1 Linux在虚拟机中的安装 2.2.2 Vi编辑器的使用 2.3 Linux常用命令 2.3.1 文件操作 2.3.2 目录操作 2.3.3 用户操作 同步训练 训练2-1:Linux数据文件管理 训练2-2:Linux系统日志采集 综合案例 案例1:酒店运营数据分析(一)——酒店大数据分析环境配置 单元小结 单元测试 单元3 大数据存储与计算 单元重点 案例资源 单元导引 3.1 分布式存储 3.1.1 分布式存储概述 3.1.2 HDFS工作原理 3.1.3 HDFS基础命令 3.2 分布式计算 3.2.1 分布式计算概述 3.2.2 MapReduce计算框架 同步训练 训练:新闻词频统计 单元小结 单元测试 单元4 大数据编程基础 单元重点 案例资源 单元导引 4.1 Python概述 4.1.1 Python语言简介 4.1.2 Python的安装与使用 4.2 Python基础 4.2.1 数据类型和表达式 4.2.2 基本流程控制结构 4.3 Scala语言 4.3.1 Scala简介 4.3.2 Scala的安装与使用 4.3.3 Scala语法基础 同步训练 训练:店铺宝贝价格排序 单元小结 单元测试 单元5 数据采集与预处理 单元重点 案例资源 单元导引 5.1 数据采集 5.1.1 数据采集原理 5.1.2 BeautifulSoup网络数据采集 5.2 数据预处理 5.2.1 数据预处理原理 5.2.2 Pandas数据预处理 同步训练 训练:爬取二手房网站数据 综合案例 案例2:酒店运营数据分析(二)——酒店数据爬虫与清洗 单元小结 单元测试 单元6 数据分析与挖掘 单元重点 案例资源 单元导引 6.1 数据分析与挖掘简介 6.1.1 数据分析简介 6.1.2 数据挖掘简介 6.1.3 Pandas数据分析 6.2 数据挖掘算法 6.2.1 数据挖掘算法分类 6.2.2 数据挖掘算法典型应用 同步训练 训练:Python电商数据分析 综合案例 案例3:酒店运营数据分析(三)——订单数据分析 单元小结 单元测试 单元7 数据可视化 单元重点 案例资源 单元导引 7.1 可视化概述 7.1.1 什么是数据可视化 7.1.2 可视化的重要作用 7.2 可视化工具 7.2.1 ECharts数据可视化 7.2.2 PyEcharts数据可视化 7.2.3 Matplotlib数据可视化 同步训练 训练7-1: PyEcharts展示电商交易数据 训练7-2: Matplotlib展示气温变化 综合案例 案例4:酒店运营数据分析(四)——酒店数据可视化 单元小结 单元测试 单元8 大数据典型行业应用分析 单元重点 案例资源 单元导引 8.1 大数据在电子商务中的应用 8.2 大数据在金融行业中的应用 8.3 大数据在物流行业中的应用 8.4 大数据在医疗行业中的应用 8.5 大数据在智慧农业中的应用 同步训练 训练:信用评分卡 单元小结 单元测试 参考文献 |