![]()
内容推荐 本教材包括12章,每个章节包括理论任务和实践任务,理论联系实际。本教材主要介绍大数据技术概述、Hadoop初体验、Hadoop分布式文件系统、Hadoop分布式计算框架、Hadoop分布式数据库HBase、NoSQL数据库、数据仓库Hive、大数据采集、Spark技术、数据可视化、Python数据分析;除此之外,还包括使用Python对房屋价格进行预测分析和通过日志数据分析用户行为两个综合案例。读者在学习大数据技术的同时,可学会真正使用大数据技术解决问题,增强大数据实战能力。 目录 第l章 大数据技术概述 1.1 理论任务:认识大数据 1.1.1 大数据概念 1.1.2 大数据处理的关键技术 1.1.3 大数据软件 1.2 实践任务:大数据实验环境 1.2.1 安装虚拟机、Linux系统 1.2.2 Linux常用命令 第2章 Had00p初体验 2.1 理论任务:初识Hadoop 2.1.1 Hadoop概述 2.1.2 Hadoop发展简史 2.1.3 Hadoop版本 2.1.4 Hadoop生态圈 2.2 实践任务:Hadoop安装与配置 第3章 Hadoop分布式文件系统 3.1 理论任务:了解HDFs 3.1.1 认识HDFS 3.1.2 HDFS相关概念 3.1.3 HDFS体系结构 3.1.4 HDFS运行原理及保障 3.2 实践任务:HDFS基本操作 3.2.1 使用HDFS Shell访问 3.2.2 使用JAVA API与HDFS交互 第4章 Hadoop分布式计算框架 4.1 理论任务:认识MapReduce 4.1.1 Mapredlice简介 4.1.2 MapRe(iuce编程模型 4.1.3 MapReduee实例分析 4.2 实践任务:MapRedLice应用开发 第5章 Hadoop分布式数据库HBase 5.1 理论任务:认识HBase 5.1.1 HBase简介 5.1.2 HBase数据模型 5.1.3 HBase体系结构 5.2 实践任务:HBase基本操作 5.2.1 HBase安装与配置 5.2.2 HBase Shell命令 5.2.3 HBase编程 第6章 NoSQL数据库 6.1 理论任务:了解NoSQL数据库 6.1.1 NoSQL简介 6.1.2 NoSQL类型 6.1.3 NoSQL数据库三大基石 6.1.4 从NoSQL到NewSQL数据库 6.2 实践任务:典型NoSQL数据库的安装和使用 6.2.1 Redis的安装和使用 6.2.2 MongoDB的安装和使用 第7章 数据仓库Hive 7.1 理论任务:认识Hive 7.1.1 Hive简介 7.1.2 Hive架构 7.1.3 Hive数据存储模型 7.2 实践任务:Hive基本操作 7.2.1 Hive和MySQL的安装及配置 7.2.2 HiveQL常用操作 第8章 大数据采集 8.1 理论任务:了解大数据采集工作 8.1.1 Sqoop简介 8.1.2 Flume简介 8.1.3 Kafka简介 8.2 实践任务:大数据采集工具的安装和使用 8.2.1 Sqoop安装及使用 8.2.2 Flume安装及使用 8.2.3 Kafka安装及使用 第9章 Spark技术 9.1 理论任务:认识Spark 9.1.1 Spark简介 9.1.2 Spark生态圈 9.2 实践任务:Spark的安装和编程 9.2.1 Spark安装和配置 9.2.2 Spark Shell使用 第10章 数据可视化 10.1 理论任务:了解数据可视化 10.1.1 数据可视化概述 10.1.2 可视化工具介绍 10.1.3 数据可视化的未来 10.2 实践任务:典型的可视化工具使用方法 10.2.1 使用ECharts制作图表 10.2.2 D3可视化库的使用方法 第1l章 Python数据分析 11.1 理论任务:了解Pythfion数据分析 11.1.1 Python语言环境搭建 11.1.2 Python语言基本语法 11.1.3 Python数据科学工具包 11.1.4 Python机器学习工具包 11.2 实践任务:Python数据分析应用 11.2.1 安装Python和numpy包 11.2.2 Python语法应用 11.2.3 Phthon数据科学工具包的安装和使用 11.2.4 Phthon机器学习工具包的安装和使用 第12章 综合案例 12.1 综合案例1:使用Python对房屋价格进行预测分析 12.2 综合案例2:通过日志数据分析用户行为 参考文献 |