本书从实用角度出发,围绕Linux操作系统和Hadoop集群部署,从虚拟机安装入手,结合典型项目和案例,较为全面地介绍了大数据开发技术平台Hadoop及其生态系统的相关知识。主要内容包括大数据技术中的Hadoop集群部署、HDFS、MapReduce、Hive、HBase和Sqoop等。全书所有知识点都结合具体的编程示例讲解,重要知识点配有视频讲解。
本书可作为高等职业院校大数据技术、软件技术、计算机网络技术、人工智能技术等专业的教材,也可作为大数据爱好者的参考书,同时也可作为企业培训教材。
网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | Hadoop大数据集群部署及数据存储项目化教程(高等职业教育大数据技术专业系列教材) |
分类 | |
作者 | |
出版社 | 化学工业出版社 |
下载 | ![]() |
简介 | 内容推荐 本书从实用角度出发,围绕Linux操作系统和Hadoop集群部署,从虚拟机安装入手,结合典型项目和案例,较为全面地介绍了大数据开发技术平台Hadoop及其生态系统的相关知识。主要内容包括大数据技术中的Hadoop集群部署、HDFS、MapReduce、Hive、HBase和Sqoop等。全书所有知识点都结合具体的编程示例讲解,重要知识点配有视频讲解。 本书可作为高等职业院校大数据技术、软件技术、计算机网络技术、人工智能技术等专业的教材,也可作为大数据爱好者的参考书,同时也可作为企业培训教材。 目录 第1章 Hadoop概述 1.1 大数据认知 1.1.1 大数据的定义 1.1.2 大数据的应用领域 1.1.3 大数据的特征 1.1.4 大数据的技术架构 1.2 Hadoop认知 1.2.1 Hadoop的发展史 1.2.2 Hadoop的特点 1.2.3 Hadoop的生态系统 1.2.4 Hadoop的核心架构 1.3 Hadoop的安装和配置 1.3.1 VMWare的安装 1.3.2 Ubuntu系统的安装 1.3.3 Linux常用命令 1.3.4 JDK安装和配置 1.3.5 Hadoop的安装 课后练习 第2章 Hadoop集群部署 2.1 Linux环境设置 2.1.1 创建用户(组) 2.1.2 Windo和Linux系统间文件传输 2.1.3 更新apt 2.1.4 vim编辑器的应用 2.1.5 网络配置 2.2 Hadoop伪分布式搭建 2.2.1 环境变量的配置 2.2.2 SSH安装 2.2.3 core-site.xml配置文件 2.2.4 hdfs-site.xml配置文件 2.2.5 Hadoop伪分布式运行实例 2.3 Yarn认知 2.3.1 初识Yarn 2.3.2 Yarn基本服务组件 2.3.3 Yarn执行过程 2.4 Hadoop分布式搭建 2.4.1 部署前准备 2.4.2 网络配置 2.4.3 配置文件的设置 2.4.4 分布式部署 课后练习 第3章 分布式文件系统HDFS 3.1 HDFS认知 3.1.1 HDFS的了解 3.1.2 HDFS的特性 3.1.3 HDFS的设计思想 3.1.4 HDFS的核心概念 3.2 HDFS常用shell命令 3.2.1 HDFS查看命令 3.2.2 HDFS目录操作命令 3.2.3 文件操作 3.3 HDFS基础编程 3.3.1 用HDFSAPI上传本地文件 3.3.2 用HDFSAPI创建HDFS文件 3.3.3 用HDFSAPI读取和写入文件 3.3.4 用HDFSAPI创建HDFS目录 3.3.5 用HDFSAPI查找文件所在位置 3.4 HDFS工作机制 3.4.1 HDFS写数据流程 3.4.2 HDFS读数据流程 3.4.3 NameNode工作机制 3.4.4 DataNode工作机制 3.5 HDFS客户信息管理 3.5.1 环境搭建 3.5.2 写入客户信息 3.5.3 读取客户信息 课后练习 第4章 MapReduce编程 4.1 MapReduce的工作原理 4.1.1 MapReduce的由来和特点 4.1.2 MapReduce执行过程 4.1.3 MapTask执行过程 4.1.4 Reduce执行过程 4.1.5 Shuffle执行过程 4.2 MapReduce程序编写 4.2.1 开发工具IDEA的安装 4.2.2 MapReduce输入/输出类型 4.2.3 MapReduce输入处理类 4.2.4 MapReduce输出处理类 4.2.5 入门案例—WordCount 4.3 统计网站大访问次数 4.3.1 实体类 4.3.2 Mapper类 4.3.3 Reducer类 4.3.4 项目驱动类 课后练习 第5章 MapReduce高级编程 5.1 MapReduce高级开发一 5.1.1 Combiner编程 5.1.2 Partitioner编程 5.1.3 RecordReader编程 5.2 MapReduce高级开发二 5.2.1 MapReduce连接操作 5.2.2 MapReduce排序操作 5.2.3 MapReduce多文件联合查询 5.3 实现课程名称和成绩的二次排序 5.3.1 实体类 5.3.2 Mapper类 5.3.3 Reducer类 5.3.4 项目驱动类编写 课后练习 第6章 Hive数据仓库 6.1 什么是Hive 6.1.1 Hive简介 6.1.2 为什么使用Hive 6.1.3 Hive的优缺点 6.1.4 Hive体系结构 6.1.5 Hive设计特征 6.2 Hive安装 6.2.1 伪分布式安装与配置Hive 6.2.2 安装与配置MySQL 6.3 Hive基本操作 6.3.1 Hive数据类型 6.3.2 数据库操作 6.3.3 内部表操作 6.3.4 外部表操作 6.3.5 分区表操作 6.3.6 分桶表操作 6.3.7 Hive数据操作 6.4 实现购物用户数据清洗项目 6.4.1 导入数据 6.4.2 数据分析 6.4.3 数据导出 课后练习 第7章 HBase数据库 7.1 HBase认知 7.1.1 HBase简介 7.1.2 HBase体系结构 7.1.3 HBase写数据流程 7.1.4 HBase读数据流程 7.2 HBase安装 7.2.1 下载软件 7.2.2 伪分布式安装与配置 7.3 HBaseshell操作命令 7.3.1 HBase数据模型 7.3.2 数据表空间操作 7.3.3 数据表操作 7.3.4 数据操作 7.4 HBaseAPI操作 7.4.1 HBase常用的API 7.4.2 Configuration对象 7.4.3 HTable句柄创建 7.4.4 HBase数据的CRUD操作 7.5 学生成绩管理 7.5.1 学生成绩表数据准备 7.5.2 学生成绩表设计分析 7.5.3 学生成绩表代码实现 课后练习 第8章 Sqoop导入和导出 8.1 概述 8.1.1 Sqoop产生背景 8.1.2 Sqoop是什么 8.1.3 为什么选择Sqoop 8.2 工作原理 8.2.1 导入机制 8.2.2 导出机制 8.3 安装 8.3.1 前提准备 8.3.2 下载Sqoop 8.3.3 安装Sqo |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。