网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 大数据技术原理与开发教程(高等学校大数据类专业核心课程教材)
分类
作者 董兆伟 王素贞 白彦峰
出版社 高等教育出版社
下载
简介
内容推荐
本书较为系统地讲解Hadoop生态系统的相关技术原理、使用方法及开发技术,全书共9章。章对大数据技术进行概述。第2章介绍Hadoop环境搭建的详细步骤。第3章介绍。HDFS的架构理论、常用命令以及API的使用和编程方法。第4章介绍MapReduce的相关原理、I/O序列化机制、MapReduce的编程开发要点和实例。第5章介绍Yarn的产生背景、体系结构、通信协议、执行过程及调度器和ZooKeeper的数据模型、架构及安装配置。第6章介绍HBase的相关原理、安装配置、Shell命令以及API编程方法。第7章介绍Hive的基本原理、基本操作、HQL语句和Hive JDBC编程。第8章介绍NoSQL数据库的基本概念、MongoDB数据库的概念和安装配置、MongoDB数据库使用方法。第9章介绍在Hadoop生态系统中常用的几种工具,包括Sqoop、Kafka以及Flume。每章后附有小结、习题、二维码即测即评等栏目。
通过本书的学习,读者可以较快速地掌握使用开源软件搭建大数据生态环境的步骤和方法,而且能够全面地学习MapReduce、HDFS、Yarn、HBase、Hive、NoSQL等大数据组件的相关理论、基本操作和编程开发方法。
本书适合“数据科学与大数据技术”本科专业、“大数据管理与应用”本科专业以及计算机类专业本科和研究生使用,也可供从事大数据工作的工程技术人员参考。
目录
章 大数据技术概述
1.1 什么是大数据
1.1.1 大数据的定义
1.1.2 大数据的产生
1.1.3 大数据技术的发展历程
1.2 大数据的四个主要特征
1.3 大数据关键技术
1.4 大数据计算模式
1.5 大数据对思维方式的影响
1.6 大数据的应用领域
1.7 我国的大数据发展战略
小结
习题
即测即评
第2章 Hadoop及环境搭建
2.1 Hadoop生态系统
2.1.1 Hadoop简介
2.1.2 Hadoop发展历史
2.1.3 Hadoop的特点
2.1.4 Hadoop生态系统
2.1.5 Hadoop的运行模式
2.2 虚拟化技术
2.2.1 常用虚拟化软件
2.2.2 VMware Workstation安装
2.2.3 VMware Workstation网络设置
2.3 Linux操作系统安装及常用操作
2.3.1 Linux简介
2.3.2 安装指南
2.3.3 常用操作
2.4 Hadoop伪分布式模式的安装
2.4.1 Hadoop安装配置
2.4.2 Hadoop启动
2.4.3 集群验证
2.5 分布式模式集群的安装
2.5.1 配置主机信息
2.5.2 配置网络
2.5.3 关闭防火墙
2.5.4 修改hosts文件
2.5.5 JDK安装
2.5.6 配置SSH免密登录
2.5.7 Hadoop安装配置
2.6 分布式模式集群的启动和验证
2.6.1 建立工作目录
2.6.2 格式化文件系统
2.6.3 启动与关闭集群
2.6.4 验证集群启动情况
小结
习题
即测即评
实验一 Hadoop环境的搭建
第3章 分布式文件系统HDFS
第4章 并行编程框架MapReduce
第5章 Yarn与ZooKeepar
第6章 分布式数据库HBase
第7章 Hive数据仓库
第8章 NoSQL数据库及MongoDB
第9章 Sqoop、Kafka和Flume
参考文献
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/3/14 23:21:54