网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 大数据理论与应用基础/新工科建设之路数据科学与大数据系列
分类
作者
出版社 电子工业出版社
下载
简介
内容推荐
本书从初学者的角度详细介绍大数据的核心技术。全书共11章,包括绪论、Linux的基础操作、Hadoop大数据处理架构、HDFS分布式文件系统、MapReduce分布式计算框架、ZooKeeper分布式协调服务、YARN资源管理器、HBase分布式数据库、Hive数据仓储、PySpark数据处理与分析及综合案例。此外,本书还提供了相应的示例代码,以帮助读者进一步理解相关方案的实现过程。
本书可作为高等院校相关专业开设大数据有关课程的本科生、研究生的教材,也可作为从事大数据挖掘等工作的科研或工程技术人员的参考书。
目录
第1章 绪论
1.1 大数据的形成和发展
1.2 大数据的基本概念
1.2.1 什么是大数据
1.2.2 大数据的特征
1.3 大数据关键技术
1.3.1 大数据采集技术
1.3.2 大数据预处理技术
1.3.3 大数据存储与管理技术
1.3.4 大数据分析与挖掘技术
1.3.5 大数据展现与应用技术
1.4 大数据的行业应用
1.4.1 水利领域
1.4.2 生物医学领域
1.4.3 智慧城市领域
1.4.4 商业领域
1.4.5 信息安全领域
1.5 大数据领域的主要职位及其能力要求
1.5.1 首席数据官
1.5.2 数据科学家
1.5.3 大数据开发工程师
1.5.4 大数据运维工程师
1.6 本章小结
1.7 习题
第2章 Linux的基础操作
2.1 Linux概述
2.1.1 Linux系统的发行版本及特点
2.1.2 Linux与Windows系统对比
2.2 Linux命令
2.2.1 命令行技巧
2.2.2 Linux帮助命令
2.2.3 Linux文件类型及查看操作
2.2.4 文件与目录操作
2.2.5 文本编辑
2.2.6 文本过滤器与处理
2.2.7 用户与用户组管理
2.2.8 文件权限管理
2.2.9 归档与压缩
2.2.10 进程管理
2.3 本章小结
2.4 习题
第3章 Hadoop大数据处理架构
3.1 Hadoop简介
3.1.1 Hadoop的概念
3.1.2 Hadoop的发展史
3.1.3 Hadoop版本介绍
3.2 Hadoop的特性
3.3 Hadoop生态系统
3.3.1 Hadoop集群的架构
3.3.2 Hadoop生态系统的组件
3.4 部署Hadoop集群
3.4.1 Hadoop集群的部署方式
3.4.2 虚拟机的创建和配置
3.4.3 安装JDK
3.4.4 安装Hadoop
3.4.5 验证
3.5 本章小节
3.6 习题
第4章 HDFS分布式文件系统
4.1 HDFS简介
4.1.1 分布式文件系统的发展
4.1.2 HDFS的基本概念
4.1.3 HDFS的特点
4.2 HDFS的存储架构和工作原理
4.2.1 HDFS的存储架构
4.2.2 HDFS文件的读取原理
4.2.3 HDFS文件的写入原理
4.3 HDFS的Shell操作
4.4 HDFS的Java API介绍
4.4.1 HDFS Java API概述
4.4.2 使用Java API操作HDFS
4.5 本章小结
4.6 习题
第5章 MapReduce分布式计算框架
5.1 MapReduce简介
5.1.1 分布式并行编程
5.1.2 MapReduce模型简介
5.1.3 MapReduce的优/缺点
5.1.4 Map和Reduce函数
5.2 MapReduce的工作原理
5.2.1 工作原理概述
5.2.2 MapReduce的工作过程
5.2.3 Map任务的工作原理
5.2.4 Shuffle的工作原理
5.2.5 Reduce任务的工作原理
5.3 MapReduce编程组件
5.3.1 InputFormat组件
5.3.2 Mapper组件
5.3.3 Reducer组件
5.3.4 Partitioner组件
5.3.5 Combiner组件
5.3.6 OutputFormat组件
5.4 MapReduce案例
5.4.1 本地测试环境配置
5.4.2 WordCount
5.4.3 倒排索引
5.4.4 数据去重
5.4.5 Top
5.5 MapReduce实验
5.5.1 任务要求
5.5.2 环境准备
5.5.3 程序编写
5.5.4 本地测试
5.5.5 集群测试
5.6 本章小结
5.7 习题
第6章 ZooKeeper分布式协调服务
6.1 ZooKeeper概述
6.1.1 ZooKeeper的设计目标
6.1.2 ZooKeeper的特性
6.1.3 ZooKeeper集群角色
6.1.4 ZooKeeper实现
6.2 ZooKeeper数据模型
6.2.1 数据存储结构
6.2.2 节点类型
6.2.3 znode属性
6.2.4 znode数据访问
6.2.5 其他节点
6.2.6 ZooKeeper中的时间
6.3 watch机制
6.3.1 watch机制的定义
6.3.2 watch机制的语义
6.3.3 watch机制的实现
6.3.4 watch机制的特点
6.3.5 watch机制的通知状态和事件类型
6.3.6 ZooKeeper对watch的支持
6.4 ZooKeeper的选举机制
6.4.1 选举机制相关概念
6.4.2 选举机制类型
6.5 ZooKeeper会话
6.6 ZooKeeper使用ACL进行访问控制
6.6.1 ACL权限与内置方案
6.6.2 ZooKeeper C API
6.7 可插拔ZooKeeper身份验证
6.8 ZooKeeper绑定
6.8.1 Java绑定
6.8.2 C绑定
6.9 ZooKeeper部署及操作
6.9.1 ZooKeeper的下载与安装
6.9.2 配置修改
6.9.3 ZooKeeper操作
6.9.4 ZooKeeper集群部署
6.9.5 ZooKeeper的Java API操作
6.10 ZooKeeper典型应用
6.10.1 数据发布与订阅
6.10.2 负载均衡
6.10.3 命名服务
6.10.4 分布式锁
6.11 本章小结
6.12 习题
第7章 YARN资源管理器
7.1 YARN介绍
7.1.1 YARN的概念
7.1.2 YARN的应用场景
7.2 YARN的基本组成
7.2.1 ResourceManager
7.2.2 NodeManager
7.2.3
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/4/9 14:55:14