大数据开发者权威教程(大数据技术与编程基础)Wrox国际IT认证项目组人民邮电出版社豆瓣PDF电子书bt网盘迅雷下载-霍普软件下载网

模块1 大数据入门
第1讲大数据简介
1.1 什么是大数据
1.1.1 大数据的优势
1.1.2 挖掘各种大数据源
1.2 数据管理的历史——大数据的演化
1.3 大数据的结构化
1.4 大数据要素
1.4.1 数据量
1.4.2 速度
1.4.3 多样性
1.5 大数据在商务环境中的应用
1.6 大数据行业中的职业机会
1.6.1 职业机会
1.6.2 所需技能
1.6.3 大数据的未来
练习
备忘单
第2讲大数据在商业上的应用
2.1 社交网络数据的重要性
2.2 金融欺诈和大数据
2.3 保险业的欺诈检测
2.4 在零售业中应用大数据
练习
备忘单
第3讲处理大数据的技术
3.1 大数据的分布式和并行计算
3.1.1 并行计算技术
3.1.2 虚拟化及其对大数据的重要性
3.2 Hadoop简介
3.3 云计算和大数据
3.3.1 大数据计算的特性
3.3.2 云部署模型
3.3.3 云交付模型
3.3.4 大数据云
3.3.5 大数据云市场中的供应商
3.3.6 使用云服务所存在的问题
3.4 大数据内存计算技术
练习
备忘单
第4讲了解Hadoop生态系统
4.1 Hadoop生态系统
4.2 用HDFS存储数据
4.2.1 HDFS架构
4.2.2 HDFS的一些特殊功能
4.3 利用Hadoop MapReduce处理数据
4.3.1 MapReduce是如何工作的
4.3.2 MapReduce的优点和缺点
4.3.3 利用Hadoop YARN管理资源和应用
4.4 利用HBase存储数据
4.5 使用Hive查询大型数据库
4.6 与Hadoop生态系统的交互
4.6.1 Pig和Pig Latin
4.6.2 Sqoop
4.6.3 Zookeeper
4.6.4 Flume
4.6.5 Oozie
练习
备忘单
第5讲 MapReduce基础
5.1 MapReduce的起源
5.2 MapReduce是如何工作的
5.3 MapReduce作业的优化技术
5.3.1 硬件/网络拓扑
5.3.2 同步
5.3.3 文件系统
5.4 MapReduce的应用
5.5 HBase在大数据处理中的角色
5.6 利用Hive挖掘大数据
练习
备忘单
模块2 管理大数据生态系统
第1讲大数据技术基础
1.1 探索大数据栈
1.2 冗余物理基础设施层
1.2.1 物理冗余网络
1.2.2 管理硬件：存储和服务器
1.2.3 基础设施的操作
1.3 安全基础设施层
1.4 接口层以及与应用程序和互联网的双向反馈
1.5 可操作数据库层
1.6 组织数据服务层及工具
1.7 分析数据仓库层
1.8 分析层
1.9 大数据应用层
1.10 虚拟化和大数据
1.11 虚拟化方法
1.11.1 服务器虚拟化
1.11.2 应用程序虚拟化
1.11.3 网络虚拟化
1.11.4 处理器和内存虚拟化
1.11.5 数据和存储虚拟化
1.11.6 用管理程序进行虚拟化管理
1.11.7 抽象与虚拟化
1.11.8 实施虚拟化来处理大数据
练习
备忘单
第2讲大数据管理系统——数据库和数据仓库
2.1 RDBMS和大数据环境
2.2 非关系型数据库
2.2.1 键值数据库
2.2.2 文档数据库
2.2.3 列式数据库
2.2.4 图数据库
2.2.5 空间数据库
2.3 混合持久化
2.4 将大数据与传统数据仓库相集成
2.4.1 优化数据仓库
2.4.2 大数据结构与数据仓库的区别
2.5 大数据分析和数据仓库
2.6 改变大数据时代的部署模式
2.6.1 设备模型
2.6.2 云模型
练习
备忘单
第3讲分析与大数据
3.1 使用大数据以获取结果
3.1.1 基本分析
3.1.2 高级分析
3.1.3 可操作性分析
3.1.4 货币化分析
3.2 是什么构成了大数据
3.2.1 构成大数据的数据
3.2.2 大数据分析算法
3.2.3 大数据基础设施支持
3.3 探索非结构化数据
3.4 理解文本分析
3.4.1 分析和提取技术
3.4.2 理解提取的信息
3.4.3 分类法
3.4.4 将结果与结构化数据放在一起
3.5 建立新的模式和方法以支持大数据
3.5.1 大数据分析的特征
3.5.2 大数据分析的应用
3.5.3 大数据分析框架的特性
练习
备忘单
第4讲整合数据、实时数据和实施大数据
4.1 大数据分析的各个阶段
4.1.1 探索阶段
4.1.2 编纂阶段
4.1.3 整合和合并阶段
4.2 大数据集成的基础
4.2.1 传统ETL
4.2.2 ELT——提取、加载和转换
4.2.3 优先处理大数据质量
4.2.4 数据性能分析工具
4.2.5 将Hadoop用作ETL
4.3 流数据和复杂的

“大数据”近年成为IT领域的热点话题，人们每天都会通过互联网、移动设备等产生大量数据。如何管理大数据、掌握大数据的核心技术、理解大数据相关的生态系统等，是作为大数据开发者必须学习和熟练掌握的。本系列书以“大数据开发者”应掌握的技术为主线，共分两卷，以7个模块分别介绍如何管理大数据生态系统、如何存储和处理数据、如何利用Hadoop工具、如何利用NoSQL与Hadoop协同工作，以及如何利用Hadoop商业发行版和管理工具。本系列书涵盖了大数据开发工作的核心内容，全面且详尽地涵盖了大数据开发的各个领域。
Wrox国际IT认证项目组编顾晨译的《大数据开发者权威教程(大数据技术与编程基础)》为第1卷，共4个模块，分别介绍大数据基础知识、大数据生态系统的管理、HDFS和MapReduce以及Hadoop工具（如Hive、Pig和Oozie等）。
本书适用于想成为大数据开发者以及所有对大数据开发感兴趣的技术人员和决策者阅读。

书名	大数据开发者权威教程(大数据技术与编程基础)
分类
作者	Wrox国际IT认证项目组
出版社	人民邮电出版社
下载
简介	目录模块1 大数据入门第1讲大数据简介 1.1 什么是大数据 1.1.1 大数据的优势 1.1.2 挖掘各种大数据源 1.2 数据管理的历史——大数据的演化 1.3 大数据的结构化 1.4 大数据要素 1.4.1 数据量 1.4.2 速度 1.4.3 多样性 1.5 大数据在商务环境中的应用 1.6 大数据行业中的职业机会 1.6.1 职业机会 1.6.2 所需技能 1.6.3 大数据的未来练习备忘单第2讲大数据在商业上的应用 2.1 社交网络数据的重要性 2.2 金融欺诈和大数据 2.3 保险业的欺诈检测 2.4 在零售业中应用大数据练习备忘单第3讲处理大数据的技术 3.1 大数据的分布式和并行计算 3.1.1 并行计算技术 3.1.2 虚拟化及其对大数据的重要性 3.2 Hadoop简介 3.3 云计算和大数据 3.3.1 大数据计算的特性 3.3.2 云部署模型 3.3.3 云交付模型 3.3.4 大数据云 3.3.5 大数据云市场中的供应商 3.3.6 使用云服务所存在的问题 3.4 大数据内存计算技术练习备忘单第4讲了解Hadoop生态系统 4.1 Hadoop生态系统 4.2 用HDFS存储数据 4.2.1 HDFS架构 4.2.2 HDFS的一些特殊功能 4.3 利用Hadoop MapReduce处理数据 4.3.1 MapReduce是如何工作的 4.3.2 MapReduce的优点和缺点 4.3.3 利用Hadoop YARN管理资源和应用 4.4 利用HBase存储数据 4.5 使用Hive查询大型数据库 4.6 与Hadoop生态系统的交互 4.6.1 Pig和Pig Latin 4.6.2 Sqoop 4.6.3 Zookeeper 4.6.4 Flume 4.6.5 Oozie 练习备忘单第5讲 MapReduce基础 5.1 MapReduce的起源 5.2 MapReduce是如何工作的 5.3 MapReduce作业的优化技术 5.3.1 硬件/网络拓扑 5.3.2 同步 5.3.3 文件系统 5.4 MapReduce的应用 5.5 HBase在大数据处理中的角色 5.6 利用Hive挖掘大数据练习备忘单模块2 管理大数据生态系统第1讲大数据技术基础 1.1 探索大数据栈 1.2 冗余物理基础设施层 1.2.1 物理冗余网络 1.2.2 管理硬件：存储和服务器 1.2.3 基础设施的操作 1.3 安全基础设施层 1.4 接口层以及与应用程序和互联网的双向反馈 1.5 可操作数据库层 1.6 组织数据服务层及工具 1.7 分析数据仓库层 1.8 分析层 1.9 大数据应用层 1.10 虚拟化和大数据 1.11 虚拟化方法 1.11.1 服务器虚拟化 1.11.2 应用程序虚拟化 1.11.3 网络虚拟化 1.11.4 处理器和内存虚拟化 1.11.5 数据和存储虚拟化 1.11.6 用管理程序进行虚拟化管理 1.11.7 抽象与虚拟化 1.11.8 实施虚拟化来处理大数据练习备忘单第2讲大数据管理系统——数据库和数据仓库 2.1 RDBMS和大数据环境 2.2 非关系型数据库 2.2.1 键值数据库 2.2.2 文档数据库 2.2.3 列式数据库 2.2.4 图数据库 2.2.5 空间数据库 2.3 混合持久化 2.4 将大数据与传统数据仓库相集成 2.4.1 优化数据仓库 2.4.2 大数据结构与数据仓库的区别 2.5 大数据分析和数据仓库 2.6 改变大数据时代的部署模式 2.6.1 设备模型 2.6.2 云模型练习备忘单第3讲分析与大数据 3.1 使用大数据以获取结果 3.1.1 基本分析 3.1.2 高级分析 3.1.3 可操作性分析 3.1.4 货币化分析 3.2 是什么构成了大数据 3.2.1 构成大数据的数据 3.2.2 大数据分析算法 3.2.3 大数据基础设施支持 3.3 探索非结构化数据 3.4 理解文本分析 3.4.1 分析和提取技术 3.4.2 理解提取的信息 3.4.3 分类法 3.4.4 将结果与结构化数据放在一起 3.5 建立新的模式和方法以支持大数据 3.5.1 大数据分析的特征 3.5.2 大数据分析的应用 3.5.3 大数据分析框架的特性练习备忘单第4讲整合数据、实时数据和实施大数据 4.1 大数据分析的各个阶段 4.1.1 探索阶段 4.1.2 编纂阶段 4.1.3 整合和合并阶段 4.2 大数据集成的基础 4.2.1 传统ETL 4.2.2 ELT——提取、加载和转换 4.2.3 优先处理大数据质量 4.2.4 数据性能分析工具 4.2.5 将Hadoop用作ETL 4.3 流数据和复杂的内容推荐 “大数据”近年成为IT领域的热点话题，人们每天都会通过互联网、移动设备等产生大量数据。如何管理大数据、掌握大数据的核心技术、理解大数据相关的生态系统等，是作为大数据开发者必须学习和熟练掌握的。本系列书以“大数据开发者”应掌握的技术为主线，共分两卷，以7个模块分别介绍如何管理大数据生态系统、如何存储和处理数据、如何利用Hadoop工具、如何利用NoSQL与Hadoop协同工作，以及如何利用Hadoop商业发行版和管理工具。本系列书涵盖了大数据开发工作的核心内容，全面且详尽地涵盖了大数据开发的各个领域。 Wrox国际IT认证项目组编顾晨译的《大数据开发者权威教程(大数据技术与编程基础)》为第1卷，共4个模块，分别介绍大数据基础知识、大数据生态系统的管理、HDFS和MapReduce以及Hadoop工具（如Hive、Pig和Oozie等）。本书适用于想成为大数据开发者以及所有对大数据开发感兴趣的技术人员和决策者阅读。
随便看	沿着花开的方向用生命阅读时光/悦读文库生命是一次美丽的燃烧/悦读文库做好人生中的每件小事(智慧故事辑)/悦读文库食品化学(食品科学与工程专业主干课程普通高等教育十三五规划教材) 骨科缝线与打结中国食品原料及食品添加剂法规与标准解读(2017年版) Hack与HHVM权威指南 Pro\ENGINEER中文野火版5.0高级应用教程(附光盘增值版)/Pro\ENGINEER中文野火版5.0工程应用精解丛书猫咪吉姆和桑迪(英汉对照)/做自信的自己简明甲病治疗学不想老妈太强势/老妈你真烦特种兵学校(12海豚奇兵)/动物战友系列远方诗词集杭州城事绘来自鬼庄园的九九/汤汤鬼精灵童话系列/儿童文学典藏书库可拓创新方法/可拓学丛书长寿命HMAC路面结构设计与应用技术/博士后文库白桦细胞培养与三萜合成的生物调控民法(飞跃版)/2017国家司法考试同步训练题解能够兑现的法律(你所不知道的秦帝国) 男性不育症白文俊2016观点(精)/中国医学临床百家肝衰竭新进展(精)/中国医学临床百家慢性阻塞性肺疾病何权瀛2016观点(精)/中国医学临床百家忽忽刚上学(9我们的节日全彩注音) 4-5岁/天才IQ.全脑思维升级训练会议签到表模板excel 会议记录表模板英语学习计划书英语学习计划表医生简历模板 it个人简历模板医生个人简历模板 it行业简历模板加班申请表模板 java开发工程师简历模板隐贤派排盘择日 V1.1 绿色专业版风水不求人 V1.0 绿色版家居风水大师 V3.0 绿色版周易品牌商标取名软件 V1.0 免费安装版立体星图 V3.8.2 绿色版歌词傻瓜制作器 V1.2 绿色版星辰沙海十二项修改器 v0.6.7.7 九秀游戏直播工具(9秀游戏直播工具) V1.0.9 官方安装版顶伯抽签抽奖系统 V1.1.2.200201 官方安装版伊凡英语启蒙好帮手 V3.0 官方安装版 ingest inglenook inglorious ingot ingrained ingrate ingratiate ingratiating ingratitude ingredient [BT下载][一路向前][第21-23集][WEB-MKV/3.74G][国语配音/中文字幕][4K-2160P][H265][流媒体][BlackTV] 剧集 2024 大陆剧情连载 [BT下载][人生波动][全15集][WEB-MKV/8.48G][中文字幕][1080P][流媒体][BlackTV] 剧集 2017 泰国剧情打包 [BT下载][人生波动][全15集][WEB-MKV/8.48G][中文字幕][1080P][流媒体][BlackTV] 剧集 2017 泰国剧情打包 [BT下载][创想季][第25-26集][WEB-MP4/1.28G][国语配音/中文字幕][1080P][流媒体][ZeroTV] 剧集 2024 大陆剧情连载 [BT下载][创想季][第25-26集][WEB-MKV/1.27G][国语配音/中文字幕][1080P][流媒体][BlackTV] 剧集 2024 大陆剧情连载 [BT下载][创想季][第25-26集][WEB-MP4/0.48G][国语配音/中文字幕][1080P][H265][流媒体][ZeroTV] 剧集 2024 大陆剧情连载 [BT下载][创想季][第23-26集][WEB-MKV/6.55G][国语配音/中文字幕][4K-2160P][60帧率][H265][流媒体][BlackT 剧集 2024 大陆剧情连载 [BT下载][创想季][第25-26集][WEB-MKV/2.54G][国语配音/中文字幕][4K-2160P][H265][流媒体][BlackTV] 剧集 2024 大陆剧情连载 [BT下载][创想季][第25-26集][WEB-MKV/1.51G][国语配音/中文字幕][4K-2160P][H265][流媒体][ZeroTV] 剧集 2024 大陆剧情连载 [BT下载][创想季][第25-26集][WEB-MP4/1.28G][国语配音/中文字幕][1080P][流媒体][LelveTV] 剧集 2024 大陆剧情连载 Win7系统双击文件夹打不开如何解决？ Win7系统如何设置动态桌面？ Win7系统如何设置双屏显示？ Win10系统C盘哪些文件可以删除？C盘无用文件都在哪？ Win10怎么取消开机密码？Win10如何跳过开机密码？ Eclipse字体大小设置步骤 Eclipse字体格式设置方法如何说服自己换新款笔记本？年迈心塞的笔记本是不是该淘汰了 WinXP系统Windows Search卸载方法 LOL游戏环境异常怎么解决？ Win10开始菜单没反应怎么解决？