网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | 大数据开发者权威教程(NoSQL\Hadoop组件及大数据实施) |
分类 | |
作者 | Wrox国际IT认证项目组 |
出版社 | 人民邮电出版社 |
下载 | |
简介 | 作者简介 顾晨,男,硕士、PMP、信息系统项目管理师。毕业于上海交通大学。曾获邀参加旧金山的Google I/O大会。喜欢所有与编程相关的事物,拥有14年的编程经验。对于大数据、SAP HANA数据库和思科技术有着极其浓厚的兴趣,是国内较早从事HANA数据库研究的人员之一。先后录制了MCSE、CCNP等多种教学视频,在多家知名网站发布。精通C#、Java编程,目前正致力于人脸识别、室内定位和门店人流统计方面的研究。 目录 模块1 额外的Hadoop工具:ZooKeeper、Sqoop、Flume、YARN和Storm 第1讲 用ZooKeeper进行分布式处理协调 1.1 ZooKeeper简介 1.1.1 ZooKeeper的好处 1.1.2 ZooKeeper术语 1.1.3 ZooKeeper命令行界面(CLI) 1.2 安装和运行ZooKeeper 1.2.1 支持的平台 1.2.2 所需的软件 1.2.3 单服务器的安装 1.3 使用ZooKeeper 1.4 ZooKeeper应用程序 1.4.1 FS爬取 1.4.2 Katta 1.4.3 Yahoo!消息代理(YMB) 1.5 使用ZooKeeper构建应用程序 1.5.1 Exec.java 1.5.2 处理事件 1.5.3 监控数据 1.5.4 实现屏障和生产者-消费者队列 练习 备忘单 第2讲 利用Sqoop有效地传输批量数据 2.1 Sqoop简介 2.1.1 Sqoop中的工作流 2.1.2 Sqoop的特性 2.2 使用Sqoop 1 2.3 用Sqoop导入数据 2.3.1 导入完整的表 2.3.2 用HBase Sqoop导入带有复合键的表 2.3.3 指定目标目录 2.3.4 导入选择的行 2.3.5 密码保护 2.3.6 用不同的文件格式导入数据 2.3.7 导入数据压缩 2.4 控制并行 2.5 编码NULL值 2.6 将数据导入Hive表 2.7 将数据导入HBase 2.7.1 使用自由形式查询 2.7.2 重命名Sqoop作业 2.8 导出数据 2.8.1 批量导出 2.8.2 原子导出 2.9 将数据导出至列的子集 2.10 Sqoop中的驱动程序和连接器 2.10.1 驱动程序 2.10.2 连接器 2.10.3 连接到数据库 …… 模块2 利用NoSQL和Hadoop:实时、安全和云 模块3 Hadoop商业发行版和管理工具 内容推荐 “大数据”近年来成为IT领域的热点话题,人们每天都会通过互联网、移动设备等产生大量数据。如何管理大数据、掌握大数据的核心技术、理解大数据相关的生态系统等,是作为大数据开发者必须学习和熟练掌握的知识。本系列书以“大数据开发者”应掌握的技术为主线,共分两卷,以7个模块分别介绍如何管理大数据生态系统、如何存储和处理数据、如何利用Hadoop工具、如何利用NoSQL与Hadoop协同工作,以及如何利用Hadoop商业发行版和管理工具。本系列书涵盖了大数据开发工作的核心内容,全面且详尽地涵盖了大数据开发的各个领域。 Wrox国际IT认证项目组编的《大数据开发者权威教程(NoSQL\\Hadoop组件及大数据实施)》为第2卷,共3个模块,分别介绍Hadoop工具(如ZooKeeper、Sqoop、Flume、YARN和Storm等),利用NoSQL和Hadoop完成实时、安全和云的相关工作,以及Hadoop商业发行版和管理工具(如Cloudera、Hortonworks、GreenplumPivotal HD等),最后介绍几个实用软件的功能、指南和安装步骤。本书适用于想成为大数据开发人员以及所有对大数据开发感兴趣的技术人员和决策者阅读。 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。