Elasticsearch集成Hadoop最佳实践(美)尔玛·舒克拉清华大学出版社豆瓣PDF电子书bt网盘迅雷下载计算机-操作系统-霍普软件下载网

第1章环境部署

1.1 安装部署Hadoop集群

Java安装和配置

用户添加和配置

SSH认证配置

Hadoop下载

环境变量配置

Hadoop配置

配置core-site.xml

配置hdfs-site.xml

配置yarn-site.xml

配置mapred-site.xml

格式化HDFS

启动Hadoop进程

1.2 安装Elasticsearch及相关插件

下载Elasticsearch

配置Elasticsearch

安装Head插件

安装Marvel插件

启动Elasticsearch

1.3 运行WordCount示例

下载编译示例程序

将示例文件上传到HDFS

运行第一个作业

1.4 使用Head 和 Marvel浏览数据

使用Head浏览数据

初识Marvel

使用Sense浏览数据

小结

第2章初识ES-Hadoop

2.1 理解WordCount程序

理解Mapper

理解Reducer

理解Driver

使用旧的API——org.apache.hadoop.mapred

2.2 实际案例——网络数据监控

获取并理解数据

明确问题

解决方案

解决方案1——预聚合结果

解决方案2——直接查询聚合结果

2.3 开发MapReduce作业

编写Mapper类

编写Driver

编译作业

上传数据到HDFS

运行作业

查看TOP N结果

2.4 将数据从Elasticsearch写回HDFS

了解Twitter数据集

导入Elasticsearch

创建MapReduce作业

编写Tweets2HdfsMapper

运行示例

确认输出

小结

第3章深入理解Elasticsearch

3.1 理解搜索

观念转换

索引

类型

文档

字段

3.2 与Elasticsearch交互

Elasticsearch的CRUD

创建文档

获取文档

更新文档

删除文档

创建索引

映射

数据类型

创建映射

索引模板

3.3 控制索引过程

什么是反转索引

输入数据分析

停止词

大小写

词根

同义词

分析器

3.4 Elastic查询

编写查询语句

URI查询

match_all查询

term查询

boolean查询

match查询

range查询

wildcard查询

过滤器

3.5 聚合查询

执行聚合查询

terms聚合

histogram聚合

range聚合

geo distance聚合

嵌套聚合

自测题

小结

第4章利用Kibana进行大数据可视化

4.1 安装部署

Kibana安装

准备数据

自测题

启动Kibana

4.2 数据发现

4.3 数据可视化

饼图

堆积柱状图

使用堆积柱状图完成日期直方图

面积图

饼图组图

环形图

瓦片地图

自测题

4.4 动态图表

小结

第5章实时分析

5.1 了解Twitter趋势分析器

实现目标

Apache Storm安装

5.2 将流式数据接入Storm

编写Storm spout

编写Storm bolt

创建Storm topology

编译运行Storm作业

5.3 趋势分析

significant term聚合

使用Kibana分析趋势

5.4 使用Percolator对推文分类

Percolator

Percolator优化

推文分类

小结

第6章 ES-Hadoop配置

6.1 分布式环境中的Elasticsearch

集群和节点

节点类型

节点发现

数据分布

分片

副本

分片分配

6.2 ES-Hadoop架构

动态并行

写入Elasticsearch

从Elasticsearch中读取

失败捕获

数据本地化

6.3 生产环境配置

硬件

内存

CPU

磁盘

网络

集群安装

集群拓扑结构

设置名称

设置路径

设置内存

脑裂问题

设置恢复参数

预设配置

数据导入

全文检索

快速聚合

生产环境部署检查列表

6.4 集群管理

监控集群健康

备份和恢复

数据备份

数据恢复

小结

第7章与Hadoop生态系统集成

7.1 与Pig集成

Pig安装

向Elasticsearch中导入数据

从JSON源写数据

类型转换

从Elasticsearch中读取数据

7.2 与Hive集成

安装Apache Hive

向Elasticsearch中导入数据

从JSON源写数据

类型转换

从Elasticsearch中读取数据

7.3 与Cascading集成

向Elasticsearch中导入数据

编写一个Cascading作业

运行作业

从Elasticsearch中读取数据

编写一个reader作业

使用Lingual

7.4 与Spark集成

安装Spark

向Elasticsearch中导入数据

使用SparkSQL向Elasticsearch中导入数据

从Elasticsearch中读取数据

使用SparkSQL从Elasticsearch中读取数据

7.5 与YARN集成

小结

附录配置

基本配置

es.resource

es.resource.read

es.resource.write

es.nodes

es.port

读写配置

es.query

es.input.json

es.write.operation

es.update.script

es.update.script.lang

es.update.script.params

es.update.script.params.json

es.batch.size.bytes

es.batch.size.entries

es.batch.write.refresh

es.batch.write.retry.count

es.batch.write.retry.wait

es.ser.reader.value.class

es.ser.writer.value.class

es.update.retry.on.conflict

映射配置

es.mapping.id

es.mapping.parent

es.mapping.version

es.mapping.version.type

es.mapping.routing

es.mapping.ttl

es.mapping.timestamp

es.mapping.date.rich

es.mapping.include

es.mapping.exclude

索引配置

es.index.auto.create

es.index.read.missing.as.empty

es.field.read.empty.as.null

es.field.read.validate.presence

网络配置

es.nodes.discovery

es.nodes.client.only

es.http.timeout

es.http.retries

es.scroll.keepalive

es.scroll.size

es.action.heart.beat.lead

认证配置

es.net.http.auth.user

es.net.http.auth.pass

SSL配置

es.net.ssl

es.net.ssl.keystore.location

es.net.ssl.keystore.pass

es.net.ssl.keystore.type

es.net.ssl.truststore.location

es.net.ssl.truststore.pass

es.net.ssl.cert.allow.self.signed

es.net.ssl.protocol

es.scroll.size

代理配置

es.net.proxy.http.host

es.net.proxy.http.port

es.net.proxy.http.user

es.net.proxy.http.pass

es.net.proxy.http.use.system.props

es.net.proxy.socks.host

es.net.proxy.socks.port

es.net.proxy.socks.user

es.net.proxy.socks.pass

es.net.proxy.socks.use.system.props

书名	Elasticsearch集成Hadoop最佳实践
分类	计算机-操作系统
作者	(美)尔玛·舒克拉
出版社	清华大学出版社
下载
简介	目录第1章环境部署 1.1 安装部署Hadoop集群 Java安装和配置用户添加和配置 SSH认证配置 Hadoop下载环境变量配置 Hadoop配置配置core-site.xml 配置hdfs-site.xml 配置yarn-site.xml 配置mapred-site.xml 格式化HDFS 启动Hadoop进程 1.2 安装Elasticsearch及相关插件下载Elasticsearch 配置Elasticsearch 安装Head插件安装Marvel插件启动Elasticsearch 1.3 运行WordCount示例下载编译示例程序将示例文件上传到HDFS 运行第一个作业 1.4 使用Head 和 Marvel浏览数据使用Head浏览数据初识Marvel 使用Sense浏览数据小结第2章初识ES-Hadoop 2.1 理解WordCount程序理解Mapper 理解Reducer 理解Driver 使用旧的API——org.apache.hadoop.mapred 2.2 实际案例——网络数据监控获取并理解数据明确问题解决方案解决方案1——预聚合结果解决方案2——直接查询聚合结果 2.3 开发MapReduce作业编写Mapper类编写Driver 编译作业上传数据到HDFS 运行作业查看TOP N结果 2.4 将数据从Elasticsearch写回HDFS 了解Twitter数据集导入Elasticsearch 创建MapReduce作业编写Tweets2HdfsMapper 运行示例确认输出小结第3章深入理解Elasticsearch 3.1 理解搜索观念转换索引类型文档字段 3.2 与Elasticsearch交互 Elasticsearch的CRUD 创建文档获取文档更新文档删除文档创建索引映射数据类型创建映射索引模板 3.3 控制索引过程什么是反转索引输入数据分析停止词大小写词根同义词分析器 3.4 Elastic查询编写查询语句 URI查询 match_all查询 term查询 boolean查询 match查询 range查询 wildcard查询过滤器 3.5 聚合查询执行聚合查询 terms聚合 histogram聚合 range聚合 geo distance聚合嵌套聚合自测题小结第4章利用Kibana进行大数据可视化 4.1 安装部署 Kibana安装准备数据自测题启动Kibana 4.2 数据发现 4.3 数据可视化饼图堆积柱状图使用堆积柱状图完成日期直方图面积图饼图组图环形图瓦片地图自测题 4.4 动态图表小结第5章实时分析 5.1 了解Twitter趋势分析器实现目标 Apache Storm安装 5.2 将流式数据接入Storm 编写Storm spout 编写Storm bolt 创建Storm topology 编译运行Storm作业 5.3 趋势分析 significant term聚合使用Kibana分析趋势 5.4 使用Percolator对推文分类 Percolator Percolator优化推文分类小结第6章 ES-Hadoop配置 6.1 分布式环境中的Elasticsearch 集群和节点节点类型节点发现数据分布分片副本分片分配 6.2 ES-Hadoop架构动态并行写入Elasticsearch 从Elasticsearch中读取失败捕获数据本地化 6.3 生产环境配置硬件内存 CPU 磁盘网络集群安装集群拓扑结构设置名称设置路径设置内存脑裂问题设置恢复参数预设配置数据导入全文检索快速聚合生产环境部署检查列表 6.4 集群管理监控集群健康备份和恢复数据备份数据恢复小结第7章与Hadoop生态系统集成 7.1 与Pig集成 Pig安装向Elasticsearch中导入数据从JSON源写数据类型转换从Elasticsearch中读取数据 7.2 与Hive集成安装Apache Hive 向Elasticsearch中导入数据从JSON源写数据类型转换从Elasticsearch中读取数据 7.3 与Cascading集成向Elasticsearch中导入数据编写一个Cascading作业运行作业从Elasticsearch中读取数据编写一个reader作业使用Lingual 7.4 与Spark集成安装Spark 向Elasticsearch中导入数据使用SparkSQL向Elasticsearch中导入数据从Elasticsearch中读取数据使用SparkSQL从Elasticsearch中读取数据 7.5 与YARN集成小结附录配置基本配置 es.resource es.resource.read es.resource.write es.nodes es.port 读写配置 es.query es.input.json es.write.operation es.update.script es.update.script.lang es.update.script.params es.update.script.params.json es.batch.size.bytes es.batch.size.entries es.batch.write.refresh es.batch.write.retry.count es.batch.write.retry.wait es.ser.reader.value.class es.ser.writer.value.class es.update.retry.on.conflict 映射配置 es.mapping.id es.mapping.parent es.mapping.version es.mapping.version.type es.mapping.routing es.mapping.ttl es.mapping.timestamp es.mapping.date.rich es.mapping.include es.mapping.exclude 索引配置 es.index.auto.create es.index.read.missing.as.empty es.field.read.empty.as.null es.field.read.validate.presence 网络配置 es.nodes.discovery es.nodes.client.only es.http.timeout es.http.retries es.scroll.keepalive es.scroll.size es.action.heart.beat.lead 认证配置 es.net.http.auth.user es.net.http.auth.pass SSL配置 es.net.ssl es.net.ssl.keystore.location es.net.ssl.keystore.pass es.net.ssl.keystore.type es.net.ssl.truststore.location es.net.ssl.truststore.pass es.net.ssl.cert.allow.self.signed es.net.ssl.protocol es.scroll.size 代理配置 es.net.proxy.http.host es.net.proxy.http.port es.net.proxy.http.user es.net.proxy.http.pass es.net.proxy.http.use.system.props es.net.proxy.socks.host es.net.proxy.socks.port es.net.proxy.socks.user es.net.proxy.socks.pass es.net.proxy.socks.use.system.props 内容推荐 ElasticSearch是一个开源的分布式搜索引擎，具有高可靠性，支持非常多的企业级搜索用例。Elasticsearch Hadoop作为一个完美的工具，用来连接 Elasticsearch 和 Hadoop 的生态系统。通过Kibana技术，Elasticsearch Hadoop很容易从Hadoop 生态系统中获得大数据分析的结果。由尔玛·舒克拉著的《Elasticsearch集成Hadoop最佳实践》全面介绍Elasticsearch Hadoop技术用于大数据分析以及数据可视化的方法。内容共分7章，包括Hadoop、Elasticsearch、 Marvel和 Kibana 安装；通过编写 MapReduce 作业，把Hadoop数据导入 Elasticsearch；全面分析 Elasticsearch本质，如全文本搜索分析、查询、筛选器和聚合；使用 Kibana创建各种可视化和交互式仪表板，并使用Storm和 Elasticsearch分类现实世界的流数据以及相关的其他主题。本书适合从事大数据分析人员、大数据应用开发的人员参考，也适合高等院校及培训机构相关专业的师生教学参考。
随便看	哈佛气质课霸汉(1) 民事官司刑事官司行政官司法律援助仲裁调解速查速用大全集(案例应用版实用珍藏版)/实用百科速查速用灭秦(1) 荣华富贵(宋朝官场上的那些事儿2) 大学/中华经典解读中庸/中华经典解读庄子/中华经典解读道德经/中华经典解读菜根谭/中华经典解读曾国藩/中华经典解读唐诗宋词/中华经典解读宋红毛泽东诗词鉴赏(增订2版)(精) 教师必备的10项修炼(刘显国教学艺术精粹)/中小学教学艺术丛书春启碎片(精) 走出神秘读懂易经犬戏豫怎样在机关工作用证据说话绍兴书画院画师作品集鸟瞰新杭州(2013) 杭州雕塑院(精) 蓝田山庄--藏画集(共2册) 中国岩彩画材料与表现/城市发展与公共艺术研究系列丛书佰阅发卡KAMIFAKA源码 v2.24 ida pro 7.5破解版 v2.87 95社区平台开源版 v2021 NDesk(Node.js安装软件) v1.0.5 NumPy(Python开发工具) v1.19.4 PB-JCE解析工具 v1.0 动手客图形化编程软件 v2.8 易程序树 v1.0 胖猫云 v1.0.11.0 DSA诊疗报告系统 v4.0 重装机兵雷诺斯七项修改器 v3.0 4399战争使命辅助 v1.0 奇易魔域私服辅助 v7.2 农场专家2017无限金钱修改器 v3.0 活锁五项修改器 v3.0 光之牛郎星三项修改器 v3.0 冒险主义无限资源修改器 v3.0 泰坦之旅年度版八项修改器 v3.0 海贼王燃血三项修改器 v3.0 最后一站八项修改器 v3.0 tobacco tobacconist to-be toboggan toby jug tocopherol tod today toddle toddler [BT下载][诡探][第13-18集][WEB-MKV/7.53G][粤语配音/中文字幕][1080P][流媒体][ZeroTV] [BT下载][诡探前传][第13-18集][WEB-MKV/7.34G][粤语配音/中文字幕][1080P][流媒体][ZeroTV] [BT下载][误入君梦][短剧][第07-12集][WEB-MKV/4.01G][国语配音/中文字幕][1080P][流媒体][ZeroTV] [BT下载][超时空罗曼史][全30集][WEB-MKV/24.07G][国语音轨/简繁英字幕][4K-2160P][H265][流媒体][MiniTV] [BT下载][逆潮][第07-10集][WEB-MKV/4.18G][国语配音/中文字幕][1080P][流媒体][ZeroTV] [BT下载][遗产侦探][第06集][WEB-MKV/1.94G][简繁英字幕][1080P][Netflix][流媒体][ZeroTV] [BT下载][铁腕毒权][全08集][WEB-MKV/23.32G][简繁英字幕][1080P][Netflix][流媒体][ZeroTV] [BT下载][错惹胭脂色][短剧][第21集][WEB-MKV/0.33G][国语配音/中文字幕][1080P][流媒体][ZeroTV] [BT下载][错惹胭脂色][短剧][第21集][WEB-MKV/0.14G][国语音轨/简繁英字幕][1080P][流媒体][MiniTV] [BT下载][错惹胭脂色][短剧][第21集][WEB-MKV/0.12G][国语配音/中文字幕][1080P][H265][流媒体][ZeroTV] photoshop中有关历史记录的操作方法 photoshop制作指纹解锁UI图标的教程 Photoshop制作质感干枯的裂痕艺术字的方法 photoshop文档不能保存成PNG格式怎么办 Photoshop辅助线与标尺快捷键汇总 photoshop通道教程之将图片调亮 photoshop抠公章图文教程 photoshop制作发光的五角星星教程使用photoshop画出五角星的图文教程 Photoshop制作水墨字教程