利用分析工具可以快速获取商业洞察,为此你需要了解如何对数据进行实时处理。通过这本实用指南,对于熟悉Apache Spark的读者来说,你们将了解如何将这个内存框架应用于流数据。你会发现Spark让你几乎可以像面对批处理作业一样来开发流处理作业。
本书介绍了Apache Spark的理论基础。这本综合指南通过两个部分比较了Spark支持的流处理API:早期Spark Streaming和后来的Structured Streaming。
网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略 音乐专区
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。
| 电子书 | 基于Apache Spark的流处理 |
| 分类 | 电子书下载 |
| 作者 | (美)杰拉德·马斯//弗朗索瓦·加里洛 |
| 出版社 | 中国电力出版社 |
| 下载 |
|
| 介绍 |
内容推荐 利用分析工具可以快速获取商业洞察,为此你需要了解如何对数据进行实时处理。通过这本实用指南,对于熟悉Apache Spark的读者来说,你们将了解如何将这个内存框架应用于流数据。你会发现Spark让你几乎可以像面对批处理作业一样来开发流处理作业。 本书介绍了Apache Spark的理论基础。这本综合指南通过两个部分比较了Spark支持的流处理API:早期Spark Streaming和后来的Structured Streaming。 作者简介 杰拉德·马斯是Lightbend的首席工程师,致力于将结构化流和其他可伸缩流处理技术无缝集成到Lightbend平台中。 目录 序
前言 第一部分 Apache Spark流处理的基本原理 第1章 流处理概述 什么是流处理 批处理与流处理 流处理中的时间概念 不确定性因素 流处理案例 可扩展的数据处理能力 扩展性与容错性 分布式流处理 Apache Spark概述 第一波浪潮:函数式API 第二波浪潮:SQL 统一的引擎 Spark组件 Spark Streaming Structured Streaming 接下来? 第2章 流处理模型 数据源与接收器 不可变流 转换与聚合 窗口聚合 滚动窗口 滑动窗口 无状态处理与有状态处理 有状态的流 案例:Scala中的本地状态计算 无状态流,还是有状态流? 时间效应 带时间戳的事件计算 通过时间戳来定义时间概念 事件时间与处理时间 使用水位线计算 小结 第3章 流处理架构 数据平台的组件 体系模型 在流处理应用中使用批处理组件 流处理架构参考 Lambda架构 Kappa架构 …… 第二部分 Structured Streaming 第三部分 Spark Streaming 第四部分 Spark Streaming高级技巧 第五部分 Apache Spark之外的世界 参考文献 作者介绍 封面介绍 |
| 截图 | |
| 随便看 |
|
免责声明
本网站所展示的内容均来源于互联网,本站自身不存储、不制作、不上传任何内容,仅对网络上已公开的信息进行整理与展示。
本站不对所转载内容的真实性、完整性和合法性负责,所有内容仅供学习与参考使用。
若您认为本站展示的内容可能存在侵权或违规情形,请您提供相关权属证明与联系方式,我们将在收到有效通知后第一时间予以删除或屏蔽。
本网站对因使用或依赖本站信息所造成的任何直接或间接损失概不承担责任。联系邮箱:101bt@pm.me