前言
第1章 状态化流处理概述
传统数据处理架构
事务型处理
分析型处理
状态化流处理
事件驱动型应用
数据管道
流式分析
开源流处理的演变
历史回顾
Flink快览
运行首个Flink应用
小结
第2章 流处理基础
Dataflow编程概述
Datanow图
数据并行和任务并行
数据交换策略
并行流处理
延迟和吞吐
数据流上的操作
时间语义
流处理场景下一分钟的含义
处理时间
事件时间
水位线
处理时间与事件时间
状态和一致性模型
任务故障
结果保障
小结
第3章 Apache Flink架构
系统架构
搭建Flink所需组件
应用部署
任务执行
高可用性设置
Flink中的数据传输
基于信用值的流量控制
任务链接
事件时间处理
时间戳
水位线
水位线传播和事件时间
时间戳分配和水位线生成
状态管理
算子状态
键值分区状态
……
第4章 设置Apache Flink开发环境
第5章 DataStream API(1.7版本)
第6章 基于时间和窗户的算子
第7章 有状态算子和应用
第8章 读写外部系统
第9章 搭建Flink运行流式应用
第10章 Flink和流式应用运维
第11章 还有什么?