目录
第 1 章 初识 Flink 2
1.1 Flink 的源起和设计理念 2
1.2 Flink 的应用 3
1.3 流式数据处理的发展和演变 6
1.4 Flink 的特性总结 13
1.5 Flink vs Spark 15
1.6 本章总结 18
第 2 章 Flink 快速上手 18
2.1 环境准备 19
2.2 创建项目 19
2.3 编写代码 22
2.4 本章总结 29
第 3 章 Flink 部署 29
3.1 快速启动一个 Flink 集群 30
3.2 部署模式 38
3.3 独立模式(Standalone) 40
3.4 YARN 模式 43
3.5 K8S 模式 48
3.6 本章总结 48
第 4 章 Flink 运行时架构 48
4.1 系统架构 49
4.2 作业提交流程 52
4.3 一些重要概念 55
4.4 本章总结 69
第 5 章 DataStream API(基础篇) 69
5.1 执行环境(Execution Environment) 70
5.2 源算子(Source) 73
5.3 转换算子(Transformation) 83
5.4 输出算子(Sink) 108
5.5 本章总结 123
第 6 章 Flink 中的时间和窗口 123
6.1 时间语义 123
6.3 窗口(Window) 144
6.4 迟到数据的处理 181
6.5 本章总结 187
第 7 章 处理函数 187
7.1 基本处理函数(ProcessFunction) 188
7.2 按键分区处理函数(KeyedProcessFunction) 193
7.3 窗口处理函数 200
7.4 应用案例——Top N 203
7.5 侧输出流(Side Output) 214
7.6 本章总结 215
第 8 章 多流转换 215
8.1 分流 215
8.2 基本合流操作 219
8.3 基于时间的合流——双流联结(Join) 232
8.4 本章总结 243
第 9 章 状态编程 244
9.1 Flink 中的状态 244
9.2 按键分区状态(Keyed State) 248
9.3 算子状态(Operator State) 266
9.4 广播状态(Broadcast State) 273
9.5 状态持久化和状态后端 280
9.6 本章总结 283
第 10 章 容错机制 284
10.1 检查点(Checkpoint) 284
10.2 状态一致性 300
10.3 端到端精确一次(end-to-end exactly-once) 301
10.4 本章总结 310
第 11 章 Table API 和SQL 310
11.1 快速上手 311
11.2 基本API 314
11.3 流处理中的表 326
11.4 时间属性和窗口 337
11.5 聚合(Aggregation)查询 343
11.6 联结(Join)查询 354
11.7 函数 357
11.8 SQL 客户端 367
11.9 连接到外部系统 369
11.10 本章总结 379
第 12 章 Flink CEP 380
12.1 基本概念 380
12.2 快速上手 383
12.3 模式API(Pattern API) 386
12.4 模式的检测处理 399
12.5 CEP 的状态机实现 410
12.6 本章总结 415
下载地址
本文转载自,原文链接:。