Flink
-
Flink技术内部之Task生命周期
Task 是 Flink 的基本执行单元。算子的每个并行实例都在 task 里执行。例如,一个并行度为 5 的算子,它的每个实例都由一个单独的 task 来执行。 StreamTa…
-
Flink技术内幕之作业调度
这篇文档简要描述了 Flink 怎样调度作业, 怎样在 JobManager 里描述和追踪作业状态 原文链接:https://nightlies.apache.org/flink/…
-
自适应批作业调度器:为 Flink 批作业自动推导并行度
对大部分用户来说,为 Flink 算子配置合适的并行度并不是一件容易的事。对于批作业,小的并行度会导致作业运行时间长,故障恢复慢,而不必要的大并行度会导致资源浪费,任务部署和数据 …
-
B站基于AIFlow+Flink在批流融合调度上的实践
本期作者 张杨&王丁 bilibili资深开发工程师 负责B站实时团队flink引擎sql方向工作,专注于flinksql性能提升优化。同时也关注flink引擎在机器学习、…
-
Streaming Data Warehouse 存储:需求与架构
作者|Jingsong Lee jingsonglee0@gmail.com 一、数仓中的计算 在计算机领域,数据仓库(DW 或 DWH),是一个用于报告和数据分析的系统,被认为是…
-
StarRocks × Apache Flink:如何构建简单强大的实时数仓架构
实时数据分析正在成为企业数字化经营的核心,如何有效构建实时数据分析系统是每个企业都在面临的挑战。 当前在构建实时数仓时,由于数据源的多样性,需要使用不同的采集工具,如 Flume、…
-
Flink 1.15 新功能架构解析:高效稳定的通用增量 Checkpoint
作者|梅源(Yuan Mei)& Roman Khachatryan 流处理系统最重要的特性是端到端的延迟,端到端延迟是指开始处理输入数据到输出该数据产生的结果所需的时间…
-
低代码实时数仓构建系统的设计与实践
1 导读 本文介绍58信安基于Flink实现低代码实时数仓构建系统,我们将数仓构建这一过程进行抽象,通过工程化的思想去解决,将固有领域问题交给系统,让开发人员关注数据本身,解放人力…
-
有赞 Flink 实时任务资源优化探索与实践
背景 随着 Flink k8s 化以及实时集群迁移完成,有赞越来越多的 Flink 实时任务运行在 K8s 集群上,Flink k8s 化提升了实时集群在大促时弹性扩缩容能力,更好…
-
Native Flink on Kubernetes 在小红书的实践
摘要:本文整理自小红书数据流团队资深研发工程师何军在 Flink Forward Asia 2021 平台建设专场的演讲,介绍了小红书基于 K8s 管理 Flink 任务的建设过程…
-
官宣|Apache Flink 1.15 发布公告
作者 | Joe Moser & 高赟 翻译 | 高赟 Apache Flink,作为 Apache 社区最活跃的项目之一[1],一直秉承积极开放的态度不断进行技术深耕。在…
-
Flink CDC Meetup · Online,5.21 开讲!
当下数据规模正在以惊人的速度增长,越来越多的应用场景也对数据处理的时效性有了更高的要求。随着近几年实时计算技术的迅猛发展,涌现了实时 OLAP、实时数据湖、实时数仓等架构,较好地解…
-
基于 Flink 的实时计算平台在新能源充电行业实践
本文介绍了特来电基于 Flink 的实时计算平台的实践。
-
剑指大数据——Flink学习精要(Java版)(最终修订版)PDF下载
Flink是 Apache基金会旗下的一个开源大数据处理框架。目前, Flink已经成为各大公司大数据实时处理的发力重点,特别是国内以阿里为代表的一众互联网大厂都在全力投入,为Fl…
-
Flink Sql Gateway的原理与实践
背景 我们在使用Flink开发实时任务时,都会用到框架本身提供的DataStream API,这使得用户不能不用Java或者Scala甚至Python来编写业务逻辑;这种方式虽然灵…
-
【视频】T3 出行 Apache Kyuubi Flink SQL Engine 设计和相关实践
在日前的 Apache SeaTunnel & Kyuubi 联合 Meetup 上,T3出行大数据平台负责人、 Apache Kyuubi committer 杨华和T3…
-
Flink内存配置调优指南
Flink内存模型(TaskManager) 从上面的内存模型图可以看出内存结构: Flink使用了JVM Heap(堆内内存)和Off-Heap Memory(堆外内存); JV…
-
Flink学习精要(Java版)电子书下载
目录 第 1 章 初识 Flink 21.1 Flink 的源起和设计理念 21.2 Flink 的应用 31.3 流式数据处理的发展和演变 61.4 Flink 的特性总结 13…
-
字节跳动流式数据集成基于Flink Checkpoint两阶段提交的实践和优化(2)
目前字节跳动中国区 MQ dump 例行任务数巨大,日均处理流量在 PB 量级。巨大的任务量和数据量对 MQ dump 的稳定性以及准确性带来了极大的挑战。 本文主要介绍 DTS …
-
字节跳动流式数据集成基于Flink Checkpoint两阶段提交的实践和优化(1)
目前字节跳动中国区 MQ dump 例行任务数巨大,日均处理流量在 PB 量级。巨大的任务量和数据量对 MQ dump 的稳定性以及准确性带来了极大的挑战。 本文主要介绍 DTS …