大数据
-
携程 Spark 多租户查询服务演进,Apache Kyuubi 未来可期
作者 陈少云 携程大数据平台开发专家,负责大数据离线平台的开发和维护工作,关注大数据领域生态建设 Apache Kyuubi (Incubating) Committer “ 当我…
-
姜伟华:阿里建设一站式实时数仓的经验分享
分享嘉宾:姜伟华博士 阿里巴巴 资深技术专家 编辑整理:Rissy 易显智能科技 出品平台:DataFunTalk 导读:大数据计算正从规模化走向实时化,实时大数据建设过程中开始面…
-
FLIP-147:支持包含结束任务的 Checkpoint 操作与作业结束流程修正
第一部分 01 简介 Flink 可以同时支持有限数据集和无限数据集的分布式处理。在最近几个版本中,Flink 逐步实现了流批一体的 DataStream API 与 Table …
-
深度解读 RocketMQ 存储机制
RocketMQ 实现了灵活的多分区和多副本机制,有效的避免了集群内单点故障对于整体服务可用性的影响。存储机制和高可用策略是 RocketMQ 稳定性的核心,社区上关于 Rocke…
-
代码注释的艺术,优秀代码真的不需要注释吗?
01 前言 Aliware 前天回家路上,有辆车强行插到前面的空位,司机大哥暴躁地拍着方向盘吐槽道“加塞最可恶了”,我问“还有更可恶的吗”,司机大哥淡定说道“不让自己加塞的”。似乎…
-
Flink on Zeppelin 作业管理系统实践
1. 业务背景介绍 在数仓ETL、实时计算的场景下,我们基于Flink SQL批流一体的框架进行了一定规模的作业迁移。在研发作业管理系统中,我们引入Apache Zeppelin组…
-
RocketMQ 5.0: 存储计算分离新思路
Apache RocketMQ 自 2012 年开源以来,因其架构简单,业务功能丰富,具备极强的可扩展性等特点被广泛采用。RocketMQ 在阿里巴巴集团内部有着数千台的集群规模,…
-
一种跳板机的实现思路
vivo 互联网运维团队- Yang Lei 本文介绍了一种跳板机实现思路,阐述了基本原理,并讲解了特点和相对优势。 一、 跳板机思路简介 本文所描述的跳板机(下文称为“jmp”…
-
成本节省 50%,10 人团队使用函数计算开发 wolai 在线文档应用
我们的日常工作场景几乎离不开“云文档”。目前,人们对于文档的需求再不仅仅是简单的记录,而扩展到办公协同、信息组织、知识分享等。在国内众多在线文档中,wolai 因为功能新、迭代快、…
-
一文彻悟容器网络通信
01 背景 Aliware 01 容器网络为何出现 在一个汽车发动机的生产车间中,汽车发动机的各个组件会存在一定的顺序进行组装,这就要求有直接关系的组件必须知道下一个组件的具体位置…
-
Dubbo3 落地实践及 Mesh 解决方案
4 月 15 日-16 日,由 InfoQ 主办的 DIVE 全球基础软件创新大会通过云上展厅的形式成功召开。在微服务 & 服务治理专场,Apache Dubbo PMC、…
-
理想汽车大规模 Apache RocketMQ 集群部署最佳实践
作者:孙航达,理想汽车智能云部中间件开发工程师,目前主要负责 Apache RocketMQ、ShardingSphere Proxy、全量数据迁移中间件的开发和运维工作。 0…
-
张镎:亚马逊云科技无服务器技术赋能大数据分析
分享嘉宾:张镎 亚马逊云科技 编辑整理:xiaomei zdph 出品平台:DataFunTalk 导读:本次演讲的主题是无服务技术赋能大数据分析。亚马逊云科技从2006年开始投入…
-
Flink内存配置指南
配置Flink进程的内存 Apache Flink 基于 JVM 的高效处理能力,依赖于其对各组件内存用量的细致掌控。 考虑到用户在 Flink 上运行的应用的多样性,尽管社区已经…
-
Flink应用部署模式
Flink 是一个多功能框架,以混合搭配的方式支持许多不同的部署场景。 下面,我们简要介绍 Flink 集群的构建块、它们的用途和可用的实现。 如果你只是想在本地启动 Flink,…
-
基于 Flink+Iceberg 构建企业级实时数据湖
Apache Flink 是大数据领域非常流行的流批统一的计算引擎,数据湖是顺应云时代发展潮流的新型技术架构。那么当 Apache Flink 遇见数据湖时,会碰撞出什么样的火花呢…
-
Flink的重启策略
Flink的重启策略 Flink支持不同的重启策略,这些重启策略控制着job失败后如何重启。集群可以通过默认的重启策略来重启,这个默认的重启策略通常在未指定重启策略的情况下使用,而…
-
Flink Table API和SQL(下)
一、函数 在 SQL 中,我们可以把一些数据的转换操作包装起来,嵌入到 SQL 查询中统一调用,这就是“函数”(functions)。 Flink 的Table API 和…
-
Flink Table API和SQL(中)
一、时间属性和窗口 基于时间的操作(比如时间窗口),需要定义相关的时间语义和时间数据来源的信息。在 Table API 和 SQL 中,会给表单独提供一个逻辑上的时间字段,专门…
-
Flink Table API和SQL(上)
概述 Flink 提供了对于“表”处理的支持,这就是更高层级的应用API,在 Flink 中被称为Table API 和 SQL。Table API 顾名思义,就是基于“表”(…