大数据

Flink

尘锋信息基于 Apache Paimon 的流批一体湖仓实践

摘要尘锋信息基于 Apache Paimon 构建流批一体湖仓，主要分享：整库入湖，TB 级数据近实时入湖基于 Flink + Paimon 的数仓批 ETL 建设基于 …

xiaozhch5
2023-04-28
058700
Flink

Airwallex 基于 Flink 打造实时风控系统

摘要：本文整理自 Airwallex Risk ML Platform Team 董大凡，在 Flink Forward Asia 2022 实时风控专场的分享。本篇内容主要分为五…

bajiebajie2333
2023-04-18
013200
后端

GraalVM基本介绍

GraalVM 是一种高性能 JDK，旨在加速用 Java 和其他 JVM 语言编写的应用程序的执行，同时还为 JavaScript、Python 和许多其他流行语言提供运行时。 …

xiaozhch5
2023-04-05
041800
Alluxio

Alluxio性能调优

本文档介绍了各种调优 Alluxio 性能的技巧和配置。常见性能问题以下是在调整性能时用于解决常见问题的清单：所有节点都在工作吗？检查 Alluxio 集群是否健康。您可…

xiaozhch5
2023-04-02
041600
Alluxio

Alluxio监控系统

指标提供了对集群中正在发生的事情的洞察力。它们是用于监视和调试的宝贵资源。 Alluxio 有一个基于 Coda Hale 指标库的可配置指标系统。在度量系统中，源生成度量，汇…

xiaozhch5
2023-04-02
026200
后端

Presto 在字节跳动的实践

导读本文主要内容包括： 1. 云平台上统一 UDF 的实现 2. 字节内部平台的实现 3. 贡献到开源社区的相关内容 4. 未来工作分享嘉宾｜张砚炳字节跳动软件开发工程师 …

jellyfin
2023-03-23
026700
Flink

Flink 在中泰证券的实践与应用

摘要：本文整理自中泰证券大数据中心实时计算平台架构师连序全，在 Flink Forward Asia 2022 行业案例专场的分享。本篇内容主要分为四个部分：平台发展历程架构&…

jellyfin
2023-03-20
015100
后端

哔哩哔哩大数据平台建设之路—数据安全篇

本期作者李昌海哔哩哔哩资深开发工程师韩志华大数据平台工具负责人 1.序言 Berserker是B站一站式数据开发及治理平台，基于常用大数据生态组件构建，满足公司内数据查询、…

jellyfin
2023-03-12
022300
Flink

基于 Flink 流计算实现的股票交易实时资产应用

01 背景本次赛题思路源自于真实工作场景的一个线上项目，该项目在经过一系列优化后已稳定上线，在该项目开发的过程中数据平台组和技术负责人提供了许多资源和指导意见，而项目的结果也让…

xiaozhch5
2023-03-10
218900
Pulsar

详解 Apache Pulsar 消息生命周期

文章摘要本文整理自 Pulsar Summit Asia 2022 腾讯云高级研发工程师冉小龙的演讲《Deep Dive into Apache Pulsar Lifecycle…

xiaozhch5
2023-03-10
030610
Flink

Apache Flink 1.16 功能解读

摘要：本文整理自阿里云高级开发工程师 Apache Flink Committer、Flink 1.16 Release Manager 黄兴勃（断尘），在 FFA 2022 核心…

xiaozhch5
2023-03-08
026400
后端

Yarn 混合部署方案在好未来的实现

背景：Kubernetes(k8s)/ack是一个开源的容器集群管理系统。在Docker技术的基础上，为容器化的应用提供部署运行、资源调度、服务发现和动态伸缩等一系列完整功能，提高…

bajiebajie2333
2023-03-06
034100
后端

得物供应链复杂业务实时数仓建设之路

01 背景得物供应链业务是纷繁复杂的，我们既有JIT的现货模式中间夹着这大量的仓库作业环节，又有到仓的寄售，品牌业务，有非常复杂的逆向链路。在这么复杂的业务背后，我们需要精细化关…

bajiebajie2333
2023-03-06
019600
Hudi

T3 出行基于 Hudi+Kyuubi 的现代技术栈探索

导读过去的几年里，随着大数据的进一步发展，现代数据栈的生态愈加丰富完善，而数据湖在这期间几乎已成为现代数据栈的必备品，它的出现大大简化了用户管理数据的难度，让用户更加关心于数据本…

bajiebajie2333
2023-03-03
037600
Hudi

apache hudi 0.13.0版本重磅发布

Apache Hudi 0.13.0引入了一系列新特性，包括Metaserver, Change Data Capture, new Record Merge API, new s…

xiaozhch5
2023-03-02
036500
Flink

集度汽车 Flink on native k8s 的应用与实践

摘要：本文整理自集度汽车数据部门实时方向负责人、 Apache Flink Contributor 周磊&集度汽车数据开发专家顾云，在 FFA 2022 行业案例专场的分享…

jellyfin
2023-03-01
028700
Alluxio

【Shopee】大数据存储加速与服务化在Shopee的实践

本次分享主要包括四个方面：存储现状存储加速存储服务化未来规划存储现状 1 存储结构：目前虾皮的存储结构从上到下主要分为存储层、调度层、计算引擎层和平台管理层。 2 存储规…

bajiebajie2333
2023-03-01
021400
Iceberg

Presto+Alluxio 加速 Iceberg 数据湖访问

导读本文将分享 Alluxio 社区和 Presto 社区在数据湖方面的一些工作，主要聚焦 Iceberg。文章包括以下几个部分： 1. Presto & Alluxi…

bajiebajie2333
2023-02-26
033800
Iceberg

Hive表迁移到Iceberg表实践教程

使用 Apache Iceberg 作为您的数据湖表格式可以实现更快的数据湖分析、时间旅行、分区演化、ACID 事务等。Apache Iceberg 是实现开放式 Lakehous…

bajiebajie2333
2023-02-25
042500
Flink

Apache Flink 实时计算在美的多业务场景下的应用与实践

摘要：本文整理自美的集团实时数据负责人、资深数据架构师董奇，在 Flink Forward Asia 2022 主会场的分享。本篇内容主要分为四个部分：实时生态系统在美的的发展和…

xiaozhch5
2023-02-20
028100