后端归档 - 第19页共39页 - 从大数据到人工智能

Alluxio

刘嘉承：从设计、实现和优化角度浅谈Alluxio元数据同步

分享嘉宾：刘嘉承 Alluxio 核心组研发工程师编辑整理：曾新宇对外经贸大学出品平台：DataFunTalk 导读：今天分享的题目是Alluxio元数据和数据的同步，从设计…

xiaozhch5

2022-06-26

063610

人工智能

强化学习在黄页商家智能聊天助手中的探索实践

00 导读本地服务（黄页）微聊代运营模式是指人工客服代替58平台上的商家与C端用户IM沟通聊天以获取商机（如用户联系方式、细粒度需求信息等），再将商机转交给商家，促进商家成单。我…

bajiebajie2333

2022-06-26

052200

后端

网易严选离线数仓质量建设实践

做数仓最重要的是什么？一是模型易用性，二是数据质量。模型易用性我们可以通过建模规范、指标管理等方式去实现。而对于数据质量呢？本篇将以严选数仓为例，从建设目标、保障措施、效果评价等几…

bajiebajie2333

2022-06-26

031400

Flink

Flink CDC + Hudi 海量数据入湖在顺丰的实践

摘要：本文整理自顺丰大数据研发工程师覃立辉在 5月 21 日 Flink CDC Meetup 的演讲。主要内容包括：顺丰数据集成背景 Flink CDC 实践问题与优化未来规…

maolv, xiao

2022-06-26

034200

Flink

Flink CDC + OceanBase 全增量一体化数据集成方案

摘要：本文整理自 OceanBase 技术专家王赫（川粉）在 5 月 21 日 Flink CDC Meetup 的演讲。主要内容包括： OceanBase 介绍 Flink CD…

maolv, xiao

2022-06-26

049300

Flink

Flink ML API，为实时机器学习设计的算法接口与迭代引擎

▼ 关注「Apache Flink」，获取更多技术干货 ▼ 摘要：本文整理自阿里巴巴高级技术专家林东、阿里巴巴技术专家高赟（云骞）在 Flink Forward Asia 2021…

bajiebajie2333

2022-06-24

021900

Flink

美团基于 Flink 的实时数仓平台建设新进展

▼ 关注「Apache Flink」，获取更多技术干货 ▼ 摘要：本文整理自美团实时数仓平台负责人姚冬阳在 Flink Forward Asia 2021 实时数仓专场的演讲。主要…

maolv, xiao

2022-06-24

032800

Flink

钱大妈基于 Flink 的实时风控实践

▼ 关注「Apache Flink」，获取更多技术干货 ▼ 摘要：本文作者彭明德，介绍了钱大妈与阿里云 Flink 实时计算团队共建实时风控规则引擎，精确识别羊毛党以防营销预算流失…

maolv, xiao

2022-06-24

040010

Flink

快手实时数仓保障体系研发实践

▼ 关注「Apache Flink」，获取更多技术干货 ▼ 摘要：本文整理自快手实时计算数据团队技术专家李天朔在 Flink Forward Asia 2021 实时数仓专场的演讲…

maolv, xiao

2022-06-24

035900

Flink 源码：广播流状态源码解析

Broadcast State 是 Operator State 的一种特殊类型。它的引入是为了支持这样的场景: 一个流的记录需要广播到所有下游任务，在这些用例中，它们用于在所有子任务中维护相同的状态。然后可以在处理第二个流的数据时访问这个广播状态，广播状态有自己的一些特性。

JasonLee实时计算

2022-06-24 • Flink

021510

Flink

Flink SQL Client远程调试指南

在使用Flink SQL过程中，SQL Client想必大家都是非常熟悉的，本文介绍基于IDEA的SQL Client远程调试方法。前提：本文使用的Flink版本为1.14.4，…

xiaozhch5

2022-06-23

01.6K00

Flink ＋ Prometheus ＋ Grafana 实时监控最佳实践

我们都知道 Flink 任务是一个 7*24 小时不停运行的任务,所以对于任务的实时监控就显得尤为重要,因为任务运行的状态对于我们来说是一个黑盒,比如任务是否挂掉,是否存在反压,使用的内存,CPU 等情况我们是不知道的,虽然 Flink 的 UI 上面可以添加相关的 metrics 来查看,但是需要手动的一个一个添加,还是比较麻烦的,特别是在任务非常多的情况下.所以就需要有一种统一的监控方案来解决这个问题.Flink 本身提供了非常丰富的 Metric Reporters,比如 JMX InfluxDB Graphite Prometheus 等等,生产环境上用的比较多的是 InfluxDB 和 Prometheus ,我这里选择的是 Prometheus 来上报 Flink 的 metrics 然后通过 Grafana 进行展示.

JasonLee实时计算

2022-06-23 • Flink

072700