后端
-
Apache Flink Table Store 0.2.0 发布
作者|Jingsong Lee jingsonglee0@gmail.com Apache Flink 社区很高兴地宣布发布 Apache Flink Table Store 0….
-
如何基于 Spark 和 Z-Order 实现企业级离线数仓降本提效?
小编有话说 市场的变幻,政策的完善,技术的革新……种种因素让我们面对太多的挑战,这仍需我们不断探索、克服。 今年,网易数帆将持续推出新栏目「金融专家说」「技术专家说」「产品专家说」…
-
数据标准在模型设计和数据质量中的实践
导读: 本文将带领大家一起基于实际的应用场景进行实践,从0~1构建数据标准并在模型设计和数据质量中体现价值。 数据标准如何应用?数据标准能起到什么作用?自数据标准产品上线以来,一直…
-
面试官:如何安全地使用List
今天我们来讨论一个JUC中的集合类CopyOnWriteArrayList。 为什么研究这个类 在很多应用场景中,对于集合的读操作的频率一定会远远大于写操作。由于读操作根本不会修改…
-
京东基于时序知识图谱的问答系统
分享嘉宾:商超博士 京东硅谷研究院 研究员 编辑整理:张存旺 北航杭州创新研究院 出品平台:DataFunTalk 导读:本文将分享Temporal Knowledge Graph…
-
Flink 侧流输出源码解析
Flink 的 side output 为我们提供了侧流(分流)输出的功能,根据条件可以把一条流分为多个不同的流,之后做不同的处理逻辑,下面就来看下侧流输出相关的源码。
-
网易传媒数据管治建设实践
分享嘉宾:盖建伟 (前)网易 数据研发 编辑整理:霍玮 洛钼集团 出品平台:DataFunTalk 导读:传媒的数据管治体系,解决了资源使用负载高、不可控的痛点,搭建了数据资产登记…
-
吴喆:全民K歌直播推荐系统详解
分享嘉宾:吴喆 腾讯音乐 高级研究员 编辑整理:吴祺尧 加州大学圣地亚哥分校 出品平台:DataFunTalk 导读:推荐技术在迭代思路上已经形成一套成熟的范式,通过对经典算法的解…
-
B站离线多机房架构实践
本期作者 陈昱康 哔哩哔哩技术专家 B站离线平台负责人, 对分布式计算和存储、调度、查询引擎、在线离线混部、高并发等方面有丰富研发和实践经验。 陈诚 哔哩哔哩资深开发工程师 202…
-
强化学习在京东618大促流量调控中的落地应用
分享嘉宾:赵宇博士 京东零售 编辑整理:王妍红 出品平台:DataFunTalk 导读:大家好,我是来自京东零售搜索算法部的赵宇,今天我来给大家介绍一下我们使用强化学习在大促流量调…
-
基于 Hudi 的湖仓一体技术在 Shopee 的实践
目录1. Shopee 数据系统建设中面临的典型问题2. 为什么选择 Hudi3. Shopee 在 Hudi 落地过程中的实践4. 社区贡献5. 总结与展望 湖仓一体(LakeH…
-
Nacos 快速入门
1.预备环境准备 Nacos 依赖 Java 环境来运行。如果您是从代码开始构建并运行Nacos,还需要为此配置 Maven环境,请确保是在以下版本环境中安装使用: 64 bit …
-
Apache Iceberg在网易严选批流一体的实践
分享嘉宾:祝佳俊 网易严选 资深开发工程师 编辑整理:张晓伟 美团点评 出品平台:DataFunTalk 导读:Iceberg是数据湖解决方案中比较热门的解决方案之一,通常用于批流…
-
一面数据: Hadoop 迁移云上架构设计与实践
? 作者简介: 刘畅,一面数据运维负责人,十五年程序老兵,计算机原理、算法、编程爱好者。 李阳良,一面数据大数据部门负责人,九年互联网工作经验,对后台开发、大数据技术接触比较多。 …
-
如何使用git 生成patch 和打入patch
平时我们在使用git 管理项目的时候,会遇到这样一种情况,那就是客户使用git 生成patch 给到我们,那我们就需要把客户给到patch 打入到我们的project ,基于这样一…
-
带你玩转消息队列和相关选型!
导语 | 本文主要介绍Kafka、RabbitMQ、Pulsar、RocketMQ相关的基本原理和选型对比,希望对此方向感兴趣的读者提供一定经验和帮助。 消息队列 (一)消息队列使…
-
Apache Hudi 0.12.0版本重磅发布!
Presto-Hudi 连接器 从 PrestoDB 0.275 版本开始,用户现在可以利用原生 Hudi 连接器来查询 Hudi 表。它与 Hive 连接器中的 Hudi 支持相…
-
SQL优化的魅力!从 30248s 到 0.001s
我用的数据库是mysql5.6,下面简单的介绍下场景 课程表: create table Course( c_id int PRIMARY KEY, name varchar(…
-
有数大数据基础平台NDH之智能运维平台EasyEagle介绍:任务篇
上一篇文章中,我们介绍了EasyEagle作为一款大数据底层的智能监控诊断平台,是如何解决数据平台中的诸多痛点问题。而在本篇中,我们将从细粒度的任务维度入手,介绍EasyEagle…
-
特性大PK?Hudi vs Delta Lake vs Iceberg
简介 随着 Lakehouse 的日益普及,人们对分析和比较作为该数据架构核心的开源项目的兴趣日益浓厚:Apache Hudi、Delta Lake 和 Apache Iceber…