bajiebajie2333编辑
-
5个关键问题让单元测试的价值最大化
阿里妹导读 本文讨论的单元测试策略来自于实践中遇到的真实问题,作者总结出了5个关键策略问题并给出了解决之道。 一、背景 关于“什么是单元测试”、“为什么要做单元测试”、“怎么做单元…
-
流批一体的近实时数仓的思考与设计
摘要:基于对数据时间旅行的思考,引出了对目前三种数仓形态和两种数仓架构的思考。结合数据湖在 Flink 的应用和数据湖元数据类型的思考,探索了基于数据湖的 Flink SQL 流批…
-
Flink DataStream数据源
当前页面所描述的是 Flink 的 Data Source API 及其背后的概念和架构。 如果您对 Flink 中的 Data Source 如何工作感兴趣,或者您想实现一个新的…
-
揭秘阿里云 Flink 智能诊断利器——Flink Job Advisor
01 引言 阿里云实时计算 Flink 作为一款专业级别的高性能实时大数据处理系统,它在各种业务场景中都发挥了关键的作用。丰富而复杂的上下游系统让它能够支撑实时数仓、实时风控、实时…
-
B站大数据集群混部实践(上)- 资源超配篇
本期作者 陈昱康 哔哩哔哩离线平台负责人 卜凡 哔哩哔哩高级开发工程师 吴剑亮 哔哩哔哩资深开发工程师 1.背景 在过去一年的时间里,B站离线平台资源调度侧的主要挑战有两个方面: …
-
ubuntu22.04美化、办公、开发工具安装
ubuntu22.04美化、办公、开发工具安装 一、安装效果 ubuntu22.04 越来越像mac,通过美化,几乎就是mac界面,适用于有一定的Linux 系统操作经验以及爱折腾…
-
Airwallex 基于 Flink 打造实时风控系统
摘要:本文整理自 Airwallex Risk ML Platform Team 董大凡,在 Flink Forward Asia 2022 实时风控专场的分享。本篇内容主要分为五…
-
工作中如何时间管理?让《搞定》帮你搞定
阿里妹导读 忙忙碌碌一天下来工作效率大大折扣,时间都不知道花到哪里了。相信很多人都存在这个困惑,做一件事时想到另外一件事或者被其他事情打乱节奏,如果你也存在这种情况建议精读这篇文章…
-
Yarn 混合部署方案在好未来的实现
背景:Kubernetes(k8s)/ack是一个开源的容器集群管理系统。在Docker技术的基础上,为容器化的应用提供部署运行、资源调度、服务发现和动态伸缩等一系列完整功能,提高…
-
得物供应链复杂业务实时数仓建设之路
01 背景 得物供应链业务是纷繁复杂的,我们既有JIT的现货模式中间夹着这大量的仓库作业环节,又有到仓的寄售,品牌业务,有非常复杂的逆向链路。在这么复杂的业务背后,我们需要精细化关…
-
T3 出行基于 Hudi+Kyuubi 的现代技术栈探索
导读 过去的几年里,随着大数据的进一步发展,现代数据栈的生态愈加丰富完善,而数据湖在这期间几乎已成为现代数据栈的必备品,它的出现大大简化了用户管理数据的难度,让用户更加关心于数据本…
-
【Shopee】大数据存储加速与服务化在Shopee的实践
本次分享主要包括四个方面: 存储现状 存储加速 存储服务化 未来规划 存储现状 1 存储结构:目前虾皮的存储结构从上到下主要分为存储层、调度层、计算引擎层和平台管理层。 2 存储规…
-
head first java 中文版 PDF下载
简介 《HeadFirstJava》是一本完整地面向对象(object-oriented,OO)程序设计和Java的学习指导用书,根据学习理论所设计,你可以从程序语言的基础开始,到…
-
破茧成蝶 – Serverless Kubernetes 的思考与征程(二)
阿里妹导读 本文主要针对 Serverless Container 技术的特殊性,分享其对 Kubernetes 的架构影响,以及阿里云在Serverless Kubernetes…
-
没有银弹,只有取舍 – Serverless Kubernetes 的思考与征程(一)
Kubernetes作为云原生计算的基础项目,已经在开发者和企业中获得广泛的支持。然而其自身复杂性和陡峭的学习曲线依然让人望而生畏。在 CNCF 2020年度调研报告中,在Kube…
-
Presto+Alluxio 加速 Iceberg 数据湖访问
导读 本文将分享 Alluxio 社区和 Presto 社区在数据湖方面的一些工作,主要聚焦 Iceberg。 文章包括以下几个部分: 1. Presto & Alluxi…
-
Hive表迁移到Iceberg表实践教程
使用 Apache Iceberg 作为您的数据湖表格式可以实现更快的数据湖分析、时间旅行、分区演化、ACID 事务等。Apache Iceberg 是实现开放式 Lakehous…
-
Kubernetes 网络学习之 Cilium 与 eBPF
这是 Kubernetes 网络学习的第五篇笔记,也是之前计划中的最后一篇。 深入探索 Kubernetes 网络模型和网络通信 认识一下容器网络接口 CNI 源码分析:从 kub…
-
K8s为什么使用 systemd 而非 croupfs
– cgroup – cgroup 是一个 Linux 内核特性,对一组进程的资源使用(CPU、内存、磁盘 I/O 和网络等)进行限制、审计和隔离。 cg…
-
这一招将 Numpy 加速 700 倍!!!
就其自身来说,Numpy 的速度已经较 Python 有了很大的提升。当你发现 Python 代码运行较慢,尤其出现大量的 for-loops 循环时,通常可以将数据处理移入 Nu…