Kafka
-
基于kcat将TPC-DS数据快速导入kafka集群
在大数据领域,TPC-DS是一个常用的基准测试框架。基准测试结果测量单用户模式下的查询响应时间、多用户模式下的查询吞吐量以及给定硬件、操作系统和数据处理系统配置在受控、复杂、多用户…
-
如何更好地使用Kafka?
点个关注?跟腾讯工程师学技术 引言| 要确保Kafka在使用过程中的稳定性,需要从kafka在业务中的使用周期进行依次保障。主要可以分为:事先预防(通过规范的使用、开发,预防问题产…
-
Kafka基础与核心概念
本文,我们将试图回答什么是apache kafka。 kafka是一个分布式流平台或者分布式消息提交日志 分布式 Kafka 由一个或多个节点组成的工作集群,这些节点可以位于不同的…
-
Kafka在美团数据平台的实践
总第526篇 2022年 第043篇 Kafka在美团数据平台承担着统一的数据缓存和分发的角色,随着数据量的增长,集群规模的扩大,Kafka面临的挑战也愈发严峻。本文分享了美团Ka…
-
消息中间件—简谈Kafka中的NIO网络通信模型
文章摘要:很多人喜欢把RocketMQ与Kafka做对比,其实这两款消息队列的网络通信层还是比较相似的,本文就为大家简要地介绍下Kafka的NIO网络通信模型 前面写的两篇Rock…
-
Kafka 负载均衡在 vivo 的落地实践
vivo 互联网服务器团队-You Shuo 副本迁移是Kafka最高频的操作,对于一个拥有几十万个副本的集群,通过人工去完成副本迁移是一件很困难的事情。Cruise Contro…
-
基于 Kafka 的实时数仓在搜索的实践应用
作者:vivo互联网服务器团队-Deng jie 一、概述 Apache Kafka 发展至今,已经是一个很成熟的消息队列组件了,也是大数据生态圈中不可或缺的一员。Apache K…
-
Kafka 万亿级消息实践之资源组流量掉零故障排查分析
作者:vivo 互联网服务器团队-Luo Mingbo 一、Kafka 集群部署架构 为了让读者能与小编在后续的问题分析中有更好的共鸣,小编先与各位读者朋友对齐一下我们 Kafka…
-
Presto on Apache Kafka 在 Uber的应用
本文翻译自Uber技术文章《Presto® on Apache Kafka® At Uber Scale》 Uber的目标是通过让世界运转来激发机遇,而大数据是其中非常重要的一部分…
-
基于SSD的Kafka应用层缓存架构设计与实现
Kafka在美团数据平台承担着统一的数据缓存和分发的角色,针对因PageCache互相污染,进而引发PageCache竞争导致实时作业被延迟作业影响的痛点,美团基于SSD自研了Ka…
-
深入理解Kafka:核心设计与实践原理 PDF下载
内容简介 Kafka 起初是由Linkedin 公司采用Scala 语言开发的一个多分区、多副本且基于ZooKeeper协调的分布式消息系统,现己被捐献给Apache 基金会。目前…
-
重磅!Apache Kafka 3.1.0正式发布!
3.1.0 版本包含许多改进和新功能。我们将在这篇博文中重点介绍一些更突出的功能,但请参阅发行说明以获取完整的更改列表。 虽然仍然不建议将 KRaft 用于生产(已知差距),但我们…
-
一文读懂Kafka Connect核心概念
概览 Kafka Connect 是一种用于在 Apache Kafka 和其他系统之间可扩展且可靠地流式传输数据的工具。 它使快速定义将大量数据移入和移出 Kafka 的连接器变…
-
基于Flink1.13.3与hudi 0.10.0-release构建准实时数仓
本文基于Flink SQL与hudi构建准实时数仓,在Flink从kafka接入数据之后,即将所有数据存于hudi中,包括所有中间处理数据以及最终数据。文章《实时数仓|基于Flin…
-
kafka log4j日志级别修改,一天生成一个日志文件
kafka的log4j日志默认配置中,有如下配置: log4j.appender.kafkaAppender=org.apache.log4j.DailyRollingFileAp…
-
kafka中的Sticky分区方法
消息在系统中传输所需的时间对 Apache Kafka® 等分布式系统的性能起着重要作用。 在 Kafka 中,生产者的延迟通常定义为客户端生成的消息被 Kafka 确认所需的时间…
-
kafka消息传递语义
现在我们对生产者和消费者的工作方式有了一些了解,让我们来讨论 Kafka 在生产者和消费者之间提供的语义保证。 显然,可以提供多种可能的消息传递保证: 最多一次——消息可能会丢失,…
-
kafka架构之Producer、Consumer详解
Producer 负载均衡 生产者将数据直接发送到作为分区领导者的broker,而没有任何干预路由层。 为了帮助生产者做到这一点,所有 Kafka 节点都可以在任何给定时间回答有关…
-
kafka集群硬件与操作系统部署建议
内存估算 您需要足够的内存来缓冲活动的读取器和写入器。 您可以通过假设您希望能够缓冲 30 秒并将您的内存需求计算为 write_throughput*30 来对内存需求进行粗略估…
-
kafka集群管理指南
本指南使用的工具为kafka/bin目录下相关脚本。 添加/删除topics 可以使用如下命令进行新增topics: > bin/kafka-topics.sh –boot…