1.什么是kafka? Kafka是一个分布式的基于发布/订阅模式的消息队列(Message Queue),主要应用于大数据实时处理领域。 2.消息队列2.1 使用消息队列的好处 1)解耦允许你独立的扩展或修改两边的处理过程,只要确保它们遵守同样的接口约束。 2)可恢复性系统的一部
转载
2024-03-26 21:22:05
45阅读
文章目录9.1 消息中间件MQ9.2 Kafka 是什么9.3 Kafka 架构9.4 为什么一个 Topic 要分成多个 Partition9.5 Kafka 如何处理旧数据9.5 副本同步9.6 Kafka 容灾9.7 Zookeeper 在 Kafka 中的作用 9.1 消息中间件MQ什么是消息中间件:消息中间件关注数据的发送和接收,主要解决的是分布式系统之间的消息传递问题。通过提供 消息
转载
2024-08-07 08:34:57
63阅读
1-Kafka定义&作用Kafka 是一种高吞吐量的分布式发布订阅消息系统,用于数据的缓冲。具有高吞吐、可持久化、可水平扩展、支持流数据处理等多种特性。作用一:消息系统。具备冗余存储、缓冲、异步通信、扩展性、可恢复性等功能。作用二:存储系统:Kafka有消息持久化和多副本机制。将消息持久化到磁盘,可以把它作为长期的数据存储系统来使用作用三:流式处理平台。Kafka 可以和流式处理框架进行集
转载
2024-03-29 11:19:51
185阅读
kafka是一个分布式消息队列。具有高性能、持久化、多副本备份、横向扩展能力。生产者往队列里写消息,消费者从队列里取消息进行业务逻辑。一般在架构设计中起到解耦、削峰、异步处理的作用。kafka对外使用topic的概念,生产者往topic里写消息,消费者从读消息。为了做到水平扩展,一个topic实际是由多个partition组成的,遇到瓶颈时,可以通过增加partition的数量来进行横向扩容。单个
转载
2024-02-26 13:30:55
192阅读
kafka源码对 java 和 gradle 版本有适配要求,否则导入源码会编译不通过,笔者引用各版本如下。Kafka源码3.0java版本11grade版本7.4.1图解KafkaProducer流程源代码分析上图对 kafka 生产者初始化的整体流程进行了简单的梳理,接下来我们从代码层面对整体流程进行一个复原。源码导入idea后都会看到一个example工程包,这个包里面有生产者和消费者的例子
转载
2024-04-21 18:26:23
33阅读
目录1.Mysql2.CHAR 与 VARCHAR 的区别?3.能说下myisam 和 innodb的区别吗?4.你能说下事务的基本特性和隔离级别吗?5.并发问题 – 脏读、不可重复读、幻读?6.事务的隔离级别?7.说说自增主键、UUID?8.mysql 的约束分类?9.drop、delete 与 truncate 的区别:10.隐式事务、显式事务?11.存储过程12.你们数据量级多大?分库分表怎
转载
2024-05-15 10:08:02
50阅读
大规模使用 Apache Kafka 的20个最佳实践快速了解Kafka的概念与架构Kafka是一种高效的分布式消息系统。在性能上,它具有内置的数据冗余度与弹性,也具有高吞吐能力和可扩展性。在功能是,它支持自动化的数据保存限制,能够以“流”的方式为应用提供数据转换,以及按照“键-值(key-value)”的建模关系“压缩”数据流。要了解各种最佳实践,您需要首先熟悉如下关键术语:• Message(
转载
2024-03-29 07:05:05
255阅读
1.kafka的主题会分为多个区,生产者发送到kafka的同一主题的消息会分散到多个区,这其中有几个策略 实现的原理也很简单List<PartitionInfo> partitions = cluster.partitionsForTopic(topic);
return Math.abs(key.hashCode()) % partitions.size();简单来说是通过has
转载
2024-03-27 09:38:23
30阅读
通过上一课时的介绍我们了解到,业务线程使用 KafkaProducer.send() 方法发送 message 的时候,会先将其写入RecordAccumulator 中进行缓冲,当 RecordAccumulator 中缓存的 message 达到一定阈值的时候,会由 IO 线程批量形成请求,发送到 kafka 集群。本课时我们就重点来看一下 RecordAccumulator 这个缓冲区的结构
转载
2024-07-18 07:43:53
37阅读
Kafka 端到端源码解析 Kafka的场景Kafka概念Topic 创建与删除 Topic状态流转一些问题Topic分区初始化选择kafka producer解析 1. 发送流程2. 分区选择策略?3. 拦截器有什么作用?4. 关键数据结构5. 参数配置6. ACK机制7.一些问题Kafka网络接收层 Kafka channel如何做限流的Kaf
转载
2024-04-18 17:00:54
202阅读
一个消息被分区以后,消息就会被放到一个缓存里面,我们看一下里面具体的细节。默认缓存块的大小是 32M,这个缓存块里面有一个重要的数据结构:batches,这个数据结构是 key-value 的结果,key 就是消息主题的分区,value 是一个队列,里面存的是发送到对应分区的批次,Sender 线程就是把这些批次发送到服务端01 生产者高级设计之自定义数据结构生产者把批次信息用 batches 这
转载
2024-04-02 09:25:11
87阅读
kafka producer发送消息的时候,可以指定key,这个key的作用是为消息选择存储分区,key可以为空,当指定key且不为空的时候,kafka是根据key的hash值与分区数取模来决定数据存储到那个分区,那么当key为null的时候,kafka又是如何存储的呢?可能很多人都会说随机选择一个分区进行存储,但是具体是怎么实现的呢?虽然可以这么说,但是还不够严谨,下面通过kafka的源码来解读
转载
2024-02-27 21:14:50
206阅读
Kafka可以作为消息中间件,在企业应用很广泛。当前的企业应用的子系统是非常多的,一个应用,可能就包含了MySQL, Redis, WebApp, DB…,多个子系统,而不同系统之间的API是有差异的,Kafka就是作为中心,负责与每个子系统的对接。关键术语消息(message) 消息是Kafka的数据单元,是键值对(key value)构成,key作为元数据,是可选的,一般用来划分消息所在的分区
转载
2024-03-22 10:24:41
99阅读
Kafka如何保证全局有序? 可回答:1)Kafka消费者怎么保证有序性?2)Kafka生产者写入数据怎么保证有序?3)Kafka可以保证 数据的局部有序,如何保证数据的全局有序?4)Kafka消息的有序性 问过的一些公司:快手x3,360x2,安恒信息,京东,京东(2021.07),重庆富民银行(2021.09) 参考答案: 1、设置Key值,指定分区 kafka分区是存在K和V的,K就是分区,
转载
2024-03-15 20:16:31
191阅读
1. kafka offset 存储1.1 去zookeeper依赖比较广为人知的Kafka offset存储方式为zookeeper,在0.8版本时,默认依然是zk,但是此时其实已经出现另外一种offset存储方式了,Kafka以“consumer group + topic + partition”为组合key,记录一份消费信息,存储在默认的”__consumer_offset”的Topic中
转载
2024-08-07 08:59:11
59阅读
1 概述1.1 消息分区微观分区信息: 宏观分区信息: 如何保证消息消费的顺序性?1)同一分区内的消息是有序的;2)设置消息key,相同key的消息会发到同一个分区。1.2 生产者发送消息消息没有Key——轮询;消息有Key——根据key选择分区。 1.3 消费模型推拉(push/poll)模型,kafka选择了拉,由消费者主动获取消息 并记录消费进度。 老
转载
2024-03-20 19:34:28
906阅读
Kafka使用Replica对象表示一个分区的副本:
class Replica(val brokerId: Int,//副本所在的brokerID
val partition: Partition,//副本对应的分区
time: Time = SystemTime,
转载
2024-04-07 00:03:15
60阅读
本文主要讲解 Kafka 是什么、Kafka 的架构包括工作流程和存储机制,以及生产者和消费者。 最终大家会掌握 Kafka 中最重要的概念,分别是 Broker、Producer、Consumer、Consumer Group、Topic、Partition、Replica、Leader、Follower,这是学会和理解 Kafka 的基础和必备内容。定义Kafka 是一个分布式的基于发布/
转载
2024-08-06 21:16:46
62阅读
一. Kafka 基础概念KafkaKafka 已被多家不同类型的公司作为多种类型的数据管道和消息系统使用。行为流数据是几乎所有站点在对其网站使用情况做报表时都要用到的数据中最常规的部分。 包括页面访问量 PV、页面曝光 Expose、页面点击 Click 等行为事件; 实时计算中的 Kafka Source,Dataflow Pipeline; 业务的消息系统,通过
转载
2024-09-14 15:46:35
57阅读
目录一、基本术语二、Kafka 基本命令三、易混淆概念四、Kafka的特性五、Kafka的使用场景六、Kakfa 的设计思想七、Kafka 配置文件设置八、新消费者九、Kafka该怎么用十、Kafka和RabbitMQ对比十一、Zookeeper 前记前一段时间,在项目中用到消息队列,我们选择了 Kafka 作为中间件。我负责研究学习,并集成到项目中去,下面就是我在学习中记录的一些知识点