消息队列中重启是否可能导致消息丢失消息队列 exactly once

转载

mob64ca13f83523 2024-07-18 11:41:59

问题解析

问题答案

问题解析

在回答这个问题之前，先来了解一下Kafka的运行机制

当我们向某个Topic发送消息的时候，在Kafka的Broker上，会通过Partition分区的机制来实现消息的物理存储。

一个Topic可以有多个Partition，相当于把一个Topic里面的N个消息数据进行分片存储。

消费端去消费消息的时候，会从指定的Partition中去获取。

在同一个消费组中，一个消费者可以消费多个Partition中的数据。但是消费者的数量只能小于或者等于Partition分区数量。

消息队列中重启是否可能导致消息丢失消息队列 exactly once_消息队列中重启是否可能导致消息丢失

理解了Kafka的工作机制以后，再来理解一下exactly Once的意思，在MQ的消息投递的语义有三种：

1、At Most Once:消息投递至多一次，可能会丢但不会出现重复。

At Least Once:消息投递至少一次，可能会出现重复但不会丢。

Exactly Once:消息投递正好一次，不会出现重复也不会丢。

所以，要回答好这个问题，必须要从上面这两个角度去切入，下面看看这个问题的回答。

首先我先回答Kafka如何保证Exactly Once。

准确来说，目前市面上的MQ产品，基本上都没有提供Exactly Once语义的实现。我们只能通过一些其他手段来达到Exactly Once 的效果。

也就是确保生产者只发送一次，消费端只接受一次

1. 生产者可以采用事物消息的方式，事务可以支持多分区的数据完整性，原子性。并且支持跨会话的exactly once处理语义，即使producer宕机重启，依旧能保证数据只处理一次。

开启事务首先需要开启幂等性，即设置enable.idempotence为true。然后对producer消息发送做事务控制。

如果出现导致生产者重试的错误，同样的消息，仍由同样的生产者发送多次，这个消息只被写到Kafka broker的日志中一次

2. 虽然生产者能保证在Kafka broker上只记录唯一一条消息，但是由于网络延迟的存在，有可能会导致Broker在投递消息给消费者的时候，触发重试导致投递多次。所以消费端，可以采用幂等性的机制来避免重试带来的重复消费问题。

其次，关于实现顺序消费问题。

在Kafka里面，每个Partition分区的消息本身就是按照顺序存储的。

所以只需要针对Topic设置一个Partition，这样就保证了所有消息都写入到这一个Partition中。

而消费者这边只需要消费这个分区，就可以实现消息的顺序消费处理。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯