《面试1v1》Kafka的幂等性

原创

JavaPub 2023-08-01 22:22:20 博主文章分类：《面试1v1》 ©著作权

文章标签 幂等性序列号发送消息 文章分类 Java 后端开发 yyds干货盘点

©著作权归作者所有：来自51CTO博客作者JavaPub的原创作品，请联系作者获取转载授权，否则将追究法律责任

我是 javapub，一名 Markdown 程序员从👨‍💻，八股文种子选手。

面试官：嗨，小明！听说你对Kafka的幂等性很感兴趣，是吗？

候选人： 是的，我一直听说Kafka的幂等性很重要，但是具体是什么意思呢？

面试官：哈哈，别担心，我来给你解释一下。幂等性其实就是指无论执行多少次相同的操作，结果都是一样的。在Kafka中，幂等性保证了消息的处理不会因为重复发送而产生副作用。

候选人： 哦，明白了！那Kafka是怎么实现幂等性的呢？

面试官：很好的问题！Kafka通过消息的唯一标识（通常是消息的key）来实现幂等性。在发送消息之前，Kafka会检查消息的key是否已经存在于特定的主题分区中。如果存在，Kafka就会认为这是一条重复的消息，并且不会将其写入分区。

候选人： 那如果我想要发送相同的消息，但是又希望它们被写入分区怎么办呢？

面试官：好问题！为了解决这个问题，Kafka引入了幂等性序列号（Idempotent Sequence Number）。每个生产者都会生成一个唯一的序列号，并将其附加到消息中。Kafka会使用这个序列号来判断消息的唯一性，而不是仅仅依赖于消息的key。这样，即使发送相同的消息，只要序列号不同，Kafka仍然会将其写入分区。

候选人： 哇，这个设计真巧妙！那Kafka是如何保证幂等性的呢？

面试官：很好奇心！Kafka使用了一种叫做"幂等性写入"的机制。当生产者发送消息时，Kafka会为每个分区维护一个递增的序列号。在写入消息之前，Kafka会检查消息的序列号是否大于分区中最后一条消息的序列号。如果是，Kafka会将消息写入分区，并更新序列号；如果不是，Kafka会认为这是一条重复的消息，并且不会写入分区。

候选人： 哇，这样一来，就能保证消息不会被重复写入了！Kafka真是个聪明的家伙！

面试官：是的，Kafka的设计确实很巧妙。通过幂等性的机制，Kafka能够保证消息的可靠性和一致性，让我们在处理大规模数据流时更加放心。

候选人： 面试官，谢谢你的解答！我对Kafka的幂等性有了更深入的理解。

面试官：不客气，小明！如果你还有其他关于Kafka或者其他技术的问题，随时都可以问我。记得在学习和工作中保持好奇心，不断探索新的知识和技术！