Kafka是什么？一起来看看吧！

转载

程序员小猿 2021-08-10 17:23:34

文章标签 kafka 消息队列数据元数据 java 文章分类 Java 后端开发

最近准备发一系列的Kafka教程，Kafka是一种高吞吐量的分布式发布订阅消息系统，它可以处理消费者在网站中的所有动作流数据。大家可以重点关注一下这个系列教程！

前言

如果有幸目睹过系统从零到一的演变过程，大家估计都会有一种感叹，就是随着业务复杂度和流量的不断上升，系统变得越来越难以维护，面对高额的维护成本，攻城师们不得不对现有架构进行改造升级，以便使得系统更适合当下业务的发展。

说到架构改造升级，那到底该怎么改造呢？从哪里入手比较合适呢？这是一个比较大的话题，一两句话没办法讲述清楚，但是有一个出发点肯定是没有错的，就是为了更好的适应业务的发展需要进行必要的改造。

假设几个场景，场景一：用户 A 刷了微博，可能对某类博主比较感兴趣，为了让用户 A 看到更多可能感兴趣的人，该怎么做呢？场景二：用户 A 修改了年龄，搜索部门为了给其推荐可能感兴趣的商品，需要实时知道用户修改年龄的动作，采用何种方式来降低用户部门和搜索部门的耦合程度呢？场景三：京东 618 当天，大佬们想要看到实时成交总额，但又不能影响业务正常运行，又该怎么做呢？从以上几个例子可以看出，为了使得消息传递实时（说一下作者对实时的理解：在用户能接受的时间范围内得到想要的结果就是实时），降低业务部门的耦合度，需要有一个“中介”从中传递从而达到目的。

各消息队列对比

主流消息队列特性对比如下

特性	Kafka	RocketMQ	ActiveMQ	RabbitMQ
吞吐量	高吞吐量，可达 10w 级别	高吞吐量，可达 10w 级别	1w 级别，吞吐量相交比较低	1w 级别，吞吐量相交比较低
时效性	延迟在 ms 级	延迟在 ms 级	延迟在 ms 级	延迟在微妙级，延迟最低
可用性	天然的分布式系统，数据有副本机制，可用性非常高	分布式架构，可用性非常高	主从架构，可用性较高	同 ActiveMQ
维护性	基于 Java 和 Scala 语言实现，社区活跃度高，维护成本较低	基于 Java 语言实现，社区活跃度高，维护成本较低	基于 Java 语言实现，消息队列场景功能很完备，但社区活跃度较低，维护成本较高	基于 erlang 语言开发，社区活跃度一般，小团队维护成本较高