利用kafka制作消息提醒 kafka的消息是存储在哪里?

转载

mob64ca13f83523 2024-03-19 01:47:05

文章标签 利用kafka制作消息提醒大数据数据库运维数据 文章分类 架构后端开发

Kafka 被称为“分布式提交日志”或“分布式流平台”

　　文件系统或数据库提交日志用来提供所有事务的持久记录，通过重放这些日志重建系统状态，同时Kafka数据是按照一定顺序持久化保存的，可以按需读取

　　Kafka数据分布在整个系统里，具有数据保障和性能伸缩能力

Kafka数据单元称为消息，类似于数据库里的行，消息由字节数组组成，里边的数据没有特殊含义；消息有一个可选的元数据----键（字节数组），当消息以一种

　　可控的方式写入不同分区时，会用到键，保证相同键的消息总是写到相同的分区上

为提高效率，Kafka分批次写入Kafka，批次是一组消息，这些消息属于同一个主题和分区，批次越大，单位时间内处理消息越多，单个消息处理时间越长，批次数据会

　　被压缩

Kafka的消息通过主题进行分类，主题类似于数据库的表，主题可以分为若干分区，一个分区就是一个提交日志，消息以追加方式写入分区，以先入先出方式读取

注意：一个主题有几个分区，无法保证主题范围内消息的顺序，但是可以保证分区内的消息顺序

分区可以分布在不同的服务器上，即一个主题可以横跨多个服务器，以此提供比单个服务器更强大的性能

利用kafka制作消息提醒 kafka的消息是存储在哪里?_数据库

人们通常会使用流来描述Kafka系统的数据，很多时候一个主题可以看作一个流，不管多少分区，流是从一组生产者移动到消费者的数据

Kafka的客户端就是Kafka系统的用户，他们被分为2种类型：生产者和消费者

生产者创建消息，默认情况下，生产者会把消息均衡的分布到主题的所有分区上，而并不关心消息会被写到哪个分区上

生产者可以指定消息写到特定分区，通过消息键和分区器实现；分区器为键生成一个散列值，并映射到指定分区上，这样可以保证同一个键的消息可以写到同一个分区上

消费者读取消息，消费者可以订阅一个或多个主题，按照生成顺序读取，通过检查消息的偏移量区分已经都去过的消息；偏移量是一个元数据，是不断递增的，在创建消息时，会添加到消息里，在给定分区里，每个消息的偏移量是唯一的，消费者会把每个分区最后读取的消息偏移量保存在Zookeeper或Kafka上，若果消费者关闭或重启，读取的状态不会丢失

消费者是消费者群组的一部分，多个消费者共同读取一个主题时，群组保证每个分区只能被一个消费者使用。消费者与分区之间的映射关系被称为消费者对分区的所有权关系

消费者可以消费包含大量消息的主题，如果一个消费者失效，其余的消费者可以接管失效的消费者工作

利用kafka制作消息提醒 kafka的消息是存储在哪里?_数据库_02

一个独立的Kafka服务器称为broker,broker接收生产者的消息，为消息设置偏移量，并提交消息到磁盘保存；broker为消费者提供服务，对读取分区的请求做出响应，返回已经提交到磁盘上的消息

broker是集群的组成部分，每个集群都有一个broker被选举为集群控制器角色，控制器负责管理工作，包括将分区分配给broker和监控broker；在集群中，一个分区从属于一个broker（分区的首领）；一个分区可以分配给多个broker，这时会发生分区复制，这种复制机制为分区提供了消息冗余，一个broker失效，其他broker可以接管领导权；相关的消费者和生产者都重新连接到新的首领

利用kafka制作消息提醒 kafka的消息是存储在哪里?_运维_03