kafka可以存视频吗 kafka的文件储存机制

转载

lgmyxbjfu 2024-04-02 14:28:04

文章标签 kafka可以存视频吗 kafka 分布式 big data 数据 文章分类 架构后端开发

Kafka架构

1、Kafka工作流程

kafka可以存视频吗 kafka的文件储存机制_分布式

Kafka中消息是以topic进行分类的，生产者生产消息，消费者消费消息，都是面向topic的。

一个topic下的每一个分区都单独维护自己的offset，所以分发到不同分区中的数据是不同的数据。消费者的分区维护是一个消费者组一个主题的一个分区维护一个offset。

通俗点说：一个分区对应于一个消费者，消费者对应记录对应分区的offset，从而获取数据。

2、Kafka文件存储机制

kafka可以存视频吗 kafka的文件储存机制_分布式_02

topic、log、segment是逻辑上的概念，而partition、.log文件、.index文件是物理上的概念。

每个partition对应于一个log文件，该log文件中存储的就是producer生产的数据。Producer生产的数据会被不断追加到该log文件末端，且每条数据都有自己的offset。消费者组中的每个消费者，都会实时记录自己消费到了哪个offset，以便出错恢复时，从上次的位置继续消费。

由于生产者生产的消息会不断追加到log文件末尾，为防止log文件过大导致数据定位效率低下，Kafka采取了分片和索引机制，将每个partition分为多个segment。每个segment对应两个文件——“.index”文件和“.log”文件。这些文件位于一个文件夹下，该文件夹的命名规则为：topic名称+分区序号。

“.index”文件存储大量的索引信息，索引信息按照数组的逻辑排列，“.log”文件存储大量的数据，数据直接紧密排列，索引文件中的元数据指向对应数据文件中message的物理偏移地址。二分查找的方式迅速定位我们的offset 在哪里。