Java Kafka 生产者消费者

在现代大数据处理中,Kafka 是一个非常常用的工具,用于实现高吞吐量,可扩展的分布式数据流平台。它的设计目标是为了进行发布和订阅消息系统,通过解耦生产者和消费者之间的关系,提供高效、可靠的数据传输。

本文将介绍如何使用 Java 编写 Kafka 生产者和消费者,并提供相应的代码示例。

Kafka 简介

Kafka 是由 Apache 软件基金会开发的一个分布式流处理平台。它是一个分布式、分区、复制的日志服务,可以处理消费者规模的网站中的所有动作流数据。Kafka 提供了一个高吞吐量的、持久化的、可分区的发布订阅系统,可以将数据流以消息的形式发布到多个主题(Topic)中,并支持多个消费者订阅这些主题。Kafka 的特点包括:

  • 高吞吐量:Kafka 可以处理非常高的消息吞吐量,每秒可以处理数十万条消息。
  • 可扩展性:Kafka 可以在集群中添加更多的节点,以支持更大规模的数据处理。
  • 持久性:Kafka 可以将消息持久化到磁盘上,避免数据丢失。
  • 效率:Kafka 的设计非常高效,可以在一台普通的硬件上运行。

Kafka 生产者

Kafka 生产者用于将消息发布到 Kafka 集群中的主题。以下是一个简单的 Kafka 生产者示例代码:

import org.apache.kafka.clients.producer.*;

import java.util.Properties;

public class KafkaProducerExample {
    public static void main(String[] args) {
        // 设置 Kafka 服务器地址和端口
        String bootstrapServers = "localhost:9092";

        // 创建生产者配置
        Properties properties = new Properties();
        properties.put("bootstrap.servers", bootstrapServers);
        properties.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
        properties.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");

        // 创建生产者实例
        KafkaProducer<String, String> producer = new KafkaProducer<>(properties);

        // 发送消息
        String topic = "my-topic";
        String key = "my-key";
        String value = "Hello, Kafka!";
        ProducerRecord<String, String> record = new ProducerRecord<>(topic, key, value);
        producer.send(record, new Callback() {
            @Override
            public void onCompletion(RecordMetadata metadata, Exception exception) {
                if (exception != null) {
                    exception.printStackTrace();
                } else {
                    System.out.println("Message sent successfully");
                    System.out.println("Topic: " + metadata.topic());
                    System.out.println("Partition: " + metadata.partition());
                    System.out.println("Offset: " + metadata.offset());
                }
            }
        });

        // 关闭生产者
        producer.close();
    }
}

以上代码中,我们首先设置了 Kafka 服务器的地址和端口。然后创建了生产者的配置对象,并设置了 key 和 value 的序列化器。接下来,我们创建了 Kafka 生产者实例,并通过 send() 方法发送了一条消息。最后,我们关闭了生产者实例。

Kafka 消费者

Kafka 消费者用于从 Kafka 主题中订阅并接收消息。以下是一个简单的 Kafka 消费者示例代码:

import org.apache.kafka.clients.consumer.*;
import org.apache.kafka.common.TopicPartition;

import java.util.Collections;
import java.util.Properties;

public class KafkaConsumerExample {
    public static void main(String[] args) {
        // 设置 Kafka 服务器地址和端口
        String bootstrapServers = "localhost:9092";

        // 设置消费者组 ID
        String groupId = "my-group";

        // 创建消费者配置
        Properties properties = new Properties();
        properties.put("bootstrap.servers", bootstrapServers);
        properties.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
        properties.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
        properties.put("group.id", groupId);

        // 创建消费者实例
        KafkaConsumer<String, String> consumer = new KafkaConsumer<>(properties);

        // 订阅主题
        String topic = "my-topic";
        consumer.subscribe(Collections.singletonList(topic));

        // 指定消费者从指定分区的指定偏移量开始消费
        TopicPartition partition