文章目录

1.部署 Pulsar

docker

docker run -it -p 6650:6650  -p 8080:8080 --mount source=pulsardata,target=/pulsar/data --mount source=pulsarconf,target=/pulsar/conf apachepulsar/pulsar:2.9.1 bin/pulsar standalone

2.Pulsar 客户端

Java 客户端

maven


org.apache.pulsar
pulsar-client
2.9.1

application.properties

# Pulsar 地址
pulsar.url=pulsar://192.168.59.155:6650
# topic
pulsar.topic=testTopic
# consumer group
pulsar.subscription=topicGroup

client:

client = PulsarClient.builder()
.serviceUrl(url)
.build();

创建 Producer

producer = client.newProducer()
.topic(topic)
.compressionType(CompressionType.LZ4)
.sendTimeout(0, TimeUnit.SECONDS)
.enableBatching(true)
.batchingMaxPublishDelay(10, TimeUnit.MILLISECONDS)
.batchingMaxMessages(1000)
.maxPendingMessages(1000)
.blockIfQueueFull(true)
.roundRobinRouterBatchingPartitionSwitchFrequency(10)
.batcherBuilder(BatcherBuilder.DEFAULT)
.create();

创建 Producer,会真正的连接集群,这时如果集群有问题,就会报连接错误。

Producer 的参数:

1.topic:Producer 要写入的 topic。
2.compressionType:压缩策略,目前支持 4 种策略 (NONE、LZ4、ZLIB、ZSTD)
3.sendTimeout:超时时间。如果 Producer 在超时时间为收到 ACK,会重复发送
4.enableBatching:是否开启消息批量处理。这里默认 true,这个参数只有在异步发送 (sendAsync) 时才能生效,选择同步发送会失效。
5.batchingMaxPublishDelay:批量发送消息的时间段,这里定义的是 10ms,需要注意的是,设置了批量时间,就不会受消息数量的影响。批量发送会把要发送的批量消息放在一个网络包里发送出去,减少网络 IO 次数,大大提高网卡的发送效率。
6.batchingMaxMessages:批量发送消息的最大数量。
7.maxPendingMessages:等待从 broker 接收 ACK 的消息队列最大长度。如果这个队列满了,producer 所有的 sendAsync 和 send 都会失败,除非设置了 blockIfQueueFull 值是 true。
8.blockIfQueueFull:Producer 发送消息时会把消息先放入本地 Queue 缓存,如果缓存满了,就会阻塞消息发送。
9.roundRobinRouterBatchingPartition-SwitchFrequency:如果发送消息时没有指定 key,那默认采用 round robin 的方式发送消息,使用 round robin 的方式,切换 partition 的周期是 (frequency * batchingMaxPublishDelay)。

创建 Consumer

Pulsar的消费模型图:
SpringBoot整合分布式消息平台Pulsar_java
从图中可以看到,Consumer 要绑定一个 subscription 才能进行消费。

consumer = client.newConsumer()
.topic(topic)
.subscriptionName(subscription)
.subscriptionType(SubscriptionType.Shared)
.subscriptionInitialPosition(SubscriptionInitialPosition.Earliest)
.negativeAckRedeliveryDelay(60, TimeUnit.SECONDS)
.receiverQueueSize(1000)
.subscribe();

参数:
1.topic:Consumer 要订阅的 topic。
2.subscriptionName:consumer 要关联的 subscription 名字。
3.subscriptionType:订阅类型,Pulsar 支持四种类型订阅:

  • Exclusive:独占模式,同一个 Topic 只能有一个消费者,如果多个消费者,就会出错。
  • Failover:灾备模式,同一个 Topic 可以有多个消费者,但是只能有一个消费者消费,其他消费者作为故障转移备用,如果当前消费者出了故障,就从备用消费者中选择一个进行消费。如下图:

SpringBoot整合分布式消息平台Pulsar_java_02

  • Shared:共享模式,同一个 Topic 可以由多个消费者订阅和消费。消息通过 round robin 轮询机制分发给不同的消费者,并且每个消息仅会被分发给一个消费者。当消费者断开,如果发送给它消息没有被消费,这些消息会被重新分发给其它存活的消费者。如下图:

SpringBoot整合分布式消息平台Pulsar_分布式_03

  • Key_Shared:消息和消费者都会绑定一个key,消息只会发送给绑定同一个key的消费者。如果有新消费者建立连接或者有消费者断开连接,就需要更新一些消息的 key。跟 Shared 模式相比,Key_Shared 的好处是既可以让消费者并发地消费消息,又能保证同一Key下的消息顺序。如下图:

SpringBoot整合分布式消息平台Pulsar_apache_04
4.subscriptionInitialPosition:创建新的 subscription 时从哪里开始消费,有两个选项:

  • Latest:从最新的消息开始消费
  • Earliest:从最早的消息开始消费

5.negativeAckRedeliveryDelay:消费失败后间隔多久 broker 重新发送。

6.receiverQueueSize:在调用 receive 方法之前,最多能累积多少条消息。可以设置为 0,这样每次只从 broker 拉取一条消息。在 Shared 模式下,receiverQueueSize 设置为 0,可以防止批量消息多发给一个 Consumer 而导致其他 Consumer 空闲。

Consumer 接收消息有四种方式:同步单条、同步批量、异步单条和异步批量,代码如下:

Message message = consumer.receive()
CompletableFuture message = consumer.receiveAsync();
Messages message = consumer.batchReceive();
CompletableFuture message = consumer.batchReceiveAsync();

批量接受:

consumer = client.newConsumer()
.topic(topic)
.subscriptionName(subscription)
.batchReceivePolicy(BatchReceivePolicy.builder()
.maxNumMessages(100)
.maxNumBytes(1024 * 1024)
.timeout(200, TimeUnit.MILLISECONDS)
.build())
.subscribe();

maxNumMessages:批量接收的最大消息数量。
maxNumBytes:批量接收消息的大小,这里是 1MB。

3.测试

Producer 发送消息代码:

public void sendMsg(String key, String data) {
CompletableFuture future = producer.newMessage()
.key(key)
.value(data.getBytes()).sendAsync();
future.handle((v, ex) -> {
if (ex == null) {
logger.info("发送消息成功, key:{}, msg: {}", key, data);
} else {
logger.error("发送消息失败, key:{}, msg: {}", key, data);
}
return null;
});
future.join();
logger.info("发送消息完成, key:{}, msg: {}", key, data);
}

Consumer 消费者代码

public void start() throws Exception{
while (true) {
Message message = consumer.receive();
String key = message.getKey();
String data = new String(message.getData());
String topic = message.getTopicName();
if (StringUtils.isNotEmpty(data)) {
try{
logger.info("收到消息, topic:{}, key:{}, data:{}", topic, key, data);
}catch(Exception e){
logger.error("接收消息异常,topic:{}, key:{}, data:{}", topic, key, data, e);
}
}
consumer.acknowledge(message);
}
}

Controller 调用 Producer 代码

@RequestMapping("/send")
@ResponseBody
public String send(@RequestParam String key, @RequestParam String data) {
logger.info("收到消息发送请求, key:{}, value:{}", key, data);
pulsarProducer.sendMsg(key, data);
return "success";
}

调用 Producer 发送一条消息,key=key1,data=data1,具体操作为在浏览器中输入下面的 url 后回车:

http://192.168.157.1:8083/pulsar/send?key=key1&data=data1

控制台输出下面日志

2022-01-08 22:42:33,199 [pulsar-client-io-6-1] [INFO] boot.pulsar.PulsarProducer - 发送消息成功, key:key1, msg: data1
2022-01-08 22:42:33,200 [http-nio-8083-exec-1] [INFO] boot.pulsar.PulsarProducer - 发送消息完成, key:key1, msg: data1
2022-01-08 22:42:33,232 [Thread-22] [INFO] boot.pulsar.PulsarConsumer - 收到消息, topic:persistent://public/default/testTopic, key:key1, data:data1
2022-01-08 22:43:14,498 [pulsar-timer-5-1] [INFO] org.apache.pulsar.client.impl.ConsumerStatsRecorderImpl - [testTopic] [topicGroup] [7def6] Prefetched messages: 0 --- Consume throughput received: 0.02 msgs/s --- 0.00 Mbit/s --- Ack sent rate: 0.02 ack/s --- Failed messages: 0 --- batch messages: 0 ---Failed acks: 0
2022-01-08 22:43:14,961 [pulsar-timer-9-1] [INFO] org.apache.pulsar.client.impl.ProducerStatsRecorderImpl - [testTopic] [standalone-9-0] Pending messages: 0 --- Publish throughput: 0.02 msg/s --- 0.00 Mbit/s --- Latency: med: 69.000 ms - 95pct: 69.000 ms - 99pct: 69.000 ms - 99.9pct: 69.000 ms - max: 69.000 ms --- Ack received rate: 0.02 ack/s --- Failed messages: 0

从日志中看到,这里使用的 namespace 就是创建集群时生成的public/default。

4.总结

从 SpringBoot 整合 Java 客户端使用来看,Pulsar 的 api 是非常友好的,使用起来方便简洁。Consumer 的使用需要考虑多一些,需要考虑到批量、异步以及订阅类型。