高吞吐量的分布式订阅消息系统

1.官网

  http://kafka.apache.org/

  050 Kafka的引入介绍_java

 

2.官网的介绍

  050 Kafka的引入介绍_apache_02

 

3.结构

  这个是版本1.0之后的版本。

  050 Kafka的引入介绍_kafka_03

  In Kafka the communication between the clients and the servers is done with a simple, high-performance, language agnostic TCP protocol.

  This protocol is versioned and maintains backwards compatibility with older version.

  We provide a Java client for Kafka, but clients are available in many languages.

 

 4.具体的结构

  备份属于来源于leader的分区上。

  050 Kafka的引入介绍_kafka_04

 

5.术语

  重点是Partition。

  需要记住的是consumer Group。

  050 Kafka的引入介绍_spark_05

 

6.1.0之后的新特性

  这个在上面的图上可以显示出来,官网上的图。

  050 Kafka的引入介绍_kafka_06

  为啥功能这么强大,还要用spark干嘛?

  理由是,spark可以转换方便,可以使用SQL。