一、简介

    官网:http://kafka.apache.org/

    Apache Kafka是分布式发布-订阅消息系统。它最初由LinkedIn公司开发,之后成为Apache项目的一部分。Kafka是一种快速、可扩展的、设计内在就是分布式的,分区的和可复制的提交日志服务。

    Apache Kafka与传统消息系统相比,有以下不同:

  • 它被设计为一个分布式系统,易于向外扩展;
  • 它同时为发布和订阅提供高吞吐量;
  • 它支持多订阅者,当失败时能自动平衡消费者;
  • 它将消息持久化到磁盘,因此可用于批量消费,例如ETL,以及实时应用程序。

二、安装

    下载地址:wget http://mirrors.shuosc.org/apache/kafka/1.0.2/kafka_2.11-1.0.2.tgz

    解压:tar -zxvf kafka_2.11-1.0.2.tgz

    cd kafka_2.11-1.0.2

三、启动服务器

    1、启动ZooKeeper
            Kafka使用ZooKeeper,所以您需要先启动一个ZooKeeper服务器,如果您还没有。您可以使用随Kafka一起打包的便捷脚本来获取一个快速但是比较粗糙的单节点ZooKeeper实例。

    启动命令:bin/zookeeper-server-start.sh config/zookeeper.properties

    这个 zookeeper中主要就3个配置:

# the directory where the snapshot is stored.
         dataDir=/tmp/zookeeper
         # the port at which the clients will connect
         clientPort=2181
         # disable the per-ip limit on the number of connections since this is a non-production config
         maxClientCnxns=0

    我们需要记住zookeeper的端口 2181,在后面会用到。

    2、Kafka基本配置
        Kafka在config目录下提供了一个基本的配置文件。为了保证可以远程访问Kafka,我们需要修改两处配置。

        打开config/server.properties文件,在很靠前的位置有listeners和 advertised.listeners两处配置的注释,去掉这两个注释,并且根据当前服务器的IP修改如下:

# The address the socket server listens on. It will get the value returned from 
         # java.net.InetAddress.getCanonicalHostName() if not configured.
         #   FORMAT:
         #     listeners = listener_name://host_name:port
         #   EXAMPLE:
         #     listeners = PLAINTEXT://your.host.name:9092
         listeners=PLAINTEXT://:9092        # Hostname and port the broker will advertise to producers and consumers. If not set, 
         # it uses the value for "listeners" if configured.  Otherwise, it will use the value
         # returned from java.net.InetAddress.getCanonicalHostName().
         advertised.listeners=PLAINTEXT://192.168.163.10:9092

    当前服务器IP为192.168.163.10,你需要修改为外网或局域网可以访问到的服务器IP。

    3、启动Kafka

        接下来启动Kafka服务:

            启动命令:bin/kafka-server-start.sh config/server.properties

    4、创建 Topic

        使用下面的命令创建 Topic。

            命令:bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test

    5、启动一个消费者

        在一个新的终端执行下面的命令。

            命令:bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test --from-beginning

    6、启动生产者

            命令:bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test

        启动后,可以输入内容,然后回车。

        此时你应该可以在上一个消费者中看到有消息输出。

    7、查看 topic 列表

            命令:bin/kafka-topics.sh --list --zookeeper localhost:2181

    8、查看描述 topics 信息

            命令:bin/kafka-topics.sh --describe --zookeeper localhost:2181 --topic test

        第一行给出了所有分区的摘要,每个附加行给出了关于一个分区的信息。 由于我们只有一个分区,所以只有一行。

        “Leader”: 是负责给定分区的所有读取和写入的节点。 每个节点将成为分区随机选择部分的领导者。

        “Replicas”: 是复制此分区日志的节点列表,无论它们是否是领导者,或者即使他们当前处于活动状态。

        “Isr”: 是一组“同步”副本。这是复制品列表的子集,当前活着并被引导到领导者。