1)解压安装包

[hadoop@hadoop102 software]$ tar -zxvf kafka_2.11-0.11.0.0.tgz -C /opt/module/

2)修改解压后的文件名称

[hadoop@hadoop102 module]$ mv kafka_2.11-0.11.0.0/ kafka

3)在/opt/module/kafka目录下创建logs文件夹

[hadoop@hadoop102 kafka]$ mkdir logs

4)修改配置文件

[hadoop@hadoop102 kafka]$ cd config/

[hadoop@hadoop102 config]$ vi server.properties

输入以下内容:

#broker的全局唯一编号,不能重复

broker.id=0

#删除topic功能使能

delete.topic.enable=true

#处理网络请求的线程数量

num.network.threads=3

#用来处理磁盘IO的现成数量

num.io.threads=8

#发送套接字的缓冲区大小

socket.send.buffer.bytes=102400

#接收套接字的缓冲区大小

socket.receive.buffer.bytes=102400

#请求套接字的缓冲区大小

socket.request.max.bytes=104857600

#kafka运行日志存放的路径

log.dirs=/opt/module/kafka/logs

#topic在当前broker上的分区个数

num.partitions=1

#用来恢复和清理data下数据的线程数量

num.recovery.threads.per.data.dir=1

#segment文件保留的最长时间,超时将被删除

log.retention.hours=168

#配置连接Zookeeper集群地址

zookeeper.connect=hadoop102:2181,hadoop103:2181,hadoop104:2181

5)配置环境变量

[hadoop@hadoop102 module]$ sudo vi /etc/profile

#KAFKA_HOME

export KAFKA_HOME=/opt/module/kafka

export PATH=$PATH:$KAFKA_HOME/bin

[hadoop@hadoop102 module]$ source /etc/profile

6)分发kafka目录到其他机器上

[hadoop@hadoop102 module]$ scp -r ./kafka hadoop@node2:$PWD

注意:分发之后记得配置其他机器的环境变量

7)分别在hadoop103和hadoop104上修改配置文件/opt/module/kafka/config/server.properties中的broker.id=1、broker.id=2

注:broker.id不得重复

8)启动集群

依次在hadoop102、hadoop103、hadoop104节点上启动kafka

[hadoop@hadoop102 kafka]$ bin/kafka-server-start.sh -daemon config/server.properties

[hadoop@hadoop103 kafka]$ bin/kafka-server-start.sh -daemon config/server.properties

[hadoop@hadoop104 kafka]$ bin/kafka-server-start.sh -daemon config/server.properties

9)关闭集群

[hadoop@hadoop102 kafka]$ bin/kafka-server-stop.sh stop

[hadoop@hadoop103 kafka]$ bin/kafka-server-stop.sh stop

[hadoop@hadoop104 kafka]$ bin/kafka-server-stop.sh stop


Kafka生产者消费者测试


1、创建topic,使用 ​​kafka-topics.sh​​ 创建 topic test

bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test

2、创建消息生产者

大数据组件-Kafka集群部署_hadoop

看一下zookeeper 配置信息: bin/zookeeper-shell.sh localhost:2181 <<< "get /brokers/ids/0"

大数据组件-Kafka集群部署_zookeeper_02

创建时生产者的时候我们用的是**localhost,**这里我们改成:bin/kafka-console-producer.sh --broker-list PLAINTEXT://上面的ip:9092 --topic test

3、创建消息消费者;bin/kafka-console-consumer.sh --bootstrap-server PLAINTEXT://上面的ip:9092 --topic test --from-beginning

在生产消息的窗口输入内容,消费窗口就可以打印出来:

大数据组件-Kafka集群部署_hadoop_03


命令操作


  • 查看现有的topic
    ​[root@slave1 config]# kafka-topics.sh --zookeeper master:2181 --list ​
  • 创建topic
    ​[root@slave1 config]# kafka-topics.sh --zookeeper master:2181 --create --replication-factor 3 --partitions 1 --topic second 选项说明: --topic 定义topic名 --replication-factor 定义副本数 --partitions 定义分区数 ​
  • 删除一个topic
    ​[root@slave1 config]# kafka-topics.sh --zookeeper master:2181 --delete --topic second ​
  • 生产者发送信息到topic
    ​[root@master kafka_2.11-1.0.0]# kafka-console-producer.sh --broker-list master:9092 --topic first > ​
  • 消费者从topic获取消息
    ​[root@slave1 config]# kafka-console-consumer.sh --bootstrap-server master:9092 --from-beginning --topic first hello say mysql is beafult --from-beginning:会把主题中以往所有的数据都读取出来。 ​
  • 查看某个topic的详情
    ​[root@slave2 logs]# kafka-topics.sh --zookeeper master:2181 --describe --topic first Topic:first PartitionCount:1 ReplicationFactor:3 Configs: Topic: first Partition: 0 Leader: 1 Replicas: 1,2,0 Isr: 1,2,0 ​
  • 修改分区数量
    ​[root@slave2 logs]# kafka-topics.sh --zookeeper master:2181 --alter --topic first --partitions 6 WARNING: If partitions are increased for a topic that has a key, the partition logic or ordering of the messages will be affected Adding partitions succeeded! ​