大数据组件-Kafka集群部署

原创

芝士味的椒盐 2022-04-21 17:03:13 博主文章分类：大数据 ©著作权

文章标签 kafka hdfs hadoop zookeeper 文章分类 Hadoop 大数据

©著作权归作者所有：来自51CTO博客作者芝士味的椒盐的原创作品，请联系作者获取转载授权，否则将追究法律责任

1）解压安装包

[hadoop@hadoop102 software]$ tar -zxvf kafka_2.11-0.11.0.0.tgz -C /opt/module/

2）修改解压后的文件名称

[hadoop@hadoop102 module]$ mv kafka_2.11-0.11.0.0/ kafka

3）在/opt/module/kafka目录下创建logs文件夹

[hadoop@hadoop102 kafka]$ mkdir logs

4）修改配置文件

[hadoop@hadoop102 kafka]$ cd config/
 
 [hadoop@hadoop102 config]$ vi server.properties
 
 输入以下内容：
 
 #broker的全局唯一编号，不能重复
 
 broker.id=0
 
 #删除topic功能使能
 
 delete.topic.enable=true
 
 #处理网络请求的线程数量
 
 num.network.threads=3
 
 #用来处理磁盘IO的现成数量
 
 num.io.threads=8
 
 #发送套接字的缓冲区大小
 
 socket.send.buffer.bytes=102400
 
 #接收套接字的缓冲区大小
 
 socket.receive.buffer.bytes=102400
 
 #请求套接字的缓冲区大小
 
 socket.request.max.bytes=104857600
 
 #kafka运行日志存放的路径 
 
 log.dirs=/opt/module/kafka/logs
 
 #topic在当前broker上的分区个数
 
 num.partitions=1
 
 #用来恢复和清理data下数据的线程数量
 
 num.recovery.threads.per.data.dir=1
 
 #segment文件保留的最长时间，超时将被删除
 
 log.retention.hours=168
 
 #配置连接Zookeeper集群地址
 
 zookeeper.connect=hadoop102:2181,hadoop103:2181,hadoop104:2181

5）配置环境变量

[hadoop@hadoop102 module]$ sudo vi /etc/profile
 
 #KAFKA_HOME
 
 export KAFKA_HOME=/opt/module/kafka
 
 export PATH=$PATH:$KAFKA_HOME/bin
 
 [hadoop@hadoop102 module]$ source /etc/profile

6）分发kafka目录到其他机器上

[hadoop@hadoop102 module]$ scp -r ./kafka hadoop@node2:$PWD
 
 注意：分发之后记得配置其他机器的环境变量

7）分别在hadoop103和hadoop104上修改配置文件/opt/module/kafka/config/server.properties中的broker.id=1、broker.id=2

注：broker.id不得重复

8）启动集群

依次在hadoop102、hadoop103、hadoop104节点上启动kafka
 
 [hadoop@hadoop102 kafka]$ bin/kafka-server-start.sh -daemon config/server.properties
 
 [hadoop@hadoop103 kafka]$ bin/kafka-server-start.sh -daemon config/server.properties
 
 [hadoop@hadoop104 kafka]$ bin/kafka-server-start.sh -daemon config/server.properties

9）关闭集群

[hadoop@hadoop102 kafka]$ bin/kafka-server-stop.sh stop
 
 [hadoop@hadoop103 kafka]$ bin/kafka-server-stop.sh stop
 
 [hadoop@hadoop104 kafka]$ bin/kafka-server-stop.sh stop

Kafka生产者消费者测试

1、创建topic，使用 kafka-topics.sh 创建 topic test

bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test

2、创建消息生产者

大数据组件-Kafka集群部署_hadoop

看一下zookeeper 配置信息： bin/zookeeper-shell.sh localhost:2181 <<< "get /brokers/ids/0"

大数据组件-Kafka集群部署_zookeeper_02

创建时生产者的时候我们用的是**localhost,**这里我们改成：bin/kafka-console-producer.sh --broker-list PLAINTEXT://上面的ip:9092 --topic test

3、创建消息消费者;bin/kafka-console-consumer.sh --bootstrap-server PLAINTEXT://上面的ip:9092 --topic test --from-beginning

在生产消息的窗口输入内容，消费窗口就可以打印出来：

大数据组件-Kafka集群部署_hadoop_03

命令操作

查看现有的topic
[root@slave1 config]# kafka-topics.sh --zookeeper master:2181 --list
创建topic
[root@slave1 config]# kafka-topics.sh --zookeeper master:2181 --create --replication-factor 3 --partitions 1 --topic second 选项说明： --topic 定义topic名 --replication-factor 定义副本数 --partitions 定义分区数
删除一个topic
[root@slave1 config]# kafka-topics.sh --zookeeper master:2181 --delete --topic second
生产者发送信息到topic
[root@master kafka_2.11-1.0.0]# kafka-console-producer.sh --broker-list master:9092 --topic first >
消费者从topic获取消息
[root@slave1 config]# kafka-console-consumer.sh --bootstrap-server master:9092 --from-beginning --topic first hello say mysql is beafult --from-beginning：会把主题中以往所有的数据都读取出来。
查看某个topic的详情
[root@slave2 logs]# kafka-topics.sh --zookeeper master:2181 --describe --topic first Topic:first PartitionCount:1 ReplicationFactor:3 Configs: Topic: first Partition: 0 Leader: 1 Replicas: 1,2,0 Isr: 1,2,0
修改分区数量
[root@slave2 logs]# kafka-topics.sh --zookeeper master:2181 --alter --topic first --partitions 6 WARNING: If partitions are increased for a topic that has a key, the partition logic or ordering of the messages will be affected Adding partitions succeeded!

上一篇：Java并发JUC（java.util.concurrent）Volatile\单例模式\CAS\原子引用

下一篇：大数据组件-Flume集群部署

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯