1.安装配置JDK
2.安装启动zookeeper
3.安装启动kafka
先来说下kafka是个什么东西,它是一个消息中间件框架,只负责发布--订阅(帮忙存东西的)
接着给大家看一张大致的kafka流程图
首先打个比方,kafka好比就是中央电视台,而中央电视台下面有很多节目,生产者就是制作节目的团队,而消费者就是我们观看这个节目的人,一开始在zookeeper创建一个节目,假设就叫cctv1,有了这个节目名后,我们就得请一个团队来填充这个节目,比如拉广告啊,放电视剧之类的数据,而我们消费者要观看这个节目的话就得需要zookeeper来授权给我们。中央电视台则只是存数据的,相当于一个中间人,和现在中介差不多个意思。
1. 下载kafka的安装包到电脑上并传输到Linux中的hadoop用户下
2. 将这个压缩包解压到hadoop用户的opt目录下
接着就会在opt目录下看到这个文件夹
3. 启动zookeeper (具体操作看前一篇)
接着我们复制该窗口,jps一下,就会看到新开的服务QuorumPeerMain(仲裁的一个机制的东西),这个东西就是zookeeper的进程
5. 启动broker(kafka)
我们这个是单机模式:
进入该目录/home/hadoop/opt/kafka_2.11-1.1.0/config,和上面一样,将一个文件的数据重定向到另一个新目录,将带有#注释的代码去掉
cat server.properties | grep -v '#' >>kafka1.properties
然后启动kafka,要在bin目录下,和上面一样
./bin/kafka-server-start.shconfig/kafka1.properties
启动了后,jps一下,就会发现启动了一个名叫Kafka的进程,说明我们已经启动成功了
6. 创建一个主题
这里相当于中央电视台创建了一个叫cctv1的节目
还是在/home/hadoop/opt/kafka_2.11-1.1.0目录下启动创建
创建 到 zookeeper 上 地址是
./bin/kafka-topics.sh--create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic cctv1(主题名)
然后就可以用命令查看一下该主题是否已经创建,看到这个cctv1就说明创建成功了
./bin/kafka-topics.sh --list --zookeeper localhost:2181
到这里就已经完成了kafka在zookeeper上创建了一个cctv1的主体,然后就需要一个生产者来制作节目,并往cctv1中灌入数据
7. 发布消息(生产者)
./bin/kafka-console-producer.sh --broker-list localhost:9092 --topic cctv1
这是一个kafka自带的控制台的消息者,这里要注意的一点是端口号为9092,说明这个东西默认监控的端口号是9092,我们可以来看下这个端口
查看server.properties这个文件
会看到箭头指向的地方有个注释,如果不想用这个端口,可以把这句前面的#去掉,然后将端口号改为自己想监控的端口号
也可以来查看下这个端口号,发现正在监控
随机输入两条数据,并没有什么变化,因为这个数据borker(经理人)帮忙存着,但这个数据看不到,必须要有一个消费者帮忙消费才能看到
8. 启动消费者
相当于订阅了cctv1这个频道
./bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic cctv1
启动消费者后,并没有发生什么变化,这时候我们就在生产者中再输入几条消息
接着就会看到消费者那边出来了数据,但看到的数据只有刚刚输入的
那之前输入的数据怎么看?
输入这个命令就行了
./bin/kafka-console-consumer.sh --bootstrap-server localhost:9092--topic cctv1 --from-beginning
意识就是在启动消费者时后面加了一个 --from-beginning,就是说明这个cctv1电视台成数字电视台了,可以点播,可以看之前所有的信息,--from-beginning表示从开头开始看,其实它可以从任意一个偏移量开始看
随后再来实验一下,我们在生产者那里接着再输入多条数据
随后发现消费者也出来对应的数据
而我们刚刚启动查询所有的信息的那个服务里面也显示出相应的信息
注意:
zookeeper只能启动单数,比如1台 、3台、7台等等,不能偶数台,偶数台的话假设有两台,那么只有一台机器再运行,因为如果是偶数的话,选举出来的管理者有可能两个borker得到的票数相同,奇数的话就不会出现这个情况
上面演示的是简单的操作,我们也可以在kafka上写如何放数据,如何读数据,全部用代码来实现。