选举机制分为两种情况,第一次启动和非第一次启动(就是选出leader后,leader挂了,需要重新选举的情况)
首先我们要先了解一下每台服务器所具有的属性标识
myid:服务器的标识,相当于服务器id,每个服务器的myid都是不相同的、
SID:服务器ID。用来唯一标识一台
ZooKeeper集群中的机器,每台机器不能重
复,和myid一致。
ZXID:事务ID。ZXID是一个事务ID,用来
标识一次服务器状态的变更。在某一时刻,
集群中的每台机器的ZXID值不一定完全一
致,这和ZooKeeper服务器对于客户端“更
新请求”的处理逻辑有关。
Epoch:每个Leader任期的代号。没有
Leader时同一轮投票过程中的逻辑时钟值是
相同的。每投完一次票这个数据就会增加
假如我们有5台服务器
(图片来自尚硅谷,我也是看尚硅谷的学习的,如果笔记看不懂的同学也可以去看尚硅谷的视频)
第一次启动
1 服务器1启动,发起一次选举,服务器投给自己一票。此时服务器的只有一票,不够半数以上(3票),所以他现在是LOOKING状态。
2服务器2启动,发起一次选举,服务器2也会投给自己一票(这里尚硅谷讲述的是这两服务器器分别给自投一票,笔者认为是叙述不够准确的,因为这样服务器1就会有2票,服务器1就会有1票,也就是说总共会有3票,显然是错误的,2台服务器只会有2张票)并交换选票信息:此时服务器1发现服务器2的myid比他大,所以他将自己的投票给了投票2,此时服务器2就会有2票,服务器1就有0票,因为票数没有达到半数以上,所以他们还是LOOKING状态。
3服务器3启动,发起一次选举,服务器3也会投给你自己一票,然后交换投票信息,发现服务器3的mymid最大,所以服务器2会将自己的两票投给服务器3,此时服务器3就有3张票,超过了半数,所以服务器3状态改为LEADING,服务器1和2状态变为FOLLOWING。
4服务器4启动,发起一次选举,此时因为已经已经选出了leader,不会再重新进行投票,更换选票信息发现服务器为3票,服务器1为1票,所以少数服从多数,服务器3会更换选票信息为服务器3,并更换状态为FOLLOWING,此时服务器3有4票,其实服务器为0票
5服务器5启动,发起一次选举,过程与4相同,最终服务器3有5票,其余服务器有0票。
非第一次启动
假如Zookeeper由5台服务器组成,SID分别为1、2、3、4、5,ZXID分别为8、8、8、7、7,并且此时SID为3的服务器是Leader。某一时刻,3和5服务器出现故障,因此开始重新进行Leader选举
SID为1、2、4的机器投票情况:
(EPOCH,ZXID,SID ) (EPOCH,ZXID,SID ) (EPOCH,ZXID,SID )
(1,8,1) (1,8,2) (1,7,4)
选举Leader规则: ①EPOCH大的直接胜出 ②EPOCH相同,事务id(ZXID)大的胜出 ③事务id相同,服务器大的id(SID)大的胜出。
所以Leader为服务器2。