keepalived 详解
keepalived原理
Keepalived 是以 VRRP 协议为实现基础的,VRRP全称Virtual Router Redundancy Protocol,即虚拟路由冗余协议。
虚拟路由冗余协议,可以认为是实现路由器高可用的协议,即将N台提供相同功能的路由器组成一个路由器组,这个组里面有一个master 和多个 backup,master 上面有一个对外提供服务的 VIP(Virtual IP Address)(该路由器所在局域网内其他机器的默认路由为该 vip),master 会发组播,当 backup 收不到 vrrp 包时就认为 master 宕掉了,这时就需要根据 VRRP 的优先级来选举一个 backup 当 master。这样的话就可以保证路由器的高可用了。
keepalived 主要有三个模块,分别是core、check 和 vrrp.
core 模块为keepalived的核心,负责主进程的启动、维护以及全局配置文件的加载和解析.
check 负责健康检查,包括常见的各种检查方式.
vrrp 模块是来实现 VRRP 协议的.
Keepalived 的作用
keepalived 提供了很好的高可用性保障服务,它可以检查服务器的状态,如果有服务器出现问题,Keepalived 会将其从系统中移除,并且同时使用备份服务器代替该服务器的工作,当这台服务器可以正常工作后,Keepalived 再将其放入服务器群中,这个过程是 Keepalived 自动完成的,不需要人工干涉,我们只需要修复出现问题的服务器即可。
基于TCP/IP协议的理解
以检测 web 服务器为例,Keepalived 从3个层次来检测服务器的状态
Layer3 、Layer4 以及 Layer7 工作在IP/TCP协议栈的IP层,TCP层,及应用层,原理分别如下:
Layer3:
Keepalived使用Layer3的方式工作时,Keepalived会定期向服务器群中的服务器发送一个ICMP的数据包(既我们平时用的Ping程序),如果发现某台服务的IP地址没有激活,Keepalived 便报告这台服务器失效,并将它从服务器群中剔除,这种情况的典型例子是某台服务器被非法关机。Layer3 的方式是以服务器的IP地址是否有效作为服务器工作正常与否的标准。
Layer4:
如果您理解了Layer3的方式,Layer4就容易了。Layer4主要以TCP 端口的状态来决定服务器工作正常与否。如 web server 的服务端口一般是80,如果 Keepalived 检测到80端口没有启动,则 Keepalived 将把这台服务器从服务器群中剔除。
Layer7:
Layer7 就是工作在具体的应用层了,比Layer3,Layer4要复杂一点,在网络上占用的带宽也要大一些。Keepalived 将根据用户的设定检查服务器程序的运行是否正常,如果与用户的设定不相符,则 Keepalived 将把服务器从服务器群中剔除。
Keepalived 选举策略
选举策略
首先,每个节点有一个初始优先级,由配置文件中的priority配置项指定,MASTER 节点的 priority 应比 BAKCUP 高。运行过程中 keepalived 根据 vrrp_script 的 weight 设定,增加或减小节点优先级。规则如下:
- weight值为正时,脚本检测成功时”weight”值会加到”priority”上,检测失败时不加
1、主失败: 主priority < 备priority+weight之和时会切换
2、主成功: 主priority+weight之和 > 备priority+weight之和时,主依然为主,即不发生切换 - weight为负数时,脚本检测成功时”weight”不影响”priority”,检测失败时,Master节点的权值将是“priority“值与“weight”值之差
1、主失败: 主priotity-abs(weight) < 备priority时会发生切换
2、主成功: 主priority > 备priority 不切换 - 当两个节点的优先级相同时,以节点发送VRRP通告的 IP 作为比较对象,IP较大者为MASTER。
priority 和 weight 的设定
1、主从的优先级初始值priority和变化量weight设置非常关键,配错的话会导致无法进行主从切换。比如,当MASTER初始值定得太高,即使script脚本执行失败,也比BACKUP的priority + weight大,就没法进行VIP漂移了。
2、所以priority和weight值的设定应遵循: abs(MASTER priority - BAKCUP priority) < abs(weight)。一般情况下,初始值MASTER的priority值应该比较BACKUP大,但不能超过weight的绝对值。 另外,当网络中不支持多播(例如某些云环境),或者出现网络分区的情况,keepalived BACKUP节点收不到MASTER的VRRP通告,就会出现脑裂(split brain)现象,此时集群中会存在多个MASTER节点。
Keepalived 实战
在keepalived中会配置 vrrp_script ,用于检测脚本,目的是为了检测nginx是否存活。以便去启动keepalived高可用功能。
配置之初,需要有一个VIP,这个VIP可以自己给定,也可以去申请一个通外网的IP。
环境
操作系统 | IP | 主机名 | 软件 |
VIP | 10.0.0.100 | ||
Rocky9 | 10.0.0.101 | node01 | keepadlived + nginx |
Rocky9 | 10.0.0.101 | node02 | keepadlived + nginx |
安装
利用VMware workstation 创建两台虚拟机,使用nat网络,在两台rocky9 服务器上安装keepalived + Nginx软件
- keepalived
dnf install keepalived -y
- Nginx
dnf install keepalived -y
修改nginx网页
修改nginx网页文件,便于区别主机信息,并且开启nginx
- node01
echo "node02" > /usr/share/nginx/html/index.html
systemctl start nginx
- node02
echo "node01" > /usr/share/nginx/html/index.html
systemctl start nginx
在浏览器输入两台机器的IP地址,访问网页,如下所示
这样就可以确认nginx是正常启用。
配置keepalived
配置nginx主要是为了实现keepalived的高可用功能,nginx网页可以明显的体现出来高可用。
keepalived 配置如下
主节点keepalived配置:
! Configuration File for keepalived
global_defs {
router_id LVS_DEVEL
script_user root
}
vrrp_script nginx {
script "/etc/keepalived/check_nginx.sh"
interval 3
weight -30
fall 2
rise 1
}
vrrp_instance VI_1 {
state MASTER
interface ens160
virtual_router_id 51
priority 100
advert_int 1
nopreempt
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
10.0.0.100
}
track_script {
nginx
}
}
备节点keepalived配置:
! Configuration File for keepalived
global_defs {
router_id LVS_DEVEL
script_user root
}
vrrp_script nginx {
script "/keepalived/check_nginx.sh"
interval 3
weight -30
fall 2
rise 1
}
vrrp_instance VI_1 {
state BACKUP
interface ens160
virtual_router_id 51
priority 90
advert_int 1
nopreempt
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
10.0.0.100
}
track_script {
nginx
}
}
check脚本 ,两台机器都需要创建。
存放目录 /etc/keepalived
#!/bin/bash
A=`ps -C nginx --no-header |wc -l`
if [ $A -eq 0 ];then
/usr/sbin/nginx
sleep 3
if [ `ps -C nginx --no-header |wc -l` -eq 0 ];then
systemctl stop keepalived.service
fi
fi
keepalived配置文件完成之后,需要启动keepalivedsystemctl start keepalived
检查keepalived状态 systemctl status keepalived
这时候使用 ip a 查看IP地址:
这时候会看到VIP在101机器上。
使用浏览器访问 VIP地址 http://10.0.0.100
检测keepalived是否启用
浏览器访问http://10.0.0.100,大概率是访问的101机器上的网页,显示出 node01;
进入 101机器,停止keepalived ,这时候VIP就会漂移到node02机器上。这样就是实现了业务的高可用。