keepalived 详解

官网地址:https://keepalived.org/

keepalived原理

Keepalived 是以 VRRP 协议为实现基础的,VRRP全称Virtual Router Redundancy Protocol,即虚拟路由冗余协议。

虚拟路由冗余协议,可以认为是实现路由器高可用的协议,即将N台提供相同功能的路由器组成一个路由器组,这个组里面有一个master 和多个 backup,master 上面有一个对外提供服务的 VIP(Virtual IP Address)(该路由器所在局域网内其他机器的默认路由为该 vip),master 会发组播,当 backup 收不到 vrrp 包时就认为 master 宕掉了,这时就需要根据 VRRP 的优先级来选举一个 backup 当 master。这样的话就可以保证路由器的高可用了。

keepalived 主要有三个模块,分别是core、check 和 vrrp.
core 模块为keepalived的核心,负责主进程的启动、维护以及全局配置文件的加载和解析.
check 负责健康检查,包括常见的各种检查方式.
vrrp 模块是来实现 VRRP 协议的.

Keepalived 的作用

keepalived 提供了很好的高可用性保障服务,它可以检查服务器的状态,如果有服务器出现问题,Keepalived 会将其从系统中移除,并且同时使用备份服务器代替该服务器的工作,当这台服务器可以正常工作后,Keepalived 再将其放入服务器群中,这个过程是 Keepalived 自动完成的,不需要人工干涉,我们只需要修复出现问题的服务器即可。

基于TCP/IP协议的理解

以检测 web 服务器为例,Keepalived 从3个层次来检测服务器的状态

Layer3 、Layer4 以及 Layer7 工作在IP/TCP协议栈的IP层,TCP层,及应用层,原理分别如下:

Layer3:

Keepalived使用Layer3的方式工作时,Keepalived会定期向服务器群中的服务器发送一个ICMP的数据包(既我们平时用的Ping程序),如果发现某台服务的IP地址没有激活,Keepalived 便报告这台服务器失效,并将它从服务器群中剔除,这种情况的典型例子是某台服务器被非法关机。Layer3 的方式是以服务器的IP地址是否有效作为服务器工作正常与否的标准。

Layer4:

如果您理解了Layer3的方式,Layer4就容易了。Layer4主要以TCP 端口的状态来决定服务器工作正常与否。如 web server 的服务端口一般是80,如果 Keepalived 检测到80端口没有启动,则 Keepalived 将把这台服务器从服务器群中剔除。

Layer7:

Layer7 就是工作在具体的应用层了,比Layer3,Layer4要复杂一点,在网络上占用的带宽也要大一些。Keepalived 将根据用户的设定检查服务器程序的运行是否正常,如果与用户的设定不相符,则 Keepalived 将把服务器从服务器群中剔除。

Keepalived 选举策略

选举策略

首先,每个节点有一个初始优先级,由配置文件中的priority配置项指定,MASTER 节点的 priority 应比 BAKCUP 高。运行过程中 keepalived 根据 vrrp_script 的 weight 设定,增加或减小节点优先级。规则如下:

  • weight值为正时,脚本检测成功时”weight”值会加到”priority”上,检测失败时不加
    1、主失败: 主priority < 备priority+weight之和时会切换
    2、主成功: 主priority+weight之和 > 备priority+weight之和时,主依然为主,即不发生切换
  • weight为负数时,脚本检测成功时”weight”不影响”priority”,检测失败时,Master节点的权值将是“priority“值与“weight”值之差
    1、主失败: 主priotity-abs(weight) < 备priority时会发生切换
    2、主成功: 主priority > 备priority 不切换
  • 当两个节点的优先级相同时,以节点发送VRRP通告的 IP 作为比较对象,IP较大者为MASTER。

priority 和 weight 的设定

1、主从的优先级初始值priority和变化量weight设置非常关键,配错的话会导致无法进行主从切换。比如,当MASTER初始值定得太高,即使script脚本执行失败,也比BACKUP的priority + weight大,就没法进行VIP漂移了。
2、所以priority和weight值的设定应遵循: abs(MASTER priority - BAKCUP priority) < abs(weight)。一般情况下,初始值MASTER的priority值应该比较BACKUP大,但不能超过weight的绝对值。 另外,当网络中不支持多播(例如某些云环境),或者出现网络分区的情况,keepalived BACKUP节点收不到MASTER的VRRP通告,就会出现脑裂(split brain)现象,此时集群中会存在多个MASTER节点。

Keepalived 实战

在keepalived中会配置 vrrp_script ,用于检测脚本,目的是为了检测nginx是否存活。以便去启动keepalived高可用功能。

配置之初,需要有一个VIP,这个VIP可以自己给定,也可以去申请一个通外网的IP。

环境

操作系统

IP

主机名

软件

VIP

10.0.0.100

Rocky9

10.0.0.101

node01

keepadlived + nginx

Rocky9

10.0.0.101

node02

keepadlived + nginx

安装

利用VMware workstation 创建两台虚拟机,使用nat网络,在两台rocky9 服务器上安装keepalived + Nginx软件

  • keepalived
dnf install keepalived -y
  • Nginx
dnf install keepalived -y

修改nginx网页

修改nginx网页文件,便于区别主机信息,并且开启nginx

  • node01
echo "node02" > /usr/share/nginx/html/index.html

systemctl start nginx
  • node02
echo "node01" > /usr/share/nginx/html/index.html

systemctl start nginx

在浏览器输入两台机器的IP地址,访问网页,如下所示

怎么判断keepalived状态 查看keepalived状态的命令_服务器

这样就可以确认nginx是正常启用。

配置keepalived

配置nginx主要是为了实现keepalived的高可用功能,nginx网页可以明显的体现出来高可用。

keepalived 配置如下

主节点keepalived配置:

! Configuration File for keepalived

global_defs {
   router_id LVS_DEVEL
   script_user root
}
vrrp_script nginx {
    script "/etc/keepalived/check_nginx.sh"
    interval 3
    weight -30
    fall 2
    rise 1
}
vrrp_instance VI_1 {
    state MASTER
    interface ens160
    virtual_router_id 51
    priority 100
    advert_int 1
    nopreempt
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    virtual_ipaddress {
        10.0.0.100
    }
    track_script {
       nginx
    }
}

备节点keepalived配置:

! Configuration File for keepalived

global_defs {
   router_id LVS_DEVEL
   script_user root
}
vrrp_script nginx {
    script "/keepalived/check_nginx.sh"
    interval 3
    weight -30
    fall 2
    rise 1
}
vrrp_instance VI_1 {
    state BACKUP
    interface ens160
    virtual_router_id 51
    priority 90
    advert_int 1
    nopreempt
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    virtual_ipaddress {
        10.0.0.100
    }
    track_script {
       nginx
    }
}

check脚本 ,两台机器都需要创建。
存放目录 /etc/keepalived

#!/bin/bash
A=`ps -C nginx --no-header |wc -l`
if [ $A -eq 0 ];then
/usr/sbin/nginx
sleep 3
if [ `ps -C nginx --no-header |wc -l` -eq 0 ];then
systemctl stop keepalived.service
fi
fi

keepalived配置文件完成之后,需要启动keepalived
systemctl start keepalived 检查keepalived状态 systemctl status keepalived

这时候使用 ip a 查看IP地址:

怎么判断keepalived状态 查看keepalived状态的命令_nginx_02

怎么判断keepalived状态 查看keepalived状态的命令_IP_03

这时候会看到VIP在101机器上。

使用浏览器访问 VIP地址 http://10.0.0.100

检测keepalived是否启用

浏览器访问http://10.0.0.100,大概率是访问的101机器上的网页,显示出 node01;
进入 101机器,停止keepalived ,这时候VIP就会漂移到node02机器上。这样就是实现了业务的高可用。