【11.7】keepalived

  • 18.1 集群介绍
  • 18.2 keepalived 介绍
  • 18.3/18.4/18.5 用 keepalived 配置高可用集群


18.1 集群介绍

  • 根据功能划分为两大类:高可用和负载均衡
  • 高可用集群通常为两台服务器,一台工作,另外一台作为冗余,当提供服务的机器宕机,冗余将接替继续提供服务
  • 实现高可用的开源软件有:heartbeat、keepalived
  • 负载均衡集群,需要有一台服务器作为分发器,它负责把用户的请求分发给后端的服务器处理,在这个集群里,除了分发器外,就是给用户提供服务的服务器了,这些服务器数量至少为2
  • 实现负载均衡的开源软件有 LVS、keepalived、haproxy、nginx,商业的有 F5、Netscaler

18.2 keepalived 介绍

  • 在这里我们使用 keepalived 来实现高可用集群,因为 heartbeat 在 centos6 上有一些问题,影响实验效果
  • keepalived通过 VRRP(Virtual Router Redundancy Protocl)来实现高可用。
  • 在这个协议里会将多台功能相同的路由器组成一个小组,这个小组里会有1个 master 角色和N(N>=1)个backup角色。
  • master 会通过组播的形式向各个 backup 发送 VRRP 协议的数据包,当 backup 收不到master 发来的 VRRP 数据包时,就会认为 master 宕机了。此时就需要根据各个 backup 的优先级来决定谁成为新的 mater。
  • Keepalived 要有三个模块,分别是 core、check 和 vrrp。其中 core 模块为 keepalived 的核心,负责主进程的启动、维护以及全局配置文件的加载和解析,check 模块负责健康检查,vrrp 模块是来实现 VRRP 协议的。

18.3/18.4/18.5 用 keepalived 配置高可用集群

1、准备两台机器 130 和 132,130 为 master,132 为 backup
2、两台机器都安装 keepalived

[root@alexis-01 ~]# yum install -y keepalived
[root@alexis-02 ~]# yum install -y keepalived

3、两台机器都需要安装 nginx,130 之前已经编译安装过,132 需要 yum 安装

[root@alexis-02 ~]# yum install -y nginx

4、重新编辑主上的 /etc/keepalived/keepalived.conf

[root@alexis-01 ~]# mv /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak
[root@alexis-02 ~]# vim /etc/keepalived/keepalived.conf 
global_defs {
   notification_email {
     arslinux@arslinux.com
   }
   notification_email_from root@arslinux.com
   smtp_server 127.0.0.1
   smtp_connect_timeout 30
   router_id LVS_DEVEL
}

vrrp_script chk_nginx {
    script "/usr/local/sbin/check_ng.sh"
    interval 3
}

vrrp_instance VI_1 {
    state MASTER
    interface ens33
    virtual_router_id 51
    priority 100
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass aminglinux>com
    }
    virtual_ipaddress {
        192.168.194.100
    }

    track_script {
        chk_nginx
    }

}

参考链接:http://note.youdao.com/noteshare?id=196f3a77c4d99a8c21286d50704690b9&sub=EEAC512A00D54B3B98BFCB6E0B67DE26


notification_email 有问题,发邮件给哪个邮箱,可以不定义
notification_email_from 有问题用哪个邮箱发邮件,可以不定义
smtp_server 127.0.0.1
smtp_connect_timeout 30
router_id LVS_DEVEL 都可以不定义
vrrp_script chk_nginx 检测服务是否正常 interval 3 检测间断为3秒
vrrp_instance VI_1 master相关的配置
state 角色是master,如果是从的话就是 backup
interface 发送广播使用的网卡
virtual_router_id 路由id
priority 100 权重
authentication 认证相关信息
auth_type PASS 认证类型,密码形式
auth_pass 密码,定义一个字符串
virtual_ipaddress 主从共有ip,也就是vip,主宕机,从解析到该ip上去,两个主机都194段
track_script 加载脚本,之前定义的chk_nginx检查nginx


5、编辑检查 nginx 是否正常的脚本

[root@alexis-01 ~]# vim /usr/local/sbin/check_ng.sh
#!/bin/bash
#时间变量,用于记录日志
d=`date --date today +%Y%m%d_%H:%M:%S`
#计算nginx进程数量
n=`ps -C nginx --no-heading|wc -l`
#如果进程为0,则启动nginx,并且再次检测nginx进程数量,
#如果还为0,说明nginx无法启动,此时需要关闭keepalived
if [ $n -eq "0" ]; then
        /etc/init.d/nginx start
        n2=`ps -C nginx --no-heading|wc -l`
        if [ $n2 -eq "0"  ]; then
                echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
                systemctl stop keepalived
        fi
fi

执行ps -C nginx --no-heading|wc -l命令计算nginx进程数,如果进程数等于0,则说明nginx服务没有启动,那么需要启动nginx服务,启动之后再查看进程数值,如果还是0,说明nginx依然没有启动,那么需要写一个日期的错误提示到日志里,方便排查问题。之后停止keepalived,主keepalived一停,从就会自动起来服务,以免主从都有keepalived启动,产生紊乱,脑裂。

参考链接:https://note.youdao.com/ynoteshare1/index.html?id=17b7d082afd8d31b4fd5c48b5f93bcc1&type=note

6、给 /usr/local/sbin/check_ng.sh 更改权限 755

[root@alexis-01 ~]# chmod 755 /usr/local/sbin/check_ng.sh

7、启动 keepalived

[root@alexis-01 ~]# systemctl start keepalived
[root@alexis-01 ~]# ps aux|grep keepalived
root       8138  0.0  0.1 122980  1412 ?        Ss   22:43   0:00 /usr/sbin/keepalived -D
root       8139  0.0  0.3 133940  3328 ?        S    22:43   0:00 /usr/sbin/keepalived -D
root       8140  0.1  0.2 133880  2860 ?        S    22:43   0:00 /usr/sbin/keepalived -D
root       8174  0.0  0.0 112724   992 pts/0    R+   22:43   0:00 grep --color=auto keepalived

8、查看 nginx 是否会自动加载

[root@alexis-01 ~]# ps aux|grep nginx
root       7988  0.0  0.1  46052  1292 ?        Ss   21:48   0:00 nginx: master process /usr/local/nginx/sbin/nginx -c /usr/local/nginx/conf/nginx.conf
nobody     7989  0.0  0.3  48540  3932 ?        S    21:48   0:00 nginx: worker process
nobody     7990  0.0  0.3  48540  3932 ?        S    21:48   0:00 nginx: worker process
root       8357  0.0  0.0 112724   988 pts/0    R+   22:45   0:00 grep --color=auto nginx
[root@alexis-01 ~]# /etc/init.d/nginx stop
Stopping nginx (via systemctl):                            [  确定  ]
[root@alexis-01 ~]# ps aux|grep nginx
root       8395  0.0  0.0 112724   984 pts/0    S+   22:45   0:00 grep --color=auto nginx
[root@alexis-01 ~]# ps aux|grep nginx
root       8417  0.0  0.1  46052  1296 ?        Ss   22:45   0:00 nginx: master process /usr/local/nginx/sbin/nginx -c /usr/local/nginx/conf/nginx.conf
nobody     8421  0.0  0.3  48540  3932 ?        S    22:45   0:00 nginx: worker process
nobody     8422  0.0  0.3  48540  3932 ?        S    22:45   0:00 nginx: worker process
root       8466  0.0  0.0 112724   988 pts/0    R+   22:46   0:00 grep --color=auto nginx

9、https://blog.51cto.com/11530642/2096227
10、日志都在 /var/log/messages 下
11、vip 不能用 ipconfig 查看,只能用 ip add 看到

[root@alexis-01 ~]# ip add
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
       valid_lft forever preferred_lft forever
    inet6 ::1/128 scope host 
       valid_lft forever preferred_lft forever
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP group default qlen 1000
    link/ether 00:0c:29:24:ea:f2 brd ff:ff:ff:ff:ff:ff
    inet 192.168.194.130/24 brd 192.168.194.255 scope global noprefixroute ens33
       valid_lft forever preferred_lft forever
    inet 192.168.194.100/32 scope global ens33
       valid_lft forever preferred_lft forever
    inet 192.168.194.150/24 brd 192.168.194.255 scope global secondary noprefixroute ens33:0
       valid_lft forever preferred_lft forever
    inet6 fe80::c905:5e78:b916:41da/64 scope link noprefixroute 
       valid_lft forever preferred_lft forever
3: ens37: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP group default qlen 1000
    link/ether 00:0c:29:24:ea:fc brd ff:ff:ff:ff:ff:ff
    inet 192.168.100.1/24 brd 192.168.100.255 scope global noprefixroute ens37
       valid_lft forever preferred_lft forever
    inet6 fe80::f41:9da7:d8e3:10ba/64 scope link noprefixroute 
       valid_lft forever preferred_lft forever

12、配置之前,一定要检查防火墙主从 iptables 和 getenforce 是否关闭
13、编辑从上的配置文件 /etc/keepalived/keepalived.conf

[root@alexis-02 ~]# mv /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak
[root@alexis-02 ~]# vim /etc/keepalived/keepalived.conf 
global_defs {
   notification_email {
     aming@aminglinux.com
   }
   notification_email_from root@aminglinux.com
   smtp_server 127.0.0.1
   smtp_connect_timeout 30
   router_id LVS_DEVEL
}

vrrp_script chk_nginx {
    script "/usr/local/sbin/check_ng.sh"
    interval 3
}

vrrp_instance VI_1 {
    state BACKUP
    interface ens33
    virtual_router_id 51
    priority 90
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass aminglinux>com
    }
    virtual_ipaddress {
        192.168.194.100
    }

    track_script {
        chk_nginx
    }

}

参考链接:https://note.youdao.com/ynoteshare1/index.html?id=b12b72e89f72aca6896e4f250f7b4ce2&type=note


state 为BACKUP
virtual_router_id,vip 都和主一致
priority 主是100,从是90,要低于主


14、编辑检查 nginx 是否正常的脚本

[root@alexis-02 ~]# vim /usr/local/sbin/check_ng.sh
#!/bin/bash
#时间变量,用于记录日志
d=`date --date today +%Y%m%d_%H:%M:%S`
#计算nginx进程数量
n=`ps -C nginx --no-heading|wc -l`
#如果进程为0,则启动nginx,并且再次检测nginx进程数量,
#如果还为0,说明nginx无法启动,此时需要关闭keepalived
if [ $n -eq "0" ]; then
        systemctl start nginx
        n2=`ps -C nginx --no-heading|wc -l`
        if [ $n2 -eq "0"  ]; then
                echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
                systemctl stop keepalived
        fi
fi

如果nginx是yum 安装的,可以用systemctl start nginx为启动命令
参考链接:http://note.youdao.com/noteshare?id=abf23beadd51b4ec2a510b5e395f9d46&sub=C046236E7A14453FADEF8DADDD81C840

15、给 /usr/local/sbin/check_ng.sh 更改权限 755

[root@alexis-02 ~]# chmod 755 /usr/local/sbin/check_ng.sh

16、启动 keepalived

[root@alexis-02 ~]# systemctl start keepalived
[root@alexis-02 ~]# ps aux|grep keepalived
root       7836  0.0  0.1 122876  1412 ?        Ss   23:14   0:00 /usr/sbin/keepalived -D
root       7837  0.0  0.3 133836  3340 ?        S    23:14   0:00 /usr/sbin/keepalived -D
root       7838  0.0  0.2 133776  2872 ?        S    23:14   0:00 /usr/sbin/keepalived -D
root       7878  0.0  0.0 112724   992 pts/0    S+   23:14   0:00 grep --color=auto keepalived

17、检查从上的 nginx 是否启动

[root@alexis-02 ~]# ps aux|grep nginx
root       7813  0.0  0.2 125004  2108 ?        Ss   23:11   0:00 nginx: master process /usr/sbin/nginx
nginx      7814  0.0  0.3 125392  3148 ?        S    23:11   0:00 nginx: worker process
root       7976  0.0  0.0 112724   984 pts/0    R+   23:15   0:00 grep --color=auto nginx

18、浏览器访问主

keepalived安装包windows server keepalived版本_集群


此时访问的是主的默认虚拟服务器,在 nginx 中定义

keepalived安装包windows server keepalived版本_nginx_02


19、从上的默认页在 /usr/share/nginx/html/index.html ,将默认页改为 backup,backup

[root@arslinux-02 ~]# vim /usr/share/nginx/html/index.html 
backup,backup

20、浏览器访问从

keepalived安装包windows server keepalived版本_keepalived_03


21、ip add 查看从上 ip

[root@arslinux-02 ~]# ip add
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
       valid_lft forever preferred_lft forever
    inet6 ::1/128 scope host 
       valid_lft forever preferred_lft forever
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP group default qlen 1000
    link/ether 00:0c:29:14:4f:d9 brd ff:ff:ff:ff:ff:ff
    inet 192.168.194.132/24 brd 192.168.194.255 scope global noprefixroute ens33
       valid_lft forever preferred_lft forever
    inet6 fe80::4c99:ed43:5757:e772/64 scope link noprefixroute 
       valid_lft forever preferred_lft forever

22、浏览器访问 vip 192.168.194.100,实际上就是 master,vip 在 master 上

keepalived安装包windows server keepalived版本_nginx_04


23、测试高可用

测试1: 关闭 主上 nginx,会重新启动,因为 keepalived

测试2: 增加规则:iptables -I OUTPUT -p vrrp -j DROP,从上出现出现了 vip ,但 主上 vip 依然没有释放

keepalived安装包windows server keepalived版本_linux_05


keepalived安装包windows server keepalived版本_集群_06


访问 vip,依然是主上的默认虚拟服务器

测试3: 停止主上的 keepalived,主上的 vip 被释放了

keepalived安装包windows server keepalived版本_linux_07


keepalived安装包windows server keepalived版本_keepalived_08


keepalived安装包windows server keepalived版本_keepalived_09


此时访问 vip 则是 从上的默认虚拟服务器

测试4: 重启主上的 keepalived,访问 vip,马上回到了主上的默认虚拟服务器

keepalived安装包windows server keepalived版本_nginx_10


24、mysql 也可以弄高可用,但是要确保两边数据一致