一 集群介绍

  • 根据功能划分为两大类:高可用和负载均衡
  • 高可用集群通常为两台服务器,一台工作,另外一台作为冗余,当提供服务的机器宕机,冗余将接替 继续提供服务
  • 实现高可用的开源软件有:heartbeat、keepalived
  • 负载均衡集群,需要有一台服务器作为分发器,它负责把用户的请求分发给后端的服务器处理,在这个集群里,除了分发器外,就是给用户提供服务的服务器了,这些服务器数量至少为2
  • 实现负载均衡的开源软件有LVS、keepalived、haproxy、nginx,商业的有F5、Netscaler

    二 keepalived 介绍

  • keepalived通过VRRP(Virtual Router Redundancy Protocl)来实现高可用。
  • 在这个协议里会将多台功能相同的路由器组成一个小组,这个小组里会有1个master角色和N(N>=1)个backup角色。
  • master会通过组播的形式向各个backup发送VRRP协议的数据包,当backup收不到master发来的VRRP数据包时,就会认为master宕机了。此时就需要根据各个backup的优先级来决定谁成为新的mater。
  • Keepalived要有三个模块,分别是core、check和vrrp。其中core模块为keepalived的核心,负责主进程的启动、维护以及全局配置文件的加载和解析,check模块负责健康检查,vrrp模块是来实现VRRP协议的。

    三 keepalived 配置高可用

    准备两台机器,ens33网卡ip为192.168.226.131和192.168.226.132,131作为master,132作为backup
    两台机器都安装keepalived
    执行yum install -y keepalived
    两台机器都事先安装好了nginx,用的是源码包安装,当然可以直接yum 安装

    yum install -y epel-release 
    yum install -y nginx

    1)master上操作
    编辑keepalived 配置文件,修改为以下内容

    vim /etc/keepalived/keepalived.conf
    global_defs {
    notification_email {
     admin@lvlinux.com   //接收通知邮件的邮箱
    }
    notification_email_from root@lvlinux.com   //发送通知邮件的邮箱
    smtp_server 127.0.0.1
    smtp_connect_timeout 30
    router_id LVS_DEVEL
    }
    vrrp_script chk_nginx {
    script "/usr/local/sbin/check_ng.sh"  // 定义检查nginx运行状况的脚本
    interval 3
    }
    vrrp_instance VI_1 {
    state MASTER
    interface ens33    // 定义vip 绑定的网卡
    virtual_router_id 51 
    priority 100  // vrrp 协议中各角色的权重
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass lvlinux
    }
    virtual_ipaddress {
        192.168.226.100   // 定义vip
    }
    track_script {
        chk_nginx
    }
    }

    创建nginx检查脚本

    vim /usr/local/sbin/check_ng.sh
    #!/bin/bash
    #时间变量,用于记录日志
    d=`date --date today +%Y%m%d_%H:%M:%S`
    #计算nginx进程数量
    n=`ps -C nginx --no-heading|wc -l`
    #如果进程为0,则启动nginx,并且再次检测nginx进程数量,
    #如果还为0,说明nginx无法启动,此时需要关闭keepalived
    if [ $n -eq "0" ]; then
        /etc/init.d/nginx start
        n2=`ps -C nginx --no-heading|wc -l`
        if [ $n2 -eq "0"  ]; then
                echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
                systemctl stop keepalived
        fi
    fi

    备注如果是yum 安装的nginx,脚本中nginx 启动命令更改为 systemctl start nginx
    更改脚本权限
    chmod 755 /usr/local/sbin/check_ng.sh
    以上操作完成后,启动keepalived服务
    systemctl start keepalived
    2)backup上操作
    跟主上操作基本一致,编辑keepalived配置文件,创建nginx检查脚本。
    区别在于 keepalived的配置文件要作相应更改,状态由主该为备,权重该一下。仅附上部分代码

    state BACKUP
    interface ens33
    virtual_router_id 51
    priority 90

    同样创建nginx 检查脚本后,给权限,然后启动keepalived 服务
    四 测试高可用
    1先看下vip 绑在哪里,在两台机器上分别执行ip addr, 发现vip 绑在主上
    Linux学习总结(五十三)keepalived 配置高可用
    2 关闭master上的nginx服务
    Linux学习总结(五十三)keepalived 配置高可用
    关闭nginx后,ps 查看进程发现,nginx还在,这是因为keepalived 调用了nginx的检查脚本,又把它启动起来了,如果nginx出现问题,无法启动,则会输出错误信息到脚本中定义的日志文件,同时发生主备切换。
    3 故意将master 上nginx的配置文件编辑错误,然后关闭nginx服务。再次查看会有什么变化
    发现vip 绑定到了备机上
    Linux学习总结(五十三)keepalived 配置高可用

分别查看主上的脚本错误日志,和从上的系统日志
192.168.226.131:cat /var/log/check_ng.log
Linux学习总结(五十三)keepalived 配置高可用
192.168.226.132: less /var/log/messages
Linux学习总结(五十三)keepalived 配置高可用
可以很清楚的看到 主上nginx 启动失败,备机接管master 状态。
4 最后进行访问测试 ,编辑主上的nginx默认页内容为hello world ,I'am from master
从上为hello world ,I'am from backup
在主上curl 访问vip
curl 192.168.226.100 , 关闭keepalived 再次访问
Linux学习总结(五十三)keepalived 配置高可用
备注,在检查脚本中,我们设定,当发现nginx无法启动时,输出错误信息到日志,紧接着会停掉宕机的keepalived服务,避免它继续掌管master。