前言

         网上已经有很多相关文章,对各种概念介绍的比较清楚,也有各种详细的步骤,这里主要记录本要在ubuntu16.04下的布署过程,主要记录编译安装keepalived时遇到的坑及解决办法。

        可以参考的文章:

         Nginx+keepalived 高可用双机热备(主从模式/双主模式)

         LVS+KeepAlived+Nginx高可用实现方案

环境

     系统: ubuntu16.04

     keepalived: 2.0.15

     nginx:1.14.2

架构

       双机高可用方法目前分为两种:

      1)Nginx+keepalived 双机主从模式:即前端使用两台服务器,一台主服务器和一台热备服务器,正常情况下,主服务器绑定一个公网虚拟IP,提供负载均衡服务,热备服务器处于空闲状态;当主服务器发生故障时,热备服务器接管主服务器的公网虚拟IP,提供负载均衡服务;但是热备服务器在主机器不出现故障的时候,永远处于浪费状态,对于服务器不多的网站,该方案不经济实惠。

      2)Nginx+keepalived 双机主主模式:即前端使用两台负载均衡服务器,互为主备,且都处于活动状态,同时各自绑定一个公网虚拟IP,提供负载均衡服务;当其中一台发生故障时,另一台接管发生故障服务器的公网虚拟IP(这时由非故障机器一台负担所有的请求)。这种方案,经济实惠。

     下面分别是两种模式对应的架构示意图。需要说明的是,虽然每台服务器都配置了VIP,但正常情况下,对于每个VIP,同时只会有一台机器实际占用。

 

安装步骤

         说明:本文主要介绍安装keepalived时遇到的问题及解决办法,所以没有只用了两台机器,并没有介绍后端服务。另外这里只介绍了主从模式。

        主要的问题归纳:

        1. 需要从解压后的源码包去找 服务脚本,这是2.0之后的变化

          cp keepalived-2.0.15/keepalived/etc/init.d/keepalived /etc/init.d/ 

        2. 这个脚本里的默认路径配置不正确,需要针ubuntu做处理

        3. 这个脚本里的命令有问题,需要修改

 主从模式

  1. 安装nginx (两台都要安装)

apt-get update #更新包源


#安装gcc g++的依赖库、 pcre依赖库、 zlib依赖库、 openssl、libssl-dev

apt install build-essential

apt install libtool

apt install libpcre3 libpcre3-dev

apt install zlib1g-dev

apt install openssl libssl-dev


#下载nginx,解压

wget http://nginx.org/download/nginx-1.14.2.tar.gz

tar -zxvf nginx-1.14.2.tar.gz

cp -r nginx-1.14.2 /usr/local/src



#添加www用户,其中 -M参数表示不添加用户家目录,-s参数表示指定shell类型

useradd www -M -s /sbin/nologin


#配置nginx 并安装

cd /usr/local/src/nginx-1.14.2

./configure --prefix=/usr/local/nginx --user=www

make && make install


#配置测试页,可以方便识别内容来自哪台服务器,主上是come from master,从上是slave

echo "come from master" >/usr/local/nginx/html/test.html

#启动nginx

/usr/local/nginx/sbin/nginx

#访问

curl localhost/test.html

come from master #从上的话应该返回 come from slave.

 2.安装 keepalived

#解压并安装

tar zxvf keepalived-2.0.15.tar.gz

cp -r keepalived-2.0.15 /usr/local/src

cd /usr/local/src/keepalived-2.0.15/

./configure --prefix=/usr/local/keepalived

make && make install


  #使keepalived命令能直接使用

  cp /usr/local/keepalived/sbin/keepalived /sbin/

  # 创建配置文件并修改

  mkdir -p /etc/keepalived

  cp /usr/local/keepalived/etc/keepalived/keepalived.conf /etc/keepalived/

  vim /etc/keepalived/keepalived.conf

  为了测试方便,我的配置文件比较简单:

  cp /usr/local/keepalived/etc/keepalived/keepalived.conf /etc/keepalived/  

! Configuration File for keepalived


global_defs {

router_id kp_s1 #在一个网络应该是唯一的

}


vrrp_script chk_nginx {

script "/etc/keepalived/nginx_check.sh" #定时检查nginx是否正常运行的脚本

interval 2 #脚本执行间隔,每2s检测一次

weight -5 #脚本结果导致的优先级变更,检测失败(脚本返回非0)则优先级 -5

fall 2 #检测连续2次失败才算确定是真失败。会用weight减少优先级(1-255之间)

rise 1 #检测1次成功就算成功。但不修改优先级

}




vrrp_instance VI_1 {

#指定keepalived的角色,这里指定的不一定就是MASTER,实际会根据优先级调整,另一台为BACKUP

state MASTER

interface ens33 #当前进行vrrp通讯的网卡

virtual_router_id 200 #虚拟路由编号(数字1-255),主从要一致

# mcast_src_ip 192.168.79.191 #

priority 100 #定义优先级,数字越大,优先级越高,MASTER的优先级必须大于BACKUP的优先级

nopreempt

advert_int 1 #设定MASTER与BACKUP负载均衡器之间同步检查的时间间隔,单位是秒

authentication {

auth_type PASS

auth_pass 2222

}

#执行监控的服务。注意这个设置不能紧挨着写在vrrp_script配置块的后面(实验中碰过的坑),

#否则nginx监控失效!!

track_script {

chk_nginx #引用VRRP脚本,即在 vrrp_script 部分指定的名字。

#定期运行它们来改变优先级,并最终引发主备切换。

}


virtual_ipaddress {#VRRP HA 虚拟地址 如果有多个VIP,继续换行填写

192.168.79.210

}

}

      #创建检查nginx状态的脚本     

vim /etc/keepalived/nginx_check.sh

      脚本的内容如下(检查nginx运行):

#!/bin/bash

counter=`ps -C nginx --no-heading|wc -l`

echo "$counter"

if [ "${counter}" = 0 ]; then

/usr/local/nginx/sbin/nginx -c /usr/local/nginx/conf/nginx.conf

sleep 2

counter=`ps -C nginx --no-heading|wc -l`

if [ "${counter}" = 0 ]; then

/etc/init.d/keepalived stop

fi

fi

      #修改脚本权限,使其可以被执行

chmod +x /etc/keepalived/nginx_check.sh

3. 设置服务启动

  复制服务脚本

  cp keepalived-2.0.15/keepalived/etc/init.d/keepalived /etc/init.d/ 

  #注意:上面的服务启动脚本是在源文件目录,而不是安装目录(/usr/local/keepalived)下,这是2.0之后的变化。

  修正相关配置问题

   vim /etc/init.d/keepalived 可以看到下图内容,其中有3个地方有问题。

 

图中1:  由于 ubuntu下没有 /etc/rc.d/init.d/functions,需要为其建立软链接

 mkdir -p  /etc/rc.d/init.d

 ln -s /lib/lsb/init-functions /etc/rc.d/init.d/functions

图中2:拷贝相应文件的源配置文件

注释内容有介绍 ,这个源配置文件(在里面设置keepalived启动参数)

mkdir /etc/sysconfig

cp /usr/local/keepalived/etc/sysconfig/keepalived /etc/sysconfig/  

图中3:安装daemon,并修改命令

  1. 安装 daemon:  apt install daemon

  2. 图中3的命令 修改为daemon -- keepalived ${KEEPALIVED_OPTIONS}  #加了一个“--”

  说明:命令里的变量 ${KEEPALIVED_OPTIONS} 是在/etc/sysconfig/keepalived里设置的,默认内容如图。 

 

   这里的-D 代表记录详细日志。那么命令 daemon keepalived ${KEEPALIVED_OPTIONS}的结果是

   daemon keepalived -D

   这个命令是有问题的,其中的-D本来是给keepalived用的,但这样组合后被认为是daemon命令的参数。这会导致服务不能启动。  如果不修改,会提示启动失败,但却不输出具体信息。但可以通过查看 /var/log/syslog  找到错误信息

    $Starting keepalived: daemon: option requires an argument -- 'D' 。这是一个底层错误,所以只在系统日志里看到。

     执行  daemon --help, 可以看到帮助信息

       

    可以看出, daemon命令的-D参数是需要一个path参数的,所以会出现系统日志里的错误。

    由 usage: daemon [options] [--] [cm arg...],可知正确的命令格式应该是:daemon -- keepalived -D

    所以上面力中标示的第3处,应该修改为 daemon -- keepalived ${KEEPALIVED_OPTIONS}

    注意:每次修改/etc/init.d/keepalived后,需要重新运行 systemctl daemon-reload 重新加载服务脚本

    启动测试(两台都启动)    

 

systemctl daemon-reload #重新加载服务

service keepalived start #启动keealived服务

service keepalived status #可以查看运行状态

ip a #查看是否占用了VIP,只有主服务器可以占用,主有问题时,才会漂移到从服务器,并且从服务器状态变为MASTER


    如果启动出现问题,除了这里的输出信息,还可以通过 /var/log/syslog来查看问题

    正常状态是

       1) 在任意一台服务器上关闭nginx,会发现keepalived自动重启nginx

       2) 关闭任意一台服务器,VIP漂移到另一台服务器

       3)通过curl http://192.168.79.210/test.html 可以查看返回内容是来自主还是来自从。

           

更多细节和 双主模式,可以参考 ​​Nginx+keepalived 高可用双机热备(主从模式/双主模式)​