一、集群介绍
- 根据功能划分为两大类:高可用和负载均衡;
- 高可用集群通常为两台服务器,一台工作,另外一台作为冗余,当提供服务的机器宕机,冗余将接替继续提供服务;
- 实现高可用的开源软件有:heartbeat、keepalived;
- 负载均衡集群,需要有一台服务器作为分发器,它负责把用户的请求分发给后端的服务器处理,在这个集群里,除了分发器外,就是给用户提供服务的服务器,这些服务器数量至少为2;
- 实现负载均衡的开源软件有LVS、keepalived、haproxy、nginx,商业的有F5、Netscaler。
二、用keepalived搭建高可用集群
- 在这里我们使用keepalived来实现高可用集群,因为heartbeat在centos6上有一个问题,影响实验效果
- keepalived通过VRRP(Virtual Router Redundancy Protocl)来实现高可用。
- 在这个协议里会将多台功能相同的路由器组成一个小组,这个小组里会有1个master角色和N(N>=1)个backup角色。
- master会通过组播的形式向各个backup发送VRRP协议的数据包,当backup收不到master发来的VRRP数据包时,就会认为master宕机了。此时就需要根据各个backup的优先级来决定谁成为新的mater。
- keepalived要有三个模块,分别是core、check和vrrp。其中core模块为keepalived的核心,负责主进程的启动、维护以及全局配置文件的加载和解析,check模块负责健康检查,vrrp模块是来实现VRRP协议的。
1、安装keepalived
- 准备两台机器128和129,130作为master,132作为backup
- 两台机器都执行
yum install -y keepalived
- 两台机器都安装nginx,其中128上已经编译安装过nginx,129上需要yum安装nginx:
yum install -y nginx
- 设定VIP为100(虚拟IP或者叫浮动IP),服务器靠这个VIP对外提供服务
2、配置master
a)编辑keepalived配置
[root@zlinux ~]# > /etc/keepalived/keepalived.conf //清空配置文件内容
[root@zlinux ~]# vim /etc/keepalived/keepalived.conf //添加以下内容
global_defs {
notification_email {
aaa@abc.com
}
#出现问题时发送邮件
notification_email_from root@zlinux.com
smtp_server 127.0.0.1
smtp_connect_timeout 30
router_id LVS_DEVEL
}
#上述自定义参数
vrrp_script chk_nginx {
script "/usr/local/sbin/check_ng.sh"
# 自定义脚本,该脚本为监控Nginx服务的脚本
interval 3
}
#检测脚本,检测时间3s一次
vrrp_instance VI_1 {
state MASTER
interface ens33
virtual_router_id 51
priority 100
advert_int 1
authentication {
auth_type PASS
auth_pass zlinux>com
}
virtual_ipaddress {
192.168.242.100
}
# 定义VIP
track_script {
chk_nginx
}
# 定义监控chk_nginx
}
b)定义监控Nginx服务脚本
[root@zlinux ~]# vim /usr/local/sbin/check_ng.sh //增加脚本,添加以下内容
#!/bin/bash
#时间变量,用于记录日志
d=`date --date today +%Y%m%d_%H:%M:%S`
#计算nginx进程数量
n=`ps -C nginx --no-heading|wc -l`
#如果进程为0,则启动nginx,并且再次检测nginx进程数量,
#如果还为0,说明nginx无法启动,此时需要关闭keepalived
if [ $n -eq "0" ]; then
/etc/init.d/nginx start
n2=`ps -C nginx --no-heading|wc -l`
if [ $n2 -eq "0" ]; then
echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
systemctl stop keepalived
fi
fi
[root@zlinux ~]# chmod 755 /usr/local/sbin/check_ng.sh
c)启动 keepalived服务
[root@zlinux ~]# systemctl start keepalived
[root@zlinux ~]# ps aux | grep keep
root 2739 0.0 0.0 120720 1400 ? Ss 13:12 0:00 /usr/sbin/keepalived -D
root 2740 0.0 0.1 127460 3260 ? S 13:12 0:00 /usr/sbin/keepalived -D
root 2748 0.0 0.1 122792 2380 ? S 13:12 0:00 /usr/sbin/keepalived -D
root 2750 0.0 0.0 112680 976 pts/0 R+ 13:12 0:00 grep --color=auto keep
[root@zlinux ~]# ps aux | grep nginx
root 865 0.0 0.1 46764 2872 ? Ss 10:49 0:00 nginx: master process /usr/local/ngin/sbin/nginx -c /usr/local/nginx/conf/nginx.conf
nobody 2606 0.0 0.2 48688 4608 ? S 12:15 0:00 nginx: worker process
nobody 2607 0.0 0.2 48688 4104 ? S 12:15 0:00 nginx: worker process
root 2752 0.0 0.0 112680 976 pts/0 R+ 13:12 0:00 grep --color=auto nginx
[root@zlinux ~]# ip add //如果没有出现100这个IP,可能是SELinux没有关闭
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN qlen 1
link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
inet 127.0.0.1/8 scope host lo
valid_lft forever preferred_lft forever
inet6 ::1/128 scope host
valid_lft forever preferred_lft forever
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
link/ether 00:0c:29:0c:74:aa brd ff:ff:ff:ff:ff:ff
inet 192.168.242.128/24 brd 192.168.242.255 scope global ens33
valid_lft forever preferred_lft forever
inet 192.168.242.100/32 scope global ens33
valid_lft forever preferred_lft forever
inet6 fe80::e335:85d4:68d:9b01/64 scope link
valid_lft forever preferred_lft forever
到这里说明master上已经大功告成。
2、配置backup
a)修改keepalived配置
[root@zlinux02 ~]# > /etc/keepalived/keepalived.conf //清空配置文件内容
[root@zlinux02 ~]# vim /etc/keepalived/keepalived.conf //添加以下内容,内容与master基本一直,state和priority有变化
global_defs {
notification_email {
aaa@abc.com
}
#出现问题时发送邮件
notification_email_from root@zlinux.com
smtp_server 127.0.0.1
smtp_connect_timeout 30
router_id LVS_DEVEL
}
#上述自定义参数
vrrp_script chk_nginx {
script "/usr/local/sbin/check_ng.sh"
# 自定义脚本,该脚本为监控Nginx服务的脚本
interval 3
}
#检测脚本,检测时间3s一次
vrrp_instance VI_1 {
state BACKUP
interface ens33
virtual_router_id 51
priority 90
advert_int 1
authentication {
auth_type PASS
auth_pass zlinux>com
}
virtual_ipaddress {
192.168.242.100
}
# 定义VIP
track_script {
chk_nginx
}
# 定义监控chk_nginx
}
b)添加Nginx服务监控脚本
[root@zlinux02 ~]# vim /usr/local/sbin/check_ng.sh //添加以下内容
#!/bin/bash
#时间变量,用于记录日志
d=`date --date today +%Y%m%d_%H:%M:%S`
#计算nginx进程数量
n=`ps -C nginx --no-heading|wc -l`
#如果进程为0,则启动nginx,并且再次检测nginx进程数量,
#如果还为0,说明nginx无法启动,此时需要关闭keepalived
if [ $n -eq "0" ]; then
/etc/init.d/nginx start
n2=`ps -C nginx --no-heading|wc -l`
if [ $n2 -eq "0" ]; then
echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
systemctl stop keepalived
fi
fi
[root@zlinux02 ~]# chmod 755 /usr/local/sbin/check_ng.sh
[root@zlinux02 ~]# systemctl start keepalived
3、测试
[root@zlinux html]# curl -I 192.168.242.100
HTTP/1.1 200 OK
Server: nginx/1.12.2
Date: Mon, 09 Apr 2018 07:00:49 GMT
Content-Type: text/html
Content-Length: 13
Last-Modified: Mon, 09 Apr 2018 06:16:24 GMT
Connection: keep-alive
ETag: "5acb0538-d"
Accept-Ranges: bytes
[root@zlinux html]# systemctl stop keepalived
[root@zlinux html]# curl -I 192.168.242.100 //这个就到slave上了
HTTP/1.1 200 OK
Server: nginx/1.12.2
Date: Mon, 09 Apr 2018 07:01:08 GMT
Content-Type: text/html
Content-Length: 15
Last-Modified: Mon, 09 Apr 2018 06:21:29 GMT
Connection: keep-alive
ETag: "5acb0669-f"
Accept-Ranges: bytes
master正常的情况下:
master出现问题: