18.1 集群介绍

Linux集群根据功能划分为两大类:高可用和负载均衡。

高可用集群

高可用集群通常为2台服务器,一台工作,另一台作为冗余,当提供服务的机器宕机时,冗余将接替继续提供服务。 实现高可用的开源软件有:heartbeat、Keepalived,其中heartbeat已无人维护,所以今后使用Keepalived来搭建高可用集群。

负载均衡集群

负载均衡集群,需要有1台服务器作为分发器,它负责把用户的请求分发给后端的服务器处理,在这个集群里,除了分发器外就是给用户提供服务的服务器了,这些服务器数量至少为2台,所以负载均衡集群至少要3台服务器。 实现负载均衡的开源软件有:LVS、Keepalived、haproxy、nginx;商业软件有:F5、Netscaler。

18.2 Keepalived介绍

Keepalived通过VRRP(virtual router redundancy protocol)虚拟路由冗余协议来实现高可用。 在这个协议里会将多台功能相同的路由器组成一个小组,这个小组会有1个master角色和N(N≥1)个backup角色。 Keepalived有三个模块:core、check、vrrp。其中core模块为Keepalived的核心,负责主进程的启动、维护以及全局配置文件的加载和解析;check模块负责健康检查,vrrp负责实现vrrp协议。

18.3-18.5 用Keepalived配置高可用集群

操作环境:

两台虚拟机: 系统:centos 7.3_64位 master:192.168.8.131;编译安装nginx;yum install -y keepalived backup:192.168.8.130;yum install -y nginx;yum install -y keepalived VIP:192.168.8.100 注: VIP(virtual IP)虚拟IP,由Keepalived设置,用于服务器对外提供服务。

准备工作

master:

安装Keepalived: [root@adailinux ~]# yum install -y keepalived

查看nginx版本: [root@adailinux ~]# /usr/local/nginx/sbin/nginx -v nginx version: nginx/1.12.1 backup:

安装Keepalived: [root@localhost ~]# yum install -y keepalived

安装nginx: [root@localhost ~]# yum install -y nginx

查看nginx版本: [root@localhost ~]# nginx -v nginx version: nginx/1.10.2 开始配置

配置master机器:

配置Keepalived: 在此使用自定义的Keepalived配置文件脚本(先清空或删除自带配置文件脚本)。

[root@adailinux ~]# vim /etc/keepalived/keepalived.conf global_defs { notification_email { aming@aminglinux.com
} #定义故障提醒邮件接收地址(本实验用不到) notification_email_from root@aminglinux.com smtp_server 127.0.0.1 smtp_connect_timeout 30
router_id LVS_DEVEL #定义故障提醒邮件发送地址(本实验用不到) } vrrp_script chk_nginx { #定义监控脚本 script "/usr/local/sbin/check_ng.sh" #指定服务健康检测(check)脚本 interval 3 #检测时间间隔 } vrrp_instance VI_1 {
state MASTER #定义该服务的角色 interface ens33 #定义在本机中监听VIP的网卡 virtual_router_id 51 #虚拟路由id(同组中的服务器保持该id一致) priority 100 #指定本机权重(决定优先级) advert_int 1
authentication { #定义认证相关信息
auth_type PASS #认证类型为密码形式 auth_pass 123456 #定义认证密码 } virtual_ipaddress { #定义VIP 192.168.188.100 } track_script { #加载监控服务(脚本) chk_nginx #注意此处服务名称要与上面监控脚本名称一致 } } 创建监控脚本:

[root@adailinux ~]# vim /usr/local/sbin/check_ng.sh #!/bin/bash #时间变量,用于记录日志 d=date --date today +%Y%m%d_%H:%M:%S #计算nginx进程数量 n=ps -C nginx --no-heading|wc -l #如果进程为0,则启动nginx,并且再次检测nginx进程数量, #如果还为0,说明nginx无法启动,此时需要关闭keepalived if [ $n -eq "0" ]; then /etc/init.d/nginx start n2=ps -C nginx --no-heading|wc -l if [ $n2 -eq "0" ]; then echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log systemctl stop keepalived #在此停止Keepalived服务是为了避免发生脑裂 fi fi

更改脚本权限: [root@adailinux ~]# chmod 755 /usr/local/sbin/check_ng.sh

启动Keepalived服务: [root@adailinux ~]# systemctl start keepalived

检测服务状态: [root@adailinux ~]# ps aux |grep keep root 4586 0.0 0.1 111708 1308 ? Ss 15:44 0:00 /usr/sbin/keepalived -D root 4587 0.1 0.2 111708 2556 ? S 15:44 0:00 /usr/sbin/keepalived -D root 4588 0.6 0.1 111708 1620 ? S 15:44 0:00 /usr/sbin/keepalived -D root 4682 0.0 0.0 112664 972 pts/1 S+ 15:45 0:00 grep --color=auto keep [root@adailinux ~]# ps aux |grep nginx root 3380 0.0 0.1 45352 1164 ? Ss 14:15 0:00 nginx: master process /usr/local/nginx/sbin/nginx -c /usr/local/nginx/conf/nginx.conf nobody 3381 0.0 0.4 47840 4064 ? S 14:15 0:00 nginx: worker process nobody 3382 0.0 0.3 47840 3804 ? S 14:15 0:00 nginx: worker process root 4696 0.0 0.0 112664 976 pts/1 R+ 15:45 0:00 grep --color=auto nginx [root@adailinux ~]# /etc/init.d/nginx stop Stopping nginx (via systemctl): [ 确定 ] [root@adailinux ~]# ps aux |grep nginx root 4814 0.0 0.1 45352 1184 ? Ss 15:46 0:00 nginx: master process /usr/local/nginx/sbin/nginx -c /usr/local/nginx/conf/nginx.conf nobody 4816 0.0 0.3 47840 3820 ? S 15:46 0:00 nginx: worker process nobody 4817 5.0 0.3 47840 3820 ? S 15:46 0:00 nginx: worker process root 4827 0.0 0.0 112664 976 pts/1 S+ 15:46 0:00 grep --color=auto nginx 注:由以上检测状态可知关闭nginx服务之后Keepalived会再次自动启动nginx服务 说明: “脑裂”,即当master宕机后仍然未释放VIP,同时backup接替master提供服务要使用同一VIP,因而导致两台机器争占同一VIP导致服务紊乱,所以当master宕机后需要关闭其Keepalived服务来避免脑裂现象发生。Keepalived服务的日志位置:/var/log/messages。 查看网卡信息:

[root@adailinux ~]# ip add 2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000 link/ether 00:0c:29:8a:1b:5c brd ff:ff:ff:ff:ff:ff inet 192.168.8.131/24 brd 192.168.8.255 scope global ens33 valid_lft forever preferred_lft forever inet 192.168.8.100/32 scope global ens33 valid_lft forever preferred_lft forever 说明: 在此不能使用ifconfig查看,ens33中增加了一个IP:192.168.8.100/32。

配置backup机器:

配置Keepalived: 同样使用自定义脚本。

[root@localhost ~]# vim /etc/keepalived/keepalived.conf global_defs { notification_email { aming@aminglinux.com } notification_email_from root@aminglinux.com smtp_server 127.0.0.1 smtp_connect_timeout 30 router_id LVS_DEVEL } vrrp_script chk_nginx { script "/usr/local/sbin/check_ng.sh" interval 3 } vrrp_instance VI_1 { #只有该部分与master有区别 state BACKUP #角色 interface ens33
virtual_router_id 51
priority 90 #权重 advert_int 1 authentication { auth_type PASS auth_pass 123456 } virtual_ipaddress { 192.168.8.100 }
track_script { chk_nginx }
}
说明: 如果是多台服务器,权重决定了master宕机后,backup接管master角色的顺序。

创建监控脚本:

[root@localhost ~]# vim /usr/local/sbin/check_ng.sh #!/bin/bash #时间变量,用于记录日志 d=date --date today +%Y%m%d_%H:%M:%S #计算nginx进程数量 n=ps -C nginx --no-heading|wc -l #如果进程为0,则启动nginx,并且再次检测nginx进程数量, #如果还为0,说明nginx无法启动,此时需要关闭keepalived if [ $n -eq "0" ]; then systemctl start nginx n2=ps -C nginx --no-heading|wc -l if [ $n2 -eq "0" ]; then echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log systemctl stop keepalived fi fi

更改脚本权限: [root@localhost ~]# chmod 755 /usr/local/sbin/check_ng.sh

启动Keepalived服务: [root@localhost ~]# systemctl start keepalived.service 说明: 该检测脚本中与master检测脚本的区别在于:systemctl start nginx,即nginx的启动方式,因为在backup服务器中是使用yum安装的nginx,默认添加到系统服务中。

测试

master宕机前:

master:

mark

backup:

mark

使用VIP访问:

mark 此时默认访问到master服务器。

master宕机后:

master宕机后该机器上的Keepalived服务必将关闭,此处模拟master服务器上的Keepalived关闭后的情景:

关闭Keepalived服务: [root@adailinux ~]# systemctl stop keepalived.service 查看master上IP状态:

[root@adailinux ~]# ip add 2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000 link/ether 00:0c:29:8a:1b:5c brd ff:ff:ff:ff:ff:ff inet 192.168.8.131/24 brd 192.168.8.255 scope global ens33 valid_lft forever preferred_lft forever inet6 fe80::65d2:adc:20d3:8c74/64 scope link valid_lft forever preferred_lft forever 说明: ens33上已经没有了VIP。

查看back上IP状态:

[root@localhost ~]# ip add 2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000 link/ether 00:0c:29:40:9f:e7 brd ff:ff:ff:ff:ff:ff inet 192.168.8.130/24 brd 192.168.8.255 scope global ens33 valid_lft forever preferred_lft forever inet 192.168.8.100/32 scope global ens33 valid_lft forever preferred_lft forever inet6 fe80::b61a:f99d:bfc0:e0b5/64 scope link valid_lft forever preferred_lft forever 说明: VIP转移到backup的ens33网卡上。然后使用浏览器访问VIP。

mark 即,master宕机后由backup继续提供服务。

注: 恢复master上的Keepalived服务后,会由master服务器为该集群提供服务。如下:

在master上操作: [root@adailinux ~]# systemctl start keepalived.service [root@adailinux ~]# ip add 2: ens33: inet 192.168.8.131/24 brd 192.168.8.255 scope global ens33 valid_lft forever preferred_lft forever inet 192.168.8.100/32 scope global ens33 valid_lft forever preferred_lft forever

在backup上:
[root@localhost ~]# ip add 2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000 link/ether 00:0c:29:40:9f:e7 brd ff:ff:ff:ff:ff:ff inet 192.168.8.130/24 brd 192.168.8.255 scope global ens33 valid_lft forever preferred_lft forever inet6 fe80::b61a:f99d:bfc0:e0b5/64 scope link valid_lft forever preferred_lft forever 再次使用浏览器访问VIP:

mark

即,Keepalived——Nginx高可用集群搭建完成!!!