18.1 集群介绍
Linux集群根据功能划分为两大类:高可用和负载均衡。
高可用集群
高可用集群通常为2台服务器,一台工作,另一台作为冗余,当提供服务的机器宕机时,冗余将接替继续提供服务。 实现高可用的开源软件有:heartbeat、Keepalived,其中heartbeat已无人维护,所以今后使用Keepalived来搭建高可用集群。
负载均衡集群
负载均衡集群,需要有1台服务器作为分发器,它负责把用户的请求分发给后端的服务器处理,在这个集群里,除了分发器外就是给用户提供服务的服务器了,这些服务器数量至少为2台,所以负载均衡集群至少要3台服务器。 实现负载均衡的开源软件有:LVS、Keepalived、haproxy、nginx;商业软件有:F5、Netscaler。
18.2 Keepalived介绍
Keepalived通过VRRP(virtual router redundancy protocol)虚拟路由冗余协议来实现高可用。 在这个协议里会将多台功能相同的路由器组成一个小组,这个小组会有1个master角色和N(N≥1)个backup角色。 Keepalived有三个模块:core、check、vrrp。其中core模块为Keepalived的核心,负责主进程的启动、维护以及全局配置文件的加载和解析;check模块负责健康检查,vrrp负责实现vrrp协议。
18.3-18.5 用Keepalived配置高可用集群
操作环境:
两台虚拟机: 系统:centos 7.3_64位 master:192.168.8.131;编译安装nginx;yum install -y keepalived backup:192.168.8.130;yum install -y nginx;yum install -y keepalived VIP:192.168.8.100 注: VIP(virtual IP)虚拟IP,由Keepalived设置,用于服务器对外提供服务。
准备工作
master:
安装Keepalived: [root@adailinux ~]# yum install -y keepalived
查看nginx版本: [root@adailinux ~]# /usr/local/nginx/sbin/nginx -v nginx version: nginx/1.12.1 backup:
安装Keepalived: [root@localhost ~]# yum install -y keepalived
安装nginx: [root@localhost ~]# yum install -y nginx
查看nginx版本: [root@localhost ~]# nginx -v nginx version: nginx/1.10.2 开始配置
配置master机器:
配置Keepalived: 在此使用自定义的Keepalived配置文件脚本(先清空或删除自带配置文件脚本)。
[root@adailinux ~]# vim /etc/keepalived/keepalived.conf
global_defs {
notification_email {
aming@aminglinux.com
} #定义故障提醒邮件接收地址(本实验用不到)
notification_email_from root@aminglinux.com
smtp_server 127.0.0.1
smtp_connect_timeout 30
router_id LVS_DEVEL #定义故障提醒邮件发送地址(本实验用不到)
}
vrrp_script chk_nginx { #定义监控脚本
script "/usr/local/sbin/check_ng.sh" #指定服务健康检测(check)脚本
interval 3 #检测时间间隔
}
vrrp_instance VI_1 {
state MASTER #定义该服务的角色
interface ens33 #定义在本机中监听VIP的网卡
virtual_router_id 51 #虚拟路由id(同组中的服务器保持该id一致)
priority 100 #指定本机权重(决定优先级)
advert_int 1
authentication { #定义认证相关信息
auth_type PASS #认证类型为密码形式
auth_pass 123456 #定义认证密码
}
virtual_ipaddress { #定义VIP
192.168.188.100
}
track_script { #加载监控服务(脚本)
chk_nginx #注意此处服务名称要与上面监控脚本名称一致
}
}
创建监控脚本:
[root@adailinux ~]# vim /usr/local/sbin/check_ng.sh
#!/bin/bash
#时间变量,用于记录日志
d=date --date today +%Y%m%d_%H:%M:%S
#计算nginx进程数量
n=ps -C nginx --no-heading|wc -l
#如果进程为0,则启动nginx,并且再次检测nginx进程数量,
#如果还为0,说明nginx无法启动,此时需要关闭keepalived
if [ $n -eq "0" ]; then
/etc/init.d/nginx start
n2=ps -C nginx --no-heading|wc -l
if [ $n2 -eq "0" ]; then
echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
systemctl stop keepalived #在此停止Keepalived服务是为了避免发生脑裂
fi
fi
更改脚本权限: [root@adailinux ~]# chmod 755 /usr/local/sbin/check_ng.sh
启动Keepalived服务: [root@adailinux ~]# systemctl start keepalived
检测服务状态: [root@adailinux ~]# ps aux |grep keep root 4586 0.0 0.1 111708 1308 ? Ss 15:44 0:00 /usr/sbin/keepalived -D root 4587 0.1 0.2 111708 2556 ? S 15:44 0:00 /usr/sbin/keepalived -D root 4588 0.6 0.1 111708 1620 ? S 15:44 0:00 /usr/sbin/keepalived -D root 4682 0.0 0.0 112664 972 pts/1 S+ 15:45 0:00 grep --color=auto keep [root@adailinux ~]# ps aux |grep nginx root 3380 0.0 0.1 45352 1164 ? Ss 14:15 0:00 nginx: master process /usr/local/nginx/sbin/nginx -c /usr/local/nginx/conf/nginx.conf nobody 3381 0.0 0.4 47840 4064 ? S 14:15 0:00 nginx: worker process nobody 3382 0.0 0.3 47840 3804 ? S 14:15 0:00 nginx: worker process root 4696 0.0 0.0 112664 976 pts/1 R+ 15:45 0:00 grep --color=auto nginx [root@adailinux ~]# /etc/init.d/nginx stop Stopping nginx (via systemctl): [ 确定 ] [root@adailinux ~]# ps aux |grep nginx root 4814 0.0 0.1 45352 1184 ? Ss 15:46 0:00 nginx: master process /usr/local/nginx/sbin/nginx -c /usr/local/nginx/conf/nginx.conf nobody 4816 0.0 0.3 47840 3820 ? S 15:46 0:00 nginx: worker process nobody 4817 5.0 0.3 47840 3820 ? S 15:46 0:00 nginx: worker process root 4827 0.0 0.0 112664 976 pts/1 S+ 15:46 0:00 grep --color=auto nginx 注:由以上检测状态可知关闭nginx服务之后Keepalived会再次自动启动nginx服务 说明: “脑裂”,即当master宕机后仍然未释放VIP,同时backup接替master提供服务要使用同一VIP,因而导致两台机器争占同一VIP导致服务紊乱,所以当master宕机后需要关闭其Keepalived服务来避免脑裂现象发生。Keepalived服务的日志位置:/var/log/messages。 查看网卡信息:
[root@adailinux ~]# ip add 2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000 link/ether 00:0c:29:8a:1b:5c brd ff:ff:ff:ff:ff:ff inet 192.168.8.131/24 brd 192.168.8.255 scope global ens33 valid_lft forever preferred_lft forever inet 192.168.8.100/32 scope global ens33 valid_lft forever preferred_lft forever 说明: 在此不能使用ifconfig查看,ens33中增加了一个IP:192.168.8.100/32。
配置backup机器:
配置Keepalived: 同样使用自定义脚本。
[root@localhost ~]# vim /etc/keepalived/keepalived.conf
global_defs {
notification_email {
aming@aminglinux.com
}
notification_email_from root@aminglinux.com
smtp_server 127.0.0.1
smtp_connect_timeout 30
router_id LVS_DEVEL
}
vrrp_script chk_nginx {
script "/usr/local/sbin/check_ng.sh"
interval 3
}
vrrp_instance VI_1 { #只有该部分与master有区别
state BACKUP #角色
interface ens33
virtual_router_id 51
priority 90 #权重
advert_int 1
authentication {
auth_type PASS
auth_pass 123456
}
virtual_ipaddress {
192.168.8.100
}
track_script {
chk_nginx
}
}
说明: 如果是多台服务器,权重决定了master宕机后,backup接管master角色的顺序。
创建监控脚本:
[root@localhost ~]# vim /usr/local/sbin/check_ng.sh
#!/bin/bash
#时间变量,用于记录日志
d=date --date today +%Y%m%d_%H:%M:%S
#计算nginx进程数量
n=ps -C nginx --no-heading|wc -l
#如果进程为0,则启动nginx,并且再次检测nginx进程数量,
#如果还为0,说明nginx无法启动,此时需要关闭keepalived
if [ $n -eq "0" ]; then
systemctl start nginx
n2=ps -C nginx --no-heading|wc -l
if [ $n2 -eq "0" ]; then
echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
systemctl stop keepalived
fi
fi
更改脚本权限: [root@localhost ~]# chmod 755 /usr/local/sbin/check_ng.sh
启动Keepalived服务: [root@localhost ~]# systemctl start keepalived.service 说明: 该检测脚本中与master检测脚本的区别在于:systemctl start nginx,即nginx的启动方式,因为在backup服务器中是使用yum安装的nginx,默认添加到系统服务中。
测试
master宕机前:
master:
mark
backup:
mark
使用VIP访问:
mark 此时默认访问到master服务器。
master宕机后:
master宕机后该机器上的Keepalived服务必将关闭,此处模拟master服务器上的Keepalived关闭后的情景:
关闭Keepalived服务: [root@adailinux ~]# systemctl stop keepalived.service 查看master上IP状态:
[root@adailinux ~]# ip add 2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000 link/ether 00:0c:29:8a:1b:5c brd ff:ff:ff:ff:ff:ff inet 192.168.8.131/24 brd 192.168.8.255 scope global ens33 valid_lft forever preferred_lft forever inet6 fe80::65d2:adc:20d3:8c74/64 scope link valid_lft forever preferred_lft forever 说明: ens33上已经没有了VIP。
查看back上IP状态:
[root@localhost ~]# ip add 2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000 link/ether 00:0c:29:40:9f:e7 brd ff:ff:ff:ff:ff:ff inet 192.168.8.130/24 brd 192.168.8.255 scope global ens33 valid_lft forever preferred_lft forever inet 192.168.8.100/32 scope global ens33 valid_lft forever preferred_lft forever inet6 fe80::b61a:f99d:bfc0:e0b5/64 scope link valid_lft forever preferred_lft forever 说明: VIP转移到backup的ens33网卡上。然后使用浏览器访问VIP。
mark 即,master宕机后由backup继续提供服务。
注: 恢复master上的Keepalived服务后,会由master服务器为该集群提供服务。如下:
在master上操作: [root@adailinux ~]# systemctl start keepalived.service [root@adailinux ~]# ip add 2: ens33: inet 192.168.8.131/24 brd 192.168.8.255 scope global ens33 valid_lft forever preferred_lft forever inet 192.168.8.100/32 scope global ens33 valid_lft forever preferred_lft forever
在backup上:
[root@localhost ~]# ip add
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
link/ether 00:0c:29:40:9f:e7 brd ff:ff:ff:ff:ff:ff
inet 192.168.8.130/24 brd 192.168.8.255 scope global ens33
valid_lft forever preferred_lft forever
inet6 fe80::b61a:f99d:bfc0:e0b5/64 scope link
valid_lft forever preferred_lft forever
再次使用浏览器访问VIP:
mark
即,Keepalived——Nginx高可用集群搭建完成!!!