keepalived起初是为lvs设计的,专门用来监控集群中各个服务器节点的状态,后来加入了VRRP的功能,它的作用是解决静态路由出现的单点故障问题,它能够保证网络不间断、稳定的运行,综上所述,keepalived一方面具有健康监测的功能,另一方面也具有HA Cluster的功能,因此,可以通过这个软件可以搭建一个高可用的集群。

高可用集群有几种模式,这里就简单介绍一下。

高可用-主备模式:一个VIP或多个,一台主机对外提供服务,另外一台做备用机,当主服务器出现问题,备用服务器接管IP继续提供服务。

高可用-主主模式:二个VIP或多个,两台主机都对外提供服务,可以是同一个服务,也可以是不同的服务,这种模式提高了硬件的投入,也对负载均衡起到一定的效果

相信主备模式的网络上已经有很多可以参考的资料了,我这里就介绍一下高可用的主主模式。

先介绍一下我这里的环境:centos6.4 64位

master1 eth0:192.168.2.13 主VIP 192.168.2.10 备VIP 192.168.2.9

eth1: 192.168.1.10

master2 eth0:192.168.2.14 主VIP 192.168.2.9 备VIP 192.168.2.10

eth1: 192.168.1.11

出于测试方便,所以两台机器上分别安装nginx,实际生产环境我们也是在用的nginx,用什么其实都一样,本文主要介绍的是keepalived的双主高可用集群,nginx安装就不介绍了,很简单。

centos自带的yum源就有keepalived,所以利用yum安装就可以

#yum install -y keepalived (目前安装的是1.2.7的版本,官方最新的是1.2.9的)

下面开始配置,因为是双主模式,所以要配置2个不同的vrrp_instance,互为主备的,下面看一下我的配置文件。

! Configuration File for keepalived
global_defs {
notification_email {
13661122705@163.com #通知收件人地址,可以写换行写多个
}
notification_email_from root@localhost #发件人地址
smtp_server 127.0.0.1 #邮件smtp服务器地址
smtp_connect_timeout 30 #邮件smtp连接超时时间
router_id KEEPALIVED_TEST #运行Keepalived服务器的标识,自定义;发邮件时显示在邮件标题中的信息
}
vrrp_script notification { #定义一个外部脚本
script "/etc/keepalived/notification.sh" #脚本的路径
interval 1 #通知间隔
weight 2
}
vrrp_script chk_alive {
script "/etc/keepalived/chk_alive.sh"
interval 1
weight 2
}
vrrp_instance master1 {
state MASTER #角色{MASTER|BACKUP}
interface eth1 #HA监测的网卡
virtual_router_id 56 #虚拟路由ID;一组集群ID号必须一样
priority 100 #权重,BACKUP不能高于MASTER
advert_int 1 #检测时间间隔
garp_master_delay 1
authentication {
auth_type PASS #认证类型
auth_pass 1234 #认证密码,同一集群密码要一样
}
virtual_ipaddress { #定义虚拟IP地址,可以有多个
192.168.2.10
}
track_script { #定义状态跟踪
chk_alive #名称为vrrp_script中定义的
}
notify_master "/etc/keepalived/notification.sh master" #指定切换到Master状态时执行的脚本
notify_backup "/etc/keepalived/notification.sh backup" #指定切换到Backup状态时执行的脚本
notify_fault "/etc/keepalived/notification.sh fault" #指定切换到Fault状态时执行的脚本
}
vrrp_instance master2 {
state BACKUP
interface eth1
virtual_router_id 58
priority 90
advert_int 1
authentication {
auth_type PASS
auth_pass 4321
}
virtual_ipaddress {
192.168.2.9
}
track_script {
chk_alive
}
}

由于篇幅的问题,master2的配置就不贴出来了,只是把master改为backup,priority大小改一下就可以了,master的priority要大于backup的,这样就可以。

chk_alive.sh是检测nginx是否存活的脚本,notification.sh是切换主备时的通知脚本,地址为

http://down.51cto.com/data/1011113

http://down.51cto.com/data/1011116


其实本文主要阐述的不是配置,是要阐述一下keepalived的工作原理,只要懂得了原理,这些都不是很难,双主集群的原理是每一台服务器都有一个主的和一个备的,互为主备,如果是web应用,想要实现2台服务器都绑定一个域名,就需要利用dns轮询的方式来做,如果后端有web服务器,前端可以利用lvs或者其他的负载均衡软件,如果只有2台,每台上面都安装web程序就可以,只要保证2台服务器上的数据一致,就可以有效的减少故障时间,还要提到的一点是,高可用集群要考虑到连接2台服务器的交换机,如果交换机死掉了就会出现脑裂的情况,所以尽量要利用2块网卡做健康监测,最好有2台交换机。

以上文章可能不够详细,如果有不明白的地方可以发评论,我会很快的回复的,谢谢大家支持。