对于Linux而言,搭建高可用性集群服务器环境的方案丰富多彩,因为有太多优秀的机制性软件供我们选择。今天我们来认识keepalived。
Keepalived简介:keepalived是一款失效转发机制的软件, 它的作用是检测web服务器的状态,如果有一台web服务器死机,或工作出现故障,Keepalived将检测到,并将有故障的web服务器从系统中剔除,当web服务器工作正常后Keepalived自动将web服务器加入到服务器群中,这些工作全部自动完成,不需要人工干涉,需要人工做的只是修复故障的web服务器。
Keepalived工作原理:
图中主服务器和备服务器都装了keepalived软件,将keepalived配置成Master的便成了主服务器,将keepaliv-ed配置成BACKUP的自然就成了备服务器。主备服务器都通过keepalived绑定有相同的虚拟ip,外界就是利用这个虚拟ip与服务器进行交互的。正常情况下只有主服务器work,当主服务器宕机或者出现其他故障时Keepalived会将work转移到备服务器上,虚拟ip依然有效。当主服务器修复好了备用服务器会自动将work权利重新交给主服务器。
Keepalived的作用:通过它的工作原理我们可以看出keepalived的作用:防止单点,故障转移一步到位,丝毫不影响外界与服务器之间的交互,对我们搭建高可用性的集群服务器有一定的帮助。
Keepalived安装配置:跟多数软件一样,keepalived也有源码安装、apt-get安装等多种安装方式。我用的是偷懒式的安装方式。(主备服务器用同样的安装方式)
安装:apt-get install keepalived //如果机器的外围配置没问题的话,这种安装方会非常的顺利。
配置:最重要的步骤当然是配置。keepalived的核心配置文件是keepalived.conf, 为了方便配置我们可以将它cp至/etc/keepalived/,下面展示的是配置成功的keep- alived.conf文件的部分,/etc/keepalived/keepalived.conf:
! Configuration File for keepalived
global_defs {
notification_email {
acassen@firewall.loc
failover@firewall.loc
sysadmin@firewall.loc
}
notification_email_from Alexandre.Cassen@firewall.loc
smtp_server 192.168.200.1
smtp_connect_timeout 30
router_id LVS_DEVEL
}
vrrp_instance VI_1 {
state MASTER // 这里决定本服务器是主还是备
interface eth0
virtual_router_id 51
priority 100
advert_int 1
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress { // 这里就是神奇的虚拟ip了,可以是一个或多个
192.168.20.16
192.168.20.17
192.168.20.18
}
}
……
……
后面的配置信息没有手动配置过,也没有研究过,就不写了。 需要说明的是,备份服务器上的配置文件跟主服务器上的配置文件并没有太大的差别。我仅仅是将MASTER改写成了SLAVE。当然,配置文件千变万化,它跟性能或者功能扩展都是直接挂钩的。
说明:想对参数进行理解,请参考此博客:http://blog.myspace.cn/e/406528085.htm
源码安装keepalived参照此博客:http://doc.chinaunix.net/linux/201003/442056.shtml
启动或者停止keepalived服务: /etc/init.d/keepalived start、restart、stop。只要提示OK并且运行到后台就表示启动成功了。当然主从都得启动。
说明:keepalived的配置模式除了MASTER<—>SLAVE外,还可以配置成MASTER<—>MASTER。
Keepalived测试: 主服务器:192.168.20.213(名称:root@serv3)
备服务器:192.168.20.214(名称:root@ubuntu-server211)
确定主从都起好keepalived服务后,在主服务器做如下测试:
一, 看看它们的工作机制:虚拟ip切换及work切换
----213(MASTER)的信息:
root@serv3:~# ip a
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 16436 qdisc noqueue
link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
inet 127.0.0.1/8 scope host lo
inet6 ::1/128 scope host
valid_lft forever preferred_lft forever
2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast qlen 1000
link/ether 00:16:ec:bc:2e:92 brd ff:ff:ff:ff:ff:ff
inet 192.168.20.213/24 brd 192.168.20.255 scope global eth0
//下面这片蓝色的ip都是配置在keepalived中虚拟ip。可以看到,keepalived服务启动后它们已经成功的绑定在了网卡上。
inet 192.168.20.16/32 scope global eth0
inet 192.168.20.17/32 scope global eth0
inet 192.168.20.18/32 scope global eth0
inet6 fe80::216:ecff:febc:2e92/64 scope link
valid_lft forever preferred_lft forever
root@serv3:~#
----214(SLAVE)的信息:
root@ubuntu-server211:~# ip a
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 16436 qdisc noqueue state UNKNOWN
link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
inet 127.0.0.1/8 scope host lo
inet6 ::1/128 scope host
valid_lft forever preferred_lft forever
2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
// 虽然在214上的keepalived也绑定了跟213相同的虚拟ip,不过作为SLAVE角色的214是不会跟MASTER的213一起工作的,所以此时网卡上并没有绑定虚拟ip
link/ether 00:25:11:e6:44:95 brd ff:ff:ff:ff:ff:ff
inet 192.168.20.214/24 brd 192.168.20.255 scope global eth0
inet6 fe80::225:11ff:fee6:4495/64 scope link
valid_lft forever preferred_lft forever
root@ubuntu-server211:~#
----我们将213(MASTER)的keepalived服务停掉,再来看ip a
root@serv3:~# /etc/init.d/keepalived stop
* Stopping keepalived keepalived [ OK ]
root@serv3:~# ip a
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 16436 qdisc noqueue
link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
inet 127.0.0.1/8 scope host lo
inet6 ::1/128 scope host
valid_lft forever preferred_lft forever
2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast qlen 1000
//当213(MASTER)上的keepalived服务停止之后,绑定在213上的虚拟ip也消失了。
link/ether 00:16:ec:bc:2e:92 brd ff:ff:ff:ff:ff:ff
inet 192.168.20.213/24 brd 192.168.20.255 scope global eth0
inet6 fe80::216:ecff:febc:2e92/64 scope link
valid_lft forever preferred_lft forever
root@serv3:~#
----213(MASTER) keepalived 停止后来看看 214(SLAVE)上面的ip a信息
root@ubuntu-server211:~# ip a
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 16436 qdisc noqueue state UNKNOWN
link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
inet 127.0.0.1/8 scope host lo
inet6 ::1/128 scope host
valid_lft forever preferred_lft forever
2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
link/ether 00:25:11:e6:44:95 brd ff:ff:ff:ff:ff:ff
inet 192.168.20.214/24 brd 192.168.20.255 scope global eth0
//发现了吗!虚拟ip已经跑在了214(SLAVE)上,因为213(MASTER)的keepalived此时处于停止状态。
inet 192.168.20.16/32 scope global eth0
inet 192.168.20.17/32 scope global eth0
inet 192.168.20.18/32 scope global eth0
inet6 fe80::225:11ff:fee6:4495/64 scope link
valid_lft forever preferred_lft forever
root@ubuntu-server211:~#
----当213(MASTER)修复好了,启动keepalived时,它们之间的work状态又会切换过来。
二,看看它对正常业务的影响
以访问两台机器上的glassfish服务器为例,Glassfish经常用来当作是web或者ejb项目的应用服务器。用Windows机器(192.168.20.19)当作客户端通过虚拟ip访问glassfish。
----213(MASTER) 214(SLAVE)的keepalived服务都启动正常时。
----当213(MASTER)的keepalived或者glassfish服务停止时。
----当214(SLAVE)的keepalive服务也停止时
测试结论:证明了keepalived工作原理的真确性。
测试过程中其中有两个虚拟ip跟本地同事的开发用Pc ip相同,所以访问不了。因为http默认访问的是本地的ip地址,而本地ip地址却没有开glassfish服务。这种问题在配置keepalived的时候是可以避免的,杜绝虚拟ip跟本地ip相同。