高可用之Keepalived详解

原创

东丶 2017-02-22 11:39:27 博主文章分类：常用服务 ©著作权

文章标签 配置文件 HA 高可用 keepalived 文章分类 服务器

©著作权归作者所有：来自51CTO博客作者东丶的原创作品，请联系作者获取转载授权，否则将追究法律责任

原理简介

keepalived顾名思义是保持存活，常用来搭建设备的高可用，防止业务核心设备出现单点故障。keepalived基于VRRP协议来实现高可用，主要用作realserver的健康检查以及负载均衡主机和backup主机之间的故障漂移。如果将TCP/IP划分为5层，则Keepalived就是一个类似于3~5层交换机制的软件，具有3~5层交换功能。

其主要作用是检测服务器的状态，如果有一台web服务器死机，或工作出现故障，Keepalived将检测到，并将有故障的服务器从系统中剔除，同时使用其他服务器代替该服务器的工作，当服务器工作正常后Keepalived自动将服务器加入到服务器群中，实现自动剔除与恢复，不需要人工干涉，需要人工做的只是修复故障的服务器。

三层机理是发送ICMP数据包即PING给某台服务器，如果不通，则认为其故障，并从服务器群中剔除；四层机理是检测TCP端口号状态来判断某台服务器是否故障，如果检测端口存在异常，则从服务器群中剔除；五层机理是根据用户的设定检查某个服务器应用程序是否正常运行，如果不正常，则从服务器群中剔除。

安装

搞定依赖包：

# yum -y install kernel-devel openssl-devel popt-devel

下载keeplived：http://www.keepalived.org/software/keepalived-1.2.12.tar.gz

tar解包并且进入目录后执行

# ./configure --prefix=/ --with-kernel-dir=/usr/src/kernels/2.6.18-194.el5-i686 #进行配置，红色地方用table键补全。指定到/，配置文件会自动放到目录下，方便使用

必须看到以下提示，说明配置正确，才能继续安装。

Use IPVS Framework : Yes

IPVS sync daemon support : Yes

Use VRRP Framework : Yes

# make && make install #编译并安装

安装好后用chkconfig设为开机自动启动。

配置文件详解

keepalived配置项分为三类。全局配置、vrrpd配置、LVS配置（有LVS时用）

# vi keepalived.conf

! Configuration File for keepalived

global_defs {

notification_email { #指定keep在发生事件时，需要发送email到对象

sunny_jyd@163.com #设置报警邮件地址，可以设置多个，每行一个。注意，如果要开启邮件报警,需要开启本机的sendmail服务

}

notification_email_from root@example.com #设置邮件的发送地址

smtp_server 127.0.0.1 #设置email的smtp服务器地址

smtp_connect_timeout 30 #设置连接 smtp 服务器超时时间

router_id KeepMASTER #运行 Keepalived服务器的一个标识。发邮件时显示在邮件标题中的信息

}

notify_master "…" #进入（切换到）Master状态时要执行的脚本，可以是状态报警，也可是服务管理。格式为 $1脚本，可选$2group或 instance名，$3Master等状态

notify_backup "…" #进入Backup状态时要执行的脚本，可以是状态报警，也可是服务管理

notify_fault "…" #进入fault状态时要执行的脚本，可以是状态报警，也可是服务管理

notify_stop "…" #进入stop状态时要执行的脚本，可以是状态报警，也可是服务管理

vrrp_sync_group G1 { #不同网段的服务器定义为不同组。内外网都开启VRRP实例，配的只查内网，外网挂了，VRRPD仍认为自己健康，不会切换。把内外网实例都放在sync_group，任何实例故障都能切换。

group {

VI-1 #实例名

}

vrrp_instance VI_1 { #vrrp实例定义部分

state MASTER #指定 Keepalived 的角色，MASTER表示此主机是主用服务器，BACKUP表示是备用服务器。备份服务器上将 MASTER 改为 BACKUP。

interface eth0 #指定 HA监测网络的接口

virtual_router_id 51 #虚拟路由标识，这个标识是一个数字，并且同一个 vrrp 实例使用唯一的标识，即同一个 vrrp_instance下，MASTER 和 BACKUP必须是一致的。（0-255）

# garp_master_delay 1 #主从切换时间秒

priority 100 #定义优先级，数字越大，优先级越高，在一个 vrrp_instance下，MASTER的优先级必须大于 BACKUP 的优先级。备份服务上将 100 改为 50

advert_int 1 #设定MASTER 与 BACKUP负载均衡器之间同步检查的时间间隔，单位是秒

nopreempt #不抢占功能，故障修复后不会抢占，提升实时性和稳定性。这个配置只能设置在stat为backup的主机上，而且这个主机的priority必须比另一台高。

authentication { #设定验证类型和密码

auth_type PASS #设置验证类型，主要有 PASS和 AH 两种

auth_pass 1111 #设置验证密码，在一个 vrrp_instance下，MASTER 与 BACKUP必须使用相同的密码才能正常通信。

}

#track_interface { #设置额外的监控，里面那个网卡出现问题都会切换

# eth0

virtual_ipaddress { #设置虚拟 IP地址，可以设置多个虚拟IP地址，每行一个

192.168.200.254/24 dev eth0

}

# virtual_route { } #发生切换时，添加/删除路由

}

#虚拟服务器定义部分

#virtual_server_group <string> { #虚拟主机组，可选，让一台realserver上的某个server可以属于多个virtual_server，并且只做一次健康检查

# vip port

# fwmark <int>

virtual_server 192.168.200.254 80 { #设置虚拟服务器，需要指定虚拟 ip 地址和服务端口，ip 与端口之间用空格隔开。

delay_loop 6 #设置健康检查时间，单位是秒

lb_algo rr #设置负载调度算法，这里设置为 rr，即轮询算法，rr |wrr | lc |wlc |lblc |sh |dh

lb_kind DR #设置 LVS实现负载均衡的机制，可以有 NAT、TUN 和 DR三个模式可选。

# persistence_timeout 20 #回话保持时间（秒）

# persistence_granularity <netmask> #LVS会话保持颗粒度

protocol TCP #指定转发协议类型，有 tcp和 udp 两种

# virtualhost <string> #HTTP_GET做健康检查时，监察web服务器的虚拟主机（即HOST：头）

real_server 192.168.200.103 80 { #配置服务节点 1，需要指定 real server 的真实IP地址和端口，ip 与端口之间用空格隔开。

weight 1 #配置服务节点的权值，权值大小用数字表示，数字越大，权值越高，设置权值的大小可以为不同性能的服务器分配不同的负载，可以对性能高的服务器设置较高的权值，而对性能较低的服务器设置相对较低的权值，合理利用系统资源

# inhibit_on_failure #在健康检查失败挂了后，吧weight调为0，而不是在ipvsadm中删。

# notify_up（down） “” #检测到服务up或down时执行的脚本

#健康检查的方式：HTTP_GET | SSL_GET | TCP_CHECK | SMTP_CHECK | MISC_CHECK

TCP_CHECK { #realserve 的状态检测设置部分，单位是秒

connect_timeout 10 #10秒无响应超时

nb_get_retry 3 #重试次数

delay_before_retry 3 #重试间隔

connect_port 80 #测试连接的端口

}

real_server 192.168.200.104 80 { #配置服务节点 2，省略……

weight 1

TCP_CHECK {

connect_timeout 10

nb_get_retry 3

delay_before_retry 3

connect_port 80

}

vrrp_script check_httpd { #对集群中某服务进行监控。这里为httpd

#script “killall -0 httpd” #通过killall命令检测，-0参数为对程序监控。关闭或异常则返回状态码1。

script “</dev/tcp/127.0.0.1/80” #检测端口的运行状态。判断服务是否正常。（或者“”里加脚本路径）

interval 2 #检查的时间间隔。2秒

# weight 2 #脚本结果导致的优先级变更：2表示优先级+2；-2则表示优先级-2

fall 2 #若请求失败两次，认为此节点故障

rise 1 #若请求一次成功，认为此节点恢复正常

}

track_script {

check_httpd #监测http进程状态，（或Haproxy等）为vrrp_script 定义的名

}

#若使用weight，则选举时：

#weight值为正数，master上script检测失败，优先级和backup的weight+优先级比较。

成功，master和backup都用weight+优先级比较。

#weight值为负数，master上的script检测失败，优先级-weight和backup的优先级比较。

成功，优先级和backup的优先级比较。

上一篇：TCP三次握手建立链接与四次挥手断开链接

下一篇：集中化管理平台saltstack--原理及部署（1）

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯