keepalived 配置介绍

一、keeplived 简介

官方参考文档

用途

vrrp协议的软件实现,原生设计目的为了高可用ipvs服务

功能
  • 基于vrrp协议完成地址流动 ,为vip地址所在的节点生成ipvs规则(在配置文件中预先定义)
  • 为ipvs集群的各RS做健康状态检测
  • 基于脚本调用接口通过执行脚本完成脚本中定义的功能,进而影响集群事务,以此 支持nginx、haproxy等服务
协议

vrrp协议:Virtual Router Redundancy Protocol

工作方式

抢占式(默认),非抢占式

工作模式
  • 主/备:单虚拟路由器
  • 主/主:主/备(虚拟路由器1),备/主(虚拟路由器2)
术语
  • 虚拟路由器:Virtual Router
  • 虚拟路由器标识:VRID(0-255),唯一标识虚拟路由器
  • 物理路由器:
  • master:主设备
  • backup:备用设备
  • priority:优先级
  • VIP:Virtual IP
  • VMAC:Virutal MAC (00-00-5e-00-01-VRID)
二、keepalived 的安装

apt-get install keepalived

默认通过apt 或者yum 安装, keepalived -v 可以查看build参数 ,这些已经够用了,一般不用编译了

程序环境

  • 主配置文件:/etc/keepalived/keepalived.conf
    apt 安装没有默认的配置文件, 可以把范例的配置文件复制改一下就可以了
Mar 22 19:48:50 director Keepalived[2124]: Starting Keepalived v1.3.9 (10/21,2017)
Mar 22 19:48:50 director Keepalived[2124]: Unable to find configuration file /etc/keepalived/keepalived.conf (glob returned 3)
Mar 22 19:48:50 director Keepalived[2124]: Stopped Keepalived v1.3.9 (10/21,2017)
dpkg  -L keepalived |grep conf
/usr/share/doc/keepalived/samples/keepalived.conf.sample
  • 主程序文件:/usr/sbin/keepalived
  • servcie : /lib/systemd/system/keepalived.service
  • 系统参数文件: /etc/default/keepalived (service 文件中指定的)
三、keepalive 的配置

keepalived.conf 的组成部分

1. global_defs 全局配置
  • notification_email {
    root@localhost 发生故障切换时邮件发送的对象,可以按行区分写多个, 可以设为 用户名@主机名
    }
  • notification_email_from Alexandre.Cassen@firewall.loc 通知邮件的发送邮箱
  • smtp_server 192.168.200.1 发送邮箱的服务器地址
  • smtp_connect_timeout 30 连接邮件服务器的超时时长
  • router_id LVS_DEVEL 物理节点的标识符 ,一般设置与服务器的主机名相同
  • vrrp_skip_check_adv_addr 所有报文都检查比较消耗性能,此配置为如果收到的报文和上一个报文 是同一个路由器则跳过检查报文中的源地址
  • vrrp_strict 严格遵守VRRP协议,不允许状况:1,没有VIP地址,2.单播邻居,3.在VRRP版本2中有IPv6地 址
  • vrrp_garp_interval 0 #ARP报文发送延迟
  • vrrp_gna_interval 0 #消息发送延迟
  • vrrp_mcast_group4 224.0.0.18 #默认组播IP地址,224.0.0.0到239.255.255.255
2. vrrp_instance VI_1 虚拟路由实例
  • state MASTER|BACKUP:当前节点在此虚拟路由器上的初始状态,状态为MASTER或者BACKUP
  • interface IFACE_NAME:绑定为当前虚拟路由器使用的物理接口 ens32,eth0,bond0,br0
  • virtual_router_id VRID:当前虚拟路由器惟一标识,范围是0-255 (主备一致,多个节点必须相同 )
  • priority 100:当前物理节点在此虚拟路由器中的优先级;范围1-254
  • advert_int 1:vrrp通告的时间间隔,默认1s
  • authentication { # 认证机制
    auth_type AH|PASS 加密的方式
    auth_pass<PASSWORD> 验证密码 仅前8位有效
    }
  • virtual_ipaddress {
    #虚拟IP <IPADDR>/<MASK> brd <IPADDR> dev<STRING> scope <SCOPE> label <LABEL>
    192.168.200.17/24 dev eth1
    192.168.200.18/24 dev eth2 label eth2:1 (一块网卡有多个地址时,需要用子网接口)
    }
  • track_interface { #配置监控网络接口,一旦出现故障,则转为FAULT状态实现地址转移 eth0 eth1 … }
3. virtual_server lvs 相关的设置

默认的配置示例

virtual_server 10.10.10.2 1358  {   ip 端口
    delay_loop 6   检查后端服务器的时间间隔 6s
    lb_algo rr  定义调度方法  rr 
    lb_kind NAT 集群的类型
    persistence_timeout 50  持久连接时长(长链接设置,用于短时间内保存session ,一般不用这个,用redis)  
    protocol TCP  指定服务协议 

    sorry_server 192.168.200.200 1358

    real_server 192.168.200.2 1358 {
        weight 1   RS权重 
        HTTP_GET {  应用层检测 
            url {
              path /testurl3/test.jsp  定义要监控的URL 
              digest 640205b7b0fc66c1ea91c463fac6334d  对请求的页面进行hash运算,然后和这个hash码进行比对,如果hash码一样就表示状态正常
            }
            connect_timeout 3  连接超时时间
            retry 3  重试次数 
            delay_before_retry 3  重试之前的延迟时长     
        }
    }
}

lvs 相关设置主要分为 3 部分

  • vs 相关的设置
  • virtual server (虚拟服务)的定义 (virtual_server 可以设置多个)
  • virtual_server IP port #定义虚拟主机IP地址及其端口
  • virtual_server fwmark int #ipvs的防火墙打标,实现基于防火墙的负载均衡集群
  • virtual_server group string #将多个虚拟服务器定义成组,将组定义成虚拟服务
  • delay_loop <INT>:检查后端服务器的时间间隔
  • lb_algo rr|wrr|lc|wlc|lblc|sh|dh:定义调度方法
  • lb_kind NAT|DR|TUN:集群的类型
  • persistence_timeout <INT>: 持久连接时长
  • protocol TCP|UDP|SCTP:指定服务协议
  • sorry_server<IPADDR> <PORT>:所有RS故障时,备用服务器地址
  • rs 相关的设置
    real_server <IPADDR><PORT> {
    weight<INT> RS权重
    notify_up <STRING>|<QUOTED-STRING>RS上线通知脚本
    notify_down<STRING>|<QUOTED-STRING> RS下线通知脚本
    HTTP_GET|SSL_GET|TCP_CHECK|SMTP_CHECK|MISC_CHEC K { … } 定义当前主机的健康状态检测方法
    }
  • 后端服务器的健康性检查
    应用层检查 为了判断服务是否存在假死的情况,java相关的应用使用 与代码质量有关
HTTP_GET|SSL_GET:应用层检测 
HTTP_GET|SSL_GET { 

	url { path <URL_PATH>:定义要监控的URL 
		status_code <INT>:判断上述检测机制为健康状态的响应码 
		} 
	connect_timeout <INTEGER>:连接请求的超时时长
	nb_get_retry <INT>:重试次数 
	delay_before_retry <INT>:重试之前的延迟时长
	connect_ip <IP ADDRESS>:向当前RS哪个IP地址发起健康状态检测请求 
	connect_port <PORT>:向当前RS的哪个PORT发起健康状态检测请求 
	bindto <IP ADDRESS>:发出健康状态检测请求时使用的源地址 
	bind_port <PORT>:发出健康状态检测请求时使用的源端口 
}

4层检查 主要通过断状态码判端口是否存活 php、nginx 之类用tcp

TCP_CHECK { 
	connect_ip <IP ADDRESS>:向当前RS的哪个IP地址发起健康状态检测请求
	connect_port <PORT>:向当前RS的哪个PORT发起健康状态检测请求
	bindto <IP ADDRESS>:发出健康状态检测请求时使用的源地址
	bind_port <PORT>:发出健康状态检测请求时使用的源端口
	connect_timeout <INTEGER>:连接请求的超时时长 
}