LVS+Keepalived



介绍

1、  LVS

LVS是一个开源的软件,可以实现LINUX平台下的简单负载均衡。LVS是Linux Virtual Server的缩写,意思是Linux虚拟服务器。目前有三种IP负载均衡技术(VS/NAT、VS/TUN和VS/DR);八种调度算法(rr,wrr,lc,wlc,lblc,lblcr,dh,sh)。


 

2、  keepalived

Keepalived 是运行在lvs 之上,是一个用于做双机热备(HA)的软件,它的主要功能是实现真实机的故障隔离及负载均衡器间的失败切换,提高系统的可用性。



运行原理

keepalived通过选举(看服务器设置的权重)挑选出一台热备服务器做MASTER机器,MASTER机器会被分配到一个指定的虚拟ip,外部程序可通过该ip访问这台服务器,如果这台服务器出现故障(断网,重启,或者本机器上的keepalived crash等),keepalived会从其他的备份机器上重选(还是看服务器设置的权重)一台机器做MASTER并分配同样的虚拟IP,充当前一台MASTER的角色。


选举策略


选举策略是根据VRRP协议,完全按照权重大小,权重最大(0~255)的是MASTER机器,下面几种情况会触发选举。

1. keepalived启动的时候;

2. master服务器出现故障(断网,重启,或者本机器上的keepalived crash等,而本机器上其他应用程序crash不算);

3.有新的备份服务器加入且权重最大。


 

配置实例

 

lvs_vip:

lvs1+keepalived主:

lvs2+keepalived备:

nginx1:

nginx2:


安装ipvsadm和keepalived

# yum -y install ipvsadm keepalived


 

修改keepalived主的配置

# vim /etc/keepalived/


global_defs{
notification_email{
               ******@         #报警接收人,多个写多行
        }
        notification_email_from ******@    #报警发件人
        smtp_server    #发送email时使用的smtp服务器地址
        smtp_connect_timeout 30   #smtp超时时间
        router_id LVS1      #表示运行keepalived服务器的一个标识,发邮件时显示在邮件主题的信息
}
#不使用SYNCGroup的话,如果路由有2个网段,一个内网,一个外网,每个网段开启一个VRRP实例,假设VRRP配置为检查内网,那么当外网出现问题时,VRRP会认为自己是健康的,则不会发送Master和Backup的切换,从而导致问题,SyncGroup可以把两个实例都放入SyncGroup,这样的话,Group里任何一个实例出现问题都会发生切换
vrrp_sync_group test {     
group{
        loadbalance
}
}
 
vrrp_instance loadbalance {
        state MASTER          #指定keepalived的角色,MASTER表示此主机是主服务器,BACKUP表示此主机是备用服务器
        interface eno16777736   #指定HA监测网络的接口
        lvs_sync_daemon_inteface eno16777736    #负载均衡器之间的监控接口,类似于HA HeartBeat的心跳线
        virtual_router_id 38    #虚拟路由标识,这个标识是一个数字,同一个vrrp实例使用唯一的标识。即同一vrrp_instance下,MASTER和BACKUP必须是一致的
        priority 100    #定义优先级,数字越大,优先级越高,在同一个vrrp_instance下,MASTER的优先级必须大于BACKUP的优先级
        advert_int 5   #定MASTER与BACKUP负载均衡器之间同步检查的时间间隔,单位是秒
authentication{
        auth_type PASS   #设置验证类型,主要有PASS和AH两种
        auth_pass 1111   #设置验证密码,在同一个vrrp_instance下,MASTER与BACKUP必须使用相同的密码才能正常通信
}
virtual_ipaddress{
           #设置虚拟IP地址,可以设置多个虚拟IP地址,每行一个
}
}
 
virtual_server  80 {     #设置虚拟服务器,需要指定虚拟IP地址和服务端口,IP与端口之间用空格隔开
        delay_loop 6    #设置运行情况检查时间,单位是秒
        lb_algo rr    #设置负载调度算法,这里设置为rr,即轮询算法
        lb_kind DR   #设置LVS实现负载均衡的机制,有NAT、TUN、DR三个模式可选
        #persistence_timeout 20   #会话保持时间,单位是秒。这个选项对动态网页是非常有用的,为集群系统中的session共享提供了一个很好的解决方案。
        protocol TCP   #指定转发协议类型,有TCP和UDP两种
        real_server  80 {    #配置服务节点1,需要指定realserver的真实IP地址和端口,IP与端口之间用空格隔开
        weight1   #配置服务节点的权值,权值大小用数字表示,数字越大,权值越高
        TCP_CHECK {
        connect_timeout 3   #表示3秒无响应超时
        nb_get_retry 3   #表示重试次数
        delay_before_retry 3  #表示重试间隔
}
}
        real_server  80 {
        weight 1
        TCP_CHECK {
        connect_timeout 3
        nb_get_retry 3
        delay_before_retry 3
}
}
}
 
virtual_server  443 {
        delay_loop 6
        lb_algo rr
        lb_kind DR
        #persistence_timeout 20
        protocol TCP
        real_server  443 {
        weight 1
        TCP_CHECK {
        connect_timeout 3
        nb_get_retry 3
        delay_before_retry 3
}
}
        real_server  443 {
        weight 1
        TCP_CHECK {
        connect_timeout 3
        nb_get_retry 3
        delay_before_retry 3
}
}
}


 

修改keepalived备的配置

基本都和主一样,只需要修改几处


stateBACKUP
priority99
router_idLVS2


 

在两台lvs服务器上开启路由转发功能


# vim /etc/
_forward = 1
# sysctl -p



 

添加realserver ip地址

# ipvsadm-A -t :80 -s rr
# ipvsadm-a -t :80 -r :80 -w 1
# ipvsadm-a -t :80 -r :80 -w 1
# ipvsadm-A -t :443 -s rr
# ipvsadm-a -t :443 -r :443 -w 1
# ipvsadm-a -t :443 -r :443 -w 1


查看


# ipvsadm -l


 

启动服务


# systemctl start keepalived
# systemctl enable keepalived


 

ipvsadm脚本


# vim /etc//ipvsadm


#!/bin/bash
#
#LVS script for VS/DR
#
#./etc///functions
#
VIP=
RIP1=
RIP2=
PORT1=80
PORT2=443
Algorithm=rr
Weight=1
#
case"$1" in
start)
#Since this is the Director we must be able to forward packets
#只是临时修改,重启机器或重启网卡失效
  echo 1 > /proc/sys/net/ipv4/ip_forward
#Clear all ipvsadm rules/services.
  /usr/sbin/ipvsadm -C
#Add an IP virtual service for VIP 
  /usr/sbin/ipvsadm -A -t $VIP:$PORT1 -s $Algorithm
#Now direct packets for this VIP to
#the real server IP (RIP) inside the cluster
  /usr/sbin/ipvsadm -a -t $VIP:$PORT1 -r $RIP1 -g -w $Weight
  /usr/sbin/ipvsadm -a -t $VIP:$PORT1 -r $RIP2 -g -w $Weight
#Add an IP virtual service for VIP 
  /usr/sbin/ipvsadm -A -t $VIP:$PORT2 -s $Algorithm
#Now direct packets for this VIP to
#the real server IP (RIP) inside the cluster
  /usr/sbin/ipvsadm -a -t $VIP:$PORT2 -r $RIP1 -g -w $Weight
  /usr/sbin/ipvsadm -a -t $VIP:$PORT2 -r $RIP2 -g -w $Weight
  /bin/touch /var/lock/subsys/ipvsadm &>/dev/null
;;
stop)
#Stop forwarding packets
  echo 0 > /proc/sys/net/ipv4/ip_forward
#Reset ipvsadm
  /usr/sbin/ipvsadm -C
# Bringdown the VIP interface
  /usr/sbin/route del $VIP
  /bin/rm -f /var/lock/subsys/ipvsadm
  echo "ipvs is stopped..."
;;
status)
  if [ ! -e /var/lock/subsys/ipvsadm ]; then
    echo "ipvsadm is stopped ..."
  else
    echo "ipvs is running ..."
    ipvsadm -L -n
  fi
;;
*)
  echo "Usage: $0{start|stop|status}"
;;
esac



添加开机启动


# vim /etc//
/etc//ipvsadm start
# chmod +x /etc//


 

relearserver端配置(nginx)

 

修改内核参数


# vim /etc/
 
_ignore=1
_announce=2
_ignore=1
_announce=2
_forward=0
 
# sysctl -p



配置虚拟IP地址

临时添加


# ifconfig lo:0  netmask  broadcast


永久添加

# vim /etc/sysconfig/network-scripts/ifcfg-lo:0
 
TYPE=Ethernet
BOOTPROTO=static
DEFROUTE=yes
PEERDNS=yes
PEERROUTES=yes
IPV4_FAILURE_FATAL=no
NAME=lo:0
DEVICE=lo:0
ONBOOT=yes
IPADDR=
NETMASK=


配置路由

临时添加


# route add -host  dev lo:0



永久添加

# vim /etc/sysconfig/network-scripts/route-lo:0
 dev lo:0


到此配置完成

 

测试

停止keepalived主,查看vip是否漂移到备,并测试是否可以正常访问

 

查看日志信息


# tail -f /var/log/messages


 

查看LVS当前设置


# watch ipvsadm -Ln


 

查看转发情况


# watch ipvsadm -Lnc


 

在测试中我发现,使用rr算法,一个用户的请求会被分发到两台nginx上,这并不是我想要的结果,大概看了一下lvs的八种算法,最后将rr替换为了sh(源地址散列),具体介绍自行百度,之后,同一个用户的请求可以被分发在同一台nginx上面了。

但是我又发现keepalived配置中有调度算法和权重,ipvsadm中也有调度算法和权重,这是不是会有冲突呢,会使用谁的算法。

经过测试,手动配置完keepalived和ipvsadm之后,例如:keepalived算法为sh,权重为3。ipvsadm算法为rr,权重为1。启动keepalived,ipvsadm -l 查看,发现算法替换为sh,权重为3。

手动将ipvsadm的配置修改,算法为rr,权重为1,keepalived不重启,ipvsadm -l 查看,配置生效,经测试,使用的是手动改动过后的配置。

所以这两个的配置要一样。

补充:后来突然想起既然keepalived启动,会替换掉配置的ipvsadm,也就是说如果不配置ipvsadm是不是也可以,我到网上一查,的确,keepalived已经集成了ipvsadm功能,所以应该不需要配置ipvsadm也可以,不过配置了也没有关系,所以没有在进行验证,有兴趣的可以验证一下不配置ipvsadm是否可以。

 

LVS负载均衡中arp_ignore和arp_annonuce参数配置的含义

arp_ignore:定义对目标地址为本地IP的ARP询问不同的应答模式0 
0 - (默认值): 回应任何网络接口上对任何本地IP地址的arp查询请求 
1 - 只回答目标IP地址是来访网络接口本地地址的ARP查询请求 
2 -只回答目标IP地址是来访网络接口本地地址的ARP查询请求,且来访IP必须在该网络接口的子网段内 
3 - 不回应该网络界面的arp请求,而只对设置的唯一和连接地址做出回应 
4-7 - 保留未使用 
8 -不回应所有(本地地址)的arp查询
arp_announce:对网络接口上,本地IP地址的发出的,ARP回应,作出相应级别的限制: 确定不同程度的限制,宣布对来自本地源IP地址发出Arp请求的接口 
0 - (默认) 在任意网络接口(eth0,eth1,lo)上的任何本地地址 
1 -尽量避免不在该网络接口子网段的本地地址做出arp回应. 当发起ARP请求的源IP地址是被设置应该经由路由达到此网络接口的时候很有用.此时会检查来访IP是否为所有接口上的子网段内ip之一.如果改来访IP不属于各个网络接口上的子网段内,那么将采用级别2的方式来进行处理. 
2 - 对查询目标使用最适当的本地地址.在此模式下将忽略这个IP数据包的源地址并尝试选择与能与该地址通信的本地地址.首要是选择所有的网络接口的子网中外出访问子网中包含该目标IP地址的本地地址. 如果没有合适的地址被发现,将选择当前的发送网络接口或其他的有可能接受到该ARP回应的网络接口来进行发送.


ipvsadm参数详解


# ipvsadm -h
 2008/5/15 (compiled with popt and IPVS )
Usage:
  ipvsadm -A|E -t|u|f service-address [-sscheduler] [-p [timeout]] [-M netmask] [--pe persistence_engine] [-bsched-flags]
  ipvsadm -D -t|u|f service-address
  ipvsadm -C
  ipvsadm -R
  ipvsadm -S [-n]
  ipvsadm -a|e -t|u|f service-address -rserver-address [options]
  ipvsadm -d -t|u|f service-address -rserver-address
  ipvsadm -L|l [options]
  ipvsadm -Z [-t|u|f service-address]
  ipvsadm --set tcp tcpfin udp
  ipvsadm --start-daemon state[--mcast-interface interface] [--syncid sid]
  ipvsadm --stop-daemon state
  ipvsadm -h
 
Options:
  --tcp-service -t service-address  service-address is host[:port]
  --udp-service -u service-address  service-address is host[:port]
  --fwmark-service  -f fwmark         fwmark is an integer greater than zero
  --ipv6        -6                   fwmark entryuses IPv6
  --scheduler   -s scheduler         one ofrr|wrr|lc|wlc|lblc|lblcr|dh|sh|sed|nq,
                                      thedefault scheduler is wlc.
  --pe            engine              alternate persistence engine maybe sip,
                                      not setby default.
  --persistent  -p [timeout]         persistentservice
  --netmask     -M netmask           persistentgranularity mask
  --real-server -r server-address   server-address is host (and port)
  --gatewaying  -g                   gatewaying(direct routing) (default)
  --ipip        -i                   ipip encapsulation (tunneling)
  --masquerading -m                   masquerading (NAT)
  --weight      -w weight            capacity ofreal server
  --u-threshold -x uthreshold        upperthreshold of connections
  --l-threshold -y lthreshold        lowerthreshold of connections
  --mcast-interface interface         multicast interface for connectionsync
  --syncid sid                        syncid for connectionsync (default=255)
  --connection  -c                   output ofcurrent IPVS connections
  --timeout                           output of timeout(tcp tcpfin udp)
  --daemon                            output of daemoninformation
  --stats                             output ofstatistics information
  --rate                              output of rateinformation
  --exact                             expand numbers(display exact values)
  --thresholds                        output of thresholdsinformation
  --persistent-conn                   output of persistentconnection info
  --nosort                            disable sortingoutput of service/server entries
  --sort                              does nothing, forbackwards compatibility
  --ops         -o                   one-packet scheduling
  --numeric     -n                   numericoutput of addresses and ports
  --sched-flags -b flags             schedulerflags (comma-separated)
 
 
 --add-service     -A        add virtual service with option  
  在内核的虚拟服务器表中添加一条新的虚拟服务器记录。也就是增加一台新的虚拟服务器  
  --edit-service    -E        edit virtual service with options  
  编辑内核虚拟服务器表中的一条虚拟服务器记录  
  --delete-service  -D        delete virtual service  
  删除内核虚拟服务器表中的一条虚拟服务器记录  
  --clear           -C        clear the whole table  
  清除内核虚拟服务器表中的所有记录  
  --restore         -R        restore rules from stdin  
  恢复虚拟服务器规则  
  --save            -S        save rules to stdout  
  保存虚拟服务器规则,输出为-R 选项可读的格式  
  --add-server      -a        add real server with options  
  在内核虚拟服务器表的一条记录里添加一条新的真实服务器  
  --edit-server     -e        edit real server with options  
  编辑一条虚拟服务器记录中的某条真实服务器记录  
  --delete-server   -d        delete real server  
  删除一条虚拟服务器记录中的某条真实服务器记录  
  --list            -L|-l     list the table  
  显示内核虚拟服务器表  
  --zero            -Z        zero counters in a service or all services  
  虚拟服务表计数器清零  
  --set tcp tcpfin udp        set connection timeout values  
  设置连接超时值  
  --start-daemon              start connection sync daemon  
  启动同步守护进程。他后面可以是master 或backup,用来说明LVS Router 是master 或是backup。在这个功能上也可以采keepalived 的VRRP 功能。  
  --stop-daemon               stop connection sync daemon  
  停止同步守护进程  
  --help            -h        display this help message  
  显示帮助信息
 
 
Options:  
  --tcp-service  -t service-address   service-address is host[:port]  
  说明虚拟服务器提供的是tcp 的服务[vip:port] or [real-server-ip:port]  
  --udp-service  -u service-address   service-address is host[:port]  
  说明虚拟服务器提供的是udp 的服务[vip:port] or [real-server-ip:port]  
  --fwmark-service  -f fwmark         fwmark is an integer greater than zero  
  说明是经过iptables 标记过的服务类型。  
  --scheduler    -s scheduler         one of rr|wrr|lc|wlc|lblc|lblcr|dh|sh|sed|nq,the default scheduler is wlc.  
  使用的调度算法,有这样几个选项,默认的调度算法是: wlc.  
  --persistent   -p [timeout]         persistent service  
  持久稳固的服务。这个选项的意思是来自同一个客户的多次请求,将被同一台真实的服务器处理。timeout 的默认值为300 秒  
  --netmask      -M netmask           persistent granularity mask  
    
  --real-server  -r server-address    server-address is host (and port)  
  真实的服务器[Real-Server:port]  
  --gatewaying   -g                   gatewaying (direct routing) (default)  
  指定LVS 的工作模式为直接路由模式(也是LVS 默认的模式  
  --ipip         -i                   ipip encapsulation (tunneling)  
  指定LVS 的工作模式为隧道模式  
  --masquerading -m                   masquerading (NAT)  
  指定LVS 的工作模式为NAT 模式  
  --weight       -w weight            capacity of real server  
  真实服务器的权值  
  --u-threshold  -x uthreshold        upper threshold of connections  
    
  --l-threshold  -y lthreshold        lower threshold of connections  
   
  --mcast-interface interface         multicast interface for connection sync  
  指定组播的同步接口  
  --syncid sid                        syncid for connection sync (default=255)  
   
  --connection   -c                   output of current IPVS connections  
  显示LVS 目前的连接 如:ipvsadm -L -c  
  --timeout                           output of timeout (tcp tcpfin udp)  
  显示tcp tcpfin udp 的timeout 值 如:ipvsadm -L --timeout  
  --daemon                            output of daemon information  
  显示同步守护进程状态  
  --stats                             output of statistics information  
  显示统计信息  
  --rate                              output of rate information  
  显示速率信息  
  --thresholds                        output of thresholds information  
    
  --persistent-conn                   output of persistent connection info  
    
  --sort                              sorting output of service/server entries  
   对虚拟服务器和真实服务器排序输出  
  --ops          -O                   one-packet scheduling  
    
  --numeric      -n                   numeric output of addresses and ports  
  输出IP 地址和端口的数字形式