haproxy各调度算法的实现方式及其应用场景
- 1. haproxy 静态调度算法
- 1.1 static-rr
- 1.2 first
- 2. haproxy 动态调度算法
- 2.1 roundrobin(默认)
- 2.2 leastconn
- 2.3 random
- 3. haproxy其他算法
- 3.1 source
- 3.2 map-base 取模法
- 3.3 一致性 hash
- 3.4 uri
- 3.5 url_param
- 3.6 hdr
- 3.7 rdp-cookie
- 4. 算法总结
- 4.1 各种算法使用协议
- 4.2 各种算法使用场景
- 5. 四层和七层负载均衡的特点
- 5.1 四层负载
- 5.2 七层代理
1. haproxy 静态调度算法
静态算法只能重启生效
后端服务器理论上无限
1.1 static-rr
基于权重的轮询调度,不支持运行时利用socat进行权重的动态调整(只支持0和1,不支持其它值)及后端服务器慢启动,其后端主机数量没有限制,相当于LVS中的 wrr
1.2 first
根据服务器在列表中的位置,自上而下进行调度,但是其只会当第一台服务器的连接数达到上限,新请求才会分配给下一台服务,因此会忽略服务器的权重设置,此方式使用较少
不支持用socat进行动态修改权重,可以设置0和1,可以设置其它值但无效
listen web_host
bind 192.168.31.7:80,:8801-8810,192.168.31.7:9001-9010
mode http
log global
balance first
server web1 192.168.31.17:80 maxconn 2 weight 1 check inter 3000 fall 2 rise 5
server web2 92.168.31.27:80 weight 1 check inter 3000 fall 2 rise 5
2. haproxy 动态调度算法
基于后端服务器状态进行调度适当调整,新请求将优先调度至当前负载较低的服务器,且权重可以在haproxy运行时动态调整无需重启。动态算法可以动态修改,使用socat实现
2.1 roundrobin(默认)
基于权重的轮询动态调度算法,支持权重的运行时调整,不同于lvs中的rr轮训模式,
HAProxy中的roundrobin支持慢启动(新加的服务器会逐渐增加转发数),其每个后端backend中最多支持4095个real server,支持对real server权重动态调整,roundrobin为默认调度算法,此算法使用广泛
2.2 leastconn
leastconn 加权的最少连接的动态,支持权重的运行时调整和慢启动,即:根据当前连接最少的后端服务器而非权重进行优先调度(新客户端连接),比较适合长连接的场景使用,比如:MySQL等场景。
2.3 random
在1.9版本开始增加 random的负载平衡算法,其基于随机数作为一致性hash的key,随机负载平衡对于大型服务器场或经常添加或删除服务器非常有用,支持weight的动态调整,weight较大的主机有更大概率获取新请求
3. haproxy其他算法
3.1 source
源地址hash,基于用户源地址hash并将请求转发到后端服务器,后续同一个源地址请求将被转发至同一个后端web服务器。此方式当后端服务器数据量发生变化时,会导致很多用户的请求转发至新的后端服务器,默认为静态方式,但是可以通过hash-type选项进行更改
这个算法一般是在不插入Cookie的TCP模式下使用,也可给不支持会话cookie的客户提供最好的会话粘性,适用于session会话保持但不支持cookie和缓存的场景
源地址有两种转发客户端请求到后端服务器的服务器选取计算方式,分别是取模法和一致性hash
3.2 map-base 取模法
取模法,对source地址进行hash计算,再基于服务器总权重的取模,最终结果决定将此
请求转发至对应的后端服务器。此方法是静态的,即不支持在线调整权重,不支持慢启动,可实现对后端服务器均衡调度。缺点是当服务器的总权重发生变化时,即有服务器上线或下线,都会因总权重发生变化而导致调度结果整体改变,hash-type 指定的默认值为此算法
3.3 一致性 hash
一致性哈希,当服务器的总权重发生变化时,对调度结果影响是局部的,不会引起大的变动,hash(o)mod n ,该hash算法是动态的,支持使用 socat等工具进行在线权重调整,支持慢启动
算法:
1、key1=hash(source_ip)%(2^32) [0---4294967295]
2、keyA=hash(后端服务器虚拟ip)%(2^32)
3、将key1和keyA都放在hash环上,将用户请求调度到离key1最近的keyA对应的后端服务器
hash环偏斜问题
增加虚拟服务器IP数量,比如:一个后端服务器根据权重为1生成1000个虚拟IP,再hash。而后端服务器权重为2则生成2000的虚拟IP,再进行hash运算,最终在hash环上生成3000个节点,从而解决hash环偏斜问题
3.4 uri
基于对用户请求的URI的左半部分或整个uri做hash,再将hash结果对总权重进行取模后,根据最终结果将请求转发到后端指定服务器,适用于后端是缓存服务器场景,默认是静态算法,也可以通过hash-type
指定map-based和consistent,来定义使用取模法还是一致性hash。
3.5 url_param
url_param对用户请求的url中的 params 部分中的一个参数key对应的value值作hash计算,并由服务器总权重相除以后派发至某挑出的服务器;通常用于追踪用户,以确保来自同一个用户的请求始终发往同一个real server,如果无没key,将按roundrobin算法
3.6 hdr
针对用户每个http头部(header)请求中的指定信息做hash,此处由 name 指定的http首部将会被取出并做hash计算,然后由服务器总权重取模以后派发至某挑出的服务器,如果无有效值,则会使用默认的轮询调度。
3.7 rdp-cookie
rdp-cookie对远windows远程桌面的负载,使用cookie保持会话,默认是静态,也可以通过hash-type指定map-based和consistent,来定义使用取模法还是一致性hash。
4. 算法总结
4.1 各种算法使用协议
#静态算法
算法 | 协议 |
static-rr | tcp/http |
first | tcp/http |
#动态算法
算法 | 协议 |
roundrobin | tcp/http |
leastconn | cp/http |
random | tcp/http |
#以下静态和动态取决于hash_type是否consistent
算法 | 协议 |
source | tcp/http |
Uri | http |
url_param | http |
hdr | http |
rdp-cookie | tcp |
4.2 各种算法使用场景
算法 | 作用 |
first | 使用较少 |
static-rr | 做了session共享的 web 集群 |
roundrobin | 做了session共享的 web 集群 |
random | 做了session共享的 web 集群 |
leastconn | 数据库 |
source | 基于客户端公网 IP 的会话保持 |
Ur | http #缓存服务器,CDN服务商,蓝汛、百度、阿里云、腾讯 |
url_param | http #可以实现session保持 |
hdr | 基于客户端请求报文头部做下一步处理 |
rdp-cookie | 基于Windows主机,很少使用 |
5. 四层和七层负载均衡的特点
5.1 四层负载
在四层负载设备中,把client发送的报文目标地址(原来是负载均衡设备的IP地址),根据均衡设备设置的选择web服务器的规则选择对应的web服务器IP地址,这样client就可以直接跟此服务器建立TCP连接并发送数据,而四层负载自身不参与建立连接,而和LVS不同,haproxy是伪四层负载均衡,因为haproxy需要分别和前端客户端及后端服务器建立连接
5.2 七层代理
七层负载均衡服务器起了一个反向代理服务器的作用,服务器建立一次TCP连接要三次握手,而client要访问Web Server要先与七层负载设备进行三次握手后建立TCP连接,把要访问的报文信息发送给七层负载均衡;然后七层负载均衡再根据设置的均衡规则选择特定的 Web Server,然后通过三次握手与此台Web Server建立TCP连接,然后Web Server把需要的数据发送给七层负载均衡设备,负载均衡设备再把数据发送给client;所以,七层负载均衡设备起到了代理服务器的作用,七层代理需要和Client和后端服务器分别建立连接