目录

常用开源软件负载均衡器有:Nginx、LVS、Haproxy

LVS

Nginx

Haproxy

Haproxy的特性

常见负责均衡策略

RR(Round Robin)

LC(Least Connections)

SH(Source Hashing)

uri

url_param

rdp—cookie(name)

source

static-rr

Haproxy搭建Web群集

实验准备

Haproxy服务器部署(192.168.200.10)

添加haproxy 系统服务

Nginx

Haproxy集群日志重新定义


常用开源软件负载均衡器有:Nginx、LVS、Haproxy

LVS

  • 抗负载能力强。抗负载能力强、性能高,能达到F5硬件的60%;对内存和cpu资源消耗比较低
  • 工作在网络4层,通过vrrp协议转发(仅作分发之用),具体的流量由linux内核处理,因此没有流量的产生。
  • 稳定性、可靠性好,自身有完美的热备方案;(如:LVS+Keepalived)
  • 应用范围比较广,可以对所有应用做负载均衡;
  • 不支持正则处理,不能做动静分离。
  • 支持负载均衡算法:rr(轮循)、wrr(带权轮循)、lc(最小连接)、wlc(权重最小连接)
  • 配置 复杂,对网络依赖比较大,稳定性很高。

Nginx

  • 工作在网络的7层之上,可以针对http应用做一些分流的策略,比如针对域名、目录结构;
  • Nginx对网络的依赖比较小,理论上能ping通就就能进行负载功能;
  • Nginx安装和配置比较简单,测试起来比较方便;
  • 也可以承担高的负载压力且稳定,一般能支撑超过1万次的并发;
  • 对后端服务器的健康检查,只支持通过端口来检测,不支持通过url来检测。
  • Nginx对请求的异步处理可以帮助节点服务器减轻负载;
  • Nginx仅能支持http、https和Email协议,这样就在适用范围较小。
  • 不支持Session的直接保持,但能通过ip_hash来解决。、对Big request header的支持不是很好,
  • 支持负载均衡算法:Round-robin(轮循)、Weight-round-robin(带权轮循)、Ip-hash(Ip哈希)
  • Nginx还能做Web服务器即Cache功能。

Haproxy

  • 支持两种代理模式:TCP(四层)和HTTP(七层),支持虚拟主机;
  • 能够补充Nginx的一些缺点比如Session的保持,Cookie的引导等工作
  • 支持url检测后端的服务器出问题的检测会有很好的帮助。
  • 更多的负载均衡策略比如:动态加权轮循(Dynamic Round Robin),加权源地址哈希(Weighted Source Hash),加权URL哈希和加权参数哈希(Weighted Parameter Hash)已经实现
  • 单纯从效率上来讲HAProxy更会比Nginx有更出色的负载均衡速度。
  • HAProxy可以对Mysql进行负载均衡,对后端的DB节点进行检测和负载均衡。
  • 支持负载均衡算法:Round-robin(轮循)、Weight-round-robin(带权轮循)、source(原地址保持)、RI(请求URL)、rdp-cookie(根据cookie)
  • 不能做Web服务器即Cache。

Haproxy的特性

  • 可靠性和稳定性非常好,可以与硬件级的F5负载均衡设备相媲美
  • 最高可以同时维护40000-50000个并发连接,单位时间内处理的最大请求数为20000个,最大处理能力可达10Git/s
  • 支持多达8 种负载均衡算法,同时也支持会话保持
  • 支持虚拟主机功能,从而实现web负载均衡更加灵活
  • 支持连接拒绝、全透明代理等独特功能
  • 拥有强大的ACL支持,用于访问控制
  • 其独特的弹性二叉树数据结构,使数据结构的复杂性上升到了0(1),即数据的查询速度不会随着数据条目的增加而速度有所下降
  • 支持客户端的keepalive功能,减少客户端与haproxy的多次三次握手导致资源量费,让多个请求在一个tcp连接中完成
  • 支持TCP加速,零复制功能,类似于mmap机制
  • 支持响应池(response buffering)
  • 支持RDP协议
  • 基于源的粘性,类似于nginx的ip_hash功能,把来自同一客户端的请求在一定时间内始终调度到上游的同一服务器
  • 更好统计数据接口,其web接口显示后端冀全中各个服务器的接受、发送、拒绝、错误等数据的统计信息
  • 详细的健康状态检测,web接口中有关对上流服务器的健康检测状态,并提供了一定的管理功能
  • 基于流量的健康评估机制
  • 基于http认证
  • 基于命令行的管理接口
  • 日志分析器,可对日志进行分析

常见负责均衡策略

RR(Round Robin)

RR算法是最简单最常用的一种算法,即轮询调度

理解举例:有三个节点A、B、C

第一个用户访问会被指派到节点A
第二个用户访问会被指派到节点B
第三个用户访问会被指派到节点C
第四个用户访问继续指派到节点A,轮询分配访问请求实现负载均衡效果

LC(Least Connections)

最小连接数算法,根据后端的节点连接数大小动态分配前端请求

SH(Source Hashing)

基于来源访问调度算法,用于一些有Session会话记录在服务端的场景,可以基于来源的IP、Cookie等做集群调度

uri

表示根据请求的URI,做cdn需使用

url_param

表示根据HTTP请求头来锁定每 一 次HTTP请求。

rdp—cookie(name)

表示根据据cookie (name)来锁定并哈希每一次TCP请求。

source

表示根据请求的源IP,类似Nginx的IP hash机制。

static-rr

表示根据权重,轮询

Haproxy搭建Web群集

实验准备

Haproxy : 192.168.200.10
Ngixn1:192.168.200.13
Ngixn2:192.168.200.14

Haproxy服务器部署(192.168.200.10)

关闭防火墙,将安装Haproxy所需软件包传到/opt目录下

systemctl stop firewalld
setenforce 0
systemctl disable firewalld
yum -y install pcre-devel zlib-devel gcc gcc-c++ make
tar zxf haproxy-1.5.19.tar.gz
cd haproxy-1.5.19/
make TARGET=linux2628 ARCH=x86_64
make install

hive开启负债均衡 hive 负载均衡参数_服务器

hive开启负债均衡 hive 负载均衡参数_负载均衡_02

mkdir /etc/haproxy
cp examples/haproxy.cfg /etc/haproxy/
cd /etc/haproxy/
vim haproxy.cfg
cp /opt/haproxy-1.5.19/examples/haproxy.init /etc/init.d/haproxy
chmod +x /etc/init.d/haproxy
chkconfig --add /etc/init.d/haproxy
ln -s /usr/local/sbin/haproxy /usr/sbin/haproxy

hive开启负债均衡 hive 负载均衡参数_hive开启负债均衡_03

hive开启负债均衡 hive 负载均衡参数_hive开启负债均衡_04

hive开启负债均衡 hive 负载均衡参数_服务器_05

cd /etc/haproxy/
vim haproxy.cfg
global #全局配置,主要用于定义全局参数,属于进程级的配置,通常和操作系统配置有关
–4~5行–修改,定义haproxy日志输出设置和日志级别,local0为日志设备,默认存放到系统日志
log /dev/log local0 info #修改
log /dev/log local0 notice #修改
#log loghost local0 info
maxconn 4096 #最大连接数,需考虑ulimit -n限制,推荐使用10240
–8行–注释,chroot运行路径,为该服务自设置的根目录,一般需将此行注释掉
#chroot /usr/share/haproxy
uid 99 #用户UID
gid 99 #用户GID
daemon #守护进程模式
nbproc 1 #添加,设置并发进程数,建议与当前服务器CPU核数相等或为其2倍

defaults #配置默认参数,这些参数可以被用到Listen,frontend,backend组件
log global #引入global定义的日志格式
mode http #模式为http(7层代理http,4层代理tcp)
option httplog #日志类别为http日志格式
option dontlognull #不记录健康检查日志信息
retries 3 #检查节点服务器失败次数,连续达到三次失败,则认为节点不可用
redispatch #当服务器负载很高时,自动结束当前队列处理比较久的连接
maxconn 2000 #最大连接数,“defaults”中的值不能超过“global”段中的定义
#contimeout 5000 #设置连接超时时间,默认单位是毫秒
#clitimeout 50000 #设置客户端超时时间,默认单位是毫秒
#srvtimeout 50000 #设置服务器超时时间,默认单位是毫秒
timeout http-request 10s #默认http请求超时时间
timeout queue 1m #默认队列超时时间
timeout connect 10s #默认连接超时时间,新版本中替代contimeout,该参数向后兼容
timeout client 1m #默认客户端超时时间,新版本中替代clitimeout,该参数向后兼容
timeout server 1m #默认服务器超时时间,新版本中替代srvtimeout,该参数向后兼容
timeout http-keep-alive 10s #默认持久连接超时时间
timeout check 10s #设置心跳检查超时时间

–删除下面所有listen项–,添加
listen webcluster 0.0.0.0:80 #haproxy实例状态监控部分配置,定义一个名为webcluster的应用
option httpchk GET /index.html #检查服务器的index.html文件
balance roundrobin #负载均衡调度算法使用轮询算法roundrobin
server inst1 192.168.32.20:80 check inter 2000 fall 3 #定义在线节点
server inst2 192.168.32.30:80 check inter 2000 fall 3

参数说明
balance roundrobin #负载均衡调度算法
#轮询算法:roundrobin;最小连接数算法:leastconn;来源访问调度算法:source,类似于nginx的ip_hash

check inter 2000 #表示启用对此后端服务器执行健康检查,设置健康状态检查的时间间隔,单位为毫秒
fall 3 #表示连续三次检测不到心跳频率则认为该节点失效
若节点配置后带有“backup”表示该节点只是个备份节点,仅在所有在线节点都失效该节点才启用。不携带“backup”,表示为主节点,和其它在线节点共同提供服务。

添加haproxy 系统服务

cp /opt/haproxy-1.5.19/examples/haproxy.init /etc/init.d/haproxy
chmod +x /etc/init.d/haproxy
chkconfig --add /etc/init.d/haproxy
ln -s /usr/local/sbin/haproxy /usr/sbin/haproxy

(!!!!!!!!!注意,如果有nginx服务的话,一定要关闭nginx服务!!!!!!!!)

service haproxy start 或 /etc/init.d/haproxy start

hive开启负债均衡 hive 负载均衡参数_负载均衡_06

Nginx

nginx安装过程请看前面的博客~

Haproxy集群日志重新定义

默认haproxy的日志是输出到系统的syslog中,查看起来不是非常方便,为了更好的管理haproxy的日志,我们在生产环境中一般单独定义出来。需要将haproxy的info及notice日志分别记录到不同的日志文件中。

需要修改rsyslog配置,为了便于管理。将haproxy相关的配置独立定义到haproxy.conf,并放到/etc/rsyslog.d/下,rsyslog启动时会自动加载此目录下的所有配置文件。

vim /etc/haproxy/haproxy.cfg
#更改日志文件
global
	log /dev/log local0 info
	log /dev/log local0 notice
#重启haproxy服务
service haproxy restart
#为了便于管理将haproxy相关的配置独立定义到haproxy.conf
vim /etc/rsyslog.d/haproxy.conf
if ($programname == 'haproxy' and $syslogseverity-text == 'info')
then -/var/log/haproxy/haproxy-info.log
&~
if ($programname == 'haproxy' and $syslogseverity-text == 'notice')
then -/var/log/haproxy/haproxy-notice.log
&~
#将haproxy的info日志记录到/var/log/haproxy/haproxy-info.log下,将notice日志记录到/var/log/haproxy/haproxy-notice.log下
#“&~”表示当日志写入到日志文件后,rsyslog停止处理这个信息。
#重启服务
systemctl restart rsyslog.service

hive开启负债均衡 hive 负载均衡参数_Nginx_07

 然后重启服务

systemctl restart rsyslog.service

浏览器访问测试

hive开启负债均衡 hive 负载均衡参数_hive开启负债均衡_08

 

查看日志文件

cat /var/log/haproxy/haproxy-info.log

hive开启负债均衡 hive 负载均衡参数_Nginx_09

停止掉某个节点服务器,然后再刷新页面,开启节点服务器,则会产生haproxy-notice.log文件

使用tail -f /var/log/haproxy/haproxy-info.log命令可以追踪请求日志信息