使用Haproxy搭建web群
- 1,常见的web集群调度器
- 2,Haproxy调度算法原理
- (1) Haproxy支持多种调度算法,最常用的有三种
- 3,案例:使用haproxy搭建web群集
- (1)Nginx的安装与启动
- (2)haproxy安装与启动
- (3)haproxy配置文件详解
- 3.1 haproxy配置文件通常分为三个部分
- 3.2 defaults配置项配置默认参数,一般会被应用组件继承
- 3.3 如果应用组建中没有特别声明,将按默认配置参数设置
- 3.4 listen配置项目一般为配置应用模块参数
- (4)配置与测试
- (5)haproxy日志管理
- (haproxy)参数优化
- 4. Haproxy案例实施搭建过程
- 主机要求
1,常见的web集群调度器
- 目前常见的web集群调度器分为软件和硬件
- 软件通常使用开源lvs,haproxy,nginx
- 硬件一般使用比较多的是f5,也有很多人使用国内的一些产品,如梭子鱼,绿盟等
三款比较:
- lvs在企业应用中抗负载能力很强,但存在不足
- LVS不支持正则处理,不能实现动静分离
- 对于大型网站,LVS的实施配置复杂,维护成本相对较高
- Haproxy是一款可提供高可用性,负载均衡,及基于TCP和HTTP应用的代理软件
- 适用于负载大的web站点
- 运行在硬件上可支持数以万计的并发连接的连接请求
2,Haproxy调度算法原理
(1) Haproxy支持多种调度算法,最常用的有三种
- 第一种:RR
+ RR算法是最简单最常用的一种算法,即轮询调度 - 理解举例
- 有三个节点a,b,c
- 第一个用户访问会被指派到节点A
- 第二个用户访问会被指派到节点B
- 第三个用户访问会被指派到节点C
- 第四个用户访问继续指派到节点A,轮询分配访问请求实现负载均衡效果
- 第二种:LC
- 最小连接数数算法,根据后端的节点连接数大小动态分配前段请求
- 理解举例
- 有三个节点A、B、C,各节点的连接数分别为A:4、B:5、C:6
- 第一个用户连接请求,会被指派到A上,连接数变为A:5、B:5、C:6
- 第二个用户请求会继续分配到A上,连接数变为A:6、B:5、C:6;再有新的请求会分配给B,每次将新的请求指派给连接数最小的客户端,由于实际情况下A、B、C的连接数会动态释放,很难会出现一样连接数的情况
- 此算法相比较rr算法有很大改进,是目前用到比较多的一种算法
- 第三种:SH
- 基于来源访问调度算法,用于一些有Session会话记录在服务器端的场景, 可以基于来源的IP、Cookie等做集群调度
- 理解举例
- 有三个节点A、B、C,第一个用户第一次访问被指派到了A,第二个用户第一-次 .访问被指派到了B
- 当第一个用户第二次访问时会被继续指派到A,第二个用户第二_次访问时依旧会 被指派到B,只要负载均衡调度器不重启,第- -个用户访问都会被指派到A,第二个用户访问都会被指派到B,实现集群的调度
- 此调度算法好处是实现会话保持,但某些IP访问量非常大时会引|起负载不均衡,部分节点访问量超大,影响业务使用
3,案例:使用haproxy搭建web群集
(1)Nginx的安装与启动
- 在两台网站服务器上安装nginx,并启动服务
- 使用源码编译的方式进行安装
- 关闭firewalld防火墙
- 安装基础软件包
- 增加系统用户账号nginx
- 编译安装nginx并启动
- 在两台nginx上配置测试网站,注意测试网页的内容应该不同,以便进行测试
(2)haproxy安装与启动
- 在负载均衡器上安装haproxy
- 安装步骤
- 安装基础软件包
- 编译安装haproxy
- 要注意操作系统版本,是32位系统还是64位
- 建立haproxy的配置文件
- 创建配置文件目录 /etc/haproxy
- 将源码包提供的配置文件样例haproxy.cfg复制到配置文件目录中
(3)haproxy配置文件详解
3.1 haproxy配置文件通常分为三个部分
- global:为全局配置
- defaults:为默认配置
- listen:为应用组件配置
- global配置参数
参数 | 说明 |
log 127.0.0.1 local0 | 配置日志记录,local0为日志设备,默认存放到系统日志 |
log 127.0.0.1 local notice | notice为日志级别,通常有24各级别 |
maxconn 4096 | 最大连接数 |
uid 99 | 用户 uid |
gid 99 | 用户 gid |
3.2 defaults配置项配置默认参数,一般会被应用组件继承
3.3 如果应用组建中没有特别声明,将按默认配置参数设置
- log global:定义日志为global配置汇总的日志定义
- mode http: 模式为http
- option httplog:采用http日志格式记录日志
- retries 3:检查节点服务器失败连续达到三次则认为节点不可用
- maxconn 2000:最大连接数
- contimeout 5000:连接超时时间
- clitimeout 50000:客户端超时时间
- clitimeout 50000:客户端超时时间
3.4 listen配置项目一般为配置应用模块参数
- listen appli4-backup 0.0.0.0:10004:定义一个appli4-backup的应用
- option httpchk /index.html:检查服务器的index.html文件
- option persist:强制将请求发送到已经down掉的服务器
- balance roundrobin:负载均衡调度算法使用轮询算法
- server inst1 192.168.114.56:80 check inter 2000 fall 3: 定义在节点
- server inst1 192.168.114.56:80 check inter 2000 fall 3 backup:定义在线节点
- server inst2192.168.114.56:81 check inter 2000 fall 3backup:定义备份节点
(4)配置与测试
- 根据实际的案例修改相应的参数
- …
- listen webcluster 0.0.0.0:80
- option httpchk GET/index.htmi
- option httpchk GET/index.htmi
- server inst1 192.168.10.61:80 check inter 2000 fall 3
- server inst2192.168.10.62:80 check inter 2000 fall 3
- 创建自启动脚本,并启动Haproxy服务
- 测试haproxy集群
- 测试高性能
- 可在两个不同的浏览器中分别访问两个测试网站,正常情况下应该出现两个网站的测试页面
- 高可用性
- 将其中一台nginx服务器停用,在客户端浏览器中访问haproxy,正常情况下应出现另外一台nginx服务器的网站测试页面
(5)haproxy日志管理
- 默认是输出到系统中的syslog中,生产环境中一般单独定义
- 定义的方法步骤
- 修改Haproxy配置文件中关于日志配置的选项,加入配置
- log ldev/log local0 info
- log ldevlog local0 notice
- 修改rsyslog配置,将Haproxy相关的配置独立定义到haproxy.conf,并放到/etc/rsyslog.d/下
- 保存配置文件并重启rsyslog服务,完成rsyslog配置
- 访问Haproxy集群测试网页并查看日志信息
(haproxy)参数优化
- ·随着企业网站负载增加,haproxy参数优化相当重要
- maxconn:最大连接数,根据应用实际情况进行调整,推荐使用10 240
- daemon:守护进程模式,Haproxy可以使用非守护进程模式启动,建议使用守护进程模式启动
- nbproc:负载均衡的并发进程数,建议与当前服务器CPU核数相等或为其2倍
- retries:重试次数,主要用于对集群节点的检查,如果节点多,且并发量大,设置为2次或3次
- .option http-server-close:主动关闭http请求选项,建议在生产环境中使用此选项
- timeout http-keep-alive:长连接超时时间,设置长连接超时时间,可以设置为10s
- timeout http-request: http请求超时时间,建议将此时间设置为5~10s,增加http连接释放速度
- timeout client:客户端超时时间,如果访问量过大,节点响应慢,可以将此时间设置短一些,建议设置为1min左右就可以了
4. Haproxy案例实施搭建过程
主机要求
- 用1台客户端,三台虚拟服务器搭建一套web集群
- 虚拟机安装centos 7.4 64位系统
主机 | 操作系统 | IP地址 | 主要软件 |
haproxy服务器 | centos7.4 x86_64 | 20.0.0.30 | haproxy |
nginx服务器1 | centos7.3 x86_64 | 20.0.0.20 | nginx |
nginx服务器2 | centos7.4 x86_64 | 20.0.0.10 | nginx |
客户端 | centos7.4 x86_64 | 20.0.0.50 | 浏览器 |
- nginx服务器1
yum -y install gcc gcc-c++ pcre-devel zlib-devel
useradd -M -s /sbin/nologin nginx //添加系统账号
tar zxf nginx-1.12.2.tar.gz
cd nginx-1.12.2/
./configure --prefix=/usr/local/nginx --user=nginx --group=nginx
make && make install
ln -s /usr/local/nginx/sbin/nginx /usr/local/sbin/ //优化命令路径
nginx //启动服务
nginx -t //检查配置文件和语法状态
echo "web1" > /usr/local/nginx/html/index.html
- nginx服务器2部署与1部署基本相同,不同点在于在设置测试网页内容的时候应该设置为不同
Haproxy服务器
yum -y install pcre-devel bzip2-devel make
tar zxf haproxy-1.4.24.tar.gz
cd haproxy-1.4.24/
make TARGET=linux26
make install
mkdir /etc/haproxy
cp examples/haproxy.cfg /etc/haproxy/
vi /etc/haproxy/haproxy.cfg
# this config needs haproxy-1.1.28 or haproxy-1.2.1
global
log /dev/log local0 info #配置日志记录,local0为日志设备,默认存放到系统日志
log /dev/log local0 notice #日志级别为 info、notice
#log loghost local0 info
maxconn 4096 #最大连接数
#chroot /usr/share/haproxy #注释掉,不让服务器从自己的目录获取,而从节点服务器
uid 99
gid 99
daemon
#debug
#quiet
defaults
log global #定义日志为global中的日志
mode http #模式为http
option httplog #采用http格式记录日志
option dontlognull
retries 3 #检查节点服务器失败三次后,判定节点不可用
#redispatch
maxconn 2000 #最大连接数
contimeout 5000 #连接超时时间
clitimeout 50000 #客户端超时时间
srvtimeout 50000 #服务器超时时间
listen webcluster 0.0.0.0:80 #当有访问80端口的请求则进行
# option httpchk GET /index.html #获取web服务器池中服务器的index.html文件
balance roundrobin #定义采用轮询算法
server web1 20.0.0.10:80 check inter 2000 fall 3 #定义在线节点服务器
server web2 20.0.0.20:80 check inter 2000 fall 3
注意: 配置文件主要改的是
注释掉下面两个
#chroot /usr/share/haproxy #注释掉,不让服务器从自己的目录获取,而从节点服务器
和
#redispatch
并且删除所有监听listen
增加
listen webcluster 0.0.0.0:80
option httpchk GET /index.html
balance roundrobin
server web1 20.0.0.10:80 check inter 2000 fall 3
server web2 20.0.0.20:80 check inter 2000 fall 3
cp examples/haproxy.init /etc/init.d/haproxy
vi /etc/init.d/haproxy
# chkconfig: - 85 15 #改为35
chmod 755 /etc/init.d/haproxy
chkconfig --add /etc/init.d/haproxy
ln -s /usr/local/sbin/haproxy /usr/sbin/haproxy
haproxy-1.4.24]# service haproxy start
systemctl enable haproxy
- 最后进行测试
在win10上与Linux下分别测调度服务器出现两个网页内容,说明配置成功