下面介绍的是Linux集群
一、Linux集群基础
1、Linux集群类型:LB、HA、HP、DS
(1)、LB:负载均衡集群
缺陷:单点故障,其调度器会成为性能瓶颈
(2)、HA:高可用集群
平均无故障时间(MTBF)、平均故障修复时间(MTTR)。
有效值==MTBF/(MTBF+MTTR) -------------提高可用性公式
(3)、HP:高性能集群
(4)、DS:分布式系统集群
功能:分布式处理、分布式存储
2、Linux集群调度器:硬件(F5)、软件(lvs)。
3、负载均衡
(1)、传输层的负载均衡:四层交换
应用协议工具:lvs、nginx、haproxy
(2)、应用层的负载均衡:七层交换
应用协议工具:httpd、nginx、haproxy
(3)、FastCGI负载均衡:------------性能好,没httpd稳定
应用协议工具:httpd、nginx
(4)、mysql的负载均衡:
管理工具:mysql-proxy
二、lvs --------------Linux虚拟服务器
虚拟服务器:vs ------------调度器
真实服务器:rs(Real Server)----------后端服务器
CIP:客户端 ip,请求发送方 ip地址
VIP:虚拟服务器 ip,客户端访问的地址
DIP:调度器 ip
RIP:真实服务器的 ip
1、lvs基础
lvs是基于套接字(ip:port)来实现数据分发的。lvs,根据目标套接字,调度数据报文到后端真实服务器(rs)上,调度时,通过不同的算法来调度响应的服务器。
lvs使用的调度规则链:INPUT
iptables 和 lvs 的规则,不能同时使用,至少INPUT规则链不能同时使用。
lvs 的内核组件:ipvs ----------接收 ipvsadm 的管理命令,支持TCP、UDP、SCTP、AH、ESP、AH_ESP协议
用户空间工具为:ipvsadm ------------集群服务和 rs 管理
2、lvs的集群类型:lvs-nat、lvs-dr、lvs-tunnel。
(1)、lvs-nat -----------多目标IP地址的DNAT
client ---------> DIP ---------- >RIP ------------> RS(目标地址、目标端口)
(同一网段、私有IP)
具体步骤:
client ------> VIP --------> INPUT ------> DIP ------> RIP ------>RS
lvs-nat:(注意)
1、RIP和DIP在同一个网段,并应该是私有IP地址,RS的网关指向DIP。
2、请求报文和响应报文,都必须通过director转发器转发,易引发性能瓶颈、单点故障。
3、可以实现端口重定向,即VIP、DIP端口号可以不同。
4、vs必须是Linux系统,而RS可以是任意的操作系统。
(2)、lvs-dr(默认类型) ----------重要
dr:直接路由(注意判断网关)----------------响应报文不经过转发器
具体步骤:
client -------> 路由器 ----------> 交换机 ---------> VS -----------> RS ---------------> 交换机
(CIP+VIP) (RIP、DIP同一网段)
-------->路由器 ---------> client
步骤:
1、客户机将CIP+VIP(源CIP,目的VIP)报文发给路由器;
2、路由器将CIP+VIP报文发给交换机;
3、交换机根据目的地址为VIP,找到接收端为转发器VS;VS有VIP、DIP。
RS也有VIP地址,但是RS的arp_ignore=1/2,表示入栈接口为指定的接口,在此指定入栈接口为VS;
4、VS接收CIP+VIP报文,发现VIP地址是集群服务的,将报文中转给对应的RS;
VS有DIP接口、VIP标签接口(别名接口);
5、RS因为有VIP地址,所以能接收CIP+VIP报文;RS的VIP在环回接口上,不和外部通信;
即:CIP+VIP报文不是从RIP直接发送出去,而是通过一条这路由到VIP的环回接口上走一圈,使发送的源地址变为VIP;
6、RS发送VIP+CIP给交换机;
因为RS内,arp_announce=2,决定了出栈地址,在此指定出栈为对应交换机;
7、交互机转发VIP+CIP报文发送给路由器;
8、路由器再将VIP+CIP报文发送给客户端;
客户端接收到VIP+CIP报文,就像直接从VS发来的一样,不会意识到有RS的存在。
lvs-dr:(注意)
1、通过对请求报文封装一个数据链路层首部(MAC地址)。
2、重新封装的源MAC地址,是DIP所在网络的MAC地址。
目的MAC地址,是调度选出来的RS的RIP接口的MAC地址。
3、源IP地址和源PORT,目的IP地址和目的PORT,在整个报文转发过程中保持不变
4、交换机 -------> VS:将目标地址为VIP的报文发往VS,方法:在路由器上静态绑定IP地址和MAC地址。
交换机 --------> RS:交换机到RS的方法,有两种:在RS上使用arptables,RS的内核参数(arp_announce、arp_ignore)
5、不支持端口重定向
6、RS为Linux
7、RS上必须配置RIP和VIP,并且VIP应该配置在lo接口的lable上
(3)、lvs-tun ----------只经过一次VS
tunnel:隧道封装,VS和RS之间的数据传输。
不修改请求报文的ip首部(CIP/VIP),而是在之外再封装一个IP首部(DIP/RIP)。
具体步骤:
client ----------> VS --------> RS ---------> client(只经过一次VS)
lvs-tun:(注意)
1、CIP,VIP,DIP,RIP都应该是公有IP地址
2、RS的网关无法指向DIP,因此响应报文不会经过Director转发,而是直接发往CIP
3、不支持端口重定向
4、RS必须支持隧道协议
5、RS上必须配置RIP和VIP
(4)、lvs-fullnat -----------非标准类型(VS的开销更大,但可增加一定的安全性)
同时修改请求报文的源IP地址、目的IP地址,实现报文转发。
CIP --------->DIP
VIP --------->RIP
即:CIP/VIP -------> DIP/RIP
lvs-fullnat:(注意)
1、CIP、VIP为公有地址,DIP、RIP为私有地址。DIP、RIP可不在同一网段。
2、RS对收到的请求报文的响应报文的目的地址是DIP,所以请求报文和响应报文都必须经过Director
3、支持端口重定向
3、lvs的调度算法
根据是否与RS的负载状态有关,分为:静态算法(无关)、动态算法(有关)。
(1)、静态算法:与算法本身有关
RR:轮询算法
WRR:加权轮询算法
SH:源地址哈希算法(源地址绑定)
DH:目标地址哈希(正向代理服务器) ---------缓存方式实现
(2)、动态算法:与RS当前负载状态有关,RS的负载:Overhead。
LC:最少连接数算法(选择Overhead值小的)------------存在【起点问题】
*WLC(默认算法):加权最小连接算法 -------------存在【起点问题】
SED:最短期望延迟算法 -------------解决了起点问题,存在【连续请求问题】
NQ:无序列排队算法 ------------开始据RS权重依次分配一个,保证一个活动连接,然后再SED
LBLC:基于本地的最少连接数算法 ----------------动态DH(正向代理)
LBLCR:带有复制功能的LBLC算法 ------------带复制的动态DH(正向代理)
4、ipvsadm -------------编写ipvs规则
ipvs规则:作用于内核空间的TCP/IP协议栈上 -------------INPUT链上
ipvsadm命令:
(1)、集群相关
【添加】集群相关格式:
ipvsadm -A -t|u|f service-address [-s scheduler] [-p [timeout]]
常用选项:
-t:基于TCP的集群,其后地址为VIP地址
-u:基于UDP的集群,其后地址为VIP地址
-f:基于防火墙标记的集群,其后地址为mangle表中的标记
-s:集群调度算法
-p:持久连接
【修改】集群格式:ipvsadm -E -t|u|f service-address [-s scheduler] [-p [timeout]]
常用选项:
-E:删除集群
【删除】集群格式:ipvsadm -D -t|u|f service-address
常用选项:
-D:删除指定集群
【清除】集群:ipvsadm -C
常用选型:
-C:清空集群,所有清空
(2)、集群中的RS相关:
【添加】RS:ipvsadm -a -t|u|f service-address -r server-address [-g|i|m] [-w weight]
常用选项:
-r:添加的RS的,IP地址和端口
-w:权重
-g:dr集群 ----------默认
-i:tunnel集群
-m:nat集群
【修改】其中的RS:ipvsadm -e -t|u|f service-address -r server-address [-g|i|m] [-w weight]
常用选项:
-e:修改集群中RS
【删除】其中的RS:ipvsadm -d -t|u|f service-address -r server-address
常用选项:
-d:删除集群中的RS
(3)、查看集群信息
格式:ipvsadm -L|l [options]:
常用选项:
-c:集群中各连接状态
--stats:集群的统计数据信息
--rate:传输速率相关
--timeout:超时时长
(4)、保存、重载ipvs的规则
保存格式:ipvsadm -S [-n]
# ipvsadm -S [-n] > /PATH/TO/IPVS_RULE_FILE
# ipvsadm-save > /PATH/TO/IPVS_RULE_FILE
重载格式:
# ipvsadm -R < /PATH/FROM/IPVS_RULE_FILE
# ipvsadm-restore < /PATH/FROM/IPVS_RULE_FILE
5、lvs-nat集群实现过程:
调度器配置:----------------支持端口重定向
# ipvsadm -A -t 172.16.72.1:80 -s rr
# ipvsadm -a -t 172.16.72.1:80 -r 192.168.100.8:8080 -m -w 1
# ipvsadm -a -t 172.16.72.1:80 -r 192.168.100.9 -m -w 2
RS服务器配置:
正常配置ip地址,注意网关指向调度器的DIP。
6、lvs-dr集群的实现过程:
调度器配置:------------两块网卡
一块网卡:作为主接口,配置DIP
另一块网卡:作为网络标签,配置VIP,用于接收报文。-----------注意配置广播地址,即只是自己使用。
# ifconfig eno16777736:0 172.16.72.101 netmask 255.255.255.255 broadcast 172.16.72.101 up
RS服务器配置:
网卡主接口:配置RIP
调整内核参数:
echo 1 > /proc/sys/net/ipv4/conf/all/arp_ignore --------入栈接口
echo 1 > /proc/sys/net/ipv4/conf/lo/arp_ignore
echo 2 > /proc/sys/net/ipv4/conf/all/arp_announce -------出栈接口
echo 2 > /proc/sys/net/ipv4/conf/lo/arp_announce
设置VIP:
# ifconfig lo:0 172.16.72.101 netmask 255.255.255.255 broadcast 172.16.72.101 up
设置直接路由:
# route add -host 172.16.72.101 dev lo:0
7、防火墙标记集群的实现过程:
打标记:iptables -t mangle -A PREROUTING -d VIP -p tcp --dport PORT -j MARK --set-mark 6
建防火墙标记集群:ipvsadm -A -f FWM -s rr
8、LVS持久连接:
常做的端口持久端口为:443、80
# iptables -t mangle -A PREROUTING -d VIP -p tcp -m multiport --dports 80,443 -j MARK --set-mark 6