群集 也称集群
1. 类型
1) LB load balancing 负载均衡
2) HA high available 高可用
3) HP 高性能
2. 方案
1)Scale On 需要升级更换 较少使用
2)Scale out 廉价 易于扩展
LB
1.)分发器 director
硬件实现:f5
软件实现:squid,lvs(linux virtual servr)
Squid是七层转发,lvs是四层转发
四层转发 :ip 协议 端口
七层转发:squid web sql
转发
内核:ipvs
用户 ipvsadm
-转发在内核里实现
2.4前手动添加lvs
2.6版本内核内部集成了lvs
Lvs主要实现负载均衡
3.调度算法:10种
当一个director收到一个访问集群服务的请求,选择的机制就是lvs调度算法。
(1)静态调度方法 fixed scheduling
不关心当前连接的活动和非活动状态,不检查realservers的连接状态
相应算法:
1,轮叫调度(Round-Robin Scheduling)
轮叫调度算法就是以轮叫的方式依次将请求调度不同的服务器,然后进行相应的处理,这种算法的优点是其简洁性,它无需记录当前所有连接的状态,所以它是一种无状态调度。
2,加权轮叫调度(Weighted Round-Robin Scheduling)
加权轮调算法用于区分后端服务器响应能力,权重越大分配的连接越多,可以解决服务器间性能不一的情况,它用相应的权值表示服务器的处理性能,服务器的缺省权值为1。它是按权值的高低和轮叫方式分配请求到各服务器,权值高的服务器先收到的连接,权值高的服务器比权值低的服务器处理更多的连接,相同权值的服务器处理相同数目的连接数。
3,目标地址散列调度(Destination Hashing Scheduling)
目标地址hash算法以目标地址为标准,针对目标地址的请求进行定向转发,能够实现来自同一用户的同一请求转发到同一台服务器上(基于缓存的架构,能够提高缓存的命中率),它通过一个散列(Hash)函数将一个目标IP地址映射到一台服务器。目标地址散列调度算法先根据请求的目标IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。
4,源地址散列调度(Source Hashing Scheduling)
源地址hash ,以源地址为标准,将来自同一地址的用户转发给同一网络,算法正好与目标地址散列调度算法相反,它根据请求的源IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。它采用的散列函数与目标地址散列调度算法的相同。它的算法流程与目标地址散列调度算法的基本相似。在实际应用中,源地址散列调度和目标地址散列调度可以结合使用在防火墙集群中,它们可以保证整个系统的唯一出入口。
静态调度算法的缺陷:不能考虑后台服务器当前的状态
(2)动态调度方法 dynamic scheduling
优点:能够基于后台服务器当前的活动连接数,进行请求的分配,更合理,避免了一台服务器负载太多,而另外的服务器处于闲置状态。
两种标准:
非活动状态的连接(但仍在连接状态)
活动状态的连接数
例:ssh,telnet均是基于状态的连接,需要实时进行检测连接的状态,而hhtp服务则是基于无状态的连接
相应的算法:
1,最小连接调度(Least-Connection Scheduling)
最少连接调度是把新的连接请求分配到当前连接数最小的服务器,它通过服务器当前所活跃的连接数来估计服务器的负载情况。调度器需要记录各个服务器已建立连接的数目,当一个请求被调度到某台服务器,其连接数加1;当连接中止或超时,其连接数减一。同时检查非活动状态连接数和活动状态连接数,基于overhead决定,谁的overhead小就会接受下一次请求。
例:overhead=当前活动状态的连接数*256+当前处于非活动状态
2,加权最小连接调度(Weighted Least-Connection Scheduling)
加权最少连接数是最小连接调度的超集,各个服务器用相应的权值表示其处理性能。服务器的缺省权值为1,系统管理员可以动态地设置服务器的权值。加权最小连接调度在调度新连接时尽可能使服务器的已建立连接数和其权值成比例,是最常用的算法。 例:overhead=(当前活动状态的连接数*256+当前处于非活动状态的连接数)/权重
3,最短的期望的延迟(Shortest Expected Delay Scheduling SED)
最短期望延迟,是对wlc算法的一种改进,不查看非状态连接数,而且在计算overhead时要把当前的活动状态连接数加一。
例:overhead=((当前活动状态的连接数+1)*256)/权重
4,最少队列调度(Never Queue Scheduling NQ)
最少队列调度不查看非活动连接数,只查看当前的活动状态,保证主机不会闲置;无需队列。如果有台realserver的连接数=0就直接分配过去,不需要在进行sed运算。
5,基于局部性的最少链接(Locality-Based Least Connections Scheduling)
基于局部性的最少链接算法和dh相似,是动态的算法,考虑后台的实际情况进行轮调,支持权重,在wlc的基础上;目前主要用于Cache集群系统,因为在Cache集群中客户请求报文的目标IP地址是变化的。这里假设任何后端服务器都可以处理任一请求,算法的设计目标是在服务器的负载基本平衡情况下,将相同目标IP地址的请求调度到同一台服务器,来提高各台服务器的访问局部性和主存Cache命中率,从而整个集群系统的处理能力。LBLC调度算法先根据请求的目标IP地址找出该目标IP地址最近使用的服务器,若该服务器是可用的且没有超载,将请求发送到该服务器;若服务器不存在,或者该服务器超载且有服务器处于其一半的工作负载,则用“最少链接”的原则选出一个可用的服务器,将请求发送到该服务器。
6,带复制的基于局部性最少链接(Locality-Based Least Connections with Replication Scheduling)
带复制的基于局部性最少链接也是针对目标IP地址的负载均衡,目前主要用于Cache集群系统。它与LBLC算法的不同之处是它要维护从一个目标IP地址到一组服务器的映射,而LBLC算法维护从一个目标IP地址到一台服务器的映射。对于一个“热门”站点的服务请求,一台Cache 服务器可能会忙不过来处理这些请求。这时,LBLC调度算法会从所有的Cache服务器中按“最小连接”原则选出一台Cache服务器,映射该“热门”站点到这台Cache服务器,很快这台Cache服务器也会超载,就会重复上述过程选出新的Cache服务器。这样,可能会导致该“热门”站点的映像会出现在所有的Cache服务器上,降低了Cache服务器的使用效率。LBLCR调度算法将“热门”站点映射到一组Cache服务器(服务器集合),当该“热门”站点的请求负载增加时,会增加集合里的Cache服务器,来处理不断增长的负载;当该“热门”站点的请求负载降低时,会减少集合里的Cache服务器数目。这样,该“热门”站点的映像不太可能出现在所有的Cache服务器上,从而提供Cache集群系统的使用效率。LBLCR算法先根据请求的目标IP地址找出该目标IP地址对应的服务器组;按“最小连接”原则从该服务器组中选出一台服务器,若服务器没有超载,将请求发送到该服务器;若服务器超载;则按“最小连接”原则从整个集群中选出一台服务器,将该服务器加入到服务器组中,将请求发送到该服务器。同时,当该服务器组有一段时间没有被修改,将最忙的服务器从服务器组中删除,以降低复制的程度。
通过#grep –i ip_vs /boot/config*查看算法的运算
实现两种方法
1. 虚拟服务
Ipvsadm –A –t|u|f vip :端口算法 –s 调度算法
-A 定义服务
-E 修改
-D 删除
-t tcp
-u udp
-f 带防火墙标记的
2. 定义realserver
Ipvsadm –a –t|u|f vip:端口号码 –r rip:端口号码
-e 修改
-d 删除
3. 查看连接
Ipvsadm –L –n –c
-L list
-n 数字
-c 连接
4. lvs 实现的是负载均衡服务
有三种模型
1.)Nat -m
2.)dr -g
3.)tunnel –i (dr 默认模型)
Ipvsadm –a –t|u|f vip:port –r rip:port –m|g|i
LB处理大量的并发数据