一、群集

1、群集的含义

Cluster、集群、群集
由多台主机构成,但对外只表现为一个整体

2、为什么会有群集

互联网应用中,随着站点对硬件性能、响应速度、服务稳定性、数据可靠性等要求越来越高,单台服务器无法满足负载均衡及高可用的需求。

3、解决方法

1、使用价格昂贵的小型机、大型机。
2、使用多台相对廉价的普通服务器构建服务群集。
通过整合多台服务器,使用LVS来达到服务器高可用和负载均衡,并于同一个IP地址对外提供相同服务。
这就是企业中常用的一种群集技术——LVS(Linux Virtual Server ,Linux虚拟服务器)。

二、群集可分为三种

1、负载均衡群集(Load Balance Cluster)

(1)提高应用系统的响应能力、尽可能处理更多的访问请求、减少延迟为目标,获得高并发、高负载(LB)的整体性能。
(2)LB的负载分配依赖于主节点的分流算法,将来自客户机的访问请求分担给多个服务器节点,从而缓解整个系统的负载。

2、高可用群集 (High Availability Cluster)

(1)提高应用系统的可靠性、尽可能地减少中断时间为目标,确保服务的连续性,达到高可用(HA) 的容错效果。
(2)HA的工作方式包括双工和主从两种模式,双工即所有节点同时在线;主从则只有主节点在线,但当出现故障时从节点能自动切换为主节点。
例如:“故障切换”、“双机热备” 等。

3、高性能运算群集(High Performance Computer Cluster)

(1)以提高应用系统的CPU运算速度、扩展硬件资源和分析能力为目标,获得相当于大型、超级计算机的高性能运算(HPC)能力。
(2)高性能依赖于"分布式运算”、“并行计算” , 通过专用硬件和软件将多个服务器的CPU、内存等资源整合在一起,实现只有大型、超级计算机才具备的计算能力。例如,“云计算”、“网格计算”等。

三、负载均衡群集架构

1、第一层,负载调度器(Load Balancer或Director)

访问整个群集系统的唯一入口, 对外使用所有服务器共有的VIP地址,也称为群集IP地址。通常会配置主、备两台调度器实现热备份,当主调度器失效以后能够平滑替换至备用调度器,确保高可用性。

2、第二层,服务器池(Server Pool)

群集所提供的应用服务、由服务器池承担,其中每个节点具有独立的RIP地址(真实IP),只处理调度器分发过来的客户机请求。当某个节点暂时失效时,负载调度器的容错机制会将其隔离,等待错误排除以后再重新纳入服务器池。

3、第三层,共享存储(Share Storage)

为服务器池中的所有节点提供稳定、一致的文件存取服务, 确保整个群集的统一性共享存储可以使用NAS设备,或者提供NFS共享服务的专用服务器。

四、负载均衡集群工作模式分析

负载均衡群集是目前企业用得最多的群集类型
群集的负载调度技术有3种工作模式
地址转换(NAT模式)
IP隧道 (TUN模式)
直接路由(DR模式)

五、三种负载调度工作模式

1、NAT模式

Network Address Translation,简称NAT模式。
类似于防火墙的私有网络结构,负载调度器作为所有服务器节点的网关,即作为客户机的访问入口,也是各节点回应客户机的访问出口。
服务器节点使用私有IP地址,与负载调度器位于同一个物理网络,安全性要优于其他两种方式。

2、TUN模式

IP隧道
IP Tunnel,简称TUN模式。
采用开放式的网络结构,负载调度器仅作为客户机的访问入口,各节点通过各自的Internet连接直接回应客户机,而不再经过负载调度器。
服务器节点分散在互联网中的不同位置,具有独立的公网IP地址,通过专用IP隧道与负载调度器相互通信。

3、DR模式

直接路由
Direct Routing,简称DR模式。
采用半开放式的网络结构,与TUN模式的结构类似,但各节点并不是分散在各地,而是与调度器位于同一个物理网络。
负载调度器与各节点服务器通过本地网络连接,不需要建立专用的IP隧道。

六、IPVSADM工具

选项

功能

-A

添加虚拟服务器

-D

删除整个虚拟服务器

-s

指定负载调度算法(轮询:rr、加权轮询:wrr、最少连接:lc、加权最少连接:wlc)

-a

表示添加真实服务器(节点服务器)

-d

删除某一个节点

-t

指定 VIP地址及 TCP端口

-r

指定 RIP地址及 TCP端口

-m

表示使用 NAT群集模式

-g

表示使用 DR模式

-i

表示使用 TUN模式

-w

设置权重(权重为 0 时表示暂停节点)

-p 60

表示保持长连接60秒

-l

列表查看 LVS 虚拟服务器(默认为查看所有)

-n

以数字形式显示地址、端口等信息,常与“-l”选项组合使用。ipvsadm -ln

七、LVS的负载调度算法

1、轮询(Round Robin)

将收到的访问请求按照顺序轮流分配给群集中的各节点(真实服务器) ,均等地对待每一台服务器 ,而不管服务器实际的连接数和系统负载。

2、加权轮询 (Weighted Round Robin)

根据调度器设置的权重值来分发请求,权重值高的节点优先获得任务,分配的请求数越多。
保证性能强的服务器承担更多的访问流量。

3、最少连接 (Least Connections )

根据真实服务器已建立的连接数进行分配,将收到的访问请求优先分配给连接数最少的节点。

4、加权最少连接(Weighted L east Connections )

在服务器节点的性能差异较大时,可以为真实服务器自动调整权重。
性能较高的节点将承担更大比例的活动连接负载。

八、LVS优缺点

高并发连接:LVS基于内核网络层面工作,有超强的承载能力和并发处理能力。单台LVS负载均衡器,可支持上万并发连接。
稳定性强:是工作在网络4层之上仅作分发之用,这个特点也决定了它在负载均衡软件里的性能最强,稳定性最好,对内存和cpu资源消耗极低。
成本低廉:硬件负载均衡器少则十几万,多则几十万上百万,LVS只需一台服务器和就能免费部署使用,性价比极高。
配置简单:LVS配置非常简单,仅需几行命令即可完成配置,也可写成脚本进行管理。
支持多种算法:支持8种负载均衡算法,可根据业务场景灵活调配进行使用。
支持多种工作模型:可根据业务场景,使用不同的工作模式来解决生产环境请求处理问题。
应用范围广:因为LVS工作在4层,所以它几乎可以对所有应用做负载均衡,包括http、数据库、DNS、ftp服务等等。
缺点:工作在4层,不支持7层规则修改,机制过于庞大,不适合小规模应用。