声明:由于家庭条件不允许这边只有NAT和DR
一、群集与分布式
1.1 群集的含义
群集又称为集群、Cluster,是由多台主机构成,但是对外依然是一个整体,只提供一个访问入口(域名或IP地址),相当于一台大型计算机。
在实际应用中,随着站点对性能的、响应速度、数据可靠性、服务器稳定性等要求越来越高,单台服务器已经无法满足负载均衡及高可用要求。
1、使用价格昂贵的小型机、大型机,即提升硬件性能。
2、使用多台相对廉价的普通服务器进行构建服务集群。
1.2 系统性能扩展方式
Scale UP:垂直扩展,向上扩展,增强,性能更强的计算机运行同样的服务
Scale Out:水平扩展,向外扩展,增加设备,并行地运行多个服务调度分配问题,Cluster(集群)
随着计算机性能的增长,其价格会成倍增长,垂直扩展不再提及,单台计算机的性能是有上限的,不可能无限制地垂直扩展,多核CPU意味着即使是单台计算机也可以并行的,也就是使用集群技术
1.3 群集的三种类型
负载均衡群集
LB:Load Balancing,负载均衡,多个主机组成,每个主机只承担一部分访问请求
提高应用系统的响应能力、尽可能处理更多的访问请求、减少延迟为目标,获得高并发、高负载(LB)的整体性能
LB的负载分配依赖于主节点的分流算法,将来自客户机的访问请求分担给多个服务器节点,从而环节整个系统的负载压力。
高可用群集
HA: High Availiablity,高可用,避免 SPOF(single Point Of failure)
提高应用系统的可靠性、尽可能地减少中断时间为目标,确保服务的连续性,达到高可用(HA)的容错效果
HA的工作方式包括双工和主从两种模式,双工即所有的节点都同时在线;主从则只有主节点在线,但是一旦出现故障从节点就能自动切换成主节点。
高性能运算群集
HPC: High-performance computing,高性能
提高应用系统的CPU运算速度、扩展硬件资源和分析能力为目标,获得相当于大型、超级计算机的高性能运算(HPC)能力
高性能依赖于“分布式运算”、“并行计算”,通过专用硬件和软件将多个服务器的CPU、内存等资源整合在一起,实现只有大型、超级计算机才具备的计算能力,如:“云计算” “网格计算” 等
1.4 LVS的负载调度算法
1.轮询(Round Robin)
- 将收到的访问请求按照顺序轮流分配给群集中的各节点 (真实服务器)
- 均等地对待每台服务器,而不管服务器实际的连接数和系统负载。
2.加权轮询(Weighted Round Robin)
- 根据调度器设置的权重值来分发请求
- 权重值高的节点优先获得任务并且分配的请求越多
- 这样可以保证性能高的节点承担更 多请求。
3.最少连接(Least Connections)
- 根据真实服务器已建立的连接数进行分配
- 将收到的访问请求优先分配给连接数最少的节点
- 如果所有的服务器节点性能相近,采用这种方式可以更好的均衡负载
4.加权最少连接(Weighted Least Connections)
- 在服务器节点的性能差异较大的 情况下,调度器可以根据节点服务器负载自动调整权重
- 权重较高的节点将承担更 大比例的活动连接负载。
1.5 分布式系统
1.分布式存储: 将数据分散存储在多台独立的设备上 。Ceph(分布式文件系统),GlusterFS,FastDFS(开源的轻量级分布式文件系统),MogileFS(高效的文件自动备份组件)
2.分布式计算: 将该应用分解成许多小的部分,分配给多台计算机进行处理。 hadoop(分布式系统基础架构),Spark
分布式常见应用
- 分布式应用-服务按照功能拆分,使用微服务(单一应用程序划分成一组小的服务,服务之间互相协调、互相配合,为用户提供最终价值服务)
- 分布式静态资源–静态资源放在不同的存储集群上
- 分布式数据和存储–使用key-value缓存系统
- 分布式计算–对特殊业务使用分布式计算,比如Hadoop集群
1.6 集群和分布式
分布式是以缩短单个任务的执行时间来提升效率的,而集群则是通过提高单位时间内执行的任务数来提升效率。
- 集群:同一个业务系统,部署在多台服务器上。集群中,每一台服务器实现的功能没有差别,数据和代码都是一样的。
- 分布式:一个业务被拆成多个子业务,或者本身就是不同的业务,部署在多台服务器上。分布式中,每一台服务器实现的功能是有差别的,数据和代码也是不一样的,分布式每台服务器功能加起来,才是完整的业务。
PS: 对于大型网站,访问用户很多,实现一个群集,在前面部署一个负载均衡服务器,后面几台服务器完成 同一业务。如果有用户进行相应业务访问时,负载均衡器根据后端哪台服务器的负载情况,决定由给哪 一台去完成响应,并且一台服务器垮了,其它的服务器可以顶上来。分布式的每一个节点,都完成不同 的业务,如果一个节点垮了,那这个业务可能就会失败。
1.7 负载均衡群集架构
第一层:负载调度器 (Load Balancer)
访问整个群集系统的唯一入口,对外使用所有服务器的共有的VIP(虚拟IP)地址,也称之为群集IP地址。通常会配置主、备两台调度器实现热备份,当主调度器失效以后能够平滑替换至备用调度器,确保高可用性。
第二层:服务器池 (Server Pool)
群集所提供的应用服务、由服务器池承担,其中每个节点具有独立的RIP地址(真实IP),只处理调度器分发过来的客户机请求。当某个节点暂时失效时,负载调度器的容错机制会将其隔离,等待错误排除以后再重新纳入服务器池。
第三层:共享存储(Share Storage)
为服务器池中的所有节点提供稳定、一致的文件存储服务,确保整个群集的统一性。共享存储可用使用NAS设备,或者提供NFS共享服务的专用服务器。
二、LVS集群的工作模式
群集的负载调度有三种工作模式:
- lvs-nat:地址转换(NAT)
- lvs-dr: 直接路由(DR)
- lvs-tun:IP隧道
2.1 LVS的NAT模式
类似于防火墙的私有网络结构,负载调度器作为所有服务器节点的网关,即作为客户机的访问入口,也是各节点回应客户机的访问出口。
2.11 NAT模式 LVS负载均衡部署
负载调度器:配置双网卡 内网:192.168.1.10(ens33) 外网卡:12.0.0.1(ens37)(Vmnet1)
两台WEB服务器集群池:192.168.1.20、192.168.1.30
一台NFS共享服务器:192.168.1.40
客户端:(win10):12.0.0.100 (Vmnet1)
2.12 部署共享存储(NFS服务器:192.168.1.40)
NFS 是一种基于 TCP/IP 传输的网络文件系统协议,最初由 Sun 公司开发。通过使用 NFS 协议,客户机可以像访问本地目录一样访问远程服务器中的共享资源。对于大多数负载均衡 群集来说,使用 NFS 协议来共享数据存储是比较常见的做法,NFS 也是 NAS 存储设备必然支 持的一种协议。
NFS 服务的实现依赖于 RPC(Remote Process Call,远端过程调用)机制,以完成远程 到本地的映射过程。在 CentOS 7 系统中,需要安装 nfs-utils、rpcbind 软件包来提供 NFS 共享服务,前者用于 NFS 共享发布和访问,后者用于 RPC 支持
1. #关闭防火墙
systemctl stop firewalld
systemctl disable firewalld
setenforce 0
2. #安装nfs服务
yum install nfs-utils rpcbind -y
3. #新建目录,并创建站点文件
cd /opt/
mkdir kk ka
echo "this is kk kk " > kk/index.html
echo "this is ka ka" > ka/index.html
4. #开启服务
systemctl start rpcbind
systemctl start nfs
5. #授权
chmod -R 777 kk/ ka/
6. #设置共享策略
vim /etc/exports
/opt/yxp 192.168.1.0/24(rw,sync)
/opt/dhc 192.168.1.0/24(rw,sync)
7. #发布服务
systemctl restart nfs
exportfs -rv
2.13 节点Web服务器
192.168.1.20
1. #关闭防火墙
systemctl stop firewalld
systemctl disable firewalld
setenforce 0
2. #安装httpd
yum install -y httpd
3. #查看nfs服务
showmount -e 192.168.1.40
4. #挂载站点
#法一:临时挂载
mount 192.168.1.40:/opt/ka /var/www/html/
df -Th
cat /var/www/html/index.html
#法二:永久挂载
vim /etc/fstab
192.168.24.40:/opt/ka/ /var/www/html/ nfs defaults,_netdev 0 0
mount -a
5. #开启httpd服务
systemctl start httpd
6. #指定网关
vim /etc/sysconfig/network-scripts/ifcfg-ens33
GATEWAY=192.168.1.10
#DNS1=8.8.8.8
7. #重启网络服务
systemctl restart network
192.168.1.30
1. #关闭防火墙
systemctl stop firewalld
systemctl disable firewalld
setenforce 0
2. #安装httpd
yum install -y httpd
3. #查看nfs服务
showmount -e 192.168.24.40
4. #挂载站点
#法一:临时挂载
mount 192.168.1.40:/opt/kk /var/www/html/
df -Th
cat /var/www/html/index.html
#法二:永久挂载
vim /etc/fstab
192.168.1.40:/opt/kk/ /var/www/html/ nfs defaults,_netdev 0 0
mount -a
5. #开启httpd服务
systemctl start httpd
6. #指定网关
vim /etc/sysconfig/network-scripts/ifcfg-ens33
GATEWAY=192.168.1.10
#DNS1=8.8.8.8
7. #重启网络服务
systemctl restart network
2.14 负载调度器
- 192.168.1.10(ens33)
- 12.0.0.1(ens37)
1. #关闭防火墙
systemctl stop firewalld
systemctl disable firewalld
setenforce 0
2. #安装ipvsadm
yum install -y ipvsadm
3. #添加一块网卡,ens37,配置网卡,重启网络
cd /etc/sysconfig/network-scripts/
cp ifcfg-ens33 ifcfg-ens37
vim ifcfg-ens37
去掉网关、UUID、修改IP
systemctl restart network
4. #打开路由转发功能
vim /etc/sysctl.conf
net.ipv4.ip_forward = 1
sysctl -p
5. #防火墙做策略
#查看策略
iptables -nL -t nat
#清空策略
iptables -F
#添加策略
iptables -t nat -A POSTROUTING -s 192.168.1.0/24 -o ens37 -j SNAT --to 12.0.0.1
#查看策略
iptables -nL -t nat
6. #加载LVS内核模块
modprobe ip_vs
cat /proc/net/ip_vs
7. #开启ipvsadm服务
ipvsadm-save >/etc/sysconfig/ipvsadm
systemctl start ipvsadm.service
8. #清空策略
ipvsadm -C
9. #制定策略
#指定IP地址 外网的入口 -s rr 轮询
ipvsadm -A -t 12.0.0.1:80 -s rr
#先指定虚拟服务器再添加真实服务器地址,-r:真实服务器地址 -m指定nat模式
ipvsadm -a -t 12.0.0.1:80 -r 192.168.1.20:80 -m
ipvsadm -a -t 12.0.0.1:80 -r 192.168.1.30:80 -m
#开启服务
ipvsadm
10. 查看策略
ipvsadm -ln
2.15 Windows客户机
修改网络 12.0.0.100
2.2 DR直接路由模式
2.21 LVS-DR 工作原理
LVS-DR(Linux Virtual Server Director Server)工作模式,是生产环境中最常用的一 种工作模式。
- LVS-DR 模式,Director Server 作为群集的访问入口,不作为网关使用
- 节点 Director Server 与 Real Server 需要在同一个网络中,返回给客户端的数据不需要经过 Director Server。
- 为了响应对整个群集的访问,Director Server 与 Real Server 都需要配置 VIP 地址。
- 客户机发起请求,经过调度服务器(lvs),经过算法调度,去访问真实服务器(RS)
- 由于不原路返回,客户机不知道,真实主机的ip地址,
- 所以只能通过调度服务器的外网ip(vip)去反回报文信息。
2.22 数据包流向分析
- 客户端发送请求到 Director Server,请求的数据报文(源 IP 是 CIP,目标 IP 是 VIP) 到达内核空间。
- Director Server 和 Real Server 在同一个网络中,数据通过二层数据链路层来传输。
- 内核空间判断数据包的目标 IP 是本机 VIP,此时 IPVS 比对数据包请求的服务是否是集群服务,是集群服务就重新封装数据包。修改源 MAC 地址为 Director Server 的 MAC 地址,修改目标 MAC 地址为 Real Server 的 MAC 地址,源 IP 地址与目标 IP 地址没有改 变,然后将数据包发送给 Real Server。
- 到达 Real Server 的请求报文的 MAC 地址是自身的 MAC 地址,就接收此报文。数 据包重新封装报文(源 IP 地址为 VIP,目标 IP 为 CIP),将响应报文通过 lo 接口传送给物理 网卡然后向外发出。
- Real Server 直接将响应报文传送到客户端。
2.23 LVS-DR 模式的特点
- Director Server 和 Real Server 必须在同一个物理网络中。
- Real Server 可以使用私有地址,也可以使用公网地址。如果使用公网地址,可以通过 互联网对 RIP 进行直接访问。
- 所有的请求报文经由 Director Server,但回复响应报文不能经过 Director Server。
- Real Server 的网关不允许指向 Director Server IP,即不允许数据包经过 Director S erver。
- Real Server 上的 lo 接口配置 VIP 的 IP 地址。
2.24 ARP问题
IP 地址冲突
在LVS-DR负载均衡集群中,负载均衡器与节点服务器都要配置相同的VIP地址,在局域网中具有相同的IP地 址。势必会造成各服务器ARP通信的紊乱
- 当ARP广播发送到LVS-DR集群时,因为负载均衡器和节点服务器都是连接到相同的网络上,它们都会接收到ARP广播
- 只有前端的负载均衡器进行响应,其他节点服务器不应该响应ARP广播
解决方法
- 对节点服务器进行处理,使其不响应针对VIP的ARP请求
- 用虚接口lo:0承载VIP地址
- 设置内核参数arp_ ignore=1: 系统只响应目的IP为本地IP的ARP请求
- 路由器发送ARP请求(广播)
- ARP---->广播去找ip地址解析成mac地址
- 默认使用调度服务器上的外网地址(vip地址)响应,
- 需要在真实服务器上修改内核参数
- 使真实服务器只对自己服务器上的真实IP地址响应ARP解析。
2.25 第二次再有访问请求
RealServer返回报文(源IP是VIP)经路由器转发,重新封装报文时,需要先获取路由器的MAC地址,发送ARP请求时,Linux默认使用IP包的源IP地址(即VIP)作为ARP请求包中的源IP地址,而不使用发送接口的IP地址,路由器收到ARP请求后,将更新ARP表项,原有的VIP对应Director的MAC地址会被更新为VIP对应RealServer的MAC地址。路由器根据ARP表项,会将新来的请求报文转发给RealServer,导致Director的VIP失效
解决方法:
对节点服务器进行处理,设置内核参数arp_announce=2:系统不使用IP包的源地址来设置ARP请求的源地址,而选择发送接口的IP地址
- 路由器上绑定了 真实服务器1的mac信息,
- 请求到达真实服务器
- 在真实服务器上修改内核参数
- 只对所有服务器真实网卡上的地址进行反馈,解析
2.3 部署LVS-DR集群
2.31 环境简介
- DR 服务器:192.168.1.40 vip(虚拟回环):192.168.1.48
- web 服务器1:192.168.1.20
- web 服务器2:192.168.1.30
- 客户端(win 10 ):192.168.1.100
2.32 配置负载调度器
1. #关闭防火墙
systemctl stop firewalld
systemctl disable firewalld
setenforce 0
2. #安装ipvsadm工具
yum install ipvsadm -y
3. #配置虚拟IP地址(VIP:192.168.1.48)
cd /etc/sysconfig/network-scripts/
cp ifcfg-ens33 ifcfg-ens33:0
vim ifcfg-ens33:0
#删除UUID,dns与网关,注意子网
NAME=ens33:0
DEVICE=ens33:0
IPADDR=192.168.1.48
NETMASK=255.255.255.255
4. #重启网络服务、启动网卡
systemctl restart network
ifup ifcfg-ens33:0
5. #调整/proc响应参数
#对于 DR 群集模式来说,由于 LVS 负载调度器和各节点需要共用 VIP 地址,应该关闭 Linux 内核的重定向参数响应服务器不是一台路由器,那么它不会发送重定向,所以可以关闭该功能
vi /etc/sysctl.conf
net.ipv4.ip_forward = 0
net.ipv4.conf.all.send_redirects = 0
net.ipv4.conf.default.send_redirects = 0
net.ipv4.conf.ens33.send_redirects = 0
6. #刷新配置
sysctl -p
7. #加载模块
modprobe ip_vs
cat /proc/net/ip_vs
8. #配置负载分配策略,并启动服务
ipvsadm-save >/etc/sysconfig/ipvsadm
systemctl start ipvsadm.service
9. #清空ipvsadm,并做策略
##添加真实服务器-a 指定VIP地址及TCP端口-t 指定RIP地址及TCP端口 -r 指定DR模式-g
ipvsadm -C
ipvsadm -A -t 192.168.24.48:80 -s rr
ipvsadm -a -t 192.168.24.48:80 -r 192.168.1.20:80 -g
ipvsadm -a -t 192.168.24.48:80 -r 192.168.1.30:80 -g
10. #保存设置
ipvsadm
ipvsadm -ln
ipvsadm-save >/etc/sysconfig/ipvsadm
2.33 第一台Web节点服务器
192.168.1.20
1. #关闭防火墙
systemctl stop firewalld
systemctl disable firewalld
setenforce 0
2. #安装httpd、开启服务
yum install httpd -y
systemctl start httpd
3. #创建一个站点文件
vim /var/www/html/index.html
this is 20 20
3. #添加回环网卡,修改回环网卡名,IP地址,子网掩码
cd /etc/sysconfig/network-scripts/
cp ifcfg-lo ifcfg-lo:0
vim ifcfg-lo:0
DEVICE=lo:0
IPADDR=192.168.1.48
NETMASK=255.255.255.255
NETWORK=127.0.0.0
systemctl restart network
4. #设置路由
route add -host 192.168.1.48 dev lo:0
route -n
5. #开机执行命令
vim /etc/rc.d/rc.local
/usr/sbin/route add -host 192.168.1.48 dev lo:0
chmod +x /etc/rc.d/rc.local
6. #调整 proc 响应参数
#添加系统只响应目的IP为本地IP的ARP请求
#系统不使用原地址来设置ARP请求的源地址,而是物理mac地址上的IP
vim /etc/sysctl.conf
net.ipv4.conf.all.arp_ignore = 1
net.ipv4.conf.all.arp_announce = 2
net.ipv4.conf.default.arp_ignore = 1
net.ipv4.conf.default.arp_announce = 2
net.ipv4.conf.lo.arp_ignore = 1
net.ipv4.conf.lo.arp_announce = 2
sysctl -p
2.34第二台Web节点服务器
192.168.1.30
1. #关闭防火墙
systemctl stop firewalld
systemctl disable firewalld
setenforce 0
2. #安装httpd、开启服务
yum install httpd -y
systemctl start httpd
3. #创建一个站点文件
vim /var/www/html/index.html
this is 30 30
3. #添加回环网卡,修改回环网卡名,IP地址,子网掩码
cd /etc/sysconfig/network-scripts/
cp ifcfg-lo ifcfg-lo:0
vim ifcfg-lo:0
DEVICE=lo:0
IPADDR=192.168.1.48
NETMASK=255.255.255.255
NETWORK=127.0.0.0
systemctl restart network
4. #设置路由
route add -host 192.168.1.48 dev lo:0
route -n
5. #开机执行命令
vim /etc/rc.d/rc.local
/usr/sbin/route add -host 192.168.1.48 dev lo:0
chmod +x /etc/rc.d/rc.local
6. #调整 proc 响应参数
#添加系统只响应目的IP为本地IP的ARP请求
#系统不使用原地址来设置ARP请求的源地址,而是物理mac地址上的IP
vim /etc/sysctl.conf
net.ipv4.conf.all.arp_ignore = 1
net.ipv4.conf.all.arp_announce = 2
net.ipv4.conf.default.arp_ignore = 1
net.ipv4.conf.default.arp_announce = 2
net.ipv4.conf.lo.arp_ignore = 1
net.ipv4.conf.lo.arp_announce = 2
sysctl -p
2.35 客户机测试
总结
LVS的NAT模式
LVS的DR模式