交换机堆叠与集群

  • 1. 堆叠、集群
  • 1.1 堆叠、集群概述
  • 1.2 ----------堆叠技术原理----------
  • 1.2.1 iStack 基本概念
  • 1.2.2 堆叠系统构建过程
  • 1.2.3 堆叠方式和连接拓扑
  • 1.2.4 主、备交换机选举
  • 1.2.5 软件、配置同步
  • 1.2.6 堆叠管理与配置文件
  • 1.2.7 堆叠成员退出、加入
  • 1.2.8 堆叠合并、分裂
  • 1.2.9 MAD检测和冲突处理
  • 1.2.10 堆叠主备倒换
  • 1.2.11 堆叠升级
  • 1.2.12 流量本地优先转发
  • 1.2.13 堆叠配置
  • 1.3 ----------集群技术原理----------
  • 1.3.1 集群概述
  • 1.3.2 集群基本概念
  • 1.3.3 集群连接方式
  • 1.3.4 集群配置
  • 2. 园区网络高可靠性解决方案
  • 2.1 堆叠和集群的作用


1. 堆叠、集群

1.1 堆叠、集群概述

  • 堆叠(iStack)
将 多台 支持堆叠特性的交换机通过堆叠线缆连接在一起,从逻辑上虚拟成一台交换设备,作为一个整体参与数据转发。
  • 集群(Cluster Switch System,CSS)
将两台支持集群特性的交换机设备组合在一起,从逻辑上虚拟成一台交换设备。
  只支持 两台 设备,一般高端框式交换机支持CSS、盒式设备支持iStack。

1.2 ----------堆叠技术原理----------

1.2.1 iStack 基本概念

  • 归总
1. 主交换机 Master;
  2. 备交换机 Standby;
  		主备交换机是从管理层面来说的,都参与流量转发。
  4. 从交换机 Slave;
  5. 堆叠物理成员端口;
  6. 堆叠端口;
  7. 堆叠 ID;
  8. 堆叠优先级。
  1. 主交换机 Master
管理整个堆叠系统,只有一个;
  1. 备交换机 Standby
主交换机的备份,有一个;
  1. 从交换机 Slave
堆叠系统中,除了主交换机,剩余的交换机都是从交换机;
 	--- 从业务角度看,三中类型的交换机都负责转发。
  1. 堆叠物理成员端口
连接堆叠线缆的物理接口;
  1. 堆叠端口
逻辑端口,需要和物理成员端口做绑定;
 一个堆叠端口中,可以存在一个或多个物理成员端口。

 一台设备可以存在两个堆叠端口 分别是stack-port n/1和n/2   n为堆叠ID;
  1. 堆叠 ID
作用:
 	1. 唯一标识一台成员交换机;
 	2. 标识成员设备的槽位号。
 生成方式:
 	1. 手工配置;
 	2. 由主交换机分配。
 	
 设备堆叠ID缺省为0;
  1. 堆叠优先级
作用:
 	选举主、备、从交换机;
 	越大越优先。

1.2.2 堆叠系统构建过程

  • 简述
1. 物理连接;
  2. 主交换机选举;
  3. 拓扑收集和被交换机选举;
  4. 软件和配置同步。
  • 堆叠构建的具体过程:
1. 使能堆叠并配置好堆叠参数;
  2. 所有设备断电;
  3. 连接堆叠线缆;
  4. 所有设备上电;
  5. 系统自动完成堆叠。
  • 系统自动完成堆叠的三步:
1. 主交换机选举:
  		1. 运行状态比较,已经运行的交换机比处于启动状态的交换机优先竞争为主交换机;
  				有20s时间差,若在此期间启动,则认为是同时启动。	
  		2. 堆叠优先级高的交换机优先竞争为主交换机;
  		3. 堆叠优先级相同时,MAC 地址小的交换机优先竞争为主交换机。
  		
  2. 拓扑收集和备交换机选举:
  	主交换机选举完成后,主交换机会收集所有成员交换机的拓扑信息,根据拓扑计算出堆叠转发表项和破坏点信息下发给堆叠中的所有成员交换机,并向所有成员交换机分配堆叠ID,周后进行备交换机选举:
  		当除主交换机外其它交换机同时完成启动时:
  			1. 堆叠优先级最高的设备成为备交换机;
  			2. 堆叠优先级相同时,MAC 地址小的交换机优先竞争为备交换机。
  
  3. 稳定运行:

1.2.3 堆叠方式和连接拓扑

  • 两种堆叠方式
堆叠卡堆叠;
  业务口堆叠。
  • 两种拓扑
链行连接
  	首位不相连,如果堆叠线/设备故障,可能造成堆叠分裂;
  	堆叠成员交换机距离较远,组建环形比较困难,再使用这种方法。
  	
  环形连接
  	可靠性高;带宽利用率高;
  	缺点:首尾需要有物理连接,距离较远不易组建。

1.2.4 主、备交换机选举

  • 主交换机 选举
1. 运行状态比较,已经运行的交换机比处于启动状态的交换机优先竞争为主交换机;
  	堆叠主交换机选举超时时间为20s,堆叠成员交换机上电或重启时,由于不同成员交换机所需的启动时间可能差异比较大,因此不是所有成员交换机都有机会参与主交换机的第一次选举。
  2. 堆叠优先级高的交换机优先竞争为主交换机;
  3. 堆叠优先级相同时,MAC地址小的交换机优先竞争为主交换机。
  • 备交换机 选举
- 主交换机选举完成后,主交换机会收集所有成员交换机的拓扑信息,并向所有成员交换机分配堆叠ID。之后进行备交换机的选举,作为主交换机的备份交换机。
  - 除主交换机外最先完成设备启动的交换机优先被选为备份交换机。
  - 当除主交换机外其它交换机同时完成启动时,备交换机的选举规则如下(依次从第一条开始判断,直至找到最优的交换机才停止比较):
  1. 堆叠优先级最高的交换机成为备交换机;
  2. 堆叠优先级相同时,MAC地址最小的成为备交换机

1.2.5 软件、配置同步

  • 角色选举、拓扑收集完成之后,所有成员交换机会自动同步主交换机的系统软件和配置文件

1.2.6 堆叠管理与配置文件

  • 堆叠管理
1. Console接口;
  		登录任意成员的Console口即可管理整个堆叠系统;
  2. Tlenet、Stelnet;
  		与堆叠系统上的任意IP地址路由可达,即可通过Telnet、Stelnet、WEB、SNMP等方式登录、管理整个堆叠系统。
  • 配置文件
堆叠建立后,竞争为主的交换机的配置文件生效,整个堆叠系统的配置都保存在主交换机的配置文件中。
  备交换机上会备份主交换机的配置文件,当主交换机故障时备份交换机的配置继续运行。
  
  简记:
  	1. 整个堆叠系统都是用主交换机的配置文件;
  	2. 只有备交换机才会保存主交换机的配置文件。

1.2.7 堆叠成员退出、加入

  • 堆叠成员退出:角色不同,对系统影响也不同
当主交换机退出时:
  	1. 备份交换机升级为主交换机;
    	2. 重新计算堆叠拓扑并同步到其他成员交换机,指定新的备交换机;
  	3. 进入稳定运行状态。
  
  当备交换机退出时:
  	1. 主交换机重新指定备交换机
  	2. 重新计算堆叠拓扑并同步到其他成员交换机
  	3. 进入稳定运行状态。

  当从交换机退出时:
  	1. 主交换机重新计算堆叠拓扑并同步到其他成员交换机
  	2. 之后进入稳定运行状态。
  
  对于环形堆叠:破环后还需要成环;
  对于链形堆叠:拆除中间设备---会导致堆叠分裂;
  	拆除前进行业务分析,尽量减少对业务的影响。

  堆叠退出的触发方式:
  	1. 拔出堆叠线缆;
  	2. 关闭堆叠端口或物理成员端口;
  	3. 堆叠成员设备重启;
  	4. 成员设备故障等其它原因。
  • 堆叠成员加入:指向已经稳定的堆叠系统添加新的交换机
1. 将 未上电 的交换机加入堆叠之后再上电启动;
  2. 新加入的交换机选举为 从交换机,其它成员不变;
  3. 角色选举结束后,主交换机更新堆叠拓扑信息,同步到其他成员交换机上,并向新加入的交换机分配堆叠ID
  		(新加入的交换机没有配置堆叠ID或配置的堆叠ID与原堆叠系统的冲突时)
  4. 新加入的交换机更新堆叠ID,并同步主交换机的配置文件和系统软件,之后进入稳定运行状态。
  
  如果是链形连接:建议新设备添加到链路两端,对业务影响小;
  如果是环形连接:需要线破环,然后再两端加设备。

1.2.8 堆叠合并、分裂

  • 堆叠合并
堆叠合并过程:
  		1. 两个堆叠系统 稳定运行;
  		2. 两个堆叠系统 通过堆叠线缆连接;
  		3. 两个堆叠系统 主交换机竞争;
  		4. 竞争成功的 主交换机所在的堆叠系统 将保持原有主备从角色和配置不变,业务也不会受到影响;
  		5. 而另外一个堆叠系统的所有成员交换机将重新启动,以从交换机的角色加入到新堆叠系统,其堆叠ID将由新主交换机重新分配,并将同步新主交换机的配置文件和系统软件,该堆叠系统的原有业务也将中断。
  	
  一般来说,不要把两个稳定运行的系统直接合并。
  • 堆叠分裂
故障原因:
  		中间设备故障;
  		堆叠线缆多点故障。
  
  堆叠分裂后的处理过程:
  		如果原堆叠 主和备 在 同一个堆叠系统中,
  			移出的成员交换机复位,重新组成堆叠。
  		如果原堆叠 主和备 不在 同一个堆叠系统中,
  			备交换机升为主,网络中出现配置相同的两组堆叠系统。

  堆叠分裂造成的问题:
  		1. 由于堆叠系统中的所有成员交换机都使用同一个IP地址和MAC地址,可能产生多个具有相同IP地址和MAC地址的堆叠系统。
  			为了防止此事发生,引起网络故障。需进行IP地址和MAC地址的冲突检查。

1.2.9 MAD检测和冲突处理

  • MAD检测
两种方式:
  		1. 直连检测方式;
  		2. 代理检测方式;
  			在同一个堆叠系统中,两种检测方式互斥,不可同时配置。
  
  直连检测方式:
  	也有两种:通过中间设备直连;堆叠成员交换机Full-mesh方式直连。
  		直连检测方式是指堆叠成员交换机间通过普通线缆直连的专用链路进行多主检测。在直连检测方式中,堆叠系统正常运行时,不发送MAD报文;堆叠系统分裂后,分裂后的两台交换机以1秒为周期通过检测链路发送MAD报文进行多主冲突处理。
  代理检测方式:
  		代理检测方式是在堆叠系统Eth-Trunk上启用代理检测,在代理设备上启用MAD检测功能。此种检测方式要求堆叠系统中的所有成员交换机都与代理设备连接,并将这些链路加入同一个Eth-Trunk内。与直连检测方式相比,代理检测方式无需占用额外的接口,Eth-Trunk接口可同时运行MAD代理检测和其他业务。
  • 冲突处理
堆叠分裂后,MAD冲突处理机制使用MAD报文进行MAD竞争,竞争结果为堆叠系统处于Detect状态或者Recovery状态:
  	Detect:竞争成功,堆叠系统将处于正常工作状态。
  	Recovery:竞争失败,堆叠系统将状态处于禁用状态,关闭除手动配置的保留端口以外的其它所有物理端口。
  • 故障恢复
通过修复故障链路,分裂后的堆叠系统重新合并为一个堆叠系统。

ios 堆叠view ip堆叠_服务器

1.2.10 堆叠主备倒换

  • 原因
1. 现在的主设备不是用户期望--通过命令主备倒换  slave switchover
  2. 主设备故障引起的主备倒换

1.2.11 堆叠升级

  • 堆叠升级方式有三种:智能升级、传统升级和平滑升级。
智能升级:堆叠建立或者新的交换机加入堆叠时会自动和主交换机的版本进行同步。
  传统升级:和普通设备升级一样,指定下次启动版本,重启整个堆叠系统进行升级,会造成较长时间的业务中断。
  平滑升级:将堆叠系统划分成为active、backup区域,可以分区域升级,整个堆叠系统的上下行采用备份组网,主、备链路分别处于active、backup区域,可以实现升级时的业务不中断。

1.2.12 流量本地优先转发

  • 问题:
链路聚合的负载分担算法根据流量特征将报文分担在不同的成员链路上,对于跨设备链路聚合极有可能出现报文的出接口和入接口不在同一台成员设备之上的情况,此时堆叠成员之间将会通过堆叠线缆转发流量,这增加了堆叠线缆的流量负担,同时也降低了转发效率。
  • 解决方法:
为保证流量转发效率、降低堆叠线缆带宽负载,设备可以开启流量本地优先转发,从本设备进入的流量优先从本地转发出去,当本设备无出接口或者出接口全部故障,才会从其它成员交换机的接口转发出去。

1.2.13 堆叠配置

ios 堆叠view ip堆叠_ios 堆叠view_02


ios 堆叠view ip堆叠_服务器_03


ios 堆叠view ip堆叠_运维_04


ios 堆叠view ip堆叠_服务器_05

1.3 ----------集群技术原理----------

1.3.1 集群概述

  • CSS
集群交换机系统CSS(Cluster Switch System),又称为集群,是指将两台支持集群特性的交换机设备组合在一起,从逻辑上虚拟成一台交换设备。
  • 与 iStack 的区别
一般框式交换机堆叠称为CSS,盒式交换机称为堆叠,堆叠与集群两者只是叫法和实现有些差异,但是功能是一样的。
  框式设备的堆叠称为集群;

1.3.2 集群基本概念

  • 主、备交换机
主交换机(Master):主交换机,即Master,负责管理整个集群。
  备交换机(Standby):备交换机,即Standby,是主交换机的备份交换机。
  • 集群 ID
即CSS ID,用来标识成员交换机,集群中成员交换机的集群ID是唯一的。
  • CSS Link
集群链路,专门用于组建集群,实现主交换机和备交换机之间数据通信。
  • 集群优先级
CSS Priority,主要用于角色选举过程中确定成员交换机的角色。优先级值越大优先级越高。

1.3.3 集群连接方式

  • 传统CSS
使用主控板上的集群卡建立集群连接,或者使用业务口建立集群连接。
  • CSS2
第二代集群交换机系统,专指使用交换网板上的集群卡方式建立集群连接的集群。

1.3.4 集群配置

ios 堆叠view ip堆叠_运维_06


ios 堆叠view ip堆叠_运维_07

2. 园区网络高可靠性解决方案

  1. 采用 堆叠iStack + 集群CSS + 链路聚合Eth-Trunk 的方案
优点:简单、高效、可靠;
  1. MSTP + VRRP

2.1 堆叠和集群的作用

  • 汇总
- 堆叠和集群的作用(配合eth-trunk使用)
  1. 简化网络;
  2. 提高网络可靠性;
  3. 网络故障,收敛速度非常快;
  4. 设备和链路利用率大大的提升(相对STP);
  5. 扩充端口的数量;
  6. 增加了带宽;