• 概要

APSAutomatic Protection Switching)是一种应用于基于VLAN以太网的线性保护机制。对一个已经配置了APS功能的工作实体上,会预留一个保护实体,当工作实体之间发生信号失效(SF)或者信号劣化(SD)后,会将相应的流量倒换到保护实体上,从而提供了一种快速简单的保护机制。

 

  • 功能目的要求

  • APS应该用于基于点到点的VLAN SNC,负责在ETH流域内的两个ETH流点之间提供连接性,通过VID来标识基于点到点的ETH

  • 在一个单一工作实体上,100%被破坏的工作流量都应当得到保护。

  • 保护倒换时间应不超过50ms

  • 应提供独立的以及组保护倒换功能。

  • 应提供返回式和非返回式倒换。

  • 应可以检测到近端与远端selector/bridge的不匹配。

  • 应支持操作者配置如锁定、强制倒换和手工倒换等命令。

  • 应支持信号失效和操作者请求之间有优先级的保护。

  • 应提供可配置的“通用延迟功能”从而可以延迟保护倒换动作的开始。

 

  • APS网络模型

在点到点的ETH网络中,APS功能分为工作实体(working entity)和保护实体(protection entity)。在链路正常的情况下,流量在工作实体之间传输,当链路发生失效后将流量倒换到保护实体间的链路上。APS链路的首端(head end)担当桥接(Bridge)任务,负责选择将流量从哪条链路发出去;尾端(tail end)担当选择器(selector)任务,负责选择从哪条链路接收流量。

根据流量是否能一直在保护实体间传输,APS可以分为1+11:1两种模型,在1+1模型中流量在工作链路和保护链路上都有复制,分别传输;在1:1模型中,在链路正常的情况下保护链路不承载流量,只有当链路发生失效后才将流量切换到保护链路上。

根据流量方向又可分为单向(Unidirectional)和双向(Bidirectional)。下面详细描述APS中三种模型:

1.  1+1单向:

在此模型中,保护域的首端将流量永久的在工作链路和保护链路上各复制一份发送。当尾端检测到链路失效后,selector会选择切换到保护链路进行流量的接收。每个方向都是独立的,因此尾端的selector只需工作在本地信息之上,不需要APS报文的交互来进行两端信息的协商。

2.  1+1双向:

在此模型中,和1+1单向模型一样,保护域的首端将流量永久的在工作链路和保护链路上各复制一份发送,但是当检测到链路失效后,保护域的两端都要进行状态的切换,即两端的bridgeselector都要切换到保护实体上去,因此此时就需要APS报文来进行信息协商。

3.  1:1双向:

在此模型中,保护域的两端都是将流量只发送到工作链路上。当出现链路失效后,两端的bridgeselector都要切换到保护实体上,因此需要APS报文的交互。


  • APS报文详解

APS报文实际上也是一种OAM报文,只是PDUAPS PUD。在OAM报文中,APS功能的OpCode39。以下是APS PDU的详细格式:

PTN线性保护倒换功能(APS)详细设计说明书_以太网

1Request/State:包含了一些本地命令的信息、信号失效、等待时间、是否返回等内容,每个内容都有不同的优先级,如果同时收到本端的命令和远端发来的APS报文,要按照优先级来执行。具体条目如下:

PTN线性保护倒换功能(APS)详细设计说明书_protection_02

2Protection Type:具体的APS保护形势,分为ABDR四个字段:

  • A:表示是否有APS隧道。0为没有,1为有

  • B:表示是1+1还是1:1方式。01+1方式,11:1方式。

  • D:表示是单向还是双向。0为单向,1为双向。

  • R:表示是否返回,即当链路失效的情况恢复后,状态是否再次切换到工作实体上来。0为不返回,1为返回。

    3Requested Signal

              这个指示了本端要求对端进行保护切换。

在实际应用中, 对于APS报文中为SF请求,如果Requested SignalNormal Traffic Signal,则说明本端通知远端的bridge要进行保护切换。

4Bridged Signal

           指示了流量是否已经桥接到了保护链路上。对于1+1模型,这个标志位始终为Normal Traffic Signal,因为1+1模型中发送端始终是在工作链路和保护链路上各有业务复制。对于1:1模型,如果业务已经切换到了保护链路上,则将此位置为Normal Traffic Signal,否则为NULL

5Reserved为保留位。

 

  • APS功能特征

1、 链路失效的检测:

APS中,工作链路和保护链路的状态由OAM中的CCM来监测,此功能在Y.1731中定义。当两端检测到CCM超时之后,会触发链路失效的相关事件。

2、 返回和非返回倒换:

当链路失效后,正常流量会被倒换到保护链路上传输。当链路失效情况清除,工作链路恢复正常后,根据流量是否会再次被倒换到工作链路上分为返回式和非返回式。返回式会将流量再次倒换到工作链路上,非返回式不做此操作。

一般情况下,1+1模式为非返回式,1:1为返回式。因为在1+1模型中,首端是将流量复制两份分别在工作和保护链路上传输,尾端selector只是选择从哪接收,因此不管链路是否恢复,工作链路和保护链路上都有流量传输,因此不用返回。在1:1模型中,一般来说工作链路的状态会比保护链路更加优化,因此当工作链路恢复之后会倒换回去。

3、 保护倒换的触发:

  • 当本地网管下发了相关命令(如强制倒换,人工倒换)后

  • 在激活的传输实体上宣布了SF,而在备用传输实体上没有宣布SF

  • 收到的APS报文中要求倒换

4、 APS报文的发送和接收:

在状态发生改变时,如果没有配置Hold-off Timer,要立即发送APS报文,前三个报文要以3.3ms的间隔发送,与CCM的发送间隔一样;之后的报文以5s的间隔发送。如果一直没有收到带有有效信息的APS报文,则上一次收到的有效信息保持可用。如果再一次收到了带有有效信息的APS报文,则相关状态需要重新计算。

5、 bridge的控制:

1+1模型中,工作链路和保护链路上都要复制业务流量,因此业务始终一直桥接在工作实体和保护实体之上,发出去的APS报文中Bridged Signal也始终为Normal Traffic Signal

1:1模型中,有以下情况触发实体进行桥接:

  • 在收到远端的APS报文中,请求类型为SF,并且Requested SignalNormal Traffic Signal。此时表明远端已经检测到工作链路上的故障,并且远端的selector已经切换到保护链路上,正在通知本端进行bridge的切换。收到这种APS报文后,本端要将bridge切换到保护链路上,切换成功后发送出去的APS报文中Bridged SignalNormal Traffic Signal,否则为NULL

  • 本端检测到工作链路故障。当CCM报文超时后,本端发现工作链路发生故障,因此将bridge切换到保护链路上,切换成功后将发送出去的APS报文的Bridged Signal置为Normal Traffic Signal

  • 人工命令控制强制倒换。

6、 selector的控制:

selector切换到保护链路上有以下触发形式:

  • 本端工作实体通过CCM检测到工作链路失效,selector进行切换。

  • 收到远端发来的APS报文中请求类型为SF,且Bridged SignalNormal Traffic Signal

  • 人工命令强制倒换。

7、 两个定时器:

  • Hold-off Timer

为了在不同层面或者分级保护域内协调保护倒换的定时,需要一个延迟定时器,允许服务器层保护倒换在客户层发生倒换之前有机会修复故障,或者允许上游保护域在下游域之前进行倒换。延迟定时器的时间为1s—10s,以100ms为步长。

当网元实体检测到链路故障之后,如果此时配置的Hold-off Timer不为0,则实体不会立即将链路失效的状态上报,而是先等待Hold-off时间。在Hold-off时间超时后,实体会检测之前出现故障的链路上是否还存在故障,如果有则SFSD状态上报,如果没有则继续工作。

  • Wait-to-restore Timer

在返回模式下,如果业务已经切换到保护链路,在工作链路恢复之后,要将业务重新切换到工作链路上。但是为了防止因为间歇性故障引起的频繁的保护倒换,在业务重新恢复到工作链路之前,应该等待一段时间,即WTR时间段,等WTR时间超时后,再切换回工作链路。WTR的范围为5min—12min,以1min为步长。

当一个实体检测到工作链路恢复后,要切换回工作链路之前,会向远端发送一个请求为WTRAPS报文,并且此APS报文中的Resquested SignalBridged Signal都为Normal Traffic Signal,通知远端等待WTR。当WTR时间超时后,本端将业务切换回工作链路,同时向远端发送请求为NRAPS报文,此时的APS报文中Requested SignalBridged Signal都为NULL。远端收到此报文后,知道对端已经恢复至工作链路,则远端自己也要进行切换,完成后向对端发送请求为NRAPS报文,此时ResquestedBridged Signal都为NULL,通知对端自己也完成了倒换。

8、 APS相关命令:

  • 端到端命令及状态:

以下命令适用于本地和远端的整个保护组,因此当APS协议使能后,这些命令会发送到远端用来同步设定。在双向倒换中,这些命令同时影响到两端的bridgeselector

  • 保护锁定(Lockout of Protection):这个命令是为了防止从保护链路上选择业务流量,实际上就是禁止保护倒换。

  • 强制倒换至保护侧(Force switch normal trafficsignal-to-protection):强制从保护链路选择业务流量。

  • 人工倒换至保护侧(Manual switch normal traffic signal-to-protection):在工作链路和保护链路没有出现链路失效的情况下,强制从保护链路选择业务流量。

  • 人工倒换至工作侧(Manual switch normal trafficsignal-to-working):在非返回模式中,在工作链路和保护链路都没有出现链路失效的情况下,强制从工作链路选择业务流量。

  • WTR时间信号(Wait-to-restore normal traffic signal):在返回模式中,当工作链路上的SFSD信号清除后,需等待WTR时间后再切换回工作链路。待WTR超时后APS的请求状态为NR

  • 倒换练习(Exercise signal):进行APS报文的接收和发送练习,看APS功能是否正常,但是相关状态不通知bridgeselector

  • 非返回模式信号(Do-not-revert normal trafficsignal):在设定了非返回模式后,倒换后即使工作链路恢复正常,也不会重新倒换至工作链路。

  • 清除(Clear):清除近端的LO,强制倒换,人工倒换,WTR和倒换练习设定。

  • 本地命令:

以下命令只用于本地的APS保护组,即使使能了APS协议,并不会通知给远端。

  • 冻结(Freeze):冻结本地保护组的状态。在清除冻结之前,所有本地命令都无效,而且忽略所有的状态变换及收到的APS报文。

  • 清除冻结(Clear freeze):清除冻结状态

  • 从保护组锁定信号(Lockout normal traffic signal fromprotection):阻止从保护实体选择业务流量。对于业务流量,SFSD信号会被忽略。在双向倒换中,远端发来的桥接信号还是会被接收以防止协议失效。

 

  • 保护倒换具体过程

以下分别以1:1双向模型为例子,说明APS的具体工作过程,在这个例子中APS为返回式,而且配置了WTR,没有配置Hold-off Timer1+1单向模型中,一般不会用APS协议;1+1双向模型中,APS协议交互过程与1:1大致差不多,只是在1+1模型中,网元一端的bridge会一直在工作链路和保护链路上同时承载业务流量,因此APS报文中的Bridged Signal一直为normal traffic signal

如果APS为非返回式,则在工作链路恢复正常后,两端实体并不会将业务流量切换回工作链路,而是一直在保护链路上发送,除非通过命令强制倒换。

如果APS没有配置WTR,则在工作链路恢复正常后,网元不会等待一段时间,也不会发送请求类型为WTRAPS报文,而是立即将流量切换回工作链路,同时通过相应APS报文通知对端。

如果APS配置了Hold-off Timer,则在检测到SF后,网元不会立即切换到保护链路,而是会等待一段时间,带Hold-off Timer超时后,会再次检测工作链路是否失效,如果此时仍失效,则进行切换,同时发送相应APS报文给对端;如果在此时间段内恢复正常,则触发SF信号,进行相关倒换工作。

 

  • 工作原理图如下:

PTN线性保护倒换功能(APS)详细设计说明书_bridge_03

  • 场景:WestEast是东西向两个网元,配置了CCM1:1 APS保护倒换,在APS配置中,配置了WTR和返回式。开始的时候工作链路和保护链路都正常,业务流量在工作链路上传输。在某一时刻WestàEast工作链路上某店出现了故障。

  • 以下是APS具体过程:

  • 在开始正常的时候,WestEast都会发送APS报文,此时的APS报文中请求类型为NR,而且RequesedBridged Signal都为NULL,表明此时两端的bridgeselector都处于工作链路;

  • 某一时刻WestàEast工作链路中某点发生故障,East端的CCM超时,表明工作链路发生故障。此时会产生SF信号,East端的bridgeselector都会切换到保护链路上。切换成功后,会向West通过保护链路发送APS报文,此时的APS报文中请求为SF(表明链路发生故障),Requested Signalnormal traffic signal(表明要求对端的bridge切换到保护链路上),Bridged Signalnormal traffic signal(表明本端的bridge已切换到保护链路上)。此时在发送APS报文时,前三个APS报文要以CCM的间隔发送(默认为3.3ms),后面的APS5s间隔发送;

  • West通过保护链路收到带有相关信息的APS报文后,发现请求类型为SF,知道对端已经检测到了链路故障,而且报文中Requested Signalnormal traffic signal,则West本端的bridge 切换到保护链路;同时收到报文中bridged signal也为normal traffic signal,说明对端的bridge也切换到了保护链路上,则West本端的selector也切换到保护链路上;

  • Westbridgeselector都切换成功后,会向East发送APS报文通知。此时的APS报文中请求类型为NRRequestedBridged Signal都为normal traffic signal,通知对端自己已经知道了链路失效,而且已经进行了状态切换;

  • East收到West发来的APS报文后,知道对端已经成功切换。此时两端都已经工作在保护实体上,达到了保护的效果;

  • 当某一时刻工作链路恢复,East端通过CCM检测到之后,会将SF状态清除。如果配置了WTR,则会向West发送APS报文,此时APS报文中请求类型为WTR,说明链路恢复,在等待超时,RequestedBridged Signal都为normal traffic signal,说明此时仍需工作在保护链路;

  • WTR超时后,East端的bridgeselector都切换到工作链路,同时向West发送APS报文,此时的APS报文中请求类型为NRRequestedBridged Signal都为NULL,说明本端已经切换回工作链路,通知对端也要进行切换;

  • West收到East发来的APS报文后,发现上次的状态为SF而此时收到的APSNR,说明链路恢复正常,而且APS报文中的RequestedBridged Signal都为NULL,则West端的bridgeselector也切换回工作链路,同时向East发送APS报文进行通知,此时的APS报文中请求类型为NRRequestedBridged Signal都为NULL

  • East收到West发来的APS通知报文,知道对端也已成功切换回工作链路。此时两端都工作在工作实体上,业务流量恢复正常。