随着IP网络迅猛发展,网络规模及节点日益庞杂,为保证IP网络健康运行及网络的健壮性。东莞公司每年都会对各个IP网络节点进行主备倒换测试。在倒换测试的过程中发现了许多典型的小案例。本文主要列举几个比较实用的案例进行分析及总结。
 

一、实用案例1

1.1故障现象
在对智能网OSPIOD系统之间的互连链路(图一)进行主备倒换测试时发现,关闭智能网OSP侧的主用路由器(OSPIODa),此时智能网OSPIOD系统之间的网络不通,业务中断,主备倒换测试失败。正常情况下,在主用链路DOWN掉的时候,业务应该自动切换到备用链路上。
 
1.2故障分析
智能网OSP侧路由器与IOD侧路由器之间的链路,是采用以太网口经过SDH传输设备进行互连的,并启用了静态路由协议。这种方式存在一个隐患:本端路由器的以太网口与SDH传输设备相连,只要SDH设备正常工作,本端路由器的以太网口永远是处于UP状态的,这样,即使对端路由器出了问题,本端路由器依然从该以太网口向对端路由器转发数据包,从而造成网络中断。
1.3解决措施
通过以上分析,我们针对网络进行整改。在互连的四台路由器上,并采用OSPF路由协议,这样只要有一端接口DOWN掉,业务也能正常从备用链路上传送。

1.4案例小结
以太网口通过SDH互连时,只要SDH设备正常工作,网络采用静态路由器协议的方式,如果对端路由器DOWN掉,本端路由器端口物理端口及协议始终处于UP状态。这样一旦出现主用链路中断,业务不会自动切换到备用链路上,将导致业务中断。备用链路实际上起了不作用。延伸到其他类似设备例如协议转换器、光电转换器,只要以上设备能正常供电,本段路由器端口永远都是UP状态。当主用链路出现故障时,业务不能正常切换。(采取链路状态动态路由协议可以检测到整条链路情况变化,自动作出业务切换,在这种情况下可以正常进行主备切换。)

二、实用案例2

2.1故障现象
在对IODCMNET之间的网络互连链路(图二)进行主备倒换测试时发现,关闭CMNET侧的主用路由器的以太网口时,IODCMNET之间的网络不通,从公网连接IOD系统的业务全部中断,主备倒换测试失败。
 
                                  图二
2.2故障分析
 CMNET侧的两台路由器(NETIODaNETIODb)都配置了到CMNET6509的默认路由(ip route-static 0.0.0.0 0.0.0.0 211.139.193.163),并且发布到OSPF路由里。主用路由器默认路由的preference值为60,备用路由器默认路由的preference值为200。同时这两台路由器把包括与CMNET互连的direct 路由引入到了OSPF中。这样:当主用路由器(NETIODa)CMNET之间的互连网口DOWN了之后,主用路由器到CMNET6509的默认路由的下一跳转而会指向备用路由器,备用路由器会继续使用通过OSPF得到的到CMNET6509的默认路由,下一跳指向主用路由器,从而导致了主备路由器之间路由循环,引起网络中断。
2.3解决措施 
  根据分析结果,我们修改了CMNET侧两台路由器的默认路由数据,在默认路由上指定了下一跳的出接口Ethernet 0/0 ,(ip route-static 0.0.0.0 0.0.0.0 Ethernet 0/0 211.139.193.163),当下一跳接口DOWN了之后,默认路由不会再发布到OSPF里,不再引起路由循环,业务也能正常通过备用链路走。
 
2.4案例小结
在采用动态路由协议的网络中采用路由重分发技术的时候务必要考虑到路由循环的问题。

三、实用案例3

3.1故障现象
在对智能网FEP与康维短信系统之间的互连链路进行主备倒换测试时发现,关闭智能网FEP侧的主用路由器,将业务切换到备用路由器上,此时智能网FEP与康为短信系统之间的网络不通,业务中断,主备倒换测试失败。(从康维短信系统去PING智能网系统是正常的,但从智能网设备去PING康维短信系统不正常,网络出现了单通的问题。由于业务的连接是由智能网FEP向康维短信系统发起的,因此这种情况会使智能网FEP与康为短信系统之间的业务连接中断)
 
3.2故障分析
智能网FEP路由器和康维短信路由器都是将两个串口(Serial)绑定成一个虚拟接口(Virtual-Template1),然后进行网络互连。查看设备数据配置时发现同时存在了静态路由和OSPF动态路由。由于静态路由的优先级别高于动态路由,所以正常情况下网络设备采用静态路由。康维短信和智能网FEP互联的链路采用的是虚拟接口技术,路由器的虚拟接口的状态永远是UP的,在使用静态路由的情况下,即使当对端设备倒掉了之后,它仍然认为对端设备是可达的,从而造成了数据包转发不正常,出现了网络中断的现象。
3.3解决措施
在互连的四台路由器上,删除所有的冗余静态路由,采用以OSPF动态路由为主的路由协议,这样主备链路便能正常切换。

3.4案例小结
在配置网络数据和做网络技术改造时候,一定要注意检查是否存在无用的冗余数据,在分析数据确实无用之后一定要立刻删除,否则很容易引起其网络故障。

四、小结

在网络建设初期,需要根据实际情况(传输情况、数据流量情况、数据流通方向等)选择合理的网络模型(网络设备、网络结构、网络协议、以及路由控制技术等),前期考虑周全,会为后期的维护及网络的健康打下良好的基础。在网络维护阶段,尤其是在网络改造的时候,需要注意制作网络数据的正确性、以及合理性,避免制造无用冗余数据,这些数据在都有可能在特定条件下触发而引起网络故障。