近几天我这里发生一个故障,原因比较奇特,现给大家说一下,看看大家有什么好的意见:
         一、网络描述
         我公司有一个大客户,大概有30多个点,这些点都是adsl ,分布在不同的城区的DSLAM上,这些DSLAM通过几台交换机互连,这些点分配在同一个vlan下,并在交换机上将vlan透传实现二层互通,实现各个点之间能够共享访问,在中心点有3台服务器,使用一台hub连接,同时中心点的adsl modem也连接到这个hub上,其他点都需要访问中心点的服务器。
         二、故障现象
         几天前经营部反映客户反映中心点到其他分点丢包严重,分点访问中心点服务器经常中断,用户反映强烈。
         三、故障处理经过
         接到申告后,首先怀疑网络***,为此派经营部人到中心点,将中心点用户设备甩开直接adsl modem接终端与其他点互ping,发现没有丢包的问题,然后将用户的hub接上,只接测试终端仍然正常,将服务器接上就出现丢包现象,为此怀疑用户服务器问题,用户检查后确认服务器没有问题,只好进行抓包,通过抓包发现下面的一个点有arp***嫌疑,将改点屏蔽后仍然丢包,只好在交换机上挨个关闭分点,发现当关闭某一个节点时,ping测试就正常了,检查该节点,发现该节点上联的DSLAM接到了一台中兴的ATM交换机上,该交换机通过的ETH板上的一个100M口和汇聚交换机上联,只有将该上联口关闭时网络才正常,关闭节点计算机或关闭该用户端口都无法使网络正常,为此将该节点所在DSLAM直接接到汇聚交换机上后网络恢复正常。
         四、故障原因分析
         由于ATM交换机在运营商网络中现在已经很少使用,我们的这台设备也已经是好几年前的了,而且ATM交换机对于IP的支持也只是一般,因此我们估计是ATM交换机的ETH口存在问题造成的这个故障,具体故障原因不明。