案例一:

一次割接当晚发现NE40EX8路由器与对端的S12704设备的千兆单模口物理上起不来

排除过程:

  1. 首先观察现象,单模模块插入后与对端起不来,但是多模模块插入后与对端起来了

我们怀疑是模块问题和线路或卡槽等物理问题所以做了自环操作后发现端口物理和link层UP起来了

所以排除了物理设备的问题


2. 其次我们将设备与对端互联后观察光的收发是否正常,

对于路由设备可以通过display interface g0/0/1  或着在接口下 display this interface 查看设备的光收发是否在正常范围值内

Rx Optical Power:  -40dBm, Normal range: [-16.989,  0.000]dBm
Tx Optical Power:  -5.43dBm, Normal range: [-9.500,  0.000]dBm

对于交换设备通过<HUAWEI> display transceiver interface gigabitEthernet 7/0/5 verbose

RX Power(dBM)                 :-40
  RX Power High Threshold(dBM)  :0.00
  RX Power Low  Threshold(dBM)  :-16.99
  TX Power(dBM)                 :-4.47
  TX Power High Threshold(dBM)  :0.00
  TX Power Low  Threshold(dBM)  :-9.50

发现接口下的接收光功率都不正常,但是发出的光都是正常的,所以应该是对端收到了光,但是由于某些原因比如协商没有通过并没有去接受这个光。


3. 由于是物理无法UP所以怀疑是协商起不来

通过查看文档发现

对于NE40EX8 的

V800R009C10

缺省情况下:

  • 电接口的自动协商模式处于使能状态。

  • 光接口的自动协商模式处于去使能状态。

对于S12704设备

V200R005C00

  • 当GE光接口插入GE光模块或GE光电模块后支持配置自协商功能

  • 缺省情况下,以太网接口处于自协商模式

  • 缺省情况下,GE光接口的自协商功能处于使能状态,但是速率自协商未使能,用户可执行命令speed auto-negotiation,配置接口速率自协商功能

所以找到了问题根源由于路由器上光端口没有开启自协商

所以在路由器上接口下输入negotiation auto 双方接口物理上UP了,link层上也没有问题,结案。


案例二:

一次客户在用服务器上传文件时发现速率特别的慢,就去看了下服务器上面,发现接口下面显示

此处为我自己电脑演示图,速率不准确

1.jpg

ifconfig查看网卡名称

2.jpg2.jpg

ethtool 查看网卡的速率

3.jpg

客户就很奇怪我买的华为服务器设备接口不是1000Mb的吗?交换机也是千兆的口啊,怎么变成了100Mb。

排除过程:

        1.首先我去了后问了下基本的情况,客户说他们有二十多台服务器,都是双网卡,但是发现有的端口是百兆的口了,速率很慢。我就跟着客户将所有服务器存在这种情况设备统计了一下,发现存在8台设备存在一个端口是1000MB,一个端口是100MB,居然还有一个端口是10MB的,还有一台设备只显示一个网卡。


        2.然后,对于服务器都是自协商来判断接口速率,我去接入交换机上查看了一下,通过display interface

将所有的接口详细情况抓取,然后去判断

<HUAWEI> display interface gigabitethernet 1/0/1
GigabitEthernet 1/0/1 current state : UP                                      
Line protocol current state : UP                                             
Description:                                                                  
Switch Port, Link-type : access(negotiated), 
PVID :    1, TPID : 8100(Hex), The Maximum Frame Length is 9216   
IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is 0025-9ef4-abcd
Last physical up time   : -                                                    
Last physical down time : 2012-05-24 21:01:26                                  
Current system time: 2012-06-05 18:56:41                                       
Port Mode: COMMON FIBER, Transceiver: 1000_BASE_SX_SFP                                                        
Speed : 1000,   Loopback: NONE                                                  
Duplex: FULL,   Negotiation: ENABLE                                             
Mdi   : NORMAL, Flow-control: DISABLE                                                                 
Last 300 seconds input rate 0 bits/sec, 0 packets/sec                          
Last 300 seconds output rate 0 bits/sec, 0 packets/sec                         
Input peak rate 0 bits/sec, Record time: -                                     
Output peak rate 0 bits/sec, Record time: -   

统计了一下具体的端口,发现也是8个端口,和服务器上的统计一致。此时表明交换机和服务器连接端口通过协商将端口判断为100MB的。

我在交换机上相应的问题接口下做了如下配置去排除可能存在问题:

1.交换机端口默认是开启自协商的,如果关闭自协商呢?

2.由于该接口是千兆以太网电口,我强制将接口速率设置为1000MB,或好的1000MB端口强制设置为100MB呢?

我将出现100MB问题的端口,关闭自协商,此时端口物理上down了,强制为100MB后端口UP了

我将没出现问题的端口,关闭自协商,此时端口down了后又up了,强制为100MB后端口down了又Up

根据现象发现可能由于物理线路问题导致出现问题口无法协商为1000MB。


        3.最后我更换了根线,发现接口下速率恢复正常了,变更为1000MB。但是线是超六类线,可能是水晶头问题,更换了水晶头后就正常了,结案。



总结一下物理接口down的排除方法

检查两端光模块类型/波长是否匹配

检查两端光纤光模块是否匹配

检查光功率是否在正常范围

检查两端接口自协商方式是否一致

背景信息

请在接口视图下执行display this interface 命令查看端口配置:

[~HUAWEI-GigabitEthernet1/0/0] display this interface
GigabitEthernet1/0/0 current state : UP (ifindex: 9)
Line protocol current state : DOWN
Link quality grade : GOOD
Description:
Route Port,The Maximum Transmit Unit is 1500
Internet protocol processing : disabled
IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is 0009-0012-0005
The Vendor PN is FTLF8519P2BNL-HW
The Vendor Name is FINISAR CORP.  
Port BW: 1G, Transceiver max BW: 1G, Transceiver Mode: MultiMode
WaveLength: 850nm, Transmission Distance: 500m

Rx Optical Power:  -6.84dBm, Normal range: [-16.989,  0.000]dBm
Tx Optical Power:  -5.43dBm, Normal range: [-9.500,  0.000]dBm

Loopback:none, full-duplex mode, negotiation: negotiation disable, Pause Flowcontrol:Receive Enable and Send Enable

上述命令行回显中粗体部分为光模块和波长的信息,需要确认本端设备与对端设备的光模块是否匹配(光模块类型和波长,两端要匹配):

  • 如果两端光模块类型/波长不匹配,请更换光模块,确保光模块类型/波长匹配。

  • 如果两端光模块类型/波长匹配,请继续执行

  • 故障现象依然存在,请按照如下步骤进行环回测试:

    1. 在接口视图下执行loopback remote命令,然后执行commit命令,如果对端物理层正常Up,说明对端端口没有问题。

    2. 用一根测试完好的光纤加上光衰减器,将本端光模块的收/发口相连:

      • 如果物理层可以Up,即可以判断本端单板和光模块没有故障,需要对链路或对端设备进行排查。

      • 如果物理层依然不能Up,则可判断本端设备的单板或光模块异常,可尝试复位接口来解决问题。复位接口可先使用shutdown命令关闭接口,再使用undo shutdown命令打开接口。如果复位接口还未解决问题,可尝试更换光模块、子卡或单板,或暂时将业务割接到其他完好的接口,

4.jpg