交换机是个人和企业的常用设备,在使用过程中难免会出现各种问题,在出现问题时该如何进行故障的定位和判断呢?下面就以H3C的交换机为例,给大家讲讲设备的异常检查项。

设备指示灯状态是否正常

设备提供种类丰富的指示灯,通过查看指示灯的状态,可以判断该指示灯所指示对象的运行状态,如果发现指示灯状态异常,请及时记录故障信息,并进行故障定位与处理。

检查设备是否存在紧急或重要告警

display alarm 命令仅部分产品支持,其他产品可通过查看日志信息确认是否存在告警。如果部署有网管系统,也可以通过网管系统来检查设备是否存在告警,日志信息的详细介绍等。

检查设备的健康状态是否正常

登录设备后,可通过以下命令查看设备的健康状态:

display cpu-usage
display memory
display fan
display power
display environment

查看告警信息确认是否存在告警

在日常维护中,对于 ERROR 级别的告警需要及时处理。登录设备后,执行 display alarm 命令查看设备是否存在级别为 ERROR 的告警信息。不同设备回显信息可能存在差异,请以设备实际显示内容为准,以下回显信息以核心交换机 S12500X-AF 系列交换机为例。

java rebbitmq 检测交换机 检查交换机是否正常_运维

java rebbitmq 检测交换机 检查交换机是否正常_网络_02

java rebbitmq 检测交换机 检查交换机是否正常_java rebbitmq 检测交换机_03

检查风扇的工作状态

查看在位的风扇的状态(State)是否均为 Normal。不同设备回显信息可能存在差异,请以设备实际显示内容为准,以下回显信息以接入交换机 S5560X-EI 系列交换机为例。

java rebbitmq 检测交换机 检查交换机是否正常_网络_04

java rebbitmq 检测交换机 检查交换机是否正常_运维_05

如果发现异常,请检查风扇模块是否插牢、风扇叶是否被卡住或灰尘较多。如果是上述原因,可通过热拔插风扇模块,清理风扇叶中的异物或灰尘等方式进行解决。如果不是上述原因,可尝试通过更换风扇模块的方式进行解决。

检查设备电源的信息

查看在位的电源模块的状态(State)是否均为 Normal。(不支持电源管理功能,以下显示信息以 接入交换机S5560X-EI 系列交换机为例)。

java rebbitmq 检测交换机 检查交换机是否正常_服务器_06

java rebbitmq 检测交换机 检查交换机是否正常_技术支持_07

java rebbitmq 检测交换机 检查交换机是否正常_运维_08

如果发现异常,请检查电源模块的开关是否闭合、电源线缆是否松动,最后可尝试通过更换电源模块解决故障。如果无法解决,请及时记录故障信息并寻求更高技术支持。

查看在位的电源模块的状态(State)是否均为 Normal(支持电源管理功能,以下回显信息以 S12500X-AF 系列交换机为例)。

java rebbitmq 检测交换机 检查交换机是否正常_技术支持_09

java rebbitmq 检测交换机 检查交换机是否正常_网络_10

java rebbitmq 检测交换机 检查交换机是否正常_java rebbitmq 检测交换机_11

java rebbitmq 检测交换机 检查交换机是否正常_技术支持_12

如果发现异常,请检查电源模块的开关是否闭合、电源线缆是否松动,最后可尝试通过更换电源模块解决故障。


第二课-设备问题排错(压缩版)


查看日志信息确认是否存在告警

登录设备后,执行 display logbuffer 命令查看日志缓冲区中记录的日志是否存在告警信息。不同设备回显信息可能存在差异,请以设备实际显示内容为准,以下回显信息还是以 S12500X-AF 系列交换机为例。

java rebbitmq 检测交换机 检查交换机是否正常_技术支持_13

java rebbitmq 检测交换机 检查交换机是否正常_运维_14

java rebbitmq 检测交换机 检查交换机是否正常_技术支持_15

检查 CPU 的使用情况

查看设备的 CPU 使用率是否高于 80%。不同设备回显信息可能存在差异,请以设备实际显示内容为准,以下回显信息还是以 S12500X-AF 系列交换机为例。

java rebbitmq 检测交换机 检查交换机是否正常_网络_16

java rebbitmq 检测交换机 检查交换机是否正常_技术支持_17

如果发现 CPU 使用率过高,请观察一段时间(5~10 分钟),如果一直处于高使用率状态,请及时寻求技术支持。

检查内存的使用情况

查看设备的内存空闲率是否低于 20%。(不支持低端内存,以下回显信息以 S12500X-AF 系列交换机为例)。

java rebbitmq 检测交换机 检查交换机是否正常_运维_18

java rebbitmq 检测交换机 检查交换机是否正常_网络_19

如果内存空闲率在持续的一段时间内(一般为 30 分钟)过低,请及时联系代理商或 H3C 技术支持热线,寻求技术支持。

查看设备的低端内存空闲率是否低于 20%。(支持低端内存,以下回显信息以 S5560X-EI 系列交换机为例)。

java rebbitmq 检测交换机 检查交换机是否正常_java rebbitmq 检测交换机_20

java rebbitmq 检测交换机 检查交换机是否正常_服务器_21

如果低端内存空闲率在持续的一段时间内(一般为 30 分钟)过低,请及时寻求技术支持。

检查设备上温度传感器的温度信息

查看当前温度(Temperature)是否处于正常范围内。不同设备回显信息可能存在差异,请以设备实际显示内容为准,以下回显信息以 S12500X-AF 系列交换机为例。

java rebbitmq 检测交换机 检查交换机是否正常_网络_22

java rebbitmq 检测交换机 检查交换机是否正常_网络_23

java rebbitmq 检测交换机 检查交换机是否正常_服务器_24

如果发现异常,请检查机房温度是否正常、设备散热通道是否堵塞、设备的风扇模块是否工作正常,并采取相应的处理措施

检查各单板及子卡运行状态是否正常

(框式设备)

登录设备后,执行 display device 命令检查单板及子卡的状态,查看在位的各单板状态(Status)是否均为 Normal,子卡状态是否正常。不同设备回显信息可能存在差异,请以设备实际显示内容为准,以下回显信息以 S12500X-AF 系列交换机为例。

java rebbitmq 检测交换机 检查交换机是否正常_网络_25

java rebbitmq 检测交换机 检查交换机是否正常_java rebbitmq 检测交换机_26

java rebbitmq 检测交换机 检查交换机是否正常_技术支持_27

如果检查结果发现异常,可通过重新插拔单板或子卡的方式进行解决。如果无法解决,请及时记录故障信息,并联系技术支持。