生产事故:IBM(AIX系统)能够在交换机上看到WWN号,却在华为存储侧离线的状态,重启小型机解决


小型机A机到交换机上能够看到HBA卡,存储那边没办法注册上去,小型机侧执行cfgmgr也无法让存储侧重新识别到HBA卡,其实重启和cfgmgr作用还是不一样的。


查看到fcs0在主机侧是可用的状态

生产事故:IBM(AIX系统)能够在交换机上看到WWN号,却在华为存储侧离线的状态,重启小型机解决_在华为存储侧离线的状态重启小型机解决

通过nmon工具,可以看到fcs0流量为0 ,nmon--->ctrl+^即可出现各HBA卡的流量情况

生产事故:IBM(AIX系统)能够在交换机上看到WWN号,却在华为存储侧离线的状态,重启小型机解决_在华为存储侧离线的状态重启小型机解决_02

删除fscsi0,遇见错误, 因为多路径软件被占用,先删sfwcomm0

生产事故:IBM(AIX系统)能够在交换机上看到WWN号,却在华为存储侧离线的状态,重启小型机解决_在华为存储侧离线的状态重启小型机解决_03


生产事故:IBM(AIX系统)能够在交换机上看到WWN号,却在华为存储侧离线的状态,重启小型机解决_在华为存储侧离线的状态重启小型机解决_04


多路径软件检查

生产事故:IBM(AIX系统)能够在交换机上看到WWN号,却在华为存储侧离线的状态,重启小型机解决_在华为存储侧离线的状态重启小型机解决_05

查看路径是否enable,确定哪些路径可以disable

生产事故:IBM(AIX系统)能够在交换机上看到WWN号,却在华为存储侧离线的状态,重启小型机解决_在华为存储侧离线的状态重启小型机解决_06

查看物理路径,小机到存储连了四条光纤线,存储侧是有四个启动器,则物理路径应该有16条

生产事故:IBM(AIX系统)能够在交换机上看到WWN号,却在华为存储侧离线的状态,重启小型机解决_在华为存储侧离线的状态重启小型机解决_07

可以通过set pathstate=disable path_id=ID来设置路径的状态,但是不能针对卡或口来设置


解决方案思路:主要看看怎么触发这个主机口发送到存储的注册信息,重启可能是个办法。

生产事故:IBM(AIX系统)能够在交换机上看到WWN号,却在华为存储侧离线的状态,重启小型机解决_在华为存储侧离线的状态重启小型机解决_08

查看交换机端口的收发功率

生产事故:IBM(AIX系统)能够在交换机上看到WWN号,却在华为存储侧离线的状态,重启小型机解决_在华为存储侧离线的状态重启小型机解决_09

把3/45端口disable,然后重新激活

生产事故:IBM(AIX系统)能够在交换机上看到WWN号,却在华为存储侧离线的状态,重启小型机解决_在华为存储侧离线的状态重启小型机解决_10


下面发现是的确disabled

生产事故:IBM(AIX系统)能够在交换机上看到WWN号,却在华为存储侧离线的状态,重启小型机解决_在华为存储侧离线的状态重启小型机解决_11

然后重新激活该端口

生产事故:IBM(AIX系统)能够在交换机上看到WWN号,却在华为存储侧离线的状态,重启小型机解决_在华为存储侧离线的状态重启小型机解决_12


主机侧执行cfgmgr,在存储上看到还是离线的状态

生产事故:IBM(AIX系统)能够在交换机上看到WWN号,却在华为存储侧离线的状态,重启小型机解决_在华为存储侧离线的状态重启小型机解决_13


最后只能重启IBM小型机,分区起来后发现存储侧就变在线了,HBA注册成功

生产事故:IBM(AIX系统)能够在交换机上看到WWN号,却在华为存储侧离线的状态,重启小型机解决_在华为存储侧离线的状态重启小型机解决_14


各HBA卡的流量情况

生产事故:IBM(AIX系统)能够在交换机上看到WWN号,却在华为存储侧离线的状态,重启小型机解决_在华为存储侧离线的状态重启小型机解决_15

多路径的状态

生产事故:IBM(AIX系统)能够在交换机上看到WWN号,却在华为存储侧离线的状态,重启小型机解决_在华为存储侧离线的状态重启小型机解决_16

盘的状态查看为Available

生产事故:IBM(AIX系统)能够在交换机上看到WWN号,却在华为存储侧离线的状态,重启小型机解决_在华为存储侧离线的状态重启小型机解决_17

此时业务开启,流量变大

生产事故:IBM(AIX系统)能够在交换机上看到WWN号,却在华为存储侧离线的状态,重启小型机解决_在华为存储侧离线的状态重启小型机解决_18