近期因为项目扩容上线,紧急从其他地方调拨过来30多台物理主机,等机房现场施工完后开始割接--打通网络、存储、业务等。在割接期间遇到古怪的异象--光交端口disable,光交端口speed--AN状态(空行)不停切换不同端口,这个问题折腾好久后终于定位到原因
问题现象
1、光交--端口状态 disabled(Port Throttled) ,且No_Sync状态 。
如下图:批量
出现以上情况可能的原因是:光模块问题、光纤线路问题。
正常状态如下: Online状态,且显示WWN
2、光交--端口speed--AN状态,且该现象的端口变化不固定。
如下图 两个地方:speed状态AN;该显示wwn状态的地方为空。
, 出现AN状态的端口 跳来跳去,且这种现象的端口不固定(有时候11、12端口,有时候就变成7、8端口)。这表示可能有光但协商出现问题,可能是万兆10G或25G的网线光口接到光交上。
3、操作系统中看不到wwn号,且状态异常。
由于驱动或未配置HBA等原因在操作系统内是看不到wwn号或状态的。此处无截图。
正确的显示如下:
4、BMC或ilo界面的HBA显示
正确如图:status状态是Unknown状态,表示未接线。
5、主机背面接线情况
通过PN的部件号在网上查询确认该部件什么用途等
正确如图:HBA卡上有fc字样,且有部件号可查用途。
经过各种比对,发现此次原因是连接光交的线接到扩展的25G网卡上导致,详细如下图。
踩坑经验总结
1、在bmc界面确认该FC-HBA卡存在,比如厂家和型号、以及wwn等;
2、在操作系统中能可以到wwn号,先忽略端口状态;
3、在主机背面接线图上确认接线正确,通过PN号确定是什么用途。
4、在光交上查看端口状态。接线后光交的端口状态显示WWN号,不配置zone下也同样显示wwn号。
所以割接操作前,最好有一份主机标签、SN号、ilo管理地址、操作系统地址、两个WWN等汇总成的一张信息表,方便操作时查看、核实。
以下是其他图片