有时候我们会接到客户的来电询问,“我主机的HBA卡坏了, 怎么更换? 存储需要更改什么设置啊? 对于主机有没有影响啊?”等等之类的问题。

下面我简单的谈一下更换主机HBA卡的方法和步骤,将围绕EMC目前主流的存储Symmetrix,VNX,Clariion进行介绍。

在进行更换之前,我们需要做以下工作:
1. 确认主机状态,是否有磁盘单链路情况(EMC Powerpath 命令为powermt display dev=all,链路上是否存在 dead链路,其他多路径软件请咨询相关厂商)
2. 确认主机HBA槽位,并且确认主机连接的光纤线标签是否清楚,我们需要非常清楚的了解主机连接的交换机端口和存储端口
3. 是否连接交换机
4. 如果连接交换机,确认交换机上的端口
5. 接着根据端口情况,确认交换机是哪种类型的zone 设置(如果是WWN Zone,请注意需要重新定义新的 zone因为新的HBA会有不同的WWN, 如果是port zone则不需要任何操作)

以下例子是在线的更换HBA的例子(基于IBM AIX系统及 EMC Powerpath)
1. Powermt display  确认故障HBA的序列号

浅谈主机FC-HBA卡更换_主机

2. Powermt remove hba=# 删除故障HBA上磁盘链路(此步可以拔出光纤)
3. rmdev 命令删除相关HBA卡
4. 更换HBA卡,插上光纤(是否需要停机由主机厂商决定)
5. 在交换机上找到相对应端口的HBA WWN(记录下)
6. 如果是WWN Zone, 需要使用新的HBA WWN更新ZONE
7. 下一步开始我们需要针对不同的存储分开讨论

我们先从 Symmetrix 开始介绍
首先从存储管理员那里了解故障主机连接的Symmetrix 磁盘是否使用了device masking(VCM).

如果回答是没有,说明新的HBA卡可以直接访问该磁盘。
如果有,则需要通过以下命令把新的HBA卡更新到VCM
Symmaskdb list –database

浅谈主机FC-HBA卡更换_主机_02

上图我们看到相关的端口访问的主机磁盘。
如果我们定位连接在16C port 0上的HBA卡 10000000C92aa277为故障卡需要更换的话
只需键入symmask –sid 1112 –wwn 10000000C92aa277 –replace new WWN
Symmask –sid 1112 refresh
这样对于symmetrix 上的主机操作就完成了

然后介绍VNX Unisphere上的相关设置

浅谈主机FC-HBA卡更换_主机_03

进入unisphere,,, 选择HOST TAB ,然后选择右侧的 Connectivity Status找出故障主机的HBA卡,选择Deregister(需要Engineering mode ).. 然后选择新的HBA, 点击register,注意编辑initiator type 和failover mode,选择的参数应与该台主机另外块HBA相同.

浅谈主机FC-HBA卡更换_主机_04

Storage group确认新的HBA卡正常添加在正确的SG里, 选择主机,然后点advance 选项 ,查看是否两块HBA 卡前已经打钩。

浅谈主机FC-HBA卡更换_主机_05

对于CLARIION  Navisphere

我们需要选择connectivity status, 与 unisphere 相同,选择故障的HBA卡Deregister(需要Engineering mode ).

浅谈主机FC-HBA卡更换_主机_06

选择新的HBA卡register, 设置好initiator type 和failover mode.

浅谈主机FC-HBA卡更换_主机_07

Storage group确认新的HBA卡正常添加在正确的SG里, 选择主机,然后点advance 选项 ,查看是否两块HBA 卡前已经打钩。

浅谈主机FC-HBA卡更换_主机_08

以上列出了不同存储需要的具体设置,待完成以后,我们需要再次扫盘。
/usr/lpp/Symmetrix/bin/emc_cfgmgr    //在主机重新扫盘(针对AIX主机,其他主机请查阅相关文档)
powermt config  //powerpath恢复磁盘路径
powermt save   //powerpath 保存磁盘路径信息
powermt display  //确认磁盘链路状况

最后期待所有磁盘路径都alive吧。。。希望以上的一些步骤能帮到大家!