客户有一台IBM X3400需要扩容本地硬盘,去之前以为和IBM x3650M4等服务器类似,就没有多查资料,到现场后发现阵列卡型号是SERVERAID 8K,整个配置界面与x3650M4 的webbios配置阵列卡完全不同,没敢贸然操作,上网查了查资料,一些注意的地方和大家分享一下。

    使用ARC配置ServeRAID_8k-l8k8i图文手册,已经上传到这里http://down.51cto.com/data/1357299


    

适用机型:
所有System x3400; 所有System x3500

 
故障现象:

当在一个已经存在的阵列配置中插入一个新硬盘时,下列信息会显示出来并伴随一个被损坏的阵列的列表:
"The following arrays have missing required members"

在所有阵列上的数据都会丢失,包括操作系统。在这个被损坏的阵列上,将无法启动进入操作系统。


受影响的配置:

下列IBM服务器受影响:
System x3400, Type 7973, any model
System x3400, Type 7974, any model
System x3400, Type 7975, any model
System x3400, Type 7976, any model
System x3500, Type 7977, any model

这篇文章没有指定特定的软件。

服务器配置了下列一个或多个IBM选件:

ServeRAID-8K-I, Option Fru p/n 25R8079
Serveraid-8K SAS Contoller Option P/N 25R8064 FRU P/N 25R8079

系统出现上述故障现象。


解决方法:

如果要避免丢失阵列信息,那么在安装新硬盘之前,要按照下面的方法对其进行初始化:
1、关闭服务器的电源;

2、拔掉服务器上所有现有的硬盘;

3、插入这个新的硬盘;

4、启动服务器;

5、在加电自检过程中,在看到Adaptec SAS RAID BIOS检测并提示如下信息时按Ctrl-A:

Press <Ctrl><A> for IBM ServeRAID

Configuration Utility!

Booting the Controller Kernel....../

6、在IBM ServeRAID ConfigurationUtility Options选项窗口中,选择"Array ConfigurationUtility";

7、在Main Menu主菜单中,选择"Initialize Drives"并按Enter;

8、按空格键来选择需要被初始化的硬盘,这些硬盘将会从左边的窗口移动到右边的窗口中,然后按Enter;

9、当出现警告提示时按Y;

10、预计每块硬盘需要用5-10秒来进行初始化,当所有的硬盘都初始化完成后,Main Menu主菜单将会显示出来;

11、按Escape退出IBM ServeRAID Configuration Utility界面;

系统重新启动;

12、在加电自检的开始,当看到IBM Logo标志显示时,关闭服务器;

13、重新安装上以前移走的硬盘;

14、那个新的硬盘可以随后安装或以后再安装;

15、启动服务器;

16、在显示Adaptec SAS RAID BIOS的界面时,将会看到下列信息:

New devices detected at the following SAS Phys: (listing

of reinserted devices)

17、按Enter回车接受当前的阵列配置;

相关文件可以在网站"Servers -ServeRAID Software Matrix"上获得,


详细信息:

当一块硬盘作为阵列的一部分后,每块硬盘都要被写上阵列配置信息的元数据。如果一块带有元数据的硬盘被安装到一个现有的阵列中,这个现有的阵列上的元数据就会被破坏并且这个阵列将会变得无法被系统使用。
在把一块硬盘插入到一个现有的阵列之前,一定要确认通过上述的初始化的步骤把所有的以前存在的元数据都要从这块硬盘上清除掉

 

======================================================

    上面的这些是网上粘过来的,基本已经说明了添加新硬盘的操作步骤。添加新硬盘后需要初始化硬盘,点初始化时会提示将破坏RAID信息,所以必须在拔掉原硬盘后去做初始化新盘的操作。


    更换硬盘的话看看后面的

    

更换ServeRAID 8k 或者8K-L的阵列中的硬盘后,这块硬盘会不会开始重建取决于Auto Failover和Copy Back的设置以及阵列中是否有热备份盘。
因此,如果一个阵列的状态变为critical重建将会从一块具备条件的热备份盘上开始。重建完成后,该硬盘将会恢复其热备份的状态并且成为运行的逻辑盘 /阵列中的一个有效组成部 分。通过标示ServeRAID ARC code,一块硬盘可以成为多个逻辑盘/阵列的热备份盘。

通过热插拔掉线的硬盘,或者重新启动系统,原来掉线的硬盘重新被识别并且显示为READY的状态,这时,copy back的特性将会开始将数据从热备份盘拷 回到原来掉线的硬盘上。这样保持了使用者最初设定的阵列的结构和状态。

然而当Auto Failover被禁用和插回一块已经使用过的硬盘(上面有数据)时,情况将会变得比较复杂。这种情况下,自动倒入数据的功能将会优先于拷贝回数据重建的操作。除非插入一块新的硬盘或者是使用者手动初始化插入的替代硬盘,否则原始数据将不会拷贝回替代硬盘进行重建。

这种行为主要是因为ServeRAID-8x Firmware v5.1-0 Build 9257或者更高,以及"Automatic Failover"默认是开启的。

下面的情况提供了更深入的关于Failover和Copy Back预期操作的说明。

情况一:
启用Auto Failover,并用一块新的硬盘插回原槽位来替代掉线的硬盘:

Auto Failover会做如下操作:
如果没有热备份盘,ServeRAID将会自动初始化硬盘并且开始重建
如果存在热备份盘,当有一块硬盘标示为掉线状态时,重建将会自动开始,并且这个重建的操作将会优先于任何AutoFailover设置或者操作。
如果存在热备份盘并且启用Copy Back时,重建完成后,数据将会开始从热备份盘转移到替代盘。
参考下面的全局热备盘的说明。

情况二:
启用Auto Failover,并用一块使用过的硬盘(内有数据)插回道原槽位替代掉线的硬盘:

Auto Failover会做如下的操作:
如果没有热备份盘,ServeRAID将会自动初始化硬盘并且开始重建
(注意:新插入硬盘上的数据将会被彻底清除)
如果存在热备份盘,当有一块硬盘状态显示为defunct时,重建将会自动开始并且优先于任何的Auto Failove的设置和操作。
如果存在热备份盘且启用Copy Back,重建完成后,数据将会开始从热备份盘上转移到替代盘。
参考下面的全局热备盘的说明。

情况三:
禁用Auto Failover并且插入一块新的硬盘(没有数据)到原槽位替代掉线的硬盘:
Auto Failover操作如下:
ServeRAID将会将新插入的硬盘变为READY的状态。
(注:这块新的硬盘需要手动干预去初始化硬盘使得硬盘可以被使用)
如果存在热备份盘,当一块硬盘显示为defunct的状态时,重建将会自动开始进行,并且优先于任何Auto Failover设置或者是操作。
如果存在热备份盘且启用Copy Back,在硬盘需要初始化的情况下,数据将不会从热备份盘转移到替代盘。在禁用Auto Failover时,我们需要手动完成该项操作。
参考下面的全局热备盘的说明

情况四:
禁用Auto Failover并且插入一块使用过的硬盘(内有数据)到原槽位替代掉线的硬盘:
Auto Failover操作如下:
ServeRAID会自动从插入的硬盘上自动倒入数据,最后的结果取决于硬盘上的RAID级别:
1)当作镜像时,逻辑盘将会联线并显示为critical的状态。
2)当有跨接阵列(例如RAID10)或者是具有条带的阵列(例如RAID5)时,数据从硬盘上倒入,

如果阵列上没有足够的空间使其状态变为online 或者critical,在新插入的硬盘上将会有***的告警灯(in SRM application)。这块硬盘将仍然不能使用直到逻辑盘上有足够的空间或者使用者手动的初始化硬盘。
(注:如果插入的这块使用过的硬盘原来是系统中一个阵列中的一块硬盘,这块硬盘将会被分配给一个新的逻辑盘从而这块硬盘看上去会和任何其他新插入的 硬盘一样。没有特殊情况的话,控制器会认为这是现有阵列中一块有效的硬盘。)

如果存在热备份盘,当有一块硬盘标示为defunct时,重建会自动开始并且高于任何Auto Failover设置或者操作。
如果存在热备份盘并且启用Copy Back,当替代盘用作他用或者需要初始化,数据将不会从热备份盘转移到替代盘。Auto Failover设置将会优先于用来保持最初的阵列状态的copy back操作。


注:全局热备盘在完成重建后将会依然保持热备份的状态。在完成重建后,使用者可以在任何时候通过在SRM中右键点击热备份盘选择deleting the "hot spare"删除热备份盘的热备份功能。当这些热备份盘失去热备份的作用后它们将会成为阵列的组成部分。如果使用者决定在更换掉线硬盘之前做这个操作,copy back将不会发生任何作用因为使用者已经接受了阵列新的硬盘组成结构。