作者:香农青岛数据恢复中心

2013-07-28 14:05

服务器RAID卡常见故障有:

RAID阵列卡/控制卡故障

RAID阵列配置信息丢失

硬盘不时发生错误导致RAID配置信息损坏

重新配置RAID时出错

如果是Raid卡故障导致的服务器系统不能启动,可能的原因有:

RAID信息破坏

RAID信息丢失

RAID卡损坏,更换后系统崩溃

重新配置RAID阵列信息

rebuild中途失败

rebuild成功后,分区找不到或者系统不能启动

如何减少RAID数据丢失的风险

在RAID阵列中,数据分布在所有的硬盘上。从数据恢复的角度看,这意味着任何一个磁盘上都不存在完整的文件,文件被分块交叉存储在整个阵列上。因此需要从所有硬盘上恢复数据(除了RAID 1)。下面是RAID发生故障时您所需要遵守的守则:

01不要更改阵列中的磁盘顺序:

这是非常重要的。实际上,除非阵列中的硬盘发生了硬件故障,否则不要将硬盘从服务器中取出。如果已经取出了,一定要按照原来的顺序放回。如果RAID中硬盘的顺序混乱了,那么就有可能丢失所有的数据。

02不要在阵列上运行磁盘检查程序:

如果操作系统检测到错误时常常会自动运行Scandisk和Chkdsk。但是这些程序不能修复硬盘的硬件故障,而且它们在遇到硬盘有故障时还会试图去修复。

03如果有一个或多个硬盘失败,不要继续运行系统:

如果RAID/SCSI BIOS报告一个或多个硬盘不能正常工作,那么通常是硬盘发生了硬件故障。有时,RAID/SCSI BIOS显示硬盘掉线不是由于硬盘的硬件故障引起,而是由于RAID配置故障导致的。

04不要重新配置RAID:

如果RAID配置正常,那么就不需要重建配置信息。如果配置信息已经丢失或损坏,那么就必须重新正确的配置RAID。

最重要的守则:

不要rebuild RAID:如果你已经做了上面提到的错误操作,而又不能确定是否可以自己恢复数据,千万不要rebuild RAID。