硬件运行环境:16块盘Raid5,每块盘1TB,接口为SATA。

软件运行环境:LUNIX

文件系统:XFS

故障现象:
16块盘的盘阵,其中15块盘做成Raid5,一块盘预留作热备盘,但是实际配置时没有设置热备盘.据客描述,2号盘(硬盘在盘阵中的编号是1-16)有坏道,3号盘作为热备盘顶替16号盘,还没有Rebuild完成。文件系统目前无法mount.

客户采取措施:
 客户开始不想走数据恢复之路,单独拿2号盘和一块型号一样的新盘,让我们把2号盘镜像到这块新盘上,然后把这个镜像过的新盘插到2号盘位置,重新启动盘阵,发现新盘状态在Raid5中显示为“Not Use”,就以为是我们的镜像方法有问题,导致阵列卡中识别不到该硬盘。后来经过导论和论证,通过这种方法更换硬盘行不通,因为Raid信息中包含有每块硬盘的SN序列号信息,这种单纯更换镜像硬盘的方式前后硬盘 SN号不一致,阵列卡不会直接识别到新镜像的硬盘的Raid信息。

数据恢复过程:
 1、通过对16块盘进行分析,发现1号盘是在出问题之前更换过的硬盘,硬盘内的信息跟Raid5的其他硬盘内容不匹配。完全可以剔除掉。
 2、发现3号盘内容前半部分和16号盘是一样的,3号盘替换16号盘Rebuild还没有完成。
 3、一共16块盘的盘阵,剔除1号盘和3号盘,只剩下14块盘,经分析,这是15块盘组成的Raid5,如今只有14块盘的数据可用,这样只能缺一块盘来组合生成。
 4、组合完成,恢复出XFS文件系统下的90多GB的文件。

本案例总结:
 1、例1号盘没有参与Raid5数据组合,16号盘已经被踢出Raid5阵列中,阵列状态停留在Rebuild过程,而且Rebuild进度到10%,只能确定目前正在Rebuild 3号盘,但是拿1号盘参与Rebuild 3号盘,如果Rebuild完成,那么数据将受到致命影响。
 2、在有些盘阵中,镜像一块硬盘,然后用镜像盘替换原始硬盘,新的镜像盘在原来阵列中可能识别不到,因为阵列信息包含有硬盘唯一标识的SN号。

声明:作者达思数据恢复技术专家覃廷良,本文首发http://www.bnuol.com 转载请保留出处,在donews.com,51cto,techweb,新浪等数据恢复技术博客上转发.