服务器数据恢复环境:

VMware ESX服务器;

服务器文件系统:VMFS;

8块硬盘组建RAID5,4号盘是热备盘。


服务器故障:

服务器两块硬盘指示灯亮黄色,机房管理员检测后初步判断这2块盘出现物理故障,序列号无法读取,在SAS扩展卡上无法识别。管理员联系我们数据恢复中心对raid进行数据恢复。


服务器数据恢复过程:

1、硬盘物理故障修复。

硬件工程师拿到所有服务器硬盘后首先检查了raid中的两块掉线盘,将故障盘连接到外部SAS扩展卡上加电检测,磁头不寻道。硬件工程师在无尘工作间对故障硬盘进行开盘修复。修复完成后对故障盘数据做镜像。


2、重组RAID5。服务器数据恢复工程师发现所有硬盘的的0扇区都有“55 AA”标志,0x01C2H处表示该分区的类型,这里显示“05”,代表这是一个扩展分区。因此从0扇区看这是一个不正常的MBR分区结构。按照这一方法继续查找,分别在7号盘和8号盘找到了“55 AA”的标志。8号盘查询结果如下。这是一个正常的MBR分区,其0x01C6处数值代表指向的下一个扇区为GPT的头部。


【服务器数据恢复】VMFS文件系统RAID5硬盘故障的数据恢复案例_raid数据恢复


7号盘查询结果如下。其0x01C6处数值代表指向下一个扇区。但是下一个扇区很明显不是GPT的头部。


【服务器数据恢复】VMFS文件系统RAID5硬盘故障的数据恢复案例_raid数据恢复_02


由此可以确定8号盘是第一块盘,7号盘可能是最后一块盘。GPT分区所在扇区起始于172032扇区,因此初步确定LUN的起始扇区是172032扇区。


条带也就是raid阵列块,是RAID处理数据的基本单元,不同的RAID的条带大小也各不相同。RAID5的1个条带组中有1个校验区,可以根据这个规律对该raid5进行分析,也可以通过比较法确定条带大小。如某一条带组中的校验区跟这一条带组中的非校验区可能相差很明显,通过WinHex查看做对比就可以找到条带大小。服务器数据恢复工程师对该服务器raid进行分析确定条带大小为1024个扇区。按照1024扇区分割,使一个记录为一个条带的大小,如图5所示。并且7块盘跳到同一记录283123。


【服务器数据恢复】VMFS文件系统RAID5硬盘故障的数据恢复案例_数据恢复_03


当7块盘都定位到同一位置时,通过对比就可以判断校验区的走向,继而判断整个RAID5的走向。之前已经判断出8号盘是第一块盘了,把8号盘放在第一个位置,确定RAID5为左走向,盘序为8,2,3,4,1,7,5。


【服务器数据恢复】VMFS文件系统RAID5硬盘故障的数据恢复案例_数据恢复_04


服务器数据恢复工程师初步确定了LUN的起始扇区是172032扇区。使用数据恢复工具跳到172032扇区对硬盘的使用情况进行观察,正常情况下这个扇区所属条带中的5号盘应该是校验区,但实际情况中却显示校验区为8号盘。根据该raid走向的规律,5号盘的校验区应该在172032-1024=171008扇区,即上一个条带。跳转到171008扇区,发现校验区为5号盘。因此可以确定LUN的起始扇区为171008扇区。


北亚数据恢复工程师使用数据恢复工具按照确定的盘序重组raid添加进去,如图所示。选择RAID5,Stripe size 512KB,左异步。


【服务器数据恢复】VMFS文件系统RAID5硬盘故障的数据恢复案例_数据恢复_05


点击Build进行重组。组好后,由于数据从1024*8=8192个扇区开始,若专业恢复工具没有跳转到此扇区的功能,那么刚组好的RAID必须和一个文件再进行一次Build重组操作。RAID的起始扇区(Start sectors)选择8192,这个文件可以任意选择起始扇区和大小(Count sectors),下图为重组后的raid5磁盘阵列。


【服务器数据恢复】VMFS文件系统RAID5硬盘故障的数据恢复案例_raid数据恢复_06


服务器数据恢复结果:

RAID5磁盘阵列重建完成后由服务器管理员验证通过,本次数据恢复工作完成。