服务器数据恢复环境:

昆腾系列存储;

9个配置24块硬盘的磁盘柜;

8个存储柜存储数据,1个存储柜存储元数据;

元数据存储柜24块146G硬盘:8组RAID1+1组4盘位的RAID10+4个全局热备盘;

数据存储柜192块硬盘:32组6盘位的RAID5,分为2个存储系统。


故障:

数据存储中的1个存储系统中的一组RAID中的2块硬盘先后故障离线,RAID失效,整个存储系统崩溃,无法使用。管理员联系北亚数据恢复中心进行数据恢复。

存储及文件系统架构大致如下:

【北亚数据恢复】昆腾系列存储服务器StorNext文件系统RAID中的2块硬盘先后故障离线,RAID崩溃的数据恢复案例_数据

【北亚数据恢复】昆腾系列存储服务器StorNext文件系统RAID中的2块硬盘先后故障离线,RAID崩溃的数据恢复案例_服务器_02

注:Meta_LUN(元数据卷)    Data_LUN(用户数据卷)


数据恢复过程:

1、为防止数据恢复过程中由于误操作对原始磁盘造成二次破坏, 首先对原始存储环境进行备份。

对故障RAID中的6块盘进行编号标记,将硬盘从存储柜中拔出,接入到北亚数据恢复中心的数据备份服务器上,对6块硬盘进行全盘备份。

对其余无故障的RAID进行存储层面的备份。使用光纤线缆将北亚专用数据备份服务器和存储设备连接,进入昆腾存储设备管理界面进行配置,让备份服务器和存储设备可以正常通信,使用软件对RAID中的LUN进行镜像备份。

在备份过程中北亚数据恢复工程师发现故障RAID中的1块故障硬盘存在大量坏道,无法正常备份。北亚工程师对故障硬盘进行开盘更换固件,并使用PC3000工具进行修复,完成故障硬盘备份。


【北亚数据恢复】昆腾系列存储服务器StorNext文件系统RAID中的2块硬盘先后故障离线,RAID崩溃的数据恢复案例_服务器_03

部分镜像文件


2、数据分析。

对故障RAID进行分析获取到RAID相关信息,北亚数据恢复工程师利用获取到的RAID信息对RAID阵列进行虚拟重组,并将RAID中的LUN恢复成镜像文件。在分析过程中发现损坏较严重的硬盘为后离线的硬盘。

登录昆腾存储设备的管理界面,获取到StorNext文件系统中卷相关的一些基本信息,如下图:

【北亚数据恢复】昆腾系列存储服务器StorNext文件系统RAID中的2块硬盘先后故障离线,RAID崩溃的数据恢复案例_数据恢复_04


继续对StorNext文件系统中的Meta卷和Data卷进行分析。本案例StorNext文件系统中包含2个Data卷,每一个完整的Data卷都是由多组RAID中的LUN组成的,北亚数据恢复工程师对这些LUN进行分析,得到LUN之间组合的算法规律,虚拟重组出完整的Data卷。


【北亚数据恢复】昆腾系列存储服务器StorNext文件系统RAID中的2块硬盘先后故障离线,RAID崩溃的数据恢复案例_数据恢复_05


对Meta卷中的节点信息、目录项信息、Meta卷和Data之间的对应关系进行分析,针对一个Meta卷管理多个Data卷的情况,北亚数据恢复工程师研究出Meta卷到Data卷的索引算法。


【北亚数据恢复】昆腾系列存储服务器StorNext文件系统RAID中的2块硬盘先后故障离线,RAID崩溃的数据恢复案例_数据_06

文件节点


【北亚数据恢复】昆腾系列存储服务器StorNext文件系统RAID中的2块硬盘先后故障离线,RAID崩溃的数据恢复案例_服务器_07

目录块


3、通过分析获取到了数据恢复工作所需要的全部信息,北亚数据恢复工程师编写程序扫描Meta卷中的节点信息和目录项信息,同时对目录项和节点进行解析,获取完整的文件系统目录结构,解析每一个节点中的指针信息,将这些信息记录在数据库中。

【北亚数据恢复】昆腾系列存储服务器StorNext文件系统RAID中的2块硬盘先后故障离线,RAID崩溃的数据恢复案例_数据_08

文件信息


4、北亚数据恢复工程师编写文件提取程序读取数据库,根据解析出的信息以及两个Data卷之间的聚合算法对数据进行提取。


验证数据&移交:

对生成出的数据进行随机抽样检测,数据没有问题。将全部文件提取到本地,确认提取完成后进行数据移交。


【北亚数据恢复】昆腾系列存储服务器StorNext文件系统RAID中的2块硬盘先后故障离线,RAID崩溃的数据恢复案例_服务器_09