服务器存储数据恢复环境:

一台MSA2000存储,有一组由8块SAS硬盘(其中有一块热备盘)组建的RAID5阵列,raid5阵列上层划分了6个lun,均分配给HP-Unix小型机使用,主要数据为oracle数据库和OA服务端。

存储raid5阵列数据恢复_数据

服务器存储故障检测分析:

MSA2000存储RAID5阵列中2块硬盘出现故障离线,阵列中只有一块热备盘,热备盘成功激活,RAID5阵列瘫痪,上层LUN无法使用,存储不可用。

存储raid5阵列数据恢复_数据恢复_02

服务器存储数据恢复过程:

1、将故障存储中所有磁盘做物理故障检测,没有发现有硬盘存在明显物理故障,都可以正常读取。

2、将所有磁盘以只读方式做扇区级全盘镜像。分析镜像文件,避免对原始磁盘数据造成二次破坏。

3、通过RAID校验程序对这个条带做校验,最终确定先掉线的那块硬盘。分析Oracle数据库页在每个磁盘中的分布情况,并根据数据分布的情况获取RAID信息。根据分析出的RAID信息虚拟重组原始RAID。

4、分析LUN在RAID中的分配情况,以及LUN分配的数据块MAP。将每一个LUN的数据块分布MAP提取出来,北亚企安数据恢复工程师编写程序解析所有LUN的数据MAP,然后根据数据MAP导出所有LUN的数据。

存储raid5阵列数据恢复_数据_03

5、修复损坏的区域并同步修改程序,重新解析LVM逻辑卷。

6、分析解析出来的LV,根据VXFS文件系统的底层结构校验此文件系统是否完整,没有报错,成功挂载。7、在HP-Unix小型机上mount文件系统后,将数据备份至指定磁盘空间。

8、使用Oracle数据库文件检测工具“dbv”检测每个数据库文件的完整性,经过检测没有发现问题。

9、将恢复出来的Oracle数据库附加到原始生产环境的HP-Unix小型机中,尝试启动Oracle数据库,Oracle数据库启动成功。

10、数据恢复完成。