环境:

IBM DS5300的存储

一个机头连接4个扩展柜

2组由50块600GB的硬盘组的RAID5


故障:

一组由27块600G硬盘组成的,存放Oracle数据库文件的RAID5崩溃。在存储系统上层一共分了11个卷:10个1TB,1个4TB。磁盘故障导致存储不可用。


数据恢复过程:

1、硬件检测:

北亚数据恢复中心的硬件工程师先对27块硬盘做了硬件检测,发现2块硬盘出现坏道、SMART的错误冗余级别已经超过阀值,对25块正常的硬盘进行全盘镜像,对2块有坏道的硬盘用硬件工具进行了恢复并生成镜像文件。


【IBM DS5300存储数据恢复】由于硬盘坏道导致RAID5崩溃的数据恢复案例_数据


【IBM DS5300存储数据恢复】由于硬盘坏道导致RAID5崩溃的数据恢复案例_数据恢复_02


2、故障分析:

首先收集IBM DS5300存储日志信息。存储上两块盘指示灯亮黄灯,用收集到的日志信息分析出两块硬盘的掉线时间,推断出那块硬盘里面的数据是最新的,用数据最新的硬盘进行数据恢复。


3、经过北亚数据恢复工程师的研讨后,提出以下解决方案:

方案一:通过IBM DS存储管理软件进行强制上线,在强制上线之前把存储的所有硬盘都进行备份后强制上线。

方案二:通过对硬盘底层数据分析,进行RAID重组,从底层提取数据,重新加载oracle数据库,调试上层应用。


4、实施方案:

把存储的所有硬盘都进行备份,先采用第一种方案,先在模拟器上进行测试,之后在存储上进行上线操作。

通过IBM DS存储管理软件进行强制上线,强制上线之后raid处于降级状态,这个时候设置好热备盘,让热备盘顶上,进行数据同步,同步完之后上层的卷直接可以用了,所有数据也都可见了,上层应用也能正常使用。

第一种解决方案,节省了很多时间,上层应用也不需要在调试,可以直接启动。


【IBM DS5300存储数据恢复】由于硬盘坏道导致RAID5崩溃的数据恢复案例_数据恢复_03


【IBM DS5300存储数据恢复】由于硬盘坏道导致RAID5崩溃的数据恢复案例_存储管理_04


【IBM DS5300存储数据恢复】由于硬盘坏道导致RAID5崩溃的数据恢复案例_oracle数据库_05


【IBM DS5300存储数据恢复】由于硬盘坏道导致RAID5崩溃的数据恢复案例_数据_06


5、数据恢复结果验证:

由于上层的卷直接可以用了,所以数据也都可见了,处于安全考虑,北亚数据恢复工程师将卷里的文件都拷贝出来,然后移交给客户公司。整个恢复过程一共历时5天。

之所以能这么快恢复,还是在于北亚数据恢复工程师之前研究过IBM DS5300的存储原理,北亚数据恢复工程师完全有能力去解决IBM DS5300的数据恢复问题。