一、存储故障描述
我中心接到某公司一台EMC存储数据恢复。经初步了解,这台存储共包含12块硬盘,组成raid5磁盘阵列,包含热备盘2块,单盘容量为1TB,由于硬盘故障导致存储崩溃。
二、硬盘物理检测及存储数据备份
工程师对客户存储内的所有硬盘进行物理检测,未发现坏道等其他物理故障,随后使用winhex将存储内的所有磁盘进行了备份,备份完成后将客户的原始存储交还给客户,接下来将在镜像文件中进行数据恢复操作。
三、存储数据恢复过程
由于客户的存储底层结构为raid5磁盘阵列,正常情况下,raid5阵列如果崩溃,则阵列中至少有2块硬盘掉线,而在物理检测过程中又并未发现有硬盘存在物理故障,所以在本次数据恢复中只需分析底层raid结构,虚拟重组即可。 1.分析raid结构 经恢复中心工程师对镜像文件进行分析,最终得出raid阵列的硬盘盘序、条带大小、分步规律等。并分析发现该存储原始阵列中的两块热备盘中均未写入任何数据。 2.分析raid阵列掉线盘 根据分析得出的riad5磁盘阵列基本信息,工程师通过自研发的raid5阵列重组工具将raid阵列进行虚拟重组。然后分析LUN在RAID组中的分配信息,以及LUN分配的数据块MAP。在本次存储数据恢复中,上层存储有一个lun,数据恢复工程师对这个lun信息进行解析并导出lun数据即可。 3.解析zfs文件系统 利用自主研发的zfs文件系统解析工具对lun文件系统进行解析,经解析发现由于存储瘫痪导致部分文件系统的元文件被破坏,工程师手动对这些被破坏的文件进行修复,最终zfs文件系统被正常解析。 4.导出存储内的所有数据 Zfs文件系统解析成功后,继续对存储中的文件节点、目录结构等进行解析并导出,工程师对导出的数据进行验证,验证数据正常未出现报错。
四、存储数据恢复成功
经过客户亲自对恢复结果进行验证,最终确认客户存储内的所有数据全部恢复成功。 由于客户存储发生故障后对现场环境进行了保护,没有任何其他操作,这使后期的数据恢复工作避免了很多不必要的麻烦,一定程度上也增加了数据恢复的成功率。