服务器数据恢复环境:
一台HP服务器,共有8块SAS的硬盘组建RAID5磁盘阵列,存储的数据为Oracle数据库。
服务器故障检测分析:
RAID5磁盘阵列中2块磁盘未知原因离线,阵列中的热备盘虽然成功激活,RAID5磁盘阵列瘫痪,系统启动不了,oracle数据库不可用。
服务器数据恢复过程:
1、对所有磁盘做检测,检测后没有发现硬盘存在物理故障,也没有发现坏道。
2、将所有硬盘以只读方式做完整的镜像备份,后续的数据分析和数据恢复操作都基于镜像文件进行,避免数据恢复操作可能对原始数据造成二次破坏。
3、因为硬盘没有存在坏道及物理坏道,所以后续直接重组raid阵列。
4、分析RAID组的信息如条带大小,磁盘顺序及数据走向,根据分析获取到的raid信息重构RAID组。分析数据盘底层,搞清楚Oracle数据库页在每个磁盘中分布的情况。
5、分析数据盘中的数据发现有一块硬盘在同一个条带上的数据和其他硬盘不一样,此盘是先掉线的。6、由于LUN是基于RAID组的,将RAID组重构出来之后就开始分析LUN在RAID组中的分配情况以及LUN分配的数据块MAP。
7、分析生成出来的所有LUN,发现所有LUN中均包含HP-Unix的LVM逻辑卷信息。
8、仔细分析程序报错的原因,经过检测发现LVM信息已经损坏。
9、搭建HP-Unix环境。
分析解析出来的LV并根据VXFS文件系统的底层结构校验此文件系统是否完整。
10、再次将修复好的LV卷挂载到HP-Unix小机上,尝试Mount文件系统,文件系统成功挂载。
11、在HP-Unix小机上mount文件系统后,将所有数据均备份至指定的磁盘空间。
12、检测每个Oracle数据库文件的完整性,没有发现问题。
13、将恢复出来的Oracle数据库附加到原始生产环境的HP-Unix服务器中,启动Oracle数据库成功。