服务器故障:

一台装有20块硬盘的服务器在运行过程中上层业务突然崩溃,服务器管理员检查服务器发现服务器崩溃的原因是3个硬盘离线。服务器管理员将服务器内的所有硬盘按照现有盘序从槽位取出后携带硬盘来到我们数据恢复中心进行服务器数据恢复。


【服务器数据恢复】硬盘坏道和不稳定扇区导致服务器崩溃的数据恢复案例_服务器管理


服务器数据恢复过程:

1、数据恢复工程师接到的硬盘后使用数据恢复检测设备对20块硬盘进行检测,发现所有硬盘均可识别,没有物理故障。

2、对所有硬盘进行镜像备份,镜像过程中发现原来服务器中提示离线的3个硬盘镜像过程十分缓慢,这也从侧面解释了为什么这3个硬盘会在服务器运行过程中会离线,根据这种情况可以初步判断这三个硬盘存在大量的坏道或者不稳定扇区。

3、在数据恢复设备中可以识别,但是镜像过程十分缓慢。这种情况可以通过调整镜像策略跳过硬盘坏扇区进行镜像,直到所有硬盘都镜像完成。


【服务器数据恢复】硬盘坏道和不稳定扇区导致服务器崩溃的数据恢复案例_数据恢复_02


4、所有硬盘完成镜像后,数据恢复工程师使用服务器数据恢复工具对所有镜像文件进行底层数据分析,根据ext3文件系统的逆向分析获取服务器内硬盘的盘序和校验信息,利用分析获取到的信息重组raid。

5、通过和服务器管理员沟通,提取出一些oracle的dmp文件。在dmp恢复的过程中,数据库报告imp-0008错误。通过分析导入dmp文件的日志文件,发现恢复的dmp文件存在问题。

6、重新分析raid结构,进一步确定ext3文件系统被破坏的程度。经过数小时的努力,重新恢复dmp文件和dbf原始库文件。

7、将恢复出来的dmp文件移交给服务器管理员进行数据导入测试,测试过程中没有发现问题,说明恢复出来的数据是可用的。对恢复出来的dbf原始库文件进行校验检测,所有文件均能通过测试。

8、服务器数据恢复工程师联系服务器管理员进行数据验证,经过服务器管理员亲自验证,确认所有数据成功恢复。在原服务器上重新搭建了一组新的raid,由数据恢复工程师配合将所有恢复出来的数据迁移回原始服务器,本次服务器数据恢复完成。


【服务器数据恢复】硬盘坏道和不稳定扇区导致服务器崩溃的数据恢复案例_服务器管理_03