案例场景:

       某某公司两库服务器数据盘无法访问,现场检查发现磁盘阵列器2块阵列盘硬盘指示灯黄灯闪烁。由于两库服务器磁盘阵列器采用双控制器及7块SAS盘组建的RAID5磁盘阵列,该阵列方式即使一块硬盘发生故障,两库管理系统也能正常运行,但本次阵列器阵列盘两块硬盘同时故障,导致阵列盘无法在线,处于离线状态,影响公司数据业务不能正常运转。

处理流程:

将故障硬盘及其它5块硬盘连夜送至某某数据恢复公司,确认两块故障硬盘无法进行数据恢复。

       联系某厂商提供技术支持,将7块新硬盘放置于两块服务器磁盘阵列器内,组建RAID5磁盘阵列,两台服务器可以识别阵列盘。由于群集服务无法正常启动,目前采取措施为备用服务器直接挂接在磁盘阵列上,采用单机运行阵列的方式挂接服务器。

       经过多种方式进行数据恢复,发现本地备份的数据无法正常倒入数据库内。采取直接在备用服务器上重新安装ORACLE10G数据库的方式执行数据恢复,最后数据恢复正常。

       服务器节点上群集服务已失效,无法启动。

解决方案:

       在做群集服务恢复之前,因风险大,做好各种数据备份。

       检查群集先前条件,重新搭建群集服务,达到冗余效果,恢复正常业务。

反应问题:

      增加热备硬盘数量

      扩充数据硬盘空间

      RAID方式的磁盘阵列

      统计硬盘使用寿命,及时更换