近日接到一个在联想朋友的电话,说一部队客户的5块盘的RAID5两块盘离线.无法起动.有重要数据,必须要现场操作.了解情况后得之,该阵列5块盘的RAID5没做HOST盘.其中一块盘离线多日.客户没在意.最近服务器总死机.客户认为是先离线硬盘导致的,准备拔出来测试.但该服务器没有坏盘的故障灯.客户在操作故障盘时拿错,再插回去,RAID卡不认,且没有FORCE ONLINE这一功能.导致RAID崩溃.和客户沟通后情况确认属实,确定其中第一块掉线盘应是物理故障.第二天带了块新盘到达现场.进RAID卡界面查看发现,一块盘状态是fail,一块盘状态是READ  三块盘是ONLIN,  RAID 状态是offine .盘序没变,记下了RAID和块大小。以我们对这块RAID卡的了解,向客提出了两个恢复方案,
第一通过RAID卡进行强制恢复(速度快,失败后不影响第二个方案的进行),
第二手工重组.(1.2T的数据.需要1天的COPY)
     客户同意第一种方案,通过RAID界面控制我们找到了FAIL盘,并替换成了新盘.因为该卡无FORCE ONLINE选项.开始实施
第一步 清除原阵列信息(卡和硬盘同时清除)
第二步 通过配置界面按原来的盘序,大小和块大小,重新配置RAID5(千万不要 initialize)
第三步 保存重启,再次进入配置界面把新加入的盘标记fail
第四步 保存重启正常进入了系统.数据恢复完成
第五步   对新盘进行rebuild. RAID状态正常,全部恢复工作完成
小记,只可观看不可模仿(对RAID卡一定要有相当的了解,才能这样操作)后果自负
     QQ  63678313 12:00:00 2010-6-17 1:09