作者:余祥军


事由

  • 今天刚刚遇到的问题,碰巧发现原来硬盘故障了没有对应型号的硬盘配件还可以这么处理,所以决定整理出来和大家分享



故障处理过程

1、早上10点收到短信告警,一台服务器出现硬盘告警,一块硬盘故障导致整列降级

2、登陆服务器,使用MegaCli64进行查看发现slot1 Failed

Enclosure Device ID: 32

Slot Number: 1

Enclosure position: 1

Media Error Count: 0

Other Error Count: 16

Predictive Failure Count: 0

Last Predictive Failure Event Seq Number: 0

PD Type:SAS

Raw Size: 2.728 TB [0x15d50a3b0 Sectors]

Firmware state: Failed

Device Firmware Level: GS0F

Foreign State: None

Enclosure Device ID: 32
————————————————

3、登陆dell官网查看故障机器保修期,万幸,还在保修期间


服务

开始日期(GMT时区)

结束日期(GMT时区)


仅限部件保修(POW)

五月 15, 2015

五月 16, 2018


4、收集dell DSET日志及TTY日志

5、拨打售后电话,和售后工程师沟通起来很愉快,因为多次报修,有些工程师照搬内部流程,浪费了N多的电话费,而今天这个工程师,我只说了我收集好了DSET日志和TTY日志了,工程师就直接说明,我给你发邮件,你将两份日志以及服务器地址和联系人信息给我即可。我欢乐的挂掉了电话,并收邮件,发邮件

6、20分钟后,负责上门的DELL工程师开始电话我,预约上门更换时间。定好时间,安排好一切后,我就出门了。

7、晚上8点回到家,登陆服务器查看硬盘同步情况,哇塞,前面废话那么多,终于到主题了,我发现我的故障硬盘是3T的SAS(确切的说是3.5寸 7.2k 3T SAS硬盘),而更换后的硬盘居然是4T的!没错,你没看错,我坏了3T的硬盘,DELL给换了4T的。

Enclosure Device ID: 32

Slot Number: 1

Enclosure position: 1

Media Error Count: 0

Other Error Count: 0

Predictive Failure Count: 0

Last Predictive Failure Event Seq Number: 0

PD Type:SAS

Raw Size: 3.638 TB [0x1d1c0beb0 Sectors]

Firmware state: Rebuild

Device Firmware Level: MS05

Foreign State: None
————————————————

看见了吗,是4T的,而且居然也能进入重建状态,My God,然后就是电话确认,百度找资料确认


好吧,不废话了,把结论奉上



结论

服务器硬盘故障时候,如果手上没有对应型号的硬盘,你是可以用其他容量的硬盘来代替的!

当然这是有条件的啦

1、故障服务器有做RAID,并且确认不是Raid0!

2、新硬盘虽然可以用其他硬盘代替,但是容量上必须比故障硬盘大!(本文故障硬盘3T,新硬盘4T)

3、新硬盘和旧硬盘的硬盘类型要一致(同为SAS、或者同为SATA)、转速也要一致(其实就是除了容量比较大,其他的都必须相同)


老叶特别备注:看到有朋友留言说,其实这种情况下,转速不一致也是可以的(验证过),但必须同为SAS或SATA(未验证过)。