硬盘坏道可能会造成存储池降级、损毁,如果只是存储池降级,更换硬盘并重新组建RAID可能可以解决问题;如果是存储池损毁,问题可能更严重 —— 如果你没有做好数据备份,可能就会丢失珍贵的数据!

群晖查看Nginx 群晖查看硬盘状态_3t硬盘坏道检测需要多久

上篇文章(存储空间堪用降级、损毁,怎么应对?请戳我)我们介绍过遇到存储池堪用降级、损毁的处理措施,这一次晖姑娘要教你在存储池损毁之前,就做好预防工作。


第一步,进行 S.M.A.R.T. 检测

定期帮硬盘进行 S.M.A.R.T. 检测可以让你掌控硬盘的健康状况,如果发现硬盘异常就可以及时替换故障硬盘。S.M.A.R.T. 是一种自动监测分析和报告技术,支持这种技术的硬盘可以提供磁头、盘片、马达的运行状况,并且针对预设的安全值进行分析。

进入“存储空间管理员 > HDD/SSD”,选择“硬盘”并且点击“状况信息”,进行快速或完整的S.M.A.R.T.检测,你会发现...

群晖查看Nginx 群晖查看硬盘状态_3t硬盘坏道检测需要多久_02

S.M.A.R.T. 信息根本看不懂?!这么多参数,哪个是重要的呢?

你可以特别关注几个跟坏道有关的编号数值:

编号 5(Reallocated Sector Count 重定位磁区计数)

编号 196(Reallocation Event Count 重定位事件计数)

编号 197(Current Pending Sector Count 等候重定的扇区计数)

编号 198(Uncorrectable Sector Count 无法校正的扇区计数)

只要原始资料数值不是0,你的硬盘就有可能损坏。当硬盘的S.M.A.R.T数值异常时,建议您将有问题的硬盘替换掉。一旦硬盘出现物理坏道,继续使用可能会让坏道越来越密集,最后造成硬盘损毁,数据无法读取

注:系统默认的安全数值是50,但是根据技术小哥建议,这几个编号数值如果不是0,建议更换硬盘。


第二步,通过系统通知预警硬盘错误


除了进行S.M.A.R.T.检测,你还可以通过系统通知重要事件,来掌控硬盘状态。打开控制面板 > 通知设置 > 高级设置,点击“内部存储”,勾选以下6个事件,就能更好的掌控硬盘状态。

群晖查看Nginx 群晖查看硬盘状态_数据备份_03

硬盘重新连接(ICRC错误)警报

硬盘重新识别(IDNF错误)警报

启动时硬盘重新连接警报

硬盘读取(UNC错误)异常警报

如果你收到以上的错误通知,可能是硬盘有问题的早期征兆,如果持续收到警报通知的话,建议及早将数据备份并且更换硬盘。除了以上4个事件,以下这2个也需要特别注意。

硬盘坏扇区超出上限

磁盘输出/输入错误

如果你持续收到警报通知,可以先进行完整的S.M.A.R.T检测,深入查看硬盘的健康状态。

除了以上工具,如果你用的是希捷酷狼硬盘,DSM整合了希捷IHM硬盘健康管理工具,对硬盘进行更全面的检测,预知硬盘将会发生的故障。