2018 年Q1硬盘故障率报告:希捷故障率最高_java

截至2018年3月31日,我们有100,110个旋转硬盘。在这个数字中,有1,922个启动驱动器和98188个数据驱动器。本文回顾了数据中心中数据驱动模型的季度和寿命统计数据。我们还会看看为什么我们会收集和报告10个新的智能属性,并偷偷看一下东芝的8个硬盘。在此过程中,我们将分享对所呈现数据的观察和见解,并期待您在评论中做同样的事情。


背景


自2013年4月以来,Backblaze记录并保存了我们数据中心的硬盘数据。每个条目包括日期、制造商、模型、序列号、状态(操作或失败),以及该驱动器报告的所有智能属性。目前约有9700万词条共计26 GB的数据。如果你想做自己的研究,你可以从我们的网站上下载这些数据,但对于初学者来说,这是我们的发现。


硬盘可靠性统计数据为2018年第一季度


在2018年第一季度末,Backblaze监控了98188个用于存储数据的硬盘驱动器。为了我们的评估,我们从考虑那些用于测试目的的驱动器和那些我们没有至少45个驱动器的驱动模型。这给我们留下了98046个硬盘。下表只涵盖了2018年第一季度。

2018 年Q1硬盘故障率报告:希捷故障率最高_java_02

其中4TB的希捷ST4000DM000的年化故障率最高,达到2.3%。具体来说就是,30941块服役,挂掉了178块。


笔记和观察


如果一个驱动模型的失败率为0%,那么它只意味着在2018年第一季度没有该模型的驱动器故障。


Q1的整体年化失败率仅为1.2%,远低于2017年第四季度的1.65%。请记住,季度失败率可能是不稳定的,特别是对于那些有少量驱动器和/或少量驱动器日的模型。


在上面的列表中有142个驱动器(98,188 - 98,046),因为我们没有至少45个给定的驱动模型。当我们报告季度、年度和终身驱动统计时,我们使用相同模型的45个驱动器作为最小值。


欢迎东芝8TB驱动器,几乎……


我们在第一段提到了东芝8tb的驱动,但是他们没有出现在Q1 Stats图表中。到底发生了什么事?我们只有20台东芝8tb的硬盘在Q1的运行,所以他们被排除在图表之外。为什么我们只有20个驱动器?当我们测试一种新的驱动模式时,我们从“书本测试”开始,用20个驱动器来填充一个卷。一个大刀是相同的驱动模型,在相同的逻辑位置,在每个20个储存库中组成一个后火焰金库。每个保险库有60个tomes。


在这个测试中,我们创建了一个8 TB驱动器的Backblaze Vault,其中59个tomes是Seagate 8 TB驱动器,1个是东芝驱动器。然后我们监测了保险库和它的成员的性能,看看是否,在这种情况下,东芝驱动器按预期执行。

2018 年Q1硬盘故障率报告:希捷故障率最高_java_03


到目前为止,东芝的驱动程序运行良好,但它们已经运行了20天。接下来是“pod测试”,我们将东芝硬盘装入一个存储单元,并将其集成到一个由类似大小驱动器组成的Backblaze Vault中。我们希望在我们的第二季度报告中更好地了解东芝8 TB的驱动因素——请继续关注。


终生硬盘可靠性统计


虽然前面介绍的季度图表有很大的兴趣,但是任何驱动模型的真正测试都是随着时间的推移而发生的。以下是截至2018年3月31日运行的所有硬盘驱动器的终身故障率图。对于每个模型,我们计算它们从最初安装时的可靠性。

2018 年Q1硬盘故障率报告:希捷故障率最高_java_04


笔记和观察


所有较大的驱动器(8- 10- 12 TB)的失败率非常好,1.2% AFR(年化失败率)或更少。这些驱动器中有许多是在去年部署的,所以数据中有一些波动,但是您可以使用置信区间来了解故障百分比范围。


整体的失败率为1.84%,是我们所达到的最低水平,比2017年底的2.00%低。


我们的普通读者和驱动统计专家可能已经注意到HGST 8 TB驱动器(模型:HUH728080ALE600)的数量大幅增加,从上季度的45个增加到这个季度的1045个。随着10 TB和12 TB的驱动变得更加有效,8 TB的每TB硬盘的价格已经下降。这使我们有机会以符合我们预算的价格购买HGST驱动器。


我们购买并投入服务于2015年第二季度的45辆HGST 8tb驱动器。他们是我们的第一个氦气驱动的驱动器,我们只有在10 TB和12 TB Seagate驱动器到达2017年Q3时才使用。我们将在即将发布的一篇博客文章中,首先研究氦是否会对驱动失败率产生影响。[Post现在出版:氦元素和硬盘驱动器失败率。-编辑器]


新智能属性


如果您曾经使用过硬盘数据或计划,您将注意到我们在2018年开始增加了10列数据。有5个新的智能属性,我们用原始的和标准化的值来跟踪它们:

●177 -磨损范围。

179 -使用保留块总数。

181 -程序失败总数或非4k对齐访问计数。

182 -清除失败计数。

235 -良好的块计数和系统(自由)块计数。

5个值都与SSD驱动器有关。


是的,SSD驱动器,但是在你得出任何结论之前,我们在Q1中使用了10个三星850 EVO SSD作为引导驱动器。这是一个实验,看看我们是否能减少储存舱的启动时间。在我们的例子中,改进的启动速度不值得SSD花费,但是它确实增加了10个新的列到硬盘数据。


说到硬盘统计数据,在我们的硬盘测试数据页上可以使用完整的数据集来创建本文所使用的信息。你可以免费下载和使用这些数据为自己的目的,我们要求都是三件事:1)你引用Backblaze的使用数据,2)你接受你单独负责如何使用数据,和3)你没有这些数据卖给任何人。它是免费的。

2018 年Q1硬盘故障率报告:希捷故障率最高_java_05