查看原文
其他

Backblaze:2022年SSD固态硬盘统计报告

常华Andy Andy730 2024-03-16

Source: Andy Klein, The SSD Edition: 2022 Drive Stats Review, March 9, 2023

本报告侧重于我们用作云存储平台中数据存储服务器的启动盘的固态硬盘(SSD)。这与我们传统的磁盘统计信息报告相反,后者侧重于用于存储客户数据的机械硬盘(HDD)。

我们从2018年第4季度开始使用SSD作为启动盘。从那时起,所有新的存储服务器和任何具有故障的HDD启动盘都已安装了SSD。在我们的环境中,启动盘的作用远不止引导存储服务器。日常使用中,它们还读取、写入和删除存储服务器本身生成的日志文件和临时文件。此报告中包含的所有SSD的工作负载相似。

在本报告中,我们研究了2022年、过去3年以及SSD生命周期中我们在存储服务器中使用的SSD的故障率。此外,我们首先查看了2022年SSD的温度,并比较了SSD和HDD的温度,看看SSD是否真的运行得更低。

概述

截至2022年12月31日,我们的存储服务器中共有2906个SSD用作启动盘。有13种不同的型号在使用中,其中大多数被认为是消费级SSD,稍后我们将介绍为什么我们使用消费级SSD。在本报告中,我们将显示这些驱动器模型在不同时间段内的年化故障率(AFR),并进行观察并提供警告以帮助解释所呈现的数据。

2022年度固态硬盘故障率

如前所述,截至2022年底,我们的存储服务器中有2906个SSD在运行。下表显示了2022年的数据。稍后,我们将2022年的数据与往年进行比较。

注意事项

  • 2022年,13个驱动器型号中有7个没有出现故障。七款型号中有六款的运行天数有限(少于10000天),这意味着没有足够的数据来可靠预测这些运行型号的故障率。

  • Dell固态硬盘(型号:DELLBOSS VD)在2022年的故障为零,全年的驱动器日超过100000个。由此产生的AFR非常出色,但这是安装在PCIe卡(半长半高外形)上的M.2 SSD,用于服务器部署,因此可能不普遍可用。顺便说一下,BOSS代表引导优化存储解决方案。

  • 除了Dell SSD之外,其它三种驱动器型号一年的驱动器日数超过100000天,因此有足够的数据来考虑它们的故障率。在这三者中,Seagate(型号:ZA250CM10003,又名:Seagate BarraCuda 120固态硬盘ZA250CM10003)的AFR最低,为0.73%,Crucial型号(型号:CT250MX500SSD1)紧随其后,AFR为1.04%,最后,Seagate(型号:ZA250CM10002,又名:Seagate BarraCuda固态硬盘ZA250CM10002)在2022年的AFR为1.98%。

2020年、2021年和2022年的年度SSD故障率

上面的2022年年度图表显示了仅在2022年发生的事件的数据。下面我们将2022年的年度数据与2020年和2021年的年度数据进行比较,其中每年的数据仅代表该期间发生的事件。

注意事项

  • 正如预期的那样,Crucial驱动器(型号:CT250MX500SSD1)在2022年出现几次早期故障后,在2021年恢复良好。我们预计这一趋势将继续下去。

  • 2022年推出了四款新型号,尽管截至2022年底,这四款型号中没有一款出现故障,但没有一款型号有足够的运行天数来识别任何模式。

  • 其中两个250GB Seagate SSD已经存在了三年,但它们正朝着不同的方向发展。Seagate SSD(型号:ZA250CM10003)在所有三年中都实现了低于1%的AFR。而Seagate SSD(型号:ZA250CM10002)的AFR在2022年下滑至近2%。型号ZA250CM10003是两者中较新的型号,大约一年。除了ZA250CM10003使用较少的空闲功率(116mW)与ZA250CM10002的185mW相比,其它方面几乎没有区别。看看年轻型号明年的表现会很有趣。它会跟随先前系列的趋势,开始更频繁地失败,还是会有自己的路线?

固态硬盘温度和AFR:初瞥

在我们进入生命周期SSD故障率之前,让我们先谈谈SSD SMART统计数据。在Backblaze,我们已经与SSD SMART统计数据搏斗了几个月,我们发现的一件事是,SSD制造商用来记录其各种SMART数据的属性甚至命名都没有太多一致性。例如,磨损均衡、耐久性、使用寿命、使用的寿命、写入的LBA、读取的LBA等术语在制造商之间使用不一致,通常使用不同的SMART属性,有时根本不记录。

一个看起来(几乎)一致的SMART属性是驱动器温度。SMART194(原始值)以摄氏度为单位记录SSD的内部温度。我们说几乎,因为Dell固态硬盘(型号:DELLBOSS VD)不报告SMART 194的原始值或标准化值。下图显示了2022年剩余在役SSD的月平均温度。

注意事项

  • 每月平均有67724次观测,从2月的57015次到12月的77174次不等。2022年,平均气温仅变化1摄氏度,从最低34.4摄氏度到最高35.4摄氏度。

  • 2022年,平均气温为34.9摄氏度。同一存储服务器在同一时期的机械硬盘的平均温度为29.1摄氏度。这种差异似乎与传统观点背道而驰,即SSD比HDD运行得更冷。一个可能的原因是,在我们所有的存储服务器中,启动盘比数据驱动器离冷通道更远。也就是说,数据驱动器首先获得冷空气。

  • 2022年所有驱动器的温度变化范围从20摄氏度(4次观测)到61摄氏度(1次观测)。下图显示了SSD在该温度范围内的观测结果。

曲线的形状应该看起来很熟悉:它是一条钟形曲线。在绘制存储服务器机械硬盘的温度观测值时,我们已经看到了相同类型的曲线。固态硬盘曲线适用于所有正常运行的固态硬盘,Dell固态硬盘除外。我们试图为失败的SSD绘制相同的曲线,但2022年只有25次故障,这条曲线是无稽之谈。

固态硬盘生命周期故障率

生命周期故障率基于给定驱动器型号在我们系统中运行的整个时间的数据。这些数据可以追溯到2018年第4季度,尽管大多数驱动器都是在过去三年中投入使用的。下表显示了截至2022年底所有在役SSD固态硬盘型号的生命周期AFR。

注意事项

  • 截至2022年底,整体生命周期AFR为0.89%。这低于截至2021年底的生命周期AFR 1.04%。

  • 有几个非常大的置信区间。这是由于这些驱动器型号的数据量(运行天数)有限。例如,WDC型号WD Blue SA510 2.5只有104个运行日。随着我们积累更多的数据,这些置信区间应该变得更加准确。

  • 我们希望看到给定驱动模型的置信区间为1.0%或更低。只有三种驱动器型号符合此标准:

    • Dell型号 DELLBOSS  VD:使用寿命AFR–0.00%

    • Seagate型号ZA250CM10003:使用寿命AFR–0.66%

    • Seagate型号ZA250CM10002:使用寿命AFR–0.96%

  • 如本报告前面所述,Dell固态硬盘是安装在PCIe卡上的M.2固态硬盘,可能未正式发布。两个Seagate硬盘是消费级固态硬盘。在我们的实例中,较便宜的消费级SSD可以满足我们的需求,因为启动盘上没有客户数据,只有启动文件以及日志和临时文件。最近,当我们从Supermicro和Dell购买存储服务器时,他们将所有组件捆绑在一起,形成每台存储服务器的单价。如果该捆绑包包括企业级SSD或PCIe卡上的M.2 SSD,那对我们来说很好。

固态硬盘统计数据

我们承认,2906个SSD是用于执行分析的相对较少的驱动器,虽然这个数字确实会导致比期望的置信区间更宽,但这是一个开始。当然,我们将继续向研究组添加SSD启动盘,这将提高所呈现数据的保真度。与此同时,我们希望我们的读者将他们通常的怀疑视角应用于所提供的数据并相应地使用它。

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存