首页 » 人工智能 » 脸书SSD失落效申报激发的一次闪存技能谈论

脸书SSD失落效申报激发的一次闪存技能谈论

深圳海外装饰工程通讯 2024-12-16 0

扫一扫用手机浏览

文章目录 [+]

较早前的运用紧张涌如今一些工控设备、移动设备中,闪存在现在数据中央中的紧张形式便是SATA/SAS接口SSD,PCIe加速卡和闪存阵列。
Facebook的闪存失落效大规模研究正是在一个运行着当代程序和系统软件的数据中央完成的,涵盖了闪存紧张的运用形式,不雅观察了闪存的全体生命周期里的各种特性特点,不同于以往闪存从业者自己揭橥对闪存的认识,不同于用户对产品利用中创造的个别bug征象,这篇论文第一次展示了闪存SSD的可靠性大规模研究结果,具有很强的实际参考意义。

6月29日,笔者听到Greenliant亚太营销副总裁李炫辉,PMC资深产品架构师《大话存储》作者张冬,达沃时期雷迎春博士,乐生活与爱IT微旗子暗记作者SDS技能专家Peter Ye,以及大家网李蓓、美图杨尚刚等互联网用户的对这一热点技能话题的谈论。

脸书SSD失落效申报激发的一次闪存技能谈论 脸书SSD失落效申报激发的一次闪存技能谈论 人工智能

价格决定买不买

脸书SSD失落效申报激发的一次闪存技能谈论 脸书SSD失落效申报激发的一次闪存技能谈论 人工智能
(图片来自网络侵删)

毫无疑问,更便宜更快速更可靠是每个买闪存卖闪存人的不懈追求,个中价格是许多人决定是不是用闪存的紧张成分,如何花更少的钱拿到更多的闪存容量呢?实在价格这个话题跟密度有很大关系,从SLC、到MLC到TLC,到QLC,每个单元存储的bit随之增多,单位容量的价格越来越低。

但这也是有代价的,72纳米的MLC可擦除次数为1万次,35纳米的MLC可擦除次数则降到了几千次,利用寿命明显降落。
虽然说低制程的产品比高制程产品便宜很多但为了保持较高的可靠性,许多企业级产品一贯坚持较高的制程工艺,这也是闪存厂商开始青睐3D NAND的缘故原由。

加州大学2012年的一项研究:闪存密度增加带来可靠性的降落

其余,由于单位空间bit的增多,单位空间的繁芜度提升,随之而来的是可靠性不断降落,性能的不断降落。

性能要稳定才能用

随着利用的增多闪存的性能会逐渐衰减,危害在于,比如某企业级客户中一个节点须要处理2万个交易,当性能衰减后处理的交易数显著降落,这对用户来说是很难接管的。
既然性能的衰减不可避免,那么有一个问题是:用户如何看到这些性能衰减数据呢?

谈到这个问题前先先容一个闪存的特性,许多厂家在做测试的时候要10 DWPD(Diskful Writes Per Day),为什么不是别的次数呢?这是由于闪存这类电子器件在进行数据操作的时候要开释电子调度电位,当溘然电子隧道打通之后,电子泄露到规定的阀值就立时关闭隧道之后,实际上里面的电子仍旧处于抖动状态,以是须要一个放松韶光。
Greenliant业务发展副总裁李炫辉先容说。

图注:闪存的性能依赖于很多成分,如主机配置,主机访问模式,块大小,闪存架构等等,而且性能测试非常耗时。

回到刚才的问题,我们理解到:厂商实在是理解这种情形的,但是客户并不理解衰减程度,只有实际运行才能看到表现,然而性能测试非常耗时(上图)。

“一个产品该当在全体生命周期里面定标准是99.9%的韶光里面性能不低于90%。
我们现在要做的是在全体五年的生命周期里面性能是5的衰减。
(如下图)” 这句话是李炫辉在先容说他们产品时说的,一定程度上这也对闪存的运用供应了一种可能。

Greenliant的产品在测试中的闪存性能衰减

由于闪存设备在长期擦写情形下,坏块会逐渐增多,故障率上升,由此会带来潜在的性能大幅低落。
(论文4.1中有所阐述) 。

Greenliant对产品进行长期擦写以及性能测试。
在疲倦测试环境中,每天通盘擦写50次,超过18000次擦写后,性能衰减不超过10%。

可靠性决定敢不敢用

美图网杨尚刚表示:“性能和可靠性比较,用户更为关注的是可靠性。
”可靠性的测试没有通用的灵巧工具,而是要靠永劫光实际写入来不雅观察。

图注:SSD失落效率变革曲线

在Facebook的报告中我们看到了如上图这样的调查结果,SSD的出错并不是大略的随着磨损次数的增加而增加,也便是说并不都是过度擦写造成的。
还有什么缘故原由呢?

当闪存颗粒没有经由大规模读写操作时是稳定的,有大规模操作后不好的颗粒坏掉,这时靠OP(over provisioning)过度配置空缺的颗粒开始更换,一些没有更换过来的就涌现故障(Failure)。

报告中也提到,早期更换较多的后期更为稳定,这是由于早期有一些处于临界状态的块没被更换掉,当打破临界值之后故障(Failure)就涌现了,随后轻微稳定些,再今后又涌现一些故障,这便是算法的问题了。

图注:温度与失落效率的关系

高温会带来高的失落败率,但是通过节流SSD操作看来可以极大地减少高温带来的可靠性负面影响,但是会带来潜在的性能低落。
节流的做法也很大略,当温度过高时对供电功率进行限定。
温度和可靠性相互抵牾,这就须要在板卡的设计中做到均匀散热,防止热点,这便是选用分布式架构的缘故原由之一。

Greenliant的分布式ECC

以Greenliant的Gcard为例(上图),这里采取了分布式ECC,分布式的组件布局降落单个组件的功耗和温度,防止温度过高对系统可靠性和稳定性的影响。

其余,也是由于采取了分布式ECC,还带来了更可靠的校验打算能力,同时,Built-in RAID保护和掉电数据保护也增强了数据的可靠性。

降落每一个颗粒的发热量,实际上就使系统会更加稳定、更低,可靠性就更高。
然而,并不是说温度越低闪存的性能越高,由于低温会影响到电子驱念头能,得当的事情温度是50-55度之间。
比如做掌握器的须要打算掌握器的发热量,而且随着对数据中央换进温度的调度(出于环保哀求-数据中央的温度有所提升),在设计的时候须要重新考虑温度的影响。

几位专家也表示,闪存的可靠性评测也没有一个通用工具,各厂家在测试可靠性的时候只有最笨最原始的办法,便是不断擦写,这也是一个耗时的过程。

图注:报告中研究也指出:读滋扰并不普遍,但是写滋扰有影响。

李炫辉提到读滋扰基本上不会影响到可靠性,由于闪存颗粒里面提到当对一个cell进行加电或放电操作的时候,会对附近的cell产生颠簸。
读没有影响,但写一样平常会有影响的,由于写是要重新加电,要把电引发到0。

实在从设计的角度来讲,全体设计的阶段都要考虑可靠性,比如当闪存固件升级的时候,厂商要把要把花至少一个月韶光把全体板卡的测试跑一遍。
当闪存在更新固件后,可能由于由于引入高密集的算法导致发热量会,进而影响板卡的稳定性。
其余也要办理一些可能涌现的新BUG。

闪存的固件更新

寿命决定你要怎么用

寿命这块内容的话,我们都知道闪存颗粒的读写是有次数限定的,从SLC到TLC依次低落,在实际利用中,为了提升闪存的寿命第一个提到的便是:“磨损均衡”(Wear Leveling)。

磨损均衡:磨损均衡又分为动态磨损、静态磨损和全景磨损。
全景磨损是在颗粒级做一次磨损,动态磨损、静态磨损在块级做磨损,这些磨损须要在掌握器操作下来完成。
结果是增加了寿命,降落性能。

图注:实际写到SSD里的数据与操作系统反馈的数据量不一样

优化读写次数:由于SSD掌握器的优化以及系统软件的缓存机制,操作系统写到闪存SSD的数量并不能精确地反响闪存Cell上的擦写数量。

当SSD涌现坏页和坏块的时候许多人都希望厂商可以供应一种工具来把坏掉的部分屏蔽掉,实在这样的工具是有的,只是有些厂商不会供应给用户。
为理解决这种情形,提升利用寿命,许多SSD厂商普遍的做法是还只是磨损均衡。

图注:分散的数据布局,小碎片的数据布局对失落败影响会非常大。

跨SSD物理地址空间的稀疏逻辑数据布局(如,不连续数据),须要通过大量的存储在SSD内部DRAM缓存的metadata来跟踪逻辑地址翻译, 会极大地影响SSD失落败率。

如果说你的数据布局和物理的区域布局非常分散,便是说本来我在逻辑上是连续的数值,但是在物理上是分散布局,这对危害值会大。
这和我们磁盘是完备不一样的,磁盘是说我一个逻辑上连续的文件最好是分散的布局。
李炫辉举例说:曾经碰到一个用户,他的运用基本上是几十个B的写,连K都到不了,结果用了三个月SSD就弗成。

在把稳以上的特性后,我们可以做一些用法上的调度,比如把一块写多的盘换到读多的环境下,这就可以延长寿命。

结语

以上是环绕这次报告谈论过程中的几个要点,闪存确实存在许多问题,谈论中还谈到了许多一些用户不敢用PCIe的缘故原由,限于篇幅和一些缘故原由不便多说。

相关文章