查看原文
其他

SSD数据缩减如何帮助企业级用户

常华Andy Andy730 2024-03-16

【ANDY】对于企业级存储数据消除(压缩、模式消除、重删等)是必选项。

Source: Robert Sheldon, How SSD data reduction can help enterprises, 09 Mar 2023

虽然通常存储系统中的数据缩减以备份场景为重点,但现在供应商将该技术集成在基于闪存的系统中。

SSD相对于HDD提供的卓越性能,使得即使在支持任务关键型应用程序的主存储系统中使用数据缩减技术成为可能。供应商还改进了他们的数据缩减技术,以提高效率,并帮助最大限度地减少对性能的影响。

尽管有这些优势,但SSD数据缩减技术在有效性方面可能因产品而异,另一方面,由此导致的性能下降。在选择存储产品之前,决策者应充分了解系统的数据缩减功能、它们对应用程序性能的潜在影响以及组织节省多少存储成本。

数据缩减包括什么:过去和现在

数据缩减是一个广义的术语,可以包含各种功能,但它通常侧重于两种主要技术:压缩和重复数据删除。压缩在位级别删除冗余数据,重复数据删除在块级别删除数据。

多年来,数据缩减通常被降级到支持备份和归档的辅助性存储,其重点的是有效的资源使用,而不是应用程序性能。

IT团队一直不愿意在其主存储系统上启用压缩或重复数据删除,因为这会对应用程序性能产生潜在影响。对于许多组织来说,即使他们迁移到全闪存阵列作为其主存储,情况仍然如此。

SSD数据缩减的问题

数据缩减操作可能会占用内存和CPU资源、增加I/O开销、增加延迟并降低整体性能。即使组织想要采用数据缩减,他们也可能正在运行无法从这些技术中受益的工作负载,任何使用它们的尝试都会导致不必要的开销。例如,他们的数据可能具有较低的冗余率,因此尝试删除重复数据几乎没有什么好处。

一些存储系统采用全有或全无的方法进行数据缩减,尽管始终在线可能弊大于利。全有或全无的方法给必须遵守区域数据法规的组织带来了挑战,某些区域性法规可能要求数据以原始格式存储。

IT团队在运行生产工作负载之前可能还没有完全意识到其产品的局限性。例如,他们可能发现他们的存储系统不支持无损压缩、无法满足不断变化的扩展要求或无法在整个阵列中全局应用数据缩减,为时已晚。

推进SSD数据缩减及其如何帮助企业级用户

随着全闪存阵列在数据中心的持续激增,数据缩减技术在存储环境中取得了重要进展,在存储环境中,每GB的成本仍然是主要考虑因素,仅次于性能。然而,SSD的进步催生了新一代设备,这些设备可以提供出色的IOPS和微秒级延迟,以及可以更轻松地适应数据缩减开销的性能。

不仅仅是存储设备本身得到了改进。符合PCIe 4.0标准的SSD现在很常见,提供比几年前更快的数据速率。此外,PCIe 5.0驱动器已上市,PCIe 6.0规范于2022年发布。每一代新的PCIe数据速率都是上一代的两倍。

NVMe和NVMe-oF帮助交付了高性能存储系统。NVM Express组织最近发布了NVMe基本规范的修订版2.0c,它为实现更低的延迟和更大的吞吐量提供了更高效的接口。与PCIe一起,NVMe有助于最大限度地发挥SSD性能的全部潜力,从而使存储系统能够更好地适应数据缩减。

数据缩减技术本身也在不断发展。它们最大限度地减少了对性能的影响,并提供了更有效的数据缩减。全闪存阵列通常支持整个阵列或命名空间的无损压缩、在线数据缩减和全局缩减。供应商使数据缩减更具适应性,并改进了他们的算法,以提供更智能的缩减和更好的性能。

全闪存阵列中的数据缩减功能可以增加其存储系统的有效容量,节省能源并减少存储占用空间。数据缩减减少了程序擦除周期的次数,延长了驱动器的使用寿命并减少了数据传输负载。这些因素共同有助于降低整体存储成本,并使SSD更实惠,适用于更多工作负载。

尽管SSD数据缩减操作仍会影响性能,但与企业驱动器提供的性能提升相比,它们的影响通常很小。对于许多工作负载,节省的容量可能值得进行任何性能权衡。

SSD供应商示例(具有数据缩减功能的产品)

SSD数据缩减是许多企业产品的常见功能,但供应商采用不同的方法。

Dell Unity全闪存存储系统提供高级数据缩减功能,包括压缩和重复数据删除。当数据首次进入系统时,Unity会将其分割为8KB块,然后将其传递给重复数据删除算法,该算法会分析块中的已知模式。如果Unity找到模式,它会删除块并将其写入磁盘。如果未找到模式,Unity会将数据传递给高级重复数据删除算法,该算法对每个块进行指纹识别以快速识别重复数据。然后,Unity将数据传递给压缩算法,该算法仅在可能节省的情况下应用压缩。Unity的数据缩减发生在系统缓存和存储设备之间。

HPE 3PAR系统具有自适应数据缩减功能,可提供内联重复数据删除和压缩。3PAR还包括精简配置、精简转换、精简持久性和精简副本回收。HPE专门设计了无损压缩算法,专门用于在闪存原生块大小上运行。它在将写入内容确认到主机之前将其存储在缓存中,并在确认后执行压缩。3PAR系统扫描数据以识别难以理解的流。如果发现,HPE会以本机格式存储它们,而不是浪费CPU周期来尝试压缩它们。

Pure Storage FlashArray采用多种数据缩减技术,以节省其全闪存阵列的空间。系统可识别并删除重复的二进制模式,并提供内联重复数据删除,支持4KB到32KB的可变块大小范围。它确保仅将唯一的数据块保存到存储中。该产品对整个阵列应用重复数据消除,而不仅仅是单个驱动器。FlashArray提供内联压缩,使用变量寻址和仅追加写入布局来消除浪费的空间。它运行后处理压缩算法以挤出更多空间。

Vast Data存储系统使用自适应分块技术,将数据分割成16KB到64KB的块。数据缩减发生在集群创建的整个命名空间的单个领域中,缩减元数据保留在存储类内存写入缓冲区中。重复数据删除操作首先识别相同的数据块,然后运行一组查找相似性的哈希函数。如果找到,Vast会使用通用压缩字典将它们压缩在一起。Vast提供自动实时应用的数据感知压缩。它的系统还使用增量编码来进一步减少存储的字节数。

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存