查看原文
其他

2022年数据存储趋势预测

常华Andy Andy730 2024-03-16

Source: Marc Staimer, Predictions for the top data storage trends of 2022, 14 Feb 2022


一项新技术是否成功,仍然取决于它所解决的问题,它的净价值,以及它是否比今天使用得更好。从这个角度来看,以下是2022年要考虑的数据存储趋势。



争夺数据存储性能霸权的战斗将升级


我们的第一个数据存储趋势是持续需要更低的延迟来缩短应用程序响应时间。更低的延迟会影响作业完成时间,从而提高生产力,更快地获得数据库的可操作性洞察,缩短上市时间,提高市场份额并缩短创收时间。减少最后一个字节的延迟对于高性能计算消息传递接口应用程序非常重要。


更高的 IOPS 可推动存储和数据库整合。更少的数据库服务器意味着更少的内核,从而降低了基础架构成本,同时提高性能。它还能够以更低的成本实现更多的应用程序开发,并加速日益流行的区块链应用程序。


对更快的分析、机器学习、深度学习和人工智能神经网络的需求使企业不断要求更好的吞吐量。这可以转化为更快地获得可操作性洞察的时间、上市时间以及首次获得收入的时间。


数据存储性能由快速采用几种性能更高的数据存储技术提供支持。例如,NVMe-oF的使用在许多数据存储系统中稳步增长,并且有三种主要类型:InfiniBand,光纤通道和基于融合以太网的RDMA。但这些选项通常需要新的交换机和网卡(NIC)基础设施。NVMe/TCP 是最新的选项,它不需要升级网络基础设施,因为它运行在标准以太网网络中运行的 TCP/IP 之上。它也是最容易实现的。不出所料,它似乎是CIO,CFO和IT专业人员中最受欢迎的选择。


企业为支持数据存储性能而采用的其他技术包括:

  • PCIe Gen 4(在某些情况下是 Gen 5)在数据存储控制器和闪存 SSD 中的快速部署,PCIe Gen 4 的带宽是 Gen 3 的两倍,而 Gen 5 的带宽是 Gen 4 的两倍。

  • 使用更高带宽的网卡,范围从 100 Gbps 到 400 Gbps,具有显著降低的延迟。带宽最高的 NIC 需要 PCIe Gen 4或Gen 5。

  • 使用数据处理单元 (DPU) 来卸载 NVMe-oF、路由甚至交换等资源密集型程序,从而大大加快数据存储性能。DPU 出现在高带宽 NIC 和某些数据存储系统上。

  • 实现更快的 NVMe 闪存 SSD,在其控制器中采用其他非易失性存储器。这减少了驱动器延迟,并提高了 IOPS 和吞吐量。

  • 使用更高性能的存储控制器和AMD,Arm和Intel的最新CPU。

  • 性能有点令人上瘾。但什么时候才足够呢?答案是,实际上,永远不会。随着达到新的水平,自满情绪开始出现。然后,应用程序利用这些较新的性能级别,并最终需要更高的性能。这是一场永无止境的数据存储之战,似乎在2022年正在加速。



数据存储网络弹性成为行业的热点投入


这种数据存储趋势是勒索病毒演变的直接结果。勒索病毒已经变得非常擅长删除或损坏数据备份,存储快照和副本。它还可以更改保留策略、保护擦除存储库或仅删除目录。这是一种阴险的盗窃形式。


数据存储系统供应商通过添加不可变存储来做出回应,以使保存备份数据的卷、文件系统或对象存储桶在策略定义的保留期内不可更改。其他人为影响数据的任何策略更改添加了多步骤,多因子身份验证。这可以防止勒索病毒有效地中和备份的数据。它不是万无一失的,也不应该是唯一使用的网络防御。然而,这是另一层防御,使网络犯罪分子更难成功。它似乎有可能在2022年成为数据存储系统的热点投入。



非结构化数据管理将成为数据存储游戏规则的改变者


一些读者可能会挠挠头,问:“非结构化数据管理到底是什么?考虑它的一个好方法是能够为非结构化数据添加有用的管理结构和灵活性。它基本上提供了类似数据库的非结构化数据的管理,搜索,查询 和控制。


非结构化数据管理并不新鲜。模式可选数据库(俗称 NoSQL数据,虽然可以使用SQL) 可以是基于文档或对象的,并为非结构化数据提供管理。然而,自治AI机器学习或自主数据管理的出现直接影响数据存储。



数据存储供应商实施非结构化数据管理已有数年之久。问题在于,他们的实现是以数据存储为中心的,而不是以数据为中心的。它往往仅限于供应商自己的数据存储系统,以及与S3兼容的对象存储的一些集成。它很少是多供应商,并将客户锁定在供应商的数据存储系统中。如果客户不介意支付更多费用并且将来没有数据存储选择,那么它的效果相当不错。这是非结构化数据管理尚未成为迄今为止数据存储主要趋势的关键原因。但这种情况即将改变。


在过去几年中,出现了一波新的非结构化数据管理产品,将其从数据存储中抽象出来。有些产品位于数据路径之外,有些产品位于数据路径中,有些产品是两者的混合体。它们与数据存储系统和供应商无关。他们可以将原始数据从主存储存档、复制、移动和删除到 S3 对象存储甚至磁带,通常没有分层存根。某些产品使用符号链接执行此操作,而其他产品则使用全局命名空间。有些产品可以收集、整理、解析和管理元数据。其他则没有。


这些系统具有令人难以置信的可扩展性 —— 达到数百PB甚至EB。最重要的是,他们不需要从当前文件或对象存储迁移数据:他们发现并映射数据存在的位置。然后,他们将其归档,将其移动到特定数据所需的数据存储中,并为不同的物理位置制作副本。企业可以证明这些非结构化数据管理系统的成本是合理的。


这种新型非结构化数据管理之所以如此有前途,是因为它改变了数据存储的购买决策。数据存储系统可以来自不同的供应商,因此企业可以为给定的应用程序使用最佳存储。根据其价值和生命周期,数据不会移动到昂贵的数据存储系统中的单独层,而是移动到成本较低的数据存储系统中。它不仅抽象了非结构化数据管理,还抽象了许多数据存储系统服务,如生命周期管理、数据保护和复制。仅复制就可以将数据拷贝到不同的数据存储系统、类型、 供应商和介质。


这些来自22dot6,Aparavi Software,Datadobi,Data Dynamics,Hammerspace,iXsystems,Quantum,Spectra Logic和StrongBox Data Solutions等供应商的下一代非结构化管理系统很可能成为2022年的主要数据存储趋势。



面向数据存储系统的类似云的弹性按需定价


众所周知,公共云存储在数据存储市场中所占的份额越来越大。弹性按需费用仅在企业使用存储容量后收取。它给云存储提供商带来了风险,因为随着时间的推移,客户不必提前购买数据存储来满足他们的未知需求。它通常花费更多,但并非总是如此。



数据存储系统供应商更有效地竞争的最佳方式是在本地提供相同的定价服务。戴尔、HPE、 Infinidat、NetApp 和 Pure Storage 都拥有这些类似云的弹性按需定价服务。预计到2022年还会有更多。


这对客户和供应商来说显然是双赢的。双赢的局面几乎总是变成趋势。


明年再回来看看这些预测有多准确。

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存