云原生 Kubernetes 数据存储报告

常华Andy Andy730 2024-03-16

Source: Joep Piscaer, GigaOm Radar for Cloud-Native Kubernetes Data Storagev3.0, Jul 28, 2022

概述

云原生、基于容器的架构和应用程序现代化的落地继续推动Kubernetes平台上对持久化存储的需求。云原生工作负载在性能、可伸缩性和可移植性方面的优势是实现业务目标的关键推动因素。

许多企业已经在运行云原生工作负载，并了解更敏捷和灵活的架构的优势，包括应用程序可移植性，可实现从数据中心到云甚至跨云的无缝工作负载移动，从而提供比传统技术更高的灵活性和对业务需求的响应能力。

自上次报告以来，Kubernetes 环境的数据存储解决方案已经发展，特别是在迁移和移动性方面，以及在成熟的企业级功能方面，以实现安全性、高级数据服务和增强的开发人员体验。

Kubernetes 采用持久化存储解决方案的一个常见模式是重用现有的企业存储解决方案。对于起初的部署来说，这被认为是一个安全的方案，但它无法应对Kubernetes大规模所需的大量后端操作。这种限制，加上使用传统存储管理多云环境所涉及的复杂性，鼓励用户寻找更智能、更高效的替代方案。

与其它类型的存储系统相比，Kubernetes原生存储提供了一个对DevOps更友好的环境，有助于构建一个可以由运营团队控制的硬件堆栈，同时使开发人员能够在必要时以自助方式快速分配和监控资源。对于寻求最智能方法来发展其流程并使其与最新的业务和技术要求保持一致的企业IT组织来说，这是一个重大福音。

现在，组织在选择其应用程序和数据应运行的位置时，可以考虑比以往更多的因素，包括财务和业务问题，他们希望能够自由决定应在哪里运行。公有云以其灵活性和敏捷性而闻名，但本地基础设施在效率、成本和可靠性方面仍然更好。随着跨云、边缘和本地的广泛落地，Kubernetes 在执行可移植、灵活和敏捷的混合云战略愿景方面发挥了重要作用，在大多数情况下，使应用程序及其数据既可移植又与云无关。它需要与基础架构层（如存储）进行正确的集成，以补充其对有状态数据存储的成熟本地化支持。

为持久性数据选择和实施 Kubernetes 存储解决方案仍然是一项艰巨的任务，该解决方案充分利用了 Kubernetes 的应用程序移动性和数据可移植性功能。

随着 Kubernetes 现在支持业务关键型应用程序和服务，要求变得更加严格。可扩展性、性能、弹性、安全性和其它非功能性需求是当务之急，Kubernetes 需要做到这一切，以确保在不中断服务的情况下实现一致的吞吐量水平。这些要求推动了对企业级有状态数据服务、可靠的安全控制、成熟的多租户性能管理，如服务质量（QoS）和带宽限制，以及全面的警报、报告和监视的需求。

最后，企业不希望被锁定在任何一家供应商的生态系统中，因为他们从Kubernetes的可移植和不可知的承诺中获益，他们正在寻找一种存储解决方案，该解决方案可以在本地和云基础架构中实现功能调整。

本报告重点介绍 Kubernetes 的云原生持久化存储解决方案。这些体系结构专门设计用于在不影响性能或可伸缩性的情况下满足云原生应用程序的需求。它们通常不设计为与其它工作负载类型（如虚拟化）共存。

市场分类

在本报告中，我们将评估 Kubernetes 原生存储，指的是专门为支持具有可扩展的分布式架构的有状态容器而构建的解决方案。通常，存储系统本身作为一组容器在 Kubernetes 集群上运行，通过容器存储接口（CSI）向集群公开存储以供工作负载使用，并与 Kubernetes 集群中的应用程序工作负载一起运行。

这些分布式存储解决方案与容器业务流程协调程序紧密耦合，并且可识别容器，因此当业务流程协调程序启动或销毁容器时，它还会处理存储预配和取消预配操作。存储操作是自动化的，对用户不可见。

这些解决方案旨在识别和解决 Kubernetes 存储的挑战，从而与容器生态系统无缝集成。这些架构与容器环境的集成最紧密;他们密切关注并实施为扩展 Kubernetes 存储功能而开发的新技术和协议。它们还在日常使用中提供最佳性能。

这些解决方案还遵循群集的自动缩放规则，更易于缩放。如果添加或删除了群集节点，存储系统也会自动向上和向下扩展。这种自动化使这种类型的存储非常灵活和动态，与它支持的应用程序设计范例紧密结合。通常，此类别中的解决方案使用存储策略将工作负载与物理存储介质分离，并且它们与硬件无关，无需任何根本性调整即可支持各种商用服务器和云服务。

为了更好地了解市场和供应商定位，我们评估了云原生 Kubernetes 数据存储解决方案在服务特定细分市场方面的表现。

中小型企业（SMB）：在此类别中，我们评估解决方案满足从小型企业到中型公司等组织需求的能力。还评估了大型企业中的部门场景，在这些场景中，易用性和部署比广泛的管理功能、数据移动性和功能集更重要。

大型企业：在这里，产品/服务根据其支持大型和业务关键型项目的能力进行评估。此类别中的最佳解决方案将重点关注灵活性、性能、数据服务和功能，以提高安全性和数据保护。可扩展性是另一个很大的差异化因素，在异构环境（包括本地和云）中部署相同服务的能力也是如此。最后，开发人员体验部分属于这一类，因为大型企业通常需要其开发团队的自助服务功能。

独立服务提供商/托管服务提供商（ISP/MSP）：在此类别中，将评估适用于 ISP 和 MSP 的解决方案。这些应包括其它安全性和多租户功能以及限制每个租户性能的功能。

成功部署的关键是解决方案能够将数据发送到何处。换句话说，确定数据存储解决方案是否可以部署在本地、云中、边缘和较小的独立服务提供商处非常重要。这种灵活性不仅考虑了解决方案的体系结构，还表明了它是否可以在组织必须应对的各种环境中轻松部署。

GigaOm雷达

本报告综合了对关键标准的分析及其对评估指标的影响，为GigaOm Radar图形提供信息。生成的图表是此报告中所有供应商的前瞻性视角，基于其产品的技术能力和特性集。

GigaOm雷达绘制了一系列同心环的供应商解决方案，其中那些设置在更靠近中心的环上被认为具有更高的整体价值。该图表在两个轴上描述了每个供应商的特征 - 平衡成熟度与创新，功能播放与平台游戏 - 同时提供了一个箭头，预测每个解决方案在未来12到18个月内的发展。

用于云原生 Kubernetes 数据存储的 GigaOm 雷达

正如您在雷达图中看到的，云原生 Kubernetes 数据存储空间正在快速发展，解决方案具有创新性，市场响应是动态的。这种情况解释了为什么像去年一样，雷达的上半部分没有供应商，因为客户需求和供应商功能不断发展。

然而，我们看到市场上不同方法的广泛描述，一些供应商根据客户需求在类别之间跳跃（与去年的报告相比）。

在右下角的“创新，平台”象限中，是正在构建云原生存储平台的供应商。这些供应商将持久性存储视为其独特的差异化，并围绕它构建产品组合。

该组中常见的是将存储平台与Kubernetes分发和集群管理产品耦合，这些产品的组合为希望进入Kubernetes世界的客户创建了一个高度集成的交钥匙解决方案。在这个群体中，我们从这个雷达中三个最强大的竞争者那里看到了最完整的功能集，每个功能集都具有强大的企业方法，成熟的高级数据服务和执行良好的开发人员体验。

在略微落后于领导者圈子的小组中，有四个挑战者，每个挑战者都有一个完全不同的方法，从关注持续的数据保护到CNCF支持的开源项目。虽然这些产品的基础很扎实，但它们在某些企业级功能上却没有达到目标。

在左下角的“创新，功能”象限中，我们看到三家供应商采用不同的市场方法，更多地面向特定功能，部署模型或利基场景。

VMware 和 Red Hat 的 Kubernetes 持久性存储解决方案仅适用于使用各自较大产品集 Tanzu 和 Red Hat OpenShift 的用户。虽然违反直觉，但这种对存储功能集的锁定意味着存储平台本身缺乏在平台游戏领域定位所需的范围广度。尽管如此，Tanzu和OpenShift用户都会发现一个引人注目的存储解决方案捆绑到产品中。

两家供应商都处于领先地位，创造了完全集成的开发人员体验，包括存储、Kubernetes 集群管理和开发工作流。他们的解决方案为已经投资这些平台并具有强大的企业级功能集和管理功能的企业提供了最便捷的云原生 Kubernetes 存储途径。

组织的 IT 配置文件具有一些定义性特征，可帮助您做出正确的购买决策。您可以通过询问以下问题来确定它们：

您是否已经拥有了一个存储平台，该平台也可以支持基于 Kubernetes 的工作负载？
您是否已经拥有附带或首选某个解决方案的群集管理解决方案？
您是否更喜欢（或需要）基于开源项目的商业解决方案，甚至是完全开源的解决方案？
在何处以及如何部署 Kubernetes 集群？本地、云、边缘和某些基于 Kubernetes 的平台（如 OpenShift 和 Tanzu）都会对哪种解决方案最适合您产生影响，本报告中的供应商支持不同级别的部署灵活性。
您的工作负载需要哪些高级数据服务，包括用于灾难恢复和备份的同步和异步复制、快照、重复数据删除、压缩和数据保护功能？
是否有能够管理存储的存储团队，或者是否需要开发人员自助服务功能？

供应商洞察

DataCore

2021年底，DataCore收购了Mayastor的开发商MayaData。Bolt是DataCore此次收购产生的第一款新产品，是Kubernetes专有的企业级云原生存储解决方案，牢牢扎根于Mayastor代码库，但定位和构建为交钥匙产品，以克服Mayastor固有的复杂性，例如其插件系统和社区控制的路线图。

Bolt与Mayastor的不同之处在于它在部署和操作方面的易用性。它针对开发人员和DevOps用户，而不是存储管理员，与Mayastor相比，扩大了其适用性。请注意，位于Mayastor基础的开源项目OpenEBS也仍然可用。

Bolt 的超融合容器化架构允许它随应用程序一起扩展，并通过在集群中的节点之间复制卷数据来照顾节点弹性。读取分布在副本中以获得最佳性能。其基于英特尔 SPDK 的架构非常适合高性能、低延迟的有状态应用。

Bolt 是纯软件，可在本地硬件以及多个云平台上运行。

然而，Bolt是市场的新进入者，并且缺少一些关键功能。它不支持许多数据服务，包括异步副本或克隆。它目前仅支持完整副本备份。虽然DataCore预计将添加这些关键的缺失功能，但这一差距确实提出了一个问题，即客户是否应该选择Bolt或暂时留在Mayastor，以享受应用程序一致性快照，静态数据加密和数据优化等功能。

优势：Bolt 是 Mayastor 的一个交钥匙、单一的分支，它有可能成为没有专用存储管理员的公司所采用的以性能为导向的解决方案。

挑战：与竞争对手相比，Bolt的企业级功能（如数据保护、复制和占用空间优化）非常有限，需要DataCore付出大量努力才能实现功能调整。虽然该解决方案正在积极开发中，并有望在不久的将来与Mayastor（如去年的报告所述）实现功能匹配，但问题仍然是Bolt能否摆脱Mayastor固有的局限性和历史。

Diamanti

Diamanti 提供的解决方案包括 Kubernetes 集群管理（Spektra Enterprise）和 Kubernetes 数据存储（Ultima Enterprise），以及用于存储的可选硬件加速卡 Ultimate Accelerator。该公司以企业级有状态应用程序场景为目标。

Ultima Enterprise是其纯软件的超融合数据平面，融合网络和存储，可以通过Amazon Web Services（AWS）和Google Cloud Platform（GCP）在本地或云中运行，并具有各种部署选项;但是，缺少对部署到 Azure 的原生支持。

Ultima 数据平面由分布式存储平台组成，该平台还提供 L2 和 L3 网络功能、数据保护功能、容器和虚拟机（VM）支持以及CNI/CSI插件。该解决方案具有企业级功能。可以跨可用性区域镜像数据。跨集群和云支持基本的崩溃一致性快照、备份和还原以及灾难恢复（具有恢复和消防演习工作流）;可以使用异步复制跨云迁移卷。值得注意的是，这些迁移功能不需要在源环境和目标环境上进行 Ultima 存储，从而提高了迁移灵活性。

Diamanti 支持基于角色的访问控制（RBAC）和多租户（使用 Spektra），允许在租户和团队之间实现基于策略的隔离。这些功能以及其QoS支持也是MSP考虑将Kubernetes作为服务交付给其客户端的一个优势。在卷和磁盘级别支持静态数据加密，并且还提供了高级内置密钥管理系统。

Diamanti具有功能丰富的管理平台，允许组织跨各种云管理多个集群。它嵌入了集群和应用程序生命周期管理功能，以实现更快的应用程序部署。该管理平台还集成了细粒度的可观察性功能，提供环境运行状况的整体视图，并一直深入到容器级别。最近在其产品组合中增加的GroundWork Monitor将提高Diamanti的监控和可观察性能力。

Spektra 是容器管理平面，支持跨云和位置（包括核心和边缘）管理 Kubernetes 集群，添加应用程序和数据移动功能，以及高级数据服务、基础架构可观察性和控制。此外，OpenShift是工厂支持的部署选项，使客户更熟悉OpenShift，下面有Ultima存储。

优势：Diamanti 基于 NVMe 的超融合架构可提供高弹性和良好性能。其（现在）纯软件部署模型（支持数据中心、云和边缘）和灵活的数据迁移功能相结合，使 Diamanti 成为出色的数据移动解决方案。

挑战：虽然此解决方案仅支持软件，但其架构仅支持 NVMe 驱动器，使其不太适合已有的部署。数据保护和数据缩减功能落后于竞争对手。

IBM

IBM 通过 IBM Spectrum Fusion 提供云原生 Kubernetes 存储功能，IBM Spectrum Fusion 是专为 OpenShift 设计的软件定义解决方案。Spectrum Fusion 是一种基于云原生的架构，可为 OpenShift 客户提供基于策略的存储。它的优势在于将开发人员的存储消耗（包括更高级的数据服务）与Kubernetes管理员通过策略进行的存储管理分开，这些策略已高度集成到OpenShift中。它提供块、文件和对象服务，以及数据保护功能。它包括应用程序感知的灾难恢复功能以及对数据迁移场景的支持，并以纠删码支持的形式提供数据效率功能。

Spectrum Fusion可以利用现有的企业存储系统，包括非IBM块存储。Spectrum Fusion可选择作为基于IBM Spectrum Scale的集成硬件设备提供，其纯软件部署支持本地和云环境。

值得注意的是，Spectrum Fusion对AI工作负载具有GPU直接支持。安全性包括加密功能、不可变快照和 RBAC。

该解决方案使用 IBM Spectrum Fusion HCI 仪表板进行管理，该仪表板提供标准监控和警报功能。可以与 IBM Cloud Satellite 和 OpenShift Advanced Cluster Management 进行集成。IBM Spectrum Fusion 还包括呼叫总部支持和故障排除功能。

IBM Spectrum Fusion的一个有趣的特性是应用程序包的可用性，它由用于流行应用程序的现成部署包组成，例如Cassandra，Kafka，MongoDB和SAP HANA。

优势：IBM 的产品是一个 Kubernetes 存储解决方案，专门设计用于在超融合模式下轻松部署Red Hat OpenShift 容器平台。

挑战：Spectrum Fusion是专门为OpenShift设计的，阻碍了非OpenShift用户的广泛应用。高级数据服务不如其企业存储阵容先进。

Ionir

Ionir 是面向 Kubernetes 的容器原生、纯软件存储解决方案，具有高级数据功能。该解决方案由弹性且可扩展的分布式微服务架构组成，该架构实现了支持卷预配和快照管理的 CSI 插件。Ionir 使用 NVMe over TCP 以及 Intel SPDK 框架来提供高效的 I/O 路径并避免性能瓶颈。

Ionir的元数据基于专有的专利数据库，该数据库记录每个写入操作的元数据以及与数据内容和写入时间相关的名称。带时间戳的记录允许以一秒的粒度从过去的任何时间点检索卷的状态;实际上，这转化为持续的数据保护。

Ionir 利用独特的元数据架构提供高级数据管理服务，如复制、迁移和灾难恢复。该解决方案允许在 40 秒或更短的时间内跨集群甚至全局跨云复制或移动持久卷，使其成为时间敏感型环境中数据迁移或复制的理想选择。它通过使目标集群上的卷和热数据可访问，并在后台重新冻结冷数据，同时仅传输唯一块，从而有效地在集群之间提供重复数据删除来实现此目的。此功能需要两端的Ionir存储。此方法也适用于具有大型环境的开发测试方案，在这些环境中，需要快速且按需提供完整的数据和环境副本。

Ionir 还提供了出色的数据效率：用户可以通过压缩和精简配置来增强内联重复数据删除功能。尚不支持纠删码，但计划在以后的版本中使用。

从安全角度来看，支持动态数据加密。静态数据加密正在路线图中，利用公司的 IP 来避免与重复数据删除的潜在冲突。使用重复数据删除功能进行逐卷加密已在路线图上。RBAC 和自助服务开发人员访问权限可用，但尚未成熟。

Ionir 具有易于使用的管理界面，可处理所有支持的活动，包括快照克隆操作和粒度数据恢复。该接口以原生方式捕获并公开 Kubernetes 对象，包括应用程序和机密。监控通过Prometheus和Grafana处理，而ELK处理日志事件的日志记录，跟踪和可视化。Ionir 允许客户通过简单的一键式部署过程启用这些工具。

优势：Ionir 是 Kubernetes 云原生存储解决方案，专注于持续数据恢复和移动性，提供每秒粒度。该解决方案具有全面的功能集，包括空间效率。

挑战：该解决方案具有一些功能，这些功能已经在路线图上徘徊了一年多，包括静态加密和擦除编码。多租户支持受到限制。

NetApp

NetApp Astra Data Store 是 NetApp 面向 Kubernetes 的云原生持久化存储解决方案，构建在其开源 Astra Trident 项目之上。ADS 使用 NetApp 的 WAFL 技术构建，但在标准服务器上作为分布式存储系统运行，使用本地存储，采用无共享架构，具有节点、机架和数据中心故障感知能力，可实现弹性。Astra 可以在本地、云中（使用超大规模云服务）运行，也可以使用 NetApp Cloud Volumes（在公有云上提供企业级高性能存储）作为完全托管的云服务运行。它使用运算符部署在Kubernetes上，也可以在裸金属或VM上运行。ADS的关键区别在于它是重新设计的ONTAP，这意味着它与ONTAP生态系统完全兼容。ADS 支持 ONTAP 的广泛功能，包括数据保护、全局重复数据删除、压缩、复制和 QoS。

目前，ADS仅公开基于文件的存储;但是，对块和对象的支持在路线图上。NFS 支持的优势和关键卖点是 ADS 同时支持基于虚拟机和基于容器的应用程序。结合 ADS 对 NetApps SnapMirror 复制技术的支持，ADS 作为已经运行 ONTAP 的客户的应用程序现代化工具具有独特的优势，因为 ADS 可以从现有的 ONTAP 环境接收 SnapMirror 复制。同样，ADS 对 VM 的支持使其成为需要同时运行 VM 和容器的边缘部署的理想平台。

Astra Control 是位于 ADS 之上的多集群或环境管理平面，通过 NetApp Cloud Insights 提供全球存储管理和运行状况监控。Astra Control 还可以管理 FAS 和 AFF 阵列以及 NetApp Cloud Volumes 产品，使其成为云原生应用程序的控制平面。它提供了一个干净且可用的管理界面，向用户显示他们需要的所有信息或他们可以执行的操作。还支持多租户，并在应用程序级别提供 RBAC 支持和访问粒度。当 ONTAP 用作存储提供程序时，支持静态加密，云卷也是如此，其密钥由云卷服务管理。

优势：Astra Data Store是ONTAP，但针对云原生环境进行了重新设计。这种强大的基岩为ADS ONTAP提供了全套功能。此外，NetApp 还有令人信服的路线图，显示出巨大的潜力。值得注意的是 ONTAP生态系统中已有的客户的强大迁移功能，因为ADS同时支持VM和容器。

挑战：与竞争对手相比，某些功能较弱，最明显的是（同步）灾难恢复。对于某些人来说，缺乏块和对象存储协议可能是个问题，但正在积极解决。

Ondat

Ondat，以前称为StorageOS，是一家专注于为Kubernetes环境提供云原生持久块存储功能的公司。该解决方案旨在满足高性能、任务关键型容器化应用程序的存储需求。

该架构由每个 Kubernetes 集群节点的本地容器组成。这些容器中的每一个都管理它们运行所在的节点上的本地附加存储。所有这些节点上的容量通过池层进行聚合和池化，池层将呈现给群集。它可以通过功能调整在本地和云中部署，与云市场广泛集成，并通过了EKS，AKS，GKE，Anthos，Rancher，OpenShift等认证。

然后，Kubernetes 业务流程协调程序可以与 Ondat 通信，以便根据需要为在集群中的节点上执行的任何容器预配或取消预配持久卷。该解决方案通过跨节点卷副本具有弹性，旨在提供可扩展性和性能，并特别关注对延迟敏感的工作负载（如数据库）。

该解决方案目前支持同步复制，但仅支持群集内复制。但是，群集可以使用拓扑感知的群集内复制跨可用性区域来扩展可用性区域。

增量同步功能仅在群集重建时复制丢失的数据。为了优化和提高效率，Ondat 使用数据压缩和智能精简配置功能。不支持纠删码和重复数据删除。

目前支持多个存储类，但其它多租户功能（如 QoS 和地缘组）尚不可用，尽管在路线图中。安全性是一个值得注意的领域，具有 RBAC 和命名空间、传输中的数据和静态数据加密，以及使用唯一的每卷加密密钥的能力。

除了自己的图形用户界面外，该解决方案还与Prometheus和Grafana集成，重点是IOPS，带宽和可用空间。尽管 Ondat 主要面向业务关键型应用程序，但其体系结构基础非常适合于解决边缘使用情形（这要归功于其低开销），一旦实施了异步复制功能，它应该非常适合。

优势：Ondat是一种具有巨大潜力的轻量级解决方案，目前非常适合面向性能的云原生应用程序。该解决方案提供强大且可扩展的架构，旨在满足苛刻的延迟和吞吐量要求，并设计为可在任何具有边缘场景潜力的平台上运行。

挑战：缺乏集群间和异步复制限制了迁移和（某些）灾难恢复方案，限制了其作为多云存储结构和某些任务关键型场景的整体适用性。缺乏先进的数据效率机制，如重复数据删除和纠删码，可能会成为未来的挑战。

Portworx by Pure Storage

Portworx 是云原生 Kubernetes 存储的最先进的解决方案之一。PX-Store 是一种超融合的 Kubernetes 原生存储解决方案，可聚合和池化存储容量以供集群使用。作为Portworx数据服务平台一部分的一系列高级数据管理组件提供了更高级的存储功能，包括数据库生命周期管理。

该解决方案提供广泛的部署选择，并支持裸金属和虚拟化环境，包括纯存储物理阵列、现有云块服务和基于云的 Kubernetes 服务，以及其它生态系统合作伙伴的服务，从而提供跨基础架构、平台和位置的一致体验。

Portworx包括一套全面的高级数据服务。

Portworx Data Services的数据库即服务平台是一项独特的功能，支持Apache Cassandra，Apache Kafka，Apache ZooKeeper，PostgreSQL，RabbitMQ和Redis，可自动执行数据库配置和部署，第2天操作和数据保护的生命周期。

PX-Backup处理数据保护，并支持Kubernetes完整的应用程序一致性备份;也就是说，不仅备份了数据，还备份了整个应用程序状态，包括所有对象、应用程序配置数据和依赖项。提供粒度，允许组织备份单个应用程序或数千个应用程序和命名空间，并根据需要定义计划策略。可以在本地或任何云上执行还原。

PX-Store 是一种现代的分布式、容器优化的云原生存储，具有弹性扩展、存储感知服务类、多编写器共享卷、本地快照功能和多个故障转移选项（节点感知、机架感知、可用性区域感知）。还支持用于数据中心弹性的本地同步复制。

PX-DR（附加模块）扩展了这些功能，以提供灾难恢复和数据复制功能。它支持城域内的多站点同步复制和零恢复点目标（RPO）灾难恢复，以及跨 WAN 连接的多站点异步复制。PX-Migrate 可处理多云和多集群应用迁移，以及到云的快照和应用一致性快照。

PX-Secure构成了Portworx解决方案的安全层，提供集群范围（每卷）加密，基于容器的粒度或存储类加密（当组织自带密钥管理系统时可用），RBAC，授权和所有权机制，以及通过OIDC与Active Directory和LDAP的集成。

最后，PX-Autopilot 通过调整大小活动，在容器卷级别以及整个存储群集上协调自动空间回收活动，目标是控制存储成本。

该解决方案通过 PX-Central 进行管理，PX-Central 是一个全面的管理平面，可处理多群集管理、命令行界面（CLI）功能、主动集中式监视以及群集安装和设置功能。与 Pure Storage Pure1 集成后，该平台可以使用来自 Portworx 的遥测数据，并提供以应用为中心的分析，并最终提供建议。

从效率的角度来看，该解决方案处理所有快照的压缩，但只有当Portworx使用具有内置数据效率功能的底层企业级平台（如Pure Storage FlashArray）时，才能实现真正的数据减少。

优势：Portworx是一个完整的企业级解决方案，具有出色的数据管理功能，无与伦比的部署可能性和卓越的管理功能。Portworx仍然是企业云原生Kubernetes存储的黄金标准。

挑战：当解决方案未与企业共享存储耦合时，数据效率功能会受到限制。

Red Hat

作为Red Hat Data Services解决方案组合的一部分，Red Hat OpenShift Data Foundation （ODF）是基于Red Hat Ceph、Rook 和 Noobaa 的云原生存储解决方案。该解决方案具有可扩展性和弹性，目前仅支持Red Hat OpenShift，它本身基于 Kubernetes。对于考虑在一个技术堆栈上进行整合的组织，ODF 在存储层提供无缝操作。

ODF 用途广泛，支持块存储、文件存储和对象存储。它可以部署在本地或云中，并支持快照和克隆。对于数据保护，Red Hat的方法是通过其 API 支持第三方数据保护供应商的生态系统。高级数据保护功能（包括复制和灾难恢复）仅在高级版中可用。

ODF 在不影响数据优化功能的情况下提供强大的性能：目前支持纠删码、压缩和重复数据删除。多租户功能超越了 Kubernetes 存储类，还包括对 ResourceQuotas 和 LimitRanges 的支持，使组织能够控制资源的使用，并使他们能够克服工作负载整合的障碍和嘈杂邻居的不利影响。

从安全角度来看，该解决方案非常出色，支持动态和静态数据加密（在物理和卷级别）。ODF 还支持密钥管理。监控和报告功能非常好，与OpenShift控制台的集成为组织提供了所有基本的性能和运行状况指标。

最后，当 ODF 以紧凑模式（从三个节点开始）部署时，也支持边缘部署。

优势：ODF 是一款云原生存储解决方案，具有企业级功能和创新的云部署方法，可在多种功能上提供可靠的价值。托管 OpenShift 服务和存储选项现已在多个云上可用，使用户能够执行其混合云和多云战略。

挑战：目前的支持仅限于Red Hat OpenShift。高级数据服务仍然是一个薄弱领域。尽管RedHat OpenShift拥有良好的数据保护API，但其数据保护方法依赖于解决方案生态系统，这可能会阻止小型组织寻求集成解决方案。

Robin.io

Robin.io 是一种创新的、应用感知的云原生 Kubernetes 解决方案，具有企业级功能。该解决方案可以在任何地方运行，无论是在本地（裸金属、虚拟机）还是在所有主要的公有云提供商上。该公司于2022年初被Rakuten Symphony收购。

该产品称为Kubernetes云原生存储（CNS），可在Kubernetes集群节点上发现和池化任何类型的本地磁盘，还可以池化来自云盘和SAN系统的存储容量。Robin CNS 提供弹性体系结构，具有跨群集节点的严格一致的副本、针对落后节点的自动重新同步以及快速故障转移功能。该解决方案支持裸金属性能、实时数据重新平衡以避免 I/O 瓶颈，并使用 QoS 来限制 IOPS 的使用。QoS 不仅限于存储，还扩展到 CPU、内存和网络资源。

CNS以其先进的数据服务大放异彩。支持多种复制模式，在节点、机架、数据中心和区域级别进行感知，为组织提供足够的粒度。为了满足应用程序级部署和性能要求，高级放置功能允许组织使用关联性/反关联性规则定义细粒度放置策略。Robin 的管理界面包括一个“应用程序捆绑包”部分，该部分提供类似于应用商店体验的快速部署功能，同时尊重这些应用程序的最佳实践部署拓扑。

该解决方案还支持快照和应用程序一致的增量永久备份。复制功能可用于跨云的数据复制和应用程序克隆、灾难恢复和应用程序移动性。数据压缩是可能的，并且通过与MinIO集成来支持对象存储。

Robin CNS 支持按卷加密，但客户必须操作自己的密钥管理系统。监视和可观察性功能已得到改进，在 UI 中增加了可视化效果，同时还公开了数据源，以便使用第三方监视工具进行抓取。

虽然CNS可以作为独立产品使用，但它可以与Robin的Kubernetes管理解决方案CNP结合使用，以实现完全集成的基础架构堆栈。此解决方案非常适合解决边缘计算场景。Robin在各种电信公司拥有良好的记录，对于这些电信公司来说，与5G基础设施相关的边缘部署是容器的主要场景之一。

优势：Robin.io 提供全面、功能丰富的企业级体验，同时坚定不移地遵守云原生开发和部署原则。高级数据服务和应用程序感知功能是此解决方案的亮点之一，其备份解决方案最近已开放以支持非 Robin 存储。

挑战：迁移功能的进一步改进（包括载入不在Robin存储节点上运行的应用程序，并将Robin存储附加到非Robin集群）以及安全和数据占用空间优化功能，将进一步加强Robin作为领导者的地位，尽管乐天最近收购该公司可能会影响Robin的路线图和未来。

SUSE

Longhorn是一种开源的云原生存储解决方案，最初由Rancher Labs开发，并被SUSE收购。它于2019年被云原生计算基金会接受，目前是一个孵化项目。

Longhorn 通过由数据平面和控制平面组成的双层架构为 Kubernetes 提供弹性持久性存储，Kubernetes 通过该架构来处理编排。数据平面由分布式块存储组成，该存储聚合并池化每个节点上可用的本地磁盘容量。控制平面通过 Longhorn 管理器通过在卷附加到的节点上旋转 Longhorn 引擎实例来创建卷，然后在应放置这些副本的节点上创建副本。结果是一个具有高性能特征的分布式弹性存储平台。尽管 Longhorn 优先考虑复原能力，但性能是足够的，并且由于路线图开发活动，可能会看到进一步的改进。

此解决方案使用写入时复制块存储层处理备份和快照，该层允许时间点恢复。这些备份可以导出到 S3 或 NFS 以进行异地存储。相同的技术可用于具有主动-被动群集拓扑的灾难恢复和复制场景，从而使多站点灾难恢复成为可能。称为“灾难恢复卷”的功能还支持在云中进行跨区域异步复制，并定义 RPO 并减少恢复时间目标（RTO）。

该解决方案不提供特定的数据占用空间优化，尽管备份经过压缩并基于更改的块跟踪。某些技术用于辅助存储，以回收未使用的空间，或对单个卷中的备份块应用一定程度的重复数据删除。由于专注于高性能和弹性，因此没有计划为群集内存储实现数据效率功能。因此，组织应利用应用程序级数据效率机制。

在安全方面，RBAC通过Kubernetes得到支持，与Rancher技术的集成允许使用Active Directory和其它企业级身份验证提供商。支持对数据卷进行动态和静态加密。监控和警报通过标准的Prometheus和Grafana集成来处理。

组织可以将 Longhorn 部署为独立解决方案，也可以从 Longhorn 与 Rancher 的强大集成中受益。值得注意的是，Harvester是其一体化超融合解决方案，将Longhorn的存储功能与Rancher的多集群管理功能集成在一起。

优势：Longhorn 是那些寻求开源、CNCF 支持的存储解决方案的人的有趣选择。与 Harvester 结合使用，该解决方案的迁移功能非常适合希望弥合虚拟化与云原生架构之间差距的组织。

挑战：Longhorn 的功能列表有限，并且缺少一些核心功能，例如支持大容量（超过 1 TB）和数据占用空间优化。

VMware

VMware Tanzu 建立在 vSAN 之上，因此既可以在带有 vSAN 的标准本地 VMware vSphere 环境中使用，也可以作为 VMware Cloud Foundation （VCF）的一部分使用。VCF 提供完整的混合云体验，vSAN 构成了 VCF 的存储基础。

在 vSAN 上部署 Tanzu 时，它允许将传统的虚拟化工作负载和云原生应用程序整合到同一层上，因此最适合已在生产环境中使用 vSAN 的组织。此模式允许从相同的存储群集向云原生工作负荷提供存储，而无需进行任何体系结构更改。

VMware 还通过 vSAN Data Persistence 平台（DPp）提供了额外的部署选项，该平台是现代有状态服务提供商在底层 vSphere 基础架构上构建 Kubernetes 插件或运算符的框架。在 DPp 上运行的有状态服务可以部署在具有 vSAN 主机-本地无共享体系结构（SNA）策略的 vSAN 数据存储上，也可以部署在称为 vSAN Direct 的第二种模式下。

第一个选项是 SNA 策略，它允许应用程序控制放置位置并接管维护数据可用性的职责。该技术使持久性服务能够轻松地将其计算实例和存储对象共存于同一物理 ESXi 主机上。使用主机本地放置，可以在服务层而不是在存储层执行复制等操作。

第二个选项是 vSAN Direct，它由具有最佳存储效率和接近裸金属性能的专用硬件组成。vSAN Direct 允许现代有状态服务利用现代有状态服务层内置的可用性、效率和安全性功能，并直接访问底层直连硬件。

Tanzu 的部分优势来自 vSAN 的基于存储策略的管理（SPBM）功能。可以创建各种存储策略，每个策略具有不同的弹性要求、功能（如加密）、QoS（IOPS 限制）等。组织可以使用现有的 API 集成来扩展 SPBM，以自动执行容器预配工作流。各个软件供应商可以将其应用程序的原生数据管理、复制和服务功能（如应用级复制、纠删码和加密）直接集成到 vSAN DPp 中，以便在应用程序级别转换一些存储策略并避免资源浪费。

Tanzu环境的管理通过Tanzu Mission Control进行处理，Tanzu Mission Control允许在本地和跨云进行多集群Kubernetes管理。数据迁移可通过 Velero 进行。

该解决方案通过基于软件的动态和静态数据加密、FIPS 140-2 加密模块、对符合 KMIP 的第三方密钥管理器的支持以及只需单击一下即可启用数据存储级加密的能力，提供了出色的安全功能。RBAC 通过 vSphere 和 VCF 提供原生支持。

优势：Tanzu 非常适合以 VMware 为重点的组织，因为他们已经具备了快速轻松地采用 Tanzu 的构建块，从而在几乎没有障碍的情况下提供出色的开发人员体验。

挑战：尽管 Tanzu 的架构非常出色，但它对其它 VMware 产品的依赖性造成了平台开销，对于寻求纯云原生部署模型的组织来说，这种开销是不必要的复杂。

分析师的观点

持久性 Kubernetes 存储市场正在迅速发展，不断创新，但其客户也是如此，他们每年都需要更成熟的企业级解决方案。

这意味着要求正在发生变化，并且逐年变得更加严格。这种市场动态对于寻求 Kubernetes 原生持久化存储解决方案的客户是有益的，但在这个不断变化的市场中选择正确的解决方案至关重要，因为每个供应商都专注于一组不同的优先级。

在这个领域，我们看到两组竞争对手，大致分为两组，一类是将持久化存储视为他们在市场上的独特差异，因此正在围绕它构建产品组合（包括各种Kubernetes集群管理解决方案），另一类是存储只是更大平台游戏中的一个功能，通常是基于Kubernetes的开发人员平台。

在前一组中，我们看到了最完整的功能集，每个供应商都以独特的方式定位自己，以对抗竞争对手。发现哪个供应商的定位最符合您的要求将有利于长期成功，无论是性能、可扩展性、高级数据服务功能（如复制或重复数据删除）、特定部署模型（针对边缘和其它场景）还是开发人员体验和自助服务功能。

同样，市场已经超越了概念验证和早期生产环境，并具有严格的安全性和其它企业级要求。然而，并非所有供应商都赶上了这些需求，有些供应商缺乏基本的安全功能，甚至缺乏快照等基本数据服务。

值得努力跟踪了解供应商的进展，而不仅仅在存储领域，因为存储和Kubernetes集群管理之间的接口正在发生大量创新，包括用于边缘和裸金属的高度集成的统一解决方案的新兴部署模型。

继续滑动看下一个

Andy730

向上滑动看下一个

这样的洞庭湖决堤，实在让人同情不起来

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

抗洪靠嘴，堵漏靠沙？印度官员真是绝了！

有的人走了，却永远活着

圈内疯传某谣言

云原生 Kubernetes 数据存储报告

您可能也对以下帖子感兴趣

这样的洞庭湖决堤，实在让人同情不起来

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

抗洪靠嘴，堵漏靠沙？印度官员真是绝了！

有的人走了，却永远活着

圈内疯传某谣言

生成图片，分享到微信朋友圈

云原生 Kubernetes 数据存储报告

您可能也对以下帖子感兴趣