查看原文
其他

CXL 3.0 技术将如何影响企业级存储

常华Andy Andy730 2024-03-16
Source: Jim Handy, How CXL 3.0 technology will affect enterprise storage, 16 May 2023

管理员们可能会将Compute Express Link(CXL)的3.0规范理解为一种更快、更昂贵的网络存储形式,但它的目标是不同的应用场景。

CXL是系统解耦的最后一环,它使得IT能够像对存储、I/O和服务器进行重新分配一样,将内存视为一种资源。通过这种方式,大型数据中心希望更高效地使用内存,减少“滞留”内存,并为应用程序提供比服务器经济支持的更大内存容量。这将对存储产生影响。

CXL 3.0将标准推进了几步

根据CXL联盟的说法,CXL 3.0规范在前几个标准版本的基础上进行了扩展,以增加可扩展性,并通过交换和互连功能、点对点通信以及跨多个计算域进行资源共享,优化系统级流程。

CXL 3.0将CXL从最初的CXL 1.0和1.1的PCIe 4.0,以及CXL 2.0的PCIe 5.0迁移到PCIe 6.0。带宽每一代都翻倍,现在将以每秒64亿次的速度运行。第3.0版实现了几个复杂的功能,提高了所有CXL版本在系统中保持一致性的能力,同时不增加延迟。这些标准也具备向后兼容性。

CXL 1.0、2.0 和 3.0 的对比表

规范中最重要的变化与内存有关,因为CXL将解耦内存。在最初的版本中,CXL将内存(或持久内存)与处理器进行点对点连接。CXL 2.0引入了交换机,使多达16个主机可以访问多个内存实体(或内存实体的部分),以进一步支持解耦,从服务器级别提升到机架级别的连接。

CXL 3.0技术使多个主机可以共享内存而无需考虑一致性问题,这是管理员可以用于简单信号量的功能。然而,随着系统架构师采用这个选项,还会有其他用途的出现。

CXL 3.0 可以级联多台交换机,实现网络结构

虽然早期版本的 CXL 只允许将一个加速器连接到交换机,但 CXL 3.0 现在可以管理多达 16 个加速器,从而保持主机处理器、加速器和内存之间的一致性。借助级联交换机,系统可以连贯地管理多达 4095 个内存实体。这一进步在下图的中心底部显示为 GFAM,或全局结构附加内存。

有一些方法可以将更复杂的结构与 CXL 3.0 连接起来,例如这种脊叶配置。

CXL 3.0 对存储的直接影响

CXL 3.0 技术支持对等读/写。存储可以选择将数据直接移入或移出内存,而无需主机干预。使用 CXL 2.0 中的远程直接内存访问方法,主机会进入事务的中间并减慢事务速度,因此此更改使 CXL 3.0 明显快于 RDMA。它还使处理器免于管理此任务。

从 I/O 流量的角度来看,对等事务将支持更高的流量,因为主机在任务之间切换时不必启动和停止 I/O 流。然后,主机应该更紧密地专注于它擅长的任务。此外,I/O 将加快速度,因为它不再需要等待主机,而更快的主机将需要更大的 I/O 带宽来保持其忙碌。

在一个完全不同的方向上,CXL 3.0对内存共享的支持意味着当前通过存储交换消息的软件最终会将该通信转移到共享内存。同样,这将加速进程,因此即使消息传递任务已从存储中移出,最终结果应该是更高的 I/O 带宽。但是,此更改的实施可能需要很长时间,这仅仅是因为它需要对软件进行许多结构更改,而这些更改通常需要几年时间才能到位。

第三,内存池将使内存密集型应用程序能够访问比当前经济更多的内存。即使是最大的应用程序的整个代码和数据集也可以驻留在内存中,没有页面错误。虽然这在执行任务期间转化为特别低的 I/O 流量,但它给存储带来了巨大的压力,要求在任务结束时快速响应,并将其内存重新分配给另一个任务。

CXL 更多的是在不增加成本的情况下提高系统性能。当系统性能的任何一部分(在本例中为内存管理)提高时,系统的其他部分必须跟上步伐,否则它们将成为瓶颈。CXL 将增加对存储的带宽需求,因为服务器将更高效地执行,因此需要更多的数据。

CXL 3.0 对存储的间接影响

CXL 3.0与内存的关系比与存储更为密切,但它很可能加速计算,从而对存储性能提出更多需求。但这几乎总是这样的情况吧?

CXL 3.0规范于2022年8月发布,预计需要大约一年时间才能在硬件上广泛使用。然后,管理员将需要升级应用程序以充分利用CXL 3.0技术所提供的一切,而这也需要一些时间。主流变化可能需要数年时间。

好消息是,在管理员需要担心CXL对系统的影响之前,他们有足够的时间熟悉这项技术。
继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存