查看原文
其他

以数据为中心的计算与计算型存储的兴起

常华Andy Andy730 2024-03-16

Source: Gaurav Chawla, Rise of Data-Centric Computing with Computational Storage, May 16, 2022


计算型存储是从数据存储系统向数据感知系统演进过程中以数据为中心的计算的下一步。


计算型存储是以数据为中心的计算的下一次演进,旨在改善数据和计算位置,并提高规模经济。重点是通过使特定应用程序的处理更接近数据,而不是将数据移动到应用程序来联合数据处理。它通过释放主机CPU和内存来运行客户应用程序,通过移动到数据处理来减少网络和I/O流量,并通过最小化数据移动来提高安全性,从而从可持续性的角度降低整体碳足迹,从而使整个数据中心环境受益。


向以数据为中心的计算的演进始于过去十年的“计算加速”(Compute Acceleration),该加速专注于应用程序加速和AI/ML,导致行业专注于GPU,ASIC(Application Specific Integrated Circuit, 专用集成电路),AI/ML框架和支持AI的应用程序。GPU/ASIC现在广泛部署在AI/ML用例中。以数据为中心的计算的第二阶段侧重于“网络和存储加速”(Network and Storage Acceleration)。它从专注于FPGA和SmartNIC开始,并在过去两年中不断发展,更广泛的行业关注DPU(数据处理单元)和IPU(基础设施处理单元)。


这些支持数据中心硬件基础设施和软件服务的解耦,以实现逻辑可组合系统和优化的数据流。DPU/IPU在云中被广泛采用,并在企业部署中得到推动。“数据加速”是向以数据为中心的计算演进的下一步,计算型存储是实现这种数据加速的关键底层技术。


自 2000 年代后期以来以数据为中心的计算技术发展


计算型存储技术的重点是通过充分利用硅多样性和分布式计算,使计算更接近数据。它将使从今天的“数据存储”系统发展到未来的“数据感知”系统,以实现更高效的数据发现,数据处理,数据转换和分析。在接下来的几年里,我们将看到它达到与AI/ML的GPU/ASIC以及用于网络和存储处理的DPU/IPU相似的成熟度和行业发展势头。


计算型存储驱动器 (CSD, Computational Storage Drive)、计算型存储处理器 (CSP,Computational Storage Processor)、数据处理单元 (DPU,Data Processing Unit) 是底层技术推动因素,可在硬件中移动数据处理并提高数据中心部署的整体经济性。FPGA(现场可编程门阵列)也将发挥作用,为特定应用的处理和未来创新提供软件可编程元件。这些正在被集成到CSD和CSP中,以实现高性能特性应用场景。


在过去两年中,初创公司、系统供应商、解决方案供应商和云服务提供商在计算型存储解决方案方面都开展了行业活动。挑战在于计算型存储接口与应用程序的集成,以及存储设备和平台中硬件加速功能的广泛可用性。


NVM Express和SNIA正在进行多种标准工作,以标准化块存储的架构模型和命令集。用于计算型存储的SNIA架构涵盖CSD,CSP和CSA(计算型存储阵列),其中CSA通常包括一个或多个CSD,CSP和用于发现,管理和利用底层CSD/CSP的软件。集成解决方案是 CSA 的一个例子。标准化和开源工作将进一步发展为对象和文件协议,因为大多数应用程序使用文件和对象访问和存储数据。


由于计算只能移动到存在数据的应用程序级场景或可以创建该场景的位置,因此您还将看到文件和对象存储系统出现计算接口。有机会扩展文件和对象访问方法,以联合特定于应用程序的处理更接近数据,并且仅将结果发送到应用程序。与新兴的软件定义数据库和数据湖架构的集成将使它在数据湖上运行的用户应用程序透明化,并提高解决方案的性能和经济性。


边缘部署的日益普及为将特定于应用程序的处理联合到生成数据的边缘站点创造了更多机会。计算内存也正在成为一种相邻技术,用于将计算转移到内存中的数据。这将在将来的持久内存结构中启用计算。HBM(高带宽内存)不仅对GPU感兴趣,而且对存储在平台中集成的数据转换引擎也很有趣。


数据操作将既是固定功能又是可编程的。现代存储系统是使用基于容器化微服务的软件定义架构构建的。这创造了一个机会,可以在水平可扩展的存储系统节点上以安全微服务的形式运行特定于应用程序的计算,或者在计算型存储磁盘驱动器或计算持久内存上一直运行。我们将看到未来的数据库和数据湖架构利用计算型存储概念来实现更高效的数据处理、数据发现和分类。


我们将看到今天的“数据存储”系统发展成为未来的“数据感知”系统。这些系统将能够根据策略自动发现、分类和转换数据,并使组织能够从数字优先转变为数据优先组织。特定于应用程序的数据处理将更接近数据,并优化数据中心和边缘到云架构的整体经济性。

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存