查看原文
其他

DPU/SmartNIC厂商及其产品线综述(2022年)

常华Andy Andy730 2024-03-16

【ANDY】注意信息是2022年7月份的。

Source: Cloudswit, The Most Comprehensive DPU/SmartNIC Vendors with its Product Line Summary, July 28, 2022

VendorProduct  LineCore Processor
AchronixSpeedster7t FPGA seriesFPGA
AMD (Xilinx; Pensando)
   Alveo series, Elba, Capri
FPGA, SoC
AsterfusionHelium SmartNIC

SoC ARM+ASIC

+ Dedicated  Accelerator

AWSNitro systemSoC
AzureCatapultGP SoC
BroadcomStingraySoC: ARM+ASIC
Intel

IPU - FPGA+X86 SoC,

FPGA+ARM SoC

FPGA+X86 SoC,

FPGA+ARM  SoC

FungibleFl DPUNP SoC
KalrayK200/K200-LPMPPA DPU Processor
MarvellOCTEON 10 DPUSoC: ARM+ASIC
NapatechNT200A02 SmartNICFPGA
NetronomeAgilio SeriesFPGA
NvidiaBlueField DPU

SoC: ARM+ASIC

+Dedicated  Accelerator/

GPU Dedicated Accelerator

Silicom

N5010, N5110A,

P425G2SNxlAONIC

FPGA


Achronix

Speedster7t FPGA系列 - FPGA

Achronix Semiconductor是一家美国无晶圆厂半导体公司,提供基于高端FPGA的数据加速解决方案,旨在满足高性能、计算密集型和实时处理应用的需求。Achronix提供Speedster7t FPGA系列和Speedcore eFPGA IP。用户可以将该技术部署为独立产品、ASIC或SoC设计。Achronix还提供VectorPath加速卡。

Achronix Speedster7t FPGA系列针对高带宽工作负载进行了优化,消除了传统FPGA所关联的性能瓶颈。Speedster7t FPGA基于TSMC的7nm FinFET技术构建,具备全新的2D片上网络(2D NoC)、一系列为高带宽和AI/M优化的机器学习处理器(MLP)工作负载、高带宽的GDDR6接口、400G以太网和PCIe Gen5端口。它提供了ASIC级别的性能,同时保留了FPGA的完全可编程性。

AMD

Xilinx、Pensando

自1969年成立以来,AMD一直是美国跨国半导体公司的代表,专注于设计和制造各种CPU、GPU以及其他微处理器,为计算机、通信和消费电子等行业提供动力。2022年2月,AMD完成了对Xilinx的收购,交易价值近500亿美元,将Xilinx的FPGA可编程逻辑模块和相关DSP引擎、AI加速器、内存控制器等核心技术纳入了AMD的技术储备。

Xilinx提供的DPU/SmartNIC是Alveo系列,基于FPGA。它可以加速计算密集型应用,包括机器学习推断、数据分析、视频转码等。

Alveo系列的性能比CPU高出90倍,可以根据用户的特定要求重新编程。由于算法的发展速度超过了芯片设计周期,需要可编程的硬件来适应不断变化的算法。Xilinx Alveo SN1000是业界首款为单一平台提供软件定义硬件加速的SmartNIC,可以卸载CPU密集型任务以优化网络性能,其架构可以在线速下加速各种自定义卸载任务。SN1000 SmartNIC基于Xilinx 16nm UltraScale+™架构,由低延迟的Xilinx XCU26 FPGA和16核Arm®处理器提供动力。

此外,2022年5月,AMD以约19亿美元宣布收购Pensando Systems,将Pensando的分布式服务平台与高性能DPU和软件堆栈相结合,进一步拓展了其数据中心产品组合。

Asterfusion 星融元

成立于2017年,Asterfusion Data Technologies致力于提供完全开放和高度解耦化的1G-400G裸金属交换网络,配备了基于SONiC的商业操作系统,适用于下一代数据中心、校园和服务提供商。其云网络交换机、白盒硬件、DPU设备、SmartNIC和NPB设备广泛应用于运营商、互联网、公有/私有云等多个行业。

Asterfusion的Helium SmartNIC是自主开发的,搭载了Marvell Octeon CN96XX芯片,分为两个型号:一个提供PCIe x16 Gen 4.0 425G接口,另一个提供2100G接口。该SmartNIC基于高性能SoC芯片(24核ARM集成多个硬件加速协处理器),使客户能够在保留服务器中宝贵的计算资源的同时,构建高性能的智能可编程网络,降低了云数据中心的总CAPEX。

Asterfusion的Helium SmartNIC搭载基础网络操作系统FusionNOS-Framework。网络开发者可以以FusionNOS-Framework为基础,开发自己的上层应用程序,加速应用移植和开发。

  • 通过一个非常简单的编译过程,各种基于x86的DPDK应用程序和通用Linux驱动程序可以轻松地移植到Asterfusion Helium SmartNIC上。

  • 支持DPDK、VPP、SPDK和Ubuntu


Asterfusion SmartNIC具有多种用途,从网络加速、存储加速到安全加速。网络功能:例如VTEP、OVS卸载、TCP卸载、GRE/GTP隧道封装和解封装、可靠的UDP等。安全功能:例如IPSec、SSL、XDP/eBPF、vFW/vLB/vNAT、DPI以及DDoS防御等。存储功能:例如NVMe-oF(TCP)和数据压缩/解压缩等。

AWS

Nitro系统 – SoC

Amazon的Nitro系统自2013年开始研发,并于2017年正式发布,旨在最大程度地提升性能和安全性。AWS Nitro产品家族旨在将数据中心的所有开销(如为虚拟机提供远程资源、加密和解密、故障跟踪和安全策略服务)从CPU转移到Nitro加速卡上,从而释放出30%的计算资源,原本用于为上层应用程序支付的“税”。

Nitro系统由三部分组成:

  • PCIe卡形式的Nitro卡,包括支持网络功能的Virtual Private Cloud(VPC)卡、Elastic Block Store(EBS)和Instance Storage卡,以及支持系统控制功能的Nitro Controller卡。

  • Nitro安全芯片,提供硬件根信任,防止在通用服务器上运行的软件修改非易失性存储,如虚拟机UEFI程序。

  • 运行在通用服务器上的Nitro Hypervisor,这是基于kvm的轻量级超级监视器,主要提供CPU和内存管理,不提供设备模拟(因为所有设备都通过透明传输添加到虚拟机中)。


Azure

Catapult – 通用SoC

Azure的Project Catapult于2013年在数据中心首次部署了支持FPGA的服务器,该项目显示出明显的延迟改善,将决策树算法的运行速度提高了40倍,同时减少了服务器的数量。

Azure在2012年在其WCS云存储中部署了Catapult v1,随后Catapult v2已在Bing和Azure中的所有新购买的服务器上部署。到2015年,Microsoft已将FPGA大规模部署到其Azure公共云中,并在一年内,其AccelNet计划引入了基于FPGA的SmartNIC作为Azure中实现虚拟网络功能的默认硬件,并在100多万台主机上部署了FPGA。2017年,Azure部署了Catapult v3,以加速深度神经网络,并将Bing中的网络速度提升至50 Gb/sec。

Broadcom

Stingray – SoC: ARM+ASIC

Broadcom的Stingray将强大的网络控制器、高性能ARM CPU、PCIe 3.0、性能加速器和DDR4内存结合在一起,从主机服务器的CPU中卸载了计算密集型应用。

Stingray提供了高数据包率和低延迟。Broadcom基于NetXtreme E系列控制器的逻辑,设计了Stingray核心的NetXtreme-S BCM58800芯片,然后在集群配置中放置了8个时钟频率为3 GHz的Arm v8 A72核心。此外,Stingray还可配置16GB的DDR4内存。

Broadcom还采用了TruFlow技术,一种可配置的流加速器,用于将常见的网络流处理过程卸载到硬件中。根据已发布的信息,TruFlow可以在硬件上卸载类似于Open vSwitch(OvS)的任务。该公司还声称,TruFlow在硬件中实现了许多经典SDN概念,如分类、匹配和操作。因此,Stingray配备了两个可编程组件,TruFlow和一个由四个3 GHz双核Arm v8 A72组成的集群。

Intel

IPU - FPGA+X86 SoC、FPGA+ARM SoC

Intel以其IPU技术引领着DPU领域的创新,为高性能数据中心服务器提供了强大的解决方案。Mount Evans是Intel与Google Cloud合作开发的首款ASIC IPU,面向高端和超大规模的数据中心服务器。Oak Springs Canyon是Intel的第二代基于FPGA的IPU平台,采用了Intel Xeon-D和Agilex FPGA。

Intel IPU技术的关键之一是快速可编程的分组处理引擎。无论是基于FPGA还是ASIC的产品,客户都可以使用P4进行编程,并支持查找、修订、加密和压缩等过程。

在“Intel Vision 2022”大会上,Intel公布了其最新的IPU路线图,展示了从2022年到2026年的整体计划。Intel将继续ASIC + FPGA IPU的设计,其路线图如下:

  • 2022年:推出200 Gbps IPU,代号为Mount Evans和Oak Springs Canyon。

  • 2023/2024年:推出400 Gbps IPU,代号为Mount Morgan和Hot Springs Canyon。

  • 2025/2026年:推出800 Gbps IPU。


此外,Intel还推出了IPU的开源开发工具包IPDK,可用于为x86芯片和诸如Marvell Octeon的Arm芯片编写应用程序。该工具包包括用于定制和定义工作负载的功能块,包括卸载包处理。

Fungible

Fl DPU - NP SoC

Fungible于2019年定义了DPU作为新型数据处理单元。Fungible的F1 DPU是行业首款800Gbps DPU,也是其旗舰产品。

在架构上,F1 DPU集成了大量的多核处理器,所有52个核心都是最新一代的MIPS64 R6内核,不仅支持硬件虚拟化,还将其分为独立的控制单元。F1 DPU采用双发射流水线设计,配备64KB的L1 I-cache和80KB的L1 D-cache,L1缓存支持ccache之间的数据传输,总内置L2缓存达到32MB。在内存方面,除了集成8GB的HBM外,F1 DPU还支持高达每通道512GB的双通道DDR4内存。

凭借独特的硬件和软件设计结合,F1 DPU在不损害数据中心计算能效的情况下,提供了最大的功能灵活性。这使得F1 DPU在存储(NVMe/TCP存储卸载)、安全性、AI/ML(GPU解耦)和数据分析服务器(OLAP、OLTP大数据分析引擎)等高性能密度和低延迟环境中得以应用。以存储为例,在不需要x86 CPU和AFA的存储系统中,F1 DPU可以实现每秒1500万IOPS的性能,这里的带宽限制完全来自PCIe本身的带宽限制。

Kalray

K200/K200-LP - MPPA DPU处理器

Kalray是一家无晶圆厂半导体公司,成立于2008年,是法国CEA实验室的一个分支。

Kalray的第三代MPPA® DPU处理器Coolidge,可以并行处理多个工作负载,用于更智能、更高效和更节能的数据密集型应用。Coolidge利用了Kalray专利的MPPA®(Massively Parallel Processor Array)架构,是一个可扩展的80核处理器,专为智能数据处理而设计。它为GPU、ASIC或FPGA提供了独特的替代方案,为从数据中心到边缘和嵌入式系统的多个应用提供了独特的价值。

基于MPPA®处理器,Kalray开发了一系列数据中心加速卡,如K200/K200-LP,提供高性能和高度的可编程性,可以用作:

  • 加速卡,通过纯加速卡(通过PCIe)或内联加速卡(通过以太网)卸载主机CPU,用于专用的数据密集型应用。

  • 替代某些用例中的主机处理器的独立解决方案,例如为服务提供商开发的K200-LP,用于构建下一代存


Marvell
OCTEON 10 DPU – SoC: ARM+ASIC
Marvell科技公司成立于1995年,是一家总部位于加利福尼亚州圣克拉拉的美国公司,专注于开发和生产半导体及相关技术。
Marvell的OCTEON和ARMADA设备专为无线基础设施和网络设备设计,包括交换机、路由器、安全网关、防火墙、网络监控和智能网卡等。它支持全面统一的SDK和开源API,适用于广泛的网络、安全和计算应用。


Marvell的OCTEON 10 DPU家族针对超大规模云负载、5G无线传输、5G RAN智能控制器(RIC)和边缘推断、运营商和企业数据中心应用进行了优化。它采用了TSMC的5纳米工艺技术和ARM的Neoverse N2 CPU核心,以及第一代OCTEON TX2的许多功能构建块。它还包括先进的IP和功能,如集成的机器学习推理引擎、内联加密处理器和向量数据包处理器,所有这些功能都可以在虚拟化环境中运行。作为DPU的重要补充,Marvell还为OCTEON 10引入了一个内部ML引擎。
  • 作为业界首款搭载ARM Neoverse N2核心的5纳米DPU,OCTEON 10提供了比以前的OCTEON代数更高3倍的计算性能和50%的功耗降低。
  • 用于内联ML/AI的创新硬件加速器,比基于软件的推理提供了100倍的性能提升。
  • 基于VPP的硬件加速器将数据包处理速度提高了5倍以上。
  • 集成的1Tb交换机、真正的内联加密和高度可编程的数据包处理。
  • 数据路径支持超过400G。
  • 支持最新的PCIe 5.0 I/O和DDR5内存。


Napatech

NT200A02 SmartNIC - FPGA

Napatech是一家提供可编程FPGA智能网卡解决方案的供应商,为全球的电信、云计算、企业、网络安全和金融应用提供服务。Napatech的SmartNIC产品系列包括1GbE、10GbE、25GbE、40GbE和100GbE选项,具备软件支持,可将计算密集型的网络和安全处理从服务器CPU卸载出来。

Napatech NT200A02 SmartNIC基于Xilinx强大的UltraScale+ VU5P FPGA架构,支持2×1/10G、8x10G、2×10/25G、4×10/25G、2x40G、2x100G等应用。NT200A02 SmartNIC支持GTP、IP-in-IP、NVGRE、VxLAN等隧道协议。

NT200A02 SmartNIC还可以删除重复的数据包、分段数据包和过滤数据包,以减少数据量,从而卸载服务器应用程序。支持支持140 million streams的有状态流处理,使CPU密集型应用程序能够智能且准确地选择要处理和忽略的流。保持所有流记录并向应用程序报告。

Netronome

Agilio系列

Netronome是一家专注于网络流处理器加速半导体的公司,其Agilio系列SmartNIC提供了云运营商和服务提供商所需的性能和可编程性,而无需消耗大量CPU核心。

  • Netronome的Agilio CX SmartNIC采用小尺寸PCIe形式因子和10、25、40和50GbE吞吐量,可卸载整个虚拟交换机数据通路处理,用于叠加、安全、负载平衡和遥测等网络功能。

  • Agilio FX 10GbE SmartNIC将公司的NFP与四核通用用途Arm v8结合起来,提供了灵活性,以解决服务器和网络可伸缩性挑战。

  • Agilio LX 40/100GbE SmartNIC适用于基于x86服务器的虚拟化和非虚拟化业务节点以及WAN网关。该解决方案为移动核心、安全、负载平衡和网关应用提供了显著的可扩展性。


Nvidia

BlueField DPU - SoC:ARM+ASIC+专用加速器/GPU 专用加速器

Nvidia是一家美国跨国技术公司,总部位于加利福尼亚州圣克拉拉。1999年,Nvidia定义了GPU,极大地推动了PC游戏市场,重新定义了现代计算机图形技术。2020年4月,NVIDIA正式宣布完成了对Mellanox的收购,其产品布局涵盖了CPU、GPU和DPU。

NVIDIA BlueField DPU为现代数据中心带来了创新。通过卸载、加速和隔离各种先进的网络、存储和安全服务,BlueField DPU为云计算、数据中心或边缘计算等环境中的各种工作负载提供了安全加速的基础设施。BlueField DPU结合了强大的计算能力、完全的芯片基础设施可编程性以及高性能的网络,以支持各种要求苛刻的工作负载。

  • 从边缘到中心的安全性:BlueField DPU支持覆盖数据中心和边缘计算的零信任综合安 全架构。

  • 用于扩展工作负载的弹性存储:通过支持NVMe over Fabrics(NVMe-oF)、GPUDirect存储、加密、弹性存储、数据完整性、解压缩和去重。BlueField提供了高性能的存储访问解决方案,可以为远程存储实现超低延迟。

  • 高性能和高效的网络:BlueField是一个强大的数据中心服务加速器,为传统和现代GPU加速应用提供了高达400 Gb/s的以太网或InfiniBand连接速度,同时释放出主机CPU核心,以运行基础设施任务之外的应用程序。

  • 软件定义基础设施:NVIDIA DOCA™软件开发套件(SDK)使开发人员可以使用行业标准API轻松创建高性能、软件定义、云原生的DPU加速服务。

  • NVIDIA BlueField-3是首款以400Gb/s速率处理软件定义的网络、存储和网络安全的DPU。BlueField-3结合了强大的计算能力、高速网络和广泛的可编程性,为苛刻的工作负载提供了软件定义的、硬件加速的解决方案。从加速的AI计算到混合云,再到云原生超级计算和5G无线网络,BlueField-3重新定义了可能性。


Silicom

N5010、N5110A、P425G2SNxlAONIC - FPGA

Silicom是一家高性能网络和数据基础设施解决方案的领先提供商。

  • Silicom FPGA SmartNIC N5010:一款硬件可编程的4x100G FPGA SmartNIC,集成了英特尔Stratix 10 DX FPGA和英特尔Ethernet 800系列适配器,优化用于数据包处理和流量管理。N5010系列配备了8GB HBM2,以及DDR4内存和四通道QSFP28,支持4x 100 Gigabit/s的吞吐量,高达500Gbps。

  • Silicom N5110A PCIe SmartNIC是一个全尺寸的PCIe单槽卡,配备了英特尔Atom P5900处理器和英特尔Stratix 10 FPGA,提供极致的计算性能和线速网络交换。

  • Silicom P425G2SNx IAONIC SmartNIC基于英特尔P5700处理器,包含8/16个X86核心,集成了带有25G/100G接口和以太网MAC的数据包处理器,使用英特尔E810。通过两个25GB端口或一个100GB端口的硬件标准NIC(通过PCIe V4)端口,实现从主机卸载完整基础设施工作负载,同时保持线速工作。


基于Marvell Octeon cn96xx芯片的Asterfusion ET3000A是48核高性能DPU设备。

它可以部署到各种网络场景中,例如边缘计算、NFV卸载、网络安全设备(如安全网关)、网络监控;三层/边缘路由器和交换机、软件定义网络(SDN)、网络功能虚拟化(NFV)、AI、SSL/IPsec卸载处理、LTE/IoT/Fog/边缘网关、SD-WAN、5G UPF应用、入侵保护系统(IPS)。


---【本文完】---

近期受欢迎的文章:


我们正处于数十年未见之大机遇中

新技术爆发式发展,催生新产品

然而,颠覆式创新并非简单的技术堆叠

而是异常复杂的系统工程

需要深度洞察

欢迎一起分享思考和见解

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存