首页 企业 SmartNIC 将从根本上改变数据中心

SmartNIC 将从根本上改变数据中心

by 汤姆芬顿

在数据中心的所有技术中,没有一项比网络连接发展得更快。 20 年前,1GbE 网络被认为是奇特的,支持它所需的基础设施(例如 NIC、交换机和电缆)既昂贵又稀缺。 三年前,10GbE 网络是最先进的,但现在 20、40 甚至 100GbE 网络已成为数据中心的标准。 随着虚拟化、软件定义网络 (SDN)、覆盖网络等元素的添加,网络不仅变得更广泛,而且变得更加复杂,这些元素在 XNUMX 年前甚至没有被设想过,但现在已经司空见惯,正在使数据中心服务器的资源紧张。

在数据中心的所有技术中,没有一项比网络连接发展得更快。 20 年前,1GbE 网络被认为是奇特的,支持它所需的基础设施(例如 NIC、交换机和电缆)既昂贵又稀缺。 三年前,10GbE 网络是最先进的,但现在 20、40 甚至 100GbE 网络已成为数据中心的标准。 随着虚拟化、软件定义网络 (SDN)、覆盖网络等元素的添加,网络不仅变得更广泛,而且变得更加复杂,这些元素在 XNUMX 年前甚至没有被设想过,但现在已经司空见惯,正在使数据中心服务器的资源紧张。

**了解有关 SmartNIC 和可组合数据中心的更多信息,请访问 赛灵思 Adapt***

当处理超过 10GbE 的网络时,我们开始看到服务器中出现 CPU 瓶颈,因为网络数据包被向上传递到 CPU 进行处理。 对于 25GbE 网络,可测量的 CPU 时间百分比用于处理网络数据包。 为了解决这个问题,我们开发了一些技术来将一些网络功能从 CPU 下推到网络接口控制器 (NIC)。 我们称能够处理这种卸载的设备 智能网卡.

在本文中,我们将解释什么是 SmartNIC、它们为数据中心带来的价值,以及您应该开始研究和投资它们的原因。 最后,我们将看看特别创新的 SmartNIC,Xilinx SN1000。

赛灵思 SN1000

什么是智能网卡?

将网络操作从 CPU 卸载到 NIC 一直是主要云提供商的重点,因为他们一直在推动数据中心的效率。 对于将 NIC 标记为 智能; 但是,至少,它们应该能够处理虚拟交换机中的一些控制平面功能,以及网络功能虚拟化 (NFV) 功能中的一些功能,例如防火墙、入侵检测和预防、主机检查和加密,以及数据平面任务,例如网络服务质量 (QoS) 和流量报告和监控。

是什么推动了 SmartNIC 的采用?

在过去十年中,公有云和超大规模数据中心推动了数据中心的创新,并将在可预见的未来继续如此。 他们使用的技术最终会渗透到企业数据中心,SmartNIC 也是如此。 事后看来,SmartNIC 只是将网络功能放在它们最初应该放在的位置:回到 NIC 而不是浪费 CPU 和主板带宽。

很容易想象有多少网络流量被丢弃或回发到网络上,而没有为被迫处理它们的系统/CPU 增加任何价值——仅仅是因为 NFV 和其他功能是使用传统服务器的 CPU 而不是实现的比在 NIC 级别。 每个可以从 CPU 卸载的 CPU 周期都会释放它并允许服务器进行生产性工作。

为了说明 SmartNIC 的好处,我们可以举一个像分布式拒绝服务 (DDoS) 攻击这样简单的例子。 尽管 DDoS 在现代数据中心很少见,但让 SmartNIC 处理 DDoS 将允许系统的 CPU 继续进行高效工作,而不是对数据包进行排序、分类和丢弃。 一个更现代的例子是让 SmartNIC 处理覆盖网络而不是系统 CPU 使用的网络数据包的封装。

为什么 Xilinx 是 SmartNIC 技术的领导者

随着所有新兴技术的出现,有些公司将自己置于技术的最前沿。 这些公司往往对技术充满热情并专注于技术。 他们将精力投入到克服阻碍新技术进入市场的无数障碍的目标上。 Xilinx 就是这样一家公司。

Xilinx 长期以来一直是新兴技术的创新者。 例如,他们发明了现场可编程门阵列 (FPGA),并被认为是该技术的领导者。 将一项新技术(如 SmartNIC)推向市场并不是一项成本低廉的提议,而且 3 年的收入超过 2020 亿美元,他们有财力这样做。 但它也需要严谨的工程和管理专业知识——同样,Xilinx 两者兼备。

2019 年 100 月,Xilinx 达成收购 Solarflare Communications 的协议,Solarflare Communications 是较早的超低延迟网络和应用加速开发商,也是 SmartNIC 技术的领导者。 同年晚些时候,Xilinx 展示了基于 Solarflare 和 Xilinx 技术的基于 FPGA 的单芯片 1000G SmartNIC。 这款 SmartNIC 将 Xilinx FPGA、片上系统 (SoC) 和自适应计算加速平台 (ACAP) 与 Solarflare 的技术相结合,创建了一种新的融合 SmartNIC 解决方案,即成为 Xilinx SNXNUMX。

赛灵思 ALVEO SN1000

Xilinx SN1000 是 FHHL PCIe x16 物理(第 4 代 x8 或第 3 代 x16 电气)NIC,具有双 100GbE 铜缆或光纤端口。 它有一个 16 核 Cortex-A72 处理器和一个具有超过一百万个查找表 (LUT) 的 FPGA。 LUT 基本上是 FPGA 构建其逻辑的方式; FPGA 拥有的 LUT 越多,它就越强大和灵活。 该卡共有 12 GB 的 DDR4 RAM,其中 4 GB 专用于 Arm 处理器,8 GB 专用于 FPGA。 这种硬件方案转化为 SN1000 能够卸载 4 万个有状态连接并每秒处理 100 亿个数据包 (PPS)。

赛灵思 SN1000 框图

专用集成电路 (ASIC)、FPGA 和 SoC 可用于制作 SmartNIC。 ASIC 可以是高性能的; 但是,它们的灵活性有限,并且很难向它们添加额外的功能。 虽然 SoC 非常灵活,但它们缺乏 ASIC 和 FPGA 的速度。

为了在其 SN1000 SmartNIC 中同时提供灵活性和性能,Xilinx 由于其固有的灵活性而使用功能强大的 SoC 来实现控制平面功能,并出于性能原因将其与 FPGA 配合使用以实现数据平面功能。 与 ASIC 相比,使用 FPGA 的主要优势在于,当开发和/或需要新功能时,可以对 FPGA 进行重新编程,而在现场获得新的 ASIC 可能需要一年或更长时间。

为 FPGA 开发代码不是一件小事,Xilinx 有一些优秀的工具可以帮助满足这一需求。 使用 Xilinx 开发和编程工具集,Xilinx 客户可以使用软件开发人员习惯的高级编程语言编写自己的 FPGA 应用程序,而不是传统上用于 FPGA 应用程序开发的硬件代码。

Xilinx 还开发了一个 应用市场 其中可以获得 Xilinx 和第三方开发的解决方案。 这种方法允许 SN1000 买家通过绕过开发周期来实现更快的价值实现时间 (TTV)。 应用商店有针对 NFV、网络安全、图像处理、机器学习 (ML) 以及其他可以并且应该在 SmartNIC 级别完成的功能的解决方案。

Xilinx 应用程序被打包为 docker 容器。 它们可以免费评估使用,然后通过信用卡直接从商店购买。

Xilinx SN1000 应用商店

虽然 Xilinx SmartNIC 是一款领先的产品,但这并不是说它们遥遥领先以至于阻碍了采用和使用。 相反,Xilinx SmartNIC 已被部署用于解决公共云、超大规模应用程序和现代数据中心中的特定用例。 它们的用途包括: VXLAN 和 NVGRE 隧道封装、开放式虚拟交换机 (OVS)、Intel DPDK 和 Virtio-net I/O。

SmartNIC 的另一个有趣用例是它们被用于卸载 Ceph 对象存储客户端等存储功能,并且 NVMe-oF 越来越受欢迎。 此外,对于高速交易,Xilinx 表示,他们的 SmartNIC 可以实现纳秒级的“tick to trade”算法交易延迟。

视频分析是 SmartNIC 大放异彩的另一个领域。 由于视频涉及的数据量很大,将其传回中央存储库是不切实际的。 作为一种解决方案,SmartNIC 被用在边缘设备上以处理视频解释功能,例如面具检测、人数统计和跟踪以及虚拟围栏,因为这些需要 FPGA 可以快速有效地处理的 AI 推理。

为什么需要 SmartNIC

随着高带宽网络的兴起,我们对数据中心服务器的要求越来越高。 我们已经到了这样一个地步,由于需要用更多网络带宽处理的网络数据包数量,服务器做有利可图的工作的周期更少。 一些研究表明,在具有高带宽网络的传统数据中心,超过 20% 的服务器 CPU 周期可用于数据包处理。 例如,对于 3GHz CPU,处理器有大约 300 个周期来处理 1500B 数据包以跟上线路速率。

为了释放 CPU 来完成它们设计用于执行的高价值工作,我们需要将不必要的功能卸载到其他设备,这些设备更接近它们的来源。 在这种情况下,处理网络的正确设备是 SmartNIC。

虽然 SmartNIC 不仅仅是 Xilinx 的专利范围,但它们处于这一新兴技术的前沿。 通过将 SoC 与 FPGA 结合使用,他们能够获得软件定义解决方案的易用性和灵活性以及硬件实现解决方案的性能。 Xilinx 知道应用程序需要利用 SmartNIC,因此他们创建了一个编程环境,允许计算机程序员而不是硬件工程师开发在其 SmartNIC 上运行的应用程序。 对于那些寻求更快 TTV 提议的用户,Xilinx 有一个应用程序商店,允许购买第三方应用程序。

为了使现代数据中心具有竞争力,它需要将服务器从尽可能多的不需要的任务中解放出来。 这些任务包括状态防火墙、负载平衡、IPsec、TLS、NVMe-over-TCP、Virtio.blk 存储访问、数据压缩或使用 SmartNIC 更好地管理的无数其他功能。

在 Xilinx Adapt 了解更多信息

赛灵思 Adapt 是 24 年 25 月 2021 日至 XNUMX 日举行的数字活动,将涵盖智能网卡在数据中心的相关性以及云计算、计算存储和可组合数据中心等重要主题。 免费入场,之后将提供重播。

点击此处细阅详情

参与 StorageReview

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | RSS订阅