首页 企业 VergeIO:高性能 VMware 替代方案

VergeIO:高性能 VMware 替代方案

by 迪维扬什·贾恩

完善的 VergeIO 平台使其优于 Proxmox 等替代方案,并且比 VMware 更具成本效益和灵活性。

寻求 VMware 替代方案的组织可以考虑 VergeIO,它提供高性能、软件定义的基础架构,无需昂贵的附加组件。大多数基础架构软件都是由多个单独的应用程序构建而成,并封装在 GUI 后面,而 VergeIO 的独特之处在于它将虚拟化、存储服务和网络集成到一个软件中。这可以简化操作并实现硬件效率的最大化。

VergeIO 集群

我们第一次关注 Verge.io 是在大约两年前,鉴于博通对 VMware 的许可计划存在不确定性,因此需要超融合替代方案。从那时起,VMware 的定价模式已经变得相当清晰。使用大多数 VMware 功能的大型组织可能会继续使用,但企业和小型企业市场的广大民众将需要替代方案。

在复杂的企业虚拟化世界中,许可通常会变成一个充满混乱和意外成本的迷宫。VergeIO 的许可模式与 VMware、Windows Server 和 Nutanix 形成鲜明对比。同时,这些竞争对手采用基于核心、处理器或功能集的复杂许可方案。客户可以配置具有一百多个核心的四处理器服务器,而无需解释为什么软件的价格是硬件的两倍。VergeIO 选择简单。VergeIO 采用按节点许可模式,并且如前所述,其基本许可证中包含所有功能。这意味着无需支付额外的许可费用即可访问高级存储分层、灾难恢复和其他企业级功能。同时比 VMWare 便宜 50%。

我们在辛辛那提实验室设置了一个全明星套件来评估 VergeIO 的集群。我们的目标是评估其特性、功能和性能。此次评估还突出了现代基础设施趋势。我们使用 Giga Computing 的密集液冷节点。这些节点具有 Solidigm 的高性能、密集闪存存储。为了确保计算性能不成问题,我们配备了高核 AMD EPYC 9554 64 核 CPU、512GB DDR5 和双端口 100GbE NVIDIA NIC。

VergeIO 优势

VergeOS 是 VergeIO 产品的基础,代表了他们所谓的超融合基础架构。与 VMware 的产品套件不同,VergeOS 在一个综合包中处理网络、存储和计算。这种统一的方法可以简化管理和许可。VergeIO 积极将自己定位为 VMware 的替代品,这一策略反映在其产品中。

考虑一下许多企业可能熟悉的场景:您是一家大型企业,目前正在使用 VMware 堆栈,但续约报价让您大吃一惊。当您考虑替代方案时,VergeIO 成为了一个潜在的解决方案。

VergeIO 提供了业界最全面的功能集之一。它可以与 Nutanix 和 HyperV 等领先解决方案相媲美。此外,它还包含一些值得注意的功能。我们特别喜欢存储分层功能。此外,在我们的测试中,VergeIO 的迁移实施是最简单、最顺畅的。

VergeOS 支持本机 WireGuard 集成以实现远程访问。这可以配置为虚拟机管理程序网络内的内部访问,也可以配置为外部网络以访问基础架构中的任何资源。无缝实施增加了一层安全性和灵活性,许多 IT 管理员会对此表示赞赏。

另一个值得注意的功能是 VergeIO 的目录,它类似于 XenOrchestra 的 Hub。目录包括各种 cloud-init 配置,用于一键式 VM 部署,简化了启动新实例的过程。此外,它还允许创建 VM 配方和存储库。与 VergeIO 的 Terraform Provider 相结合,这些功能可以显著加速编排过程。

VergeIO 仪表板

VergeIO 不仅仅关乎便利。维持高 SLA 对于企业级虚拟化至关重要。VergeOS 功能齐全,支持高可用性和实时迁移,允许虚拟机在集群内的节点之间迁移。

无论如何,灾难恢复是 VergeIO 真正擅长的领域。首先,VergeOS 支持像克隆一样的独立快照。这些快照不依赖于以前的克隆,从而可以提高性能。这要归功于他们的 IOClone,它可以即时进行重复数据删除。此外,VergeIO 更进一步。他们将整个数据中心封装在其多租户虚拟数据中心 (VDC) 中,允许将数据中心作为单个对象进行复制和管理。

与 IOGuardian 搭配使用时,VergeIO 可提供近乎实时的复制(间隔低至 15 分钟)。此复制过程还包含内联重复数据删除,以确保最大程度地利用驱动器。复制包括原始数据中心的完整副本,包括所有配置详细信息。这确保即使在不同的硬件设置下也能正常工作。此外,VergeIO 允许利用 IOGuardian 复制快速恢复更换的驱动器。这些功能使用户能够完全在 VergeOS 环境中实施 3-2-1 备份策略。

VergeIO 的系统更新方法也有助于维持较高的 SLA。首先,VergeOS 按季度更新周期运行,确保每个版本都成熟且经过全面测试。其次,更新按计划自动应用。系统通过迁移虚拟机并在维护模式下一次将更新应用于一个主机来智能地管理此过程。每个更新都有一个系统快照,其有效期为 12 小时,可轻松回滚。

虚拟机迁移

当客户考虑 VMware 替代方案时,迁移到新平台是一个关键问题。迁移从使用 VSAN(这与 VMware 的 vSAN 不同)对 VergeIO 集群进行非常快速的初始设置开始。真正令人印象深刻的是迁移本身,它可以在几分钟内完成。

VergeIO 仪表板具有“备份/灾难恢复”选项卡,允许使用其本机 API 直接连接到您的 vCenter 或 ESXi。此功能允许您查看 VMware VM 并选择要复制的 VM。系统会启动同步过程,确保您的 VM 定期更新。

建立同步后,您可以启动在此过程中自动转换的虚拟机。在此阶段,VergeIO 提供了灵活性,让您选择首选的存储层(我们将在稍后深入介绍此功能)并保留现有 DHCP 预留的 MAC 地址。持续的同步过程可确保您的虚拟机保持最新状态,直到您完成测试并准备好完全迁移,从而使您可以放心地从 VMware 环境中删除虚拟机。

 

现在,您的虚拟机可以在 VergeOS 上运行,这为管理打开了无限可能。该平台允许创建站点、租户、集群和数据中心,从而实现资源的虚拟分段。管理员可以精细地控制用户访问,允许他们管理特定的资源集。与 vCenter 类似,系统会一丝不苟地记录所有操作。VergeIO 通过提供密码保护控制台的选项、添加额外的保护层以及提供用于 SSO 身份验证的 OIDC 集成,进一步提高了安全性。

VergeIO VSAN 和存储分层

VergeOS 的突出功能之一是其存储分层功能。VergeOS 允许用户根据性能、可用​​性和恢复要求将数据存储在各种类型的介质上。该系统将所有这些无缝集成到其 vSAN 中。重要的是,VergeIO 在基础 VergeOS 中以单一许可证提供此功能,并且不会对所消耗的容量收取额外费用——这与 VMware 的多个许可层级形成鲜明对比。

我们用于构建 VergeIO HCI 的平台提供了 24 个 2.5 英寸 NVMe 托架,每个节点有六个可用托架。两个节点需要元数据磁盘,这为我们提供了五个剩余插槽,用于匹配 SSD 以构建存储层。VergeIO 在处理不同类型的存储设备时非常灵活,因此我们使用 Solidigm SSD 创建了两个存储池。虽然不用于存储容量,但 VergeIO 使用元数据层来存储日志以进行数据缩减索引跟踪。建议围绕多驱动器每日写入 SSD 构建该层。

对于第 1 层,我们使用了 16 个 Solidigm 15.36TB P5520 SSD,它们是 1DWPD SSD,总存储容量为 111.7TB。对于第 2 层,我们使用了 Solidigm 61.44TB SSD,每个节点都使用一个 SSD。这也相当于 111.7TB 的存储容量,因为驱动器的容量是 P4 SSD 的 5520 倍。值得注意的是,VergeIO 平台的可用存储容量将更加可观,因为它提供了内联全局数据重复数据删除。对于元数据第 0 层,只需要两个 SSD 即可实现镜像冗余。我们在节点 5620 和 6.4 中安装了 Solidigm P1 2TB SSD。

Solidigm 产品组合提供各种 SSD,可满足多种不同用例的需求。对于许多系统而言,SSD 的类型(Gen4 或 Gen5)可能是一个决定性因素,而其他系统则可能关注驱动器形状:U.2、E1.S 或 E3.S。驱动器耐用性在 SSD 型号系列中利用的 NAND 类型方面也发挥着重要作用。对于希望部署 VergeIO 集群的客户,Solidigm 提供每个层级的产品,轻松成为闪存存储的一站式商店。

VergeIO Solidigm SSD

数据密度在存储解决方案中起着重要作用。如果您想利用市场上容量最高的 SSD,例如 Solidigm 61.44TB P5336,存储系统必须与其 4K 原生块大小兼容。客户可以使用 QLC 介质来存储大量数据,例如我们的构建,我们只使用了四个驱动器就获得了 111TB。VMware 目前不支持 QLC,这限制了客户的平台密度和选择所需驱动器的能力。

测试平台 – GIGABYTE H273-Z80-LAW1

为了评估 VergeIO 的性能, 我们引入了几家领先的合作伙伴来使该集群焕发生机。 我们组装了一套先进的硬件配置,重点强调密度和效率——这是现代数据中心的两个关键趋势。我们测试集群的核心是 GIGABYTE H273-Z80-LAW1,这是一款高密度液冷 4N2U 服务器,完全符合这些目标。

H273-Z80-LAW1 是一款出色的服务器,提供多达 1024 个内核和 48TB 的 RAM。我们的具体配置包括八个 AMD EPYC 9554 64 核处理器和 2TB 的 DDR5 内存,为我们的 VergeIO 集群提供了坚实的基础。

VergeIO CoolIT 冷板

这种令人印象深刻的密度得益于 Giga Computing 与 CoolIT 的合作,将液体冷却发挥了作用。该系统与我们现有的 CoolIT CDU 和歧管设置完美契合,这种配置在现代数据中心中变得越来越重要。这种直接液体冷却解决方案不仅仅是为了提高性能;它对于满足当今高功率 CPU、GPU 和密集 HPC 服务器配置的散热需求是必不可少的。

我们之前使用类似设置的经验表明,由于热节流减少,功耗显著降低,CPU 温度降低,性能略有提升。CoolIT 系统的效率和易用性使其成为高密度计算环境的理想选择。

H273-Z80-LAW1 中的每个节点最多支持 6 个 U.2 NVMe/SAS/SATA 驱动器,整个服务器总共支持 24 个驱动器。如上所述,我们整合了三层 Solidigm 闪存,使我们能够测试 VergeIO 根据性能要求优化数据放置的能力。该服务器还具有用于联网和扩展的高速 PCIe Gen 5 插槽,确保我们的 HCI 环境具有一流的连接性。

除了高密度和令人印象深刻的扩展性之外,H273-Z80-LAW1 的突出特点之一是其集中管理控制器 (CMC)。此集成解决方案简化了所有四个节点的管理,为整个服务器提供了单一控制点。CMC 支持 IPMI 2.0 和 Redfish API,提供灵活的远程管理和监控选项。

VergeIO 性能

为了测量 VergeIO 平台的性能,我们部署了 16 个虚拟机(每个节点分布 4 个),以测量此 HCI 集群的总体性能。这些虚拟机用于协调在集群中均匀运行的 Vdbench 工作负载,所有工作负载都报告给一个虚拟机。这些 Vdbench 会话还设置为使用不可压缩数据进行测试,以查看集群在最坏情况下的表现,因为它们支持数据缩减。关于数据占用空间,每个虚拟机都有一个 500GB 的数据磁盘,整个集群总共有 8TB 的压力。

VergeIO 性能

我们重点关注四角性能以及使用以下工作负载的综合数据库性能:

  • 2MB 连续读写
  • 4K随机读写
  • SQL 工作负载

至于峰值连续带宽,我们测量到 TLC 层的读取速度为 4.7GB/s,QLC 层的读取速度为 4.2GB/s。切换到写入带宽,TLC 层的测量值为 6.9GB/s,而 QLC 层的测量值为 5GB/s。

Vdbench 工作负载 VergeIO Tier 1 Solidigm TLC VergeIO Tier 2 Solidigm QLC
2MB 顺序读取 4.7GB/秒(27毫秒) 4.2GB/秒(30毫秒)
2MB 顺序写入 6.9GB/秒(17.6毫秒) 5.0GB/秒(21.5毫秒)
4K 随机读取 215MB/秒(2.6毫秒) 243MB/秒(8.2毫秒)
4K 随机写入 263MB/秒(0.96毫秒) 200MB(0.85毫秒)
SQL 533MB/秒(0.89毫秒) 525MB/秒(0.97毫秒)

VergeIO VSAN 在 Solidigm TLC 和 QLC 存储层上表现出色。顺序操作显示出出色的吞吐量,TLC 层的写入速度达到 6.9GB/s,读取速度达到 4.7GB/s。随机 I/O 性能可观,两个层的 200K 操作速度均超过 4MB/s。值得注意的是,该平台在 SQL 和 VDI 启动工作负载方面表现出色,保持了亚毫秒级的延迟和高吞吐量。

这些结果表明 Solidigm SSD 能够轻松跟上我们平台中集成的存储层,主要限制因素是网络和平台约束,而不是驱动器本身。VergeIO 的超融合基础架构可以有效支持各种企业应用程序,从大文件传输到数据库操作和虚拟桌面环境,TLC 层通常可为写入密集型场景提供更高的性能。

VDI 性能

由于 VDI 是部署在 VergeIO 平台上的常见工作负载,我们想测试一次极端的启动风暴,看看集群在 1000 个虚拟机同时启动的情况下表现如何。每个虚拟机都有 2 个 CPU、2GB RAM 和 10GB 磁盘。虚拟机安装了标准的 Ubuntu 22.04(不是最低配置),以代表真实世界的镜像。完全启动后,通过 systemd 调用一个脚本,该脚本使用 curl 通过 HTTP 将其 mac 和时间戳发送到远程收集器。

我们的测试表明,TLC 和 QLC 提供的最终性能非常相似。查看后端存储数据,TLC SSD 在总 IOPS 方面确实具有优势,尽管对于这个平台,CPU 在存储之前成为瓶颈。所有 1000 台虚拟机都能够在大约 71 秒内启动。这些结果凸显了在 VergeIO 平台中混合使用各种 SSD 的好处。客户可以轻松地将 QLC 存储用于 VDI 任务,在这种情况下,这可以实现出色的密度和成本效益。

我们还测试了高可用性。我们测量到,在节点完全丢失后,虚拟机需要 138 秒才能恢复可用,这与 VergeIO 的说法大致相符。

总结

VergeIO 是 VMWare 的绝佳替代品。其全面的 Wiki 和用户友好的迁移流程使其成为考虑进行更改的组织的有吸引力的选择。简化的每节点许可模式平均比 VMWare 便宜 50%,使决策者更容易评估和采用。

融合管理也使其成为更易于管理的平台之一。同时,Catalog和原生Wireguard集成等功能增强了整体软件包、平台的强大性能以及对灾难恢复的细致关注,这确实令人印象深刻。

VergeIO 平台的精良特性使其优于 Proxmox 等替代方案。我们可以轻松地向任何寻求虚拟机管理程序解决方案的人推荐 VergeIO。它提供了一个强大、功能丰富的环境,适合各种规模的组织。VergeIO 成功地结合了易用性、强大的性能和企业级功能,使其成为虚拟化领域的顶级选择。

Verge.io 产品页面

本报告由 VergeIO 赞助。本报告中表达的所有观点和意见均基于我们对所考虑产品的客观看法。

参与 StorageReview

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅