英特爾資料中心 GPU Flex 系列 170 對於想要為其 VDI 用戶提供價格實惠的 GPU 的組織來說非常有吸引力。
企業虛擬桌面基礎架構 (VDI) 社群一直迫切需要更強大的解決方案。隨著企業努力提高效率和改善用戶體驗,專用硬體加速器的作用變得至關重要。英特爾資料中心 GPU Flex 系列在這一領域表現突出,為資料中心內的雲端遊戲、媒體、VDI 和圖形加速提供客製化解決方案。
什麼是英特爾 Flex 系列 GPU?
英特爾產品的核心是兩款出色的產品: Flex 140 和 Flex 170 GPUs。 Flex Series 140 是一款低調的 PCIe Gen4 卡,具有雙 GPU,每個 GPU 擁有 6 個 Xe 核心和 6GB GDDR12 記憶體。此配置非常適合最多 XNUMX 個 VDI 會話,可滿足具有中等圖形需求的知識工作者。
對於更多圖形密集型應用程序,Flex Series 170 可擴展為具有 32 個 Xe 核心和 16GB GDDR6 內存的單個 GPU 節點,全部位於全尺寸 PCIe 卡上,為高分辨率任務提供強大的火力。
英特爾資料中心 GPU Flex 170 | 英特爾資料中心 GPU Flex 140 | |
---|---|---|
要領 | ||
微體系架構 | 氙氣HPG | 氙氣HPG |
可用的嵌入式選項 | 沒有 | 沒有 |
使用條件 | 服務器/企業 | 服務器/企業 |
用例 | 雲計算 | 雲計算 |
顯卡規格 | ||
Xe-顏色 | 32 | 16 |
渲染切片 | 8 | 4 |
光線追踪單元 | 32 | 16 |
英特爾® Xe 矩陣擴展(Intel® XMX)引擎 | 512 | 256 |
執行單元 | 512 | 256 |
顯示卡最大動態時鐘 | 2050 MHz | 1950 MHz |
英特爾® Xe 矩陣擴展(Intel® XMX)最大動態時鐘 | 1950 MHz | 1600 MHz |
TBP | 150W¯¯ | 75W¯¯ |
內存規格 | ||
內存大小 | GB 16 | GB 12 |
內存類型 | GDDR6 | GDDR6 |
圖形內存接口 | 256位 | 192位 |
顯存帶寬 | 576 GB / s | 336 GB / s |
支持的技術 | ||
光線追踪 | 充足 | 充足 |
一個API支援 | 充足 | 充足 |
OpenVINO™ 支持 | 充足 | 充足 |
DirectX* 支援 | DirectX 12 終極版 | DirectX 12 終極版 |
Vulkan* 支持 | 1.3 | 1.3 |
OpenGL* 支持 | 截至到4.6 | 截至到4.6 |
OpenCL* 支持 | 3 | 3 |
多格式編解碼器引擎 | 2 | 4 |
功能 | ||
H.264 硬體編碼/解碼 | 充足 | 充足 |
H.265 (HEVC) 硬體編碼/解碼 | 充足 | 充足 |
AV1 編碼/解碼 | 充足 | 充足 |
VP9 位元流和解碼 | 充足 | 充足 |
這些圖形處理單元的基礎是 Xe 核心,Flex Series 170 的核心和渲染切片是 Flex 140 的兩倍。 。
在記憶體方面,我們也看到 Flex Series 170 以 16GB GDDR6 分配領先,超過了 Flex 140 的 12GB。這種額外的記憶體與更寬的 256 位元介面相結合,可提供 576 GB/s 峰值的圖形頻寬,而同類產品的頻寬為 336 GB/s。
關於 GPU 熱設計功耗 (TDP) 效率的討論仍然存在。 Flex Series 170 的 TDP 為 150 瓦,表明其對性能的關注,而 Flex Series 140 的 TDP 為 75 瓦,則凸顯了其對省電和高能效應用的傾向。
對光線追蹤、oneAPI 和 OpenVINO 等尖端技術的支援是貫穿這兩個模型的共同主線,確保了一個面向未來的開發者平台。同時,DirectX 12 Ultimate 相容性支援超逼真的圖形,這是對專業視覺化和雲端遊戲等領域潛在交叉應用的認可。
英特爾 Flex GPU 的魔力:SR-IOV
Flex 系列 GPU 的魔力來自 SR-IOV。如果您熟悉它,請隨意跳到下一節;這裡沒有什麼新的。如果沒有,或者您需要複習一下,請繫好安全帶;這是一些很酷的東西。
單根 I/O 虛擬化 (SR-IOV) 是一項技術,透過允許單一實體設備(例如網路介面卡 (NIC) 或圖形處理單元 (GPU))顯示為虛擬化環境的可管理性和效率,多個獨立的虛擬設備。這對於資料中心提高虛擬機器 (VM) 的效能並最大限度地提高底層硬體資源的利用率特別有用。
SR-IOV技術有兩個核心概念:實體功能(PF)和虛擬功能(VF)。 PF 是實體設備的主接口,管理 SR-IOV 功能,包括 VF 的建立和管理。這些 VF 是 PF 的輕量級版本,配備了資料移動所需的資源,但配置功能有所減少。每個 VF 都可以直接分配給 VM,從而提供對設備功能的高效能、直接訪問,而無需虛擬化設備的典型開銷。
當 SR-IOV 與 GPU 結合使用時,它允許每個虛擬機器 (VM) 直接存取部分 GPU 資源。這種直接存取是透過虛擬功能 (VF) 實現的,虛擬功能是 GPU 的輕量級表示,可以單獨分配給 VM。
儘管 VF 由分配給它們的 VM 控制,但 PF 保留總體控制、管理資源和執行設備級策略。在效能和低延遲至關重要的場景中,例如複雜的 VDI 環境、高效能運算任務和大規模 Web 服務,這種設定非常有價值,可顯著提高虛擬化系統的運作效率。
此設定使虛擬機器能夠繞過傳統的基於虛擬機器管理程式的資源共享方法,從而減少開銷並提高效能。 GPU 密集型任務(例如 3D 渲染、視訊處理或機器學習應用程式)可顯著降低延遲,更有效地利用 GPU 資源,並提高虛擬化環境中的整體效能。
Intel Flex GPU 提供「免費」VDI 加速
該部分的標題不是開玩笑。英特爾資料中心 GPU Flex 系列進入加速器領域,在 VDI 部署方面具有顯著優勢——設定虛擬 GPU (vGPU) 配置的授權成本為零。利用上述基於單根 I/O 虛擬化 (SR-IOV) 的 GPU 虛擬化,此 Intel Flex 系列消除了與 vGPU 配置相關的傳統財務障礙。無需支付許可費,可降低初始設定成本並減少持續營運費用,從而實現長期的顯著節省。
這種經濟高效的 vGPU 管理方法增強了 VDI 伺服器部署的可擴充性。組織可以跨虛擬環境動態配置和調整 vGPU 資源,而無需擔心增加授權成本。這種靈活性對於適應不斷變化的工作負載需求和支援越來越多的使用者至關重要,特別是在知識工作者群體典型的高密度環境中。
從商業角度來看,Intel Flex 系列 GPU 可以帶來巨大的經濟效益。透過消除許可的複雜性和成本,英特爾使組織能夠簡化其 VDI 基礎設施。這種簡化加快了部署時間,並減少了對 GPU 功能進行大量預算分配的需求,使英特爾 Flex 系列成為尋求優化 VDI 投資同時保持高效能和可靠性的企業的絕佳選擇。
動手實作:採用 Supermicro SuperBlade 的英特爾 Flex 系列 170
在實驗室中,我們擁有 Intel Flex Series 170,並選擇將其與我們的 VMware 上的 VMware 配對。 超微 SuperBlade X13 GPU 刀片系統。 VMware ESXi 上英特爾獨立顯示卡的安裝已簡化,可增強使用者體驗和系統效能。就像加載一個簡單的 驅動程式的 ZIP 透過 SCP 到主機,啟用 SSH 訪問,並執行驅動程式安裝。主機快速重新啟動後,Flex Series 170 出現在硬體清單中,並且可以設定 0-31 的 SR-IOV 選項。
測試是使用 超微 SuperBlade 系統 作為主機,這對於驗證 Flex Series 170 GPU 作為 VDI 加速器的效能至關重要。 SuperBlade 系統旨在最大限度地提高運算密度和效率,同時最大限度地降低功耗。這使其成為測試高密度知識工作者用例(例如 Intel Flex 系列 GPU 銷售的用例)的理想平台。
部分 | SuperMicro SuperBlade 配置 |
---|---|
中央處理器 | 1 個英特爾至強 8562Y+ |
記憶體應用 | 256GB DDR5 |
雲端硬碟 | 2 個三星 3840G M.2 驅動器 |
GPU | 英特爾 Flex 系列 170 |
Supermicro SuperBlade X13 系統為密度論證提供了一個理想的平台。由於能夠將 10 個這樣的節點放入單一 8U 機箱中,因此您可以在一個整潔且易於管理的機箱中容納 320 個加速 VDI。另一方面,每個Flex 系列170 卡配備更多核心和VRAM,並擁有80-160 個知識工作者等級的VDI,但由於能夠在該系統中放置10 個GPU,您可以混合搭配,並且得益於超快速的內部網絡,您可以擁有一些非常有創意的故障轉移解決方案。 查看我們的完整評論 了解有關我們的“瑞士軍刀”SuperBlade 伺服器的更多資訊。
英特爾資料中心 GPU Flex 系列 170 效能
這裡重要的是要考慮到,測試是根據正式產生的完整結果來選擇的,這是在虛擬環境下進行測試的限制,無需特殊的調整和破解。我們選擇了一些 SR-IOV 切片,然後選擇了一些非標準切片,看看它會是什麼樣子。
3D渲染
我們透過 3D Mark Wildlife 基準測試來展示 Flex 系列 GPU 的雲端遊戲和 3D 渲染功能。
3DMark Wild Life 提供與 Windows、Android 和 Apple iOS 系統相容的跨平台基準測試工具。該工具可以評估和對比各種設備的圖形性能,包括筆記型電腦、平板電腦和智慧型手機。 Wild Life 針對 Windows 和 Android 裝置使用 Vulkan 圖形 API,而針對 iOS 裝置則使用 Metal。由於此測試適用於各種分數的整合式顯示卡,因此它可以說明英特爾 Flex Series 170 的純圖形分數的威力。
測試/SR-IOV 切片 | 2GB | 4GB | 7GB | 14GB |
---|---|---|---|---|
3D 標記野生動物 | 29,062 | 42,466 | 49,671 | 45,908 |
3D Mark 野生動物極限 | 9,023 | 14,948 | 17,661 | 16,959 |
勒克斯馬克
接下來是 LuxMark,一個 OpenCL GPU 基準測試實用程式。 Flex Series 170 在本次測試中真正展現了 Flex 的性能,提供了一些令人印象深刻的數位和擴充。
測試/SR-IOV 切片 | 2GB | 4GB | 7GB | 14GB |
---|---|---|---|---|
盧克斯馬克廳 | 2,961 | 4,382 | 11,002 | 11,202 |
盧克斯馬克食品 | 不適用 | 1,316 | 4,502 | 4,525 |
PCMark 10 Express
PCMark 10 配備了廣泛的測試套件,可以準確反映工作場所中遇到的各種任務。此基準測試工具包括各種效能評估、客製化測試選項、電池壽命設定檔以及新添加的儲存基準測試,使其成為評估現代辦公室電腦效能的全方位解決方案。
測試/SR-IOV 切片 | 2GB | 4GB | 7GB | 14GB |
---|---|---|---|---|
PCMark 10 Express 整體評分 | 5,111 | 5,146 | 5,311 | 5,218 |
從來沒有 | 10,269 | 10,318 | 10,734 | 10,364 |
應用程式啟動分數 | 17,833 | 17,664 | 19,034 | 17,340 |
視訊會議得分 | 7,798 | 7,933 | 8,095 | 7,980 |
網頁瀏覽分數 | 7,789 | 7,839 | 8,028 | 8,046 |
生產 | 6,952 | 7,004 | 7,181 | 7,180 |
試算表分數 | 6,924 | 6,953 | 7,186 | 7,184 |
寫作分數 | 6,981 | 7,057 | 7,178 | 7,177 |
看看我們這裡的結果,雖然不是那麼引人注目,但我們可以看到利用加速的各種任務的清晰擴展。
為了方便比較,我將所有測試的結果匯總到一個表格中。
測試/SR-IOV 切片 | 2GB | 4GB | 7GB | 14GB |
---|---|---|---|---|
3D 標記野生動物 | 29,062 | 42,466 | 49,671 | 45,908 |
3D Mark 野生動物極限 | 9,023 | 14,948 | 17,661 | 16,959 |
盧克斯馬克廳 | 2,961 | 4,382 | 11,002 | 11,202 |
盧克斯馬克食品 | 不適用 | 1,316 | 4,502 | 4,525 |
PCMark 10 Express 整體評分 | 5,111 | 5,146 | 5,311 | 5,218 |
從來沒有 | 10,269 | 10,318 | 10,734 | 10,364 |
應用程式啟動分數 | 17,833 | 17,664 | 19,034 | 17,340 |
視訊會議得分 | 7,798 | 7,933 | 8,095 | 7,980 |
網頁瀏覽分數 | 7,789 | 7,839 | 8,028 | 8,046 |
生產 | 6,952 | 7,004 | 7,181 | 7,180 |
試算表分數 | 6,924 | 6,953 | 7,186 | 7,184 |
寫作分數 | 6,981 | 7,057 | 7,178 | 7,177 |
關閉的思考
考慮到所有這些數據並應用人們的因素,我不斷地對這些卡片帶來的簡單性和力量感到震驚,甚至敬畏。將 1/32 的 GPU 對應到 VM 並安裝後 來自英特爾的 Windows 驅動程式,內建遠端桌面等功能表現較好。在 Chrome 中使用英特爾的 Google Earth 聚會技巧可以明顯看出,即使使用 512MB VRAM 和一個 Xe 核心,VDI 體驗也好得驚人。在過去的職業生涯中使用過其他 VDI 產品,一旦安裝了驅動程序,體驗就「感覺很好」。
英特爾資料中心 GPU Flex 系列,特別是 Flex 系列 170 型號,已被證明是可靠且面向未來的 VDI 解決方案,可提供卓越的效能,同時提高 VM 密度和可擴充性。低 CPU 使用率、一致的幀速率和每瓦特的高編碼效能相結合,使其成為希望將 VDI 基礎架構轉變為高效能、可靠和可擴展解決方案的資料中心的理想選擇。憑藉 Intel Flex 170 GPU 的核心,VDI 管理員可以自信地為最終用戶提供一流的圖形使用者體驗,同時在各種顯示解析度下保持高品質標準。
將這些與 Supermicro SuperBlade 系統可實現的密度相結合,您可以建造超密集且高效的 VDI 設備。由於刀鋒式伺服器的靈活性,機殼可以在 Flex 系列 GPU 旁邊託管更強大的 Max 卡,從而使所有使用者和服務互動更加緊密。很快就會有更多相關內容。
雖然此測試的範圍不包括與大多數商務級筆記型電腦的比較,但您可以自己劃定界限。當您考慮透過網路發送像素的資料壓縮、VDI 附帶的安全性和可管理性以及許可模式(希望不會逆轉方向)時,Flex 系列的定位非常好。我可以將 Flex 系列卡總結為讓企業和用戶滿意的兩大優勢:更好的效能和更便宜的用戶端 PC 部署成本。對我們來說,在尋求改善組織一直在努力解決的老化或乏善可陳的 VDI 設定時,這使得這些變得不費吹灰之力。
參與 StorageReview
電子通訊 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱