首頁 Enterprise 採用英特爾傲騰 DC 持久內存的 Supermicro SuperServer 初審

採用英特爾傲騰 DC 持久內存的 Supermicro SuperServer 初審

by 布賴恩·比勒

Supermicro SuperServer 1029U-TN10RT 是一個 1U 雙處理器完整系統。 Supermicro 設計 SuperServer 是為了解決大量流行的用例,例如虛擬化、數據庫、雲計算和其他可以從高密度計算能力中受益的用例。 該系統已更新為支持第二代 Intel Xeon 可擴展 CPU,並且是首批支持 英特爾傲騰 DC 持久內存模塊.


Supermicro SuperServer 1029U-TN10RT 是一個 1U 雙處理器完整系統。 Supermicro 設計 SuperServer 是為了解決大量流行的用例,例如虛擬化、數據庫、雲計算和其他可以從高密度計算能力中受益的用例。 該系統已更新為支持第二代 Intel Xeon 可擴展 CPU,並且是首批支持 英特爾傲騰 DC 持久內存模塊 (PMM)。

除了支持最新的英特爾數據中心技術外,該系統還通過前面的十個熱插拔 2.5 英寸 NVMe 托架提供存儲。 Supermicro 內部支持兩個 M.2 插槽,一個 SATA 和一個 NVMe,但可以選擇添加額外的 M.2 插槽。 該主板支持 24 個 DIMM 插槽,可以以傳統方式與 DRAM 一起使用,也可以與本評測中的配置一起與 PMEM 一起使用。 在連接性方面,系統有兩個板載 10GBase-T LAN 端口。 可通過兩個 PCI-E 3.0 x16(FH,10.5 英寸長)卡槽擴展額外的連接性。

如前所述,我們的評測系統具有兩個英特爾至強可擴展 8268(2.9GHz,24C)以及 12 個 DRAM 棒和 12 個英特爾傲騰 DC 持久內存模塊。 雖然持久內存之旅仍處於早期階段,但這種使用主板上所有內存插槽和兩個英特爾 CPU 的 4:1 持久內存與 DRAM 的配置可能會成為典型的推薦服務器配置,以充分利用這些新技術。 除了這些核心組件外,正在審查的系統還包括十個 英特爾 DC P4510 NVMe 固態硬盤.

Supermicro SuperServer 1029U-TN10RT 規格

  • 機箱 – 超 1U SYS-1029U-TN10RT
  • CPU – 2 個英特爾至強可擴展 8268(2.9GHz,24C)
  • 存儲 – 10 x Intel DC P4510 2TB NVMe SSD, 1DWPD
  • 內存 – 12 x 32GB DDR4-2933
  • 持久內存 – 12 個 128GB DDR4-2666 Intel Optane DC PMM
  • 網絡 – 2 x 10GBaseT

設計和建造

如前所述,Supermicro SuperServer 1029U-TN10RT 是一款高密度 1U 服務器,可以容納兩個新的英特爾至強可擴展處理器。 設備正面的大部分空間被 2.5 英寸 NVMe 驅動器托架佔據,總共有 3.0 個。 右側是帶有電源按鈕、UID 按鈕和狀態 LED 的控制面板。 下面是兩個 USB XNUMX A 型端口。

將設備翻轉到背面,左側有兩個 PSU,然後是兩個 10GBase-T PJ45 LAN 端口、兩個 USB 3.0 端口、一個 IPMI 專用 LAN 端口、一個串行端口、UID 指示燈和開關、視頻端口和兩個PCIe 插槽。

正面的 2.5 英寸托架支持熱插拔,用戶可以輕鬆推動橙色卡舌以伸出手柄,以便快速拆卸/安裝。 在此服務器和 Supermicro 的其他服務器上,橙色球童表示支持 NVMe。

配備 2.5 個 10 英寸托架的 SuperServer,我們的評測系統隨附 4510 個 Intel P2 XNUMXTB NVMe SSD。

英特爾傲騰持久內存模塊具有與傳統 DRAM 相同的外形尺寸。 它們不需要額外的電源線或冷卻裝置。 散熱器作為持久性內存設計的一部分包含在內,其在寬度和高度方面遵循與 DRAM 模塊相同的設計考慮因素。 所以我們不應該看到在 DRAM 插槽上有氣流罩的超薄服務器有任何新的變化。

與許多 Supermicro 服務器一樣,頂蓋可以通過兩個按鈕輕鬆取下,並卸下後部的連接螺絲。 這提供了對新 CPU、RAM、安裝 GPU 或其他 PCIe 設備的快速訪問,對於本次審查來說重要的是,安裝英特爾傲騰 DC PMM。

性能

在我們第一次看到新的英特爾傲騰 DC 持久內存時,我們專注於以相當傳統的形式衡量其性能; 將其塊存儲性能與標準發行的 NVMe SSD 進行比較。 雖然持久內存有不同的運行模式,但我們計劃在不久的將來圍繞內存模式和 App Direct 字節級關注特定用例。 具體來說,我們將 12 個 128GB 持久內存模塊(每個 CPU 6 個)配置在兩個池中,與 10 個 Intel P4510 2TB NVMe SSD 相對應。 我們在這種情況下的基準測試應用程序仍然使用 vdbench 處理我們的四個角工作負載以及數據庫工作負載配置文件。 展望未來,我們將過渡回 FIO 以及直接使用持久內存的數據庫應用程序。

就我們的基準技術配置而言,我們將 6 個持久內存模塊組合在一起形成一個池(每個 CPU 一個池)並將整個池空間分配給持久內存命名空間。 在操作系統級別,我們然後預填充原始持久內存模塊,將它們分區為總大小的 50%,並在較小的部分上執行我們的工作負載。 然後應用工作負載以顯示持續的性能,這模仿了應用程序數據集在它們上的運行方式。

我們的第一個測試是 4K 隨機讀取測試,持久內存在 1,371,386 微秒時以 4.6 IOPS 開始,然後在僅 13,169,761 微秒的延遲時達到 12.1 IOPS 的峰值。 雖然英特爾 NVMe 驅動器表現不錯,峰值為 5,263,647 IOPS,延遲為 191.4μs,但 PMM 顯然以超過兩倍的吞吐量和延遲只有 NVMe 驅動器的 6% 擊敗了它。

看看 4K 隨機寫入,我們看到了寫入技術的局限性。 如上圖所示,性能顯著提高,持久內存將在寫入時更快地達到峰值。 在這裡,持久內存以 162,642 IOPS 開始,延遲為 8.9 微秒,峰值約為 980K IOPS,延遲約為 60 微秒,然後下降。

切換到順序工作負載,在 64K 讀取中,Optane DC PMM 以 106,739 IOPS 或 6.67GB/s 和 31.9μs 的延遲開始,然後以 1,055,634 IOPS 或 65.98GB/s 的延遲 57.2μs 達到峰值。 NVMe 驅動器再次表現出色,峰值得分為 431,252 IOPS 或 26.6GB/s,延遲為 721.5μs,但遠不及持久內存。

在 64K 順序寫入中,持久內存以 52,472 IOPS 或 1.64GB/s 的速度開始,延遲為 78.8μs。 持久內存模塊繼續達到 255,405 IOPS 或 15.96GB/s 的峰值,延遲僅為 121.8μs。 這與 Intel P4510 組形成鮮明對比,後者在驅動器達到並超過其飽和點時延遲激增。

接下來是 SQL VDBench 測試,包括 SQL、SQL 90-20 和 SQL 80-20。 對於 SQL,持久內存以 547,821 微秒延遲時的 6.4 IOPS 開始,然後在 5,095,690 微秒延遲時達到 10.7 IOPS 的峰值。 NVMe 驅動器再次具有強大的性能,峰值性能為 188,170 IOPS 和 170µs。

對於 SQL 90-10,這兩個比較在吞吐量方面更接近一些,儘管在延遲方面沒有問題,持久內存無疑具有更低的延遲。 持久性內存以 169,874 IOPS 開始,延遲為 8.1 微秒,峰值為 1,911,900 IOPS,延遲為 27.1 微秒,而 NVMe 的峰值為 1,612,337 IOPS,延遲為 189.8 微秒。

對於 SQL 80-20,持久內存具有更好的峰值延遲,65.3 微秒,但吞吐量低得多,為 668,983 IOPS,而 NVMe 驅動器的吞吐量為 1,482,554 IOPS,延遲為 206 微秒。

本次審查的最後一批測試是我們的 Oracle 工作負載、Oracle、Oracle 90-10 和 Oracle 80-20。 Oracle 測試顯示持久內存在 453,449 IOPS 的早期達到峰值,延遲為 103 微秒。 NVMe 驅動器能夠繼續達到 1,366,615 IOPS 的峰值,延遲為 225.8μs。

對於 Oracle 90-10,持久內存從 181,455 IOPS 開始,延遲為 7.8 微秒,然後達到峰值 2,080,543 IOPS,延遲僅為 16.9 微秒。 再次碾壓峰值為 1,357,112 IOPS 且延遲為 157.1μs 的 NVMe 驅動器的性能。

最後,對於我們的 Oracle 80-20,持久內存以 225,492 IOPS 和 8.5 微秒的延遲開始,然後在 1,146,229 微秒的延遲時達到 30.4 IOPS 的峰值。 NVMe 驅動器的吞吐量較低,為 1,265,479 IOPS,但延遲也高得多,為 165.9μs。

結論

Supermicro SuperServer 1029U-TN10RT 是一個雙插槽系統,具有 10 個 2.5 英寸 NVMe 驅動器托架,適合 1U 佔用空間。 除了 2.5 英寸 NVMe 驅動器托架外,服務器還可以配置兩個 M.2 存儲插槽,一個 SATA 和另一個 NVMe。 該服務器專為虛擬化、數據庫和雲計算以及其他利用高計算能力的密集外形的用例而設計。 說到計算,該服務器支持新發布的第二代英特爾至強可擴展 CPU。 CPU 旁邊是 24 個 DIMM 插槽。 除了為該服務器配備大量 DRAM 外,對新 CPU 的支持還意味著對英特爾新的 Optane DC 持久內存模塊的支持。

在性能方面,英特爾持久內存模塊能夠達到我們實驗室尚未見過的性能水平。 由於英特爾或多或少是目前市面上唯一擁有持久內存的遊戲,因此我們沒有競爭對手或舊版本可供比較。 相反,我們將其與英特爾 P4510 2TB NVMe 驅動器進行了比較,以此作為利用新技術時的預期結果示例。 在讀取方面,PMM 超越了 NVMe 技術,4K 讀取為 13.2 萬次 IOPS,延遲僅為 12.1μs,64K 順序讀取達到 66GB/s,延遲僅為 57.2μs。 隨機寫入看到了該技術的一些局限性,持久內存迅速飆升至 980K IOPS,並且在下降之前有大約 60μs 的延遲,遠低於 NVMe 驅動器。 然而,64K 寫入看到持久內存以 15.96GB/s 的速度佔據主導地位,延遲僅為 121.8μs。 對於 SQL 基準測試,持久內存在 SQL(5,095,690 IOPS,延遲為 10.7μs)和 SQL 90-10(1,911,900 IOPS,延遲為 27.1μs)中擊敗了 NVMe 驅動器。 在我們的 Oracle 測試中,持久內存在 Oracle 90-10 中顯示出更高的分數(2,080,543 IOPS,延遲僅為 16.9μs),但從吞吐量的角度來看,在其他兩個測試中落後。 需要注意的是延遲。 持久內存的最高峰值延遲為 103 微秒,最低峰值延遲為 10.7 微秒。

在查看本次審查的初步結果時,顯然有充分的理由感到非常熱情。 我們從整體上看到了新的至強可擴展 CPU 的提升,但當然 Optane DC 持久內存模塊是這裡的明星。 如前所述,這個初步審查並不是我們如何評估具有持久內存的系統的終點; 這只是開始。 我們目前正在努力更深入地研究該系統中的應用程序性能,並將繼續突​​破邊界和最佳實踐,以在 App Direct 和內存模式下評估英特爾傲騰 DC 持久內存。 不過就目前而言,要感謝 Supermicro 及其工程團隊如此快速和全面地將這個套件組合在一起,這將是一個有趣的系列評論。

Supermicro SuperServer 1029U-TN10RT 產品頁面

討論這篇評論