幾週前,我們回顧了 Dell EMC PowerEdge R6525 服務器. 總的來說,1U 服務器非常令人印象深刻,但缺乏真正讓它脫穎而出的東西,即端到端的 PCIe Gen4 存儲支持。 好吧,在 Dell Technologies 人員的幫助下,我們已經糾正了這個問題並再次審查服務器,這次是使用 PCIe Gen4 存儲。
幾週前,我們回顧了 Dell EMC PowerEdge R6525 服務器. 總的來說,1U 服務器非常令人印象深刻,但缺乏真正讓它脫穎而出的東西,即端到端的 PCIe Gen4 存儲支持。 好吧,在 Dell Technologies 人員的幫助下,我們已經糾正了這個問題並再次審查服務器,這次是使用 PCIe Gen4 存儲。
正如我們之前所說,上市消息有點令人困惑。 吹捧該設備支持 PCIe Gen4,然後不提供內置支持是一個錯誤。 然而,戴爾為我們提供了一個現場工具包來更換前背板和電纜,使其為最新的存儲設備做好準備。 我們的實驗室主管花了大約 XNUMX 分鐘來更換三根電纜和背板,然後我們就可以開始了。
由於這是具有相同管理的同一設備,因此讀者可以參考原始評論以了解規格、設計和構建以及管理。
Dell EMC PowerEdge R6525 (PCIe Gen4) 性能
Dell EMC PowerEdge R6525 配置:
- 2 個 AMD 霄龍 7742
- 512GB,每個 CPU 256GB
- 性能存儲:4 x 3.84Tb Micron 9300 (Gen3) 或 4 x 3.84TB SK海力士PE8010 (第二代)
- CentOS 8(2004)
- ESXi 6.7u3
VDBench 工作負載分析
在對存儲陣列進行基準測試時,應用程序測試是最好的,綜合測試排在第二位。 雖然不能完美代表實際工作負載,但綜合測試確實有助於為具有可重複性因素的存儲設備建立基線,從而可以輕鬆地在競爭解決方案之間進行同類比較。 這些工作負載提供了一系列不同的測試配置文件,包括“四個角”測試、常見的數據庫傳輸大小測試,以及來自不同 VDI 環境的跟踪捕獲。 所有這些測試都利用通用的 vdBench 工作負載生成器,以及一個腳本引擎來自動化和捕獲大型計算測試集群的結果。 這使我們能夠在各種存儲設備上重複相同的工作負載,包括閃存陣列和單個存儲設備。
簡介:
- 4K 隨機讀取:100% 讀取,128 個線程,0-120% 重複率
- 4K 隨機寫入:100% 寫入,64 線程,0-120% iorate
- 64K 順序讀取:100% 讀取,16 個線程,0-120% 迭代
- 64K 順序寫入:100% 寫入,8 個線程,0-120% 迭代
- 綜合數據庫:SQL 和 Oracle
- VDI 完整克隆和鏈接克隆跟踪
通過隨機 4K 讀取,服務器在 PCIe Gen4 驅動器上的表現要好得多。 從 70.7µs 開始,一直保持在 100µs 以下,直到突破 3 萬次 IOPS。 該服務器繼續達到 3,505,292 IOPS 的峰值,延遲僅為 127.4µs。
對於 4K 隨機寫入,服務器表現出更好的性能,PCIe Gen4 的延遲保持在 100 微秒以下,直到超過 1.5 萬次,峰值為 1,619,322 IOPS,延遲為 247.6 微秒。 這是 Gen3 驅動器峰值的兩倍多。
接下來是我們研究 64k 的順序工作負載。 對於讀取,Dell EMC 服務器在 331,648µs 的延遲下達到了 20.7 IOPS 或 381.2GB/s 的峰值,在較低延遲下性能提高了約 35%。
對於 64K 順序寫入,服務器中的 Gen4 存儲能夠在 112,704µs 的延遲下達到 7.02 IOPS 或 551.7GB/s 的峰值。
我們的下一組測試是我們的 SQL 工作負載:SQL、SQL 90-10 和 SQL 80-20。 從 SQL 開始,加載了 Gen6525 驅動器的 Dell EMC R4 保持在 100µs 以下,直到大約 900K IOPS 並達到 1,113,419 IOPS 的峰值,延遲為 112.3µs。
對於 SQL 90-10,Gen4 驅動器的峰值為 947,597 IOPS,延遲僅為 128.9µs。
SQL 80-20 在 Gen4 驅動器上繼續表現出更強的性能,峰值為 873,301 IOPS,延遲為 140.5µs。
接下來是我們的 Oracle 工作負載:Oracle、Oracle 90-10 和 Oracle 80-20。 從 Oracle 開始,帶有 Gen6525 驅動器的 R4 一直保持在 100µs 以下,直到大約 799,687 萬次 IOPS,然後達到 157.5 IOPS 的峰值,延遲為 XNUMXµs。
對於 Oracle 90-10,Dell EMC 服務器的峰值為 793,994 IOPS,延遲為 107.5µs。
使用 Oracle 80-20,我們看到了 739,968 IOPS 的峰值和 115.1µs 的延遲。 以更低的延遲提高超過 140K IOPS。
接下來,我們切換到我們的 VDI 克隆測試,完整和鏈接。 對於 VDI 完整克隆 (FC) 啟動,我們看到低於 100µs 的延遲性能直到大約 400K IOPS,在 722,683µs 的延遲下達到 176 IOPS 的峰值。 Gen100 超過 4K IOPS。
VDI FC Initial Login 讓 Gen4 真正擊敗了 Gen3,峰值性能為 335,994 IOPS 在 309.2µs 與 187K IOPS 在 407.4µs
VDI FC Monday Login 顯示了另一個令人印象深刻的飛躍,與 Gen4 的 292,466 IOPS 和 196.2µs 的延遲相比,Gen3 設置的峰值達到 175,193 IOPS 和 260.3µs。
切換到 VDI 鏈接克隆 (LC) 引導後,具有 Gen6525 的 Dell EMC R4 峰值達到 385,279 IOPS,延遲為 154.6µs。
同樣,我們看到初始登錄有很大差異,這次 Gen4 在 163,938µs 時達到 166.7 IOPS 的峰值,而 Gen3 的 101,301 IOPS 延遲為 234.4µs。
最後,我們查看 VDI LC Monday Login,其中第 4 代加載服務器的峰值為 207,004 IOPS,延遲為 271.8µs,比第 100 代高出近 3K。
結論
Dell EMC PowerEdge R6525 是一款功能強大的小型 1U 服務器,配備雙 AMD EPYC CPU。 雖然服務器已準備好運行 PCIe Gen4,但我們的早期構建並沒有以這種方式開箱即用。 很公平,在戴爾和現場工具包的幫助下,我們為最新的存儲技術做好了準備。 這個過程很簡單,幾分鐘後,我們就可以進行測試了。
對於基準測試,我們運行了 VDBench 工作負載分析,發現兩代 PCIe 技術之間的性能有了相當大的提升。 亮點包括 4K 讀取 3.5 萬 IOPS,4K 寫入 1.6 萬 IOPS,64K 讀取 20.7GB/s,7.02K 寫入 64GB/s。 這表示性能分別提高了 34.6%、100%、54% 和 67%。
通過我們的 SQL 測試,我們看到了 1.1 萬 IOPS 的峰值,SQL 948-90 中的 10K IOPS 和 873-80 中的 20K IOPS,或者分別提高了大約 34%、32% 和 24%。 對於 Oracle 服務器,我們看到了 800K IOPS、794-90 的 10K IOPS 和 Oracle 740-80 的 20K IOPS 的峰值,分別代表了 20%、23% 和 25% 的改進。 通過 VDI 完整克隆結果,我們看到了 723K IOPS 啟動、336K IOPS 初始登錄和 292K IOPS 星期一登錄的峰值。 VDI 鏈接克隆顯示 385K IOPS 啟動峰值、164K IOPS 初始登錄和 207K IOPS 星期一登錄。
PCIe Gen4 有很多性能承諾,並且帶有用於 戴爾易安信 PowerEdge R6525,我們能夠實現它們。 在某些情況下,增長如此之大,我們看到了大約 100% 的改善。 今天訂購的系統將配備支持 Gen4 的背板。 從數字上看,性能的提升對於需要性能的應用程序來說是一項值得的投資。
參與 StorageReview
電子通訊 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | RSS訂閱