英特爾推出了 傲騰 DC 持久內存模塊 2019 年春季,作為彌合易失性 DRAM 和高性能 SSD 之間差距的一種方式。 一年多後,英特爾在該平台上構建了英特爾傲騰持久內存 200 系列或簡稱傲騰 PMem 200。 新模塊針對新 第三代英特爾至強可擴展處理器, 與英特爾 SSD 的組合非常適合平台遊戲。 PMem 200 據稱可提供比 Gen32 多 1% 的內存帶寬,這是一個很好的提升,我們將在本次評測中進行測試。
英特爾推出了 傲騰 DC 持久內存模塊 2019 年春季,作為彌合易失性 DRAM 和高性能 SSD 之間差距的一種方式。 一年多後,英特爾在該平台上構建了英特爾傲騰持久內存 200 系列或簡稱傲騰 PMem 200。 新模塊針對新 第三代英特爾至強可擴展處理器, 與英特爾 SSD 的組合非常適合平台遊戲。 PMem 200 據稱可提供比 Gen32 多 1% 的內存帶寬,這是一個很好的提升,我們將在本次評測中進行測試。
作為背景,我們之前對 PMem 有廣泛的報導。 這個迭代與第一個迭代沒有太大區別,因此大多數先前的工作在架構、收益等方面今天仍然非常相關。 如果您需要加快 PMem 的速度,這裡有一些要點:
- 播客 #60: Kristie Mann,英特爾持久內存
- 英特爾傲騰 DC 持久內存 NoSQL 性能評估
- Supermicro SuperServer 與 英特爾傲騰 DC 持久內存初審
- 英特爾解釋 PMem 200 與 DAOS 的優勢
在本次審查中,我們匯集了多種技術的完美結合。 在硬件方面,我們有一個英特爾 OEM 盒子,配備了 PMem 200 模塊和最新的 Xeon 可擴展 CPU。 我們在 MemVerge memory Machine v1.2 之上分層,這是專門為最好地利用持久內存模塊而構建的軟件。
英特爾傲騰持久內存 200 系列的新功能
200 系列的大部分優勢都與第三代英特爾至強可擴展處理器的提升有關。 顯然內存帶寬吞吐量的最大差異,PMem 3 獲得了 200 MT/s 的支持。 但是還有其他一些與絕對性能相關的好處。
之前版本的核心數量為 8-28 個核心,在 200 系列中它從 16 個核心增加到 40 個。使用第一個 PMem,用戶可以添加 3TB 的 PMem,每個插槽的總內存為 4.5TB,現在每個插槽總數為 6TB,添加了 4TB 的 PMem 200。 最大熱設計功率從 18W 降至 15W。 最新的持久內存帶有 eADR,即擴展的異步 DRAM 刷新。
PMem 100 與 200 性能差異 (512GB)
記憶體 | 英特爾Optane | 英特爾傲騰 200 |
耐力 100% 寫入 15W 256B | 300體重體重 | 410體重體重 |
耐力 100% 寫入 15W 64B | 75體重體重 | 103體重體重 |
帶寬 100% 讀取 15W 256B | 5.3GB /秒 | 7.45GB /秒 |
帶寬 100% 寫入 15W 256B | 1.89GB /秒 | 2.60GB /秒 |
帶寬 100% 讀取 15W 64B | 1.4GB /秒 | 1.86GB /秒 |
帶寬 100% 寫入 15W 64B | 0.47GB /秒 | 0.65GB /秒 |
英特爾傲騰持久內存 200 系列規格
兼容處理器 | 3 插槽平台上的第三代英特爾至強可擴展處理器 | |||||
外形 | 持久內存模塊 | |||||
SKU | GB 128 | GB 256 | GB 512 | |||
用戶容量 | GB 126.7 | GB 253.7 | GB 507.7 | |||
MOQ | 4 | 50 | 4 | 50 | 4 | 50 |
技術 | 英特爾Optane技術 | |||||
有限保修 | 5年 | |||||
AFR | ≤0.44 | |||||
耐力 100% 寫入 15W 256B | 292體重體重 | 497體重體重 | 410體重體重 | |||
耐力 67% 閱讀; 33% 寫 15W 256B |
224體重體重 | 297體重體重 | 242體重體重 | |||
耐力 100% 寫入 15W 64B |
73體重體重 | 125體重體重 | 103體重體重 | |||
耐力 67% 閱讀; 33% 寫作 15W 64B |
56體重體重 | 74體重體重 | 60體重體重 | |||
帶寬 100% 讀取 15W 256B |
7.45 GB / s | 8.10 GB / s | 7.45 GB / s | |||
帶寬 67% 讀取; 33% 寫 15W 256B |
4.25 GB / s | 5.65 GB / s | 4.60 GB / s | |||
帶寬 100% 寫入 15W 256B |
2.25 GB / s | 3.15 GB / s | 2.60 GB / s | |||
帶寬 100% 讀取 15W 64B |
1.86 GB / s | 2.03 GB / s | 1.86 GB / s | |||
帶寬 67% 讀取; 33% 寫 15W 64B |
1.06 GB / s | 1.41 GB / s | 1.15 GB / s | |||
帶寬 100% 寫入 15W 64B |
0.56 GB / s | 0.79 GB / s | 0.65 GB / s | |||
內存頻率 | 3200 MT/s | |||||
最大熱設計 | 15W | 18W | ||||
溫度(最大值) | ≤ 83°C(85°C 關機,83°C 默認)介質溫度 | |||||
溫度(環境) | 48°C @ 2.4m/s 12W | |||||
溫度(環境) | 43°C @ 2.7m/s 15W | |||||
MemVerge 管理
MemVerge Memory Machine v1.2 仍然利用 我們在原始評論中看到的相同 GUI. Global Dashboard 通過專注於 DRAM 和 PMem 使自己脫穎而出,其中大多數 GUI 關注 CPU、內存、存儲和網絡等事物。 對於 IO 密集型應用程序,顯示跨多個系統的存儲使用情況的儀表板可能很有價值。 對於以內存為中心的應用程序,Memory Machine Global Dashboard 提供了跨多個服務器可視化內存使用情況、節點狀態、事件和警報的獨特功能。
因為這是重點,我們可以在測試時監控 DRAM 和 PMem 帶寬,因為大多數用戶都在利用該技術。 DRAM 和 PMEM 使用數據是系統管理員調整大小決策的指南,可幫助他們了解性能調整和調試所需的工作負載行為。 例如,當工作負載達到內存使用峰值時,或者它是否定期分配和釋放內存時,管理員可以看到持續的內存使用情況。 當應用程序因 OOM 而崩潰時,這一點尤為重要。 管理員可以查看內存使用數據,以快速準確地確定它發生的時間。
在實例選項卡下,我們可以看到 Redis 實例及其摘要。
MemVerge Memory Machine 管理界面可以幫助管理員處理許多用例:
崩潰恢復——快照 GUI 用於快速恢復數據庫和/或排除故障原因。 數據庫日誌和 Memory Machine Dashboard 數據確定崩潰時間,允許管理員選擇和恢復最接近崩潰時間的快照。 然後,開發人員可以使用該還原的實例進行調試。
使用 Memory DVR 加速動畫和 VFX – 藝術家希望在基礎 Maya 場景上探索不同的選項。 他們加載基礎場景,應用更改,並將其保存為不同的項目。 它們可以保存許多單獨的場景,但要顯示這些選項,它們必須反復重新加載,這需要很長時間。 使用內存 DVR 功能,您可以加載一次基本場景,拍攝快照作為基本快照,然後應用您的更改並拍攝另一張快照。 要應用不同的效果,只需恢復快照、編輯並拍攝另一張快照即可。 內存快照的恢復速度是幾秒鐘,而從存儲中重新加載場景則需要幾分鐘。
使用內存 DVR 加速基因組分析——科學家們想要使用不同的參數設置來試驗機器學習算法。 他們加載數據、設置參數、運行算法並檢查結果。 如果結果不好,則重新加載數據,應用一組不同的參數,然後再次運行算法。 使用內存 DVR 功能,您可以一次加載數據並拍攝快照。 從那時起,如果結果不好,則恢復基礎數據並在幾秒鐘內完成另一次使用新參數的運行。
英特爾傲騰持久內存 200 系列 性能
雖然 PMem 可以作為塊存儲進行測試(我們過去做過),但 PMem 的真正優勢體現在您可以通過適當的軟件在字節級別利用它。 在許多情況下,像 SAP 這樣的應用程序開發人員會調整他們的應用程序以能夠利用 PMem。 雖然這適用於某些應用程序,但還有另一種選擇。 利用從頭開始構建的軟件定義解決方案,幫助企業利用 PMem 200 提供的所有性能和持久性優勢。 為了測試最新一代的 PMem,我們正是這樣做的。
在利用持久內存方面,MemVerge 提供了最全面的產品之一。 我們看了一下 MemVerge 記憶機器 今年早些時候。 MemVerge 發布了軟件更新,以利用新的 Xeon CPU、PMem 200 和英特爾發布的所有新存儲。 MemVerge Memory Machine 現已推出 v1.2,具有多項新優勢,前兩項是支持第三代 Intel Xeon 可擴展處理器和支持 Intel Optane Persistent Memory 200 系列。
Memory Machine v1.2 提供了對 Linux 上的 Microsoft SQL Server 的支持,他們表示他們可以在相同的內存成本下將 OLTP 性能提高一倍。 它還支持 KVM 虛擬機管理程序,可以動態調整每個 VM 的 DRAM:PMEM 比率。 Redis 和 Hazlecast 等內存數據庫集群現在具有 HA 和協調的內存快照。 最後,v1.2 對整個數據中心的 DRAM 和 PMem 進行了集中式內存管理。
Ice Lake 平台——英特爾 OEM 服務器
- 2 x Intel Xeon Platinum 8380 @ 2.3GHz 40 核
- 16 個 32GB DDR4 3200MHz
- 16 個 128GB 英特爾持久內存 200 系列
- 引導固態硬盤:英特爾 1TB SATA
- 數據庫固態硬盤: 英特爾 P5510 7.68TB
- 操作系統:CentOS 8.3.2011
Cascade Lake 平台 – Supermicro SYS-2029U-TN24R4T
- 2 x Intel Xeon Platinum 8270 @ 2.70GHz 26 核
- 12 個 16GB DDR4 192GB
- 12 個 128GB 英特爾持久內存 100 系列
- 啟動固態硬盤:1TB SATA 固態硬盤
- 操作系統 CentOS 8.2.2004
Optane 和 MemVerge Memory Machine 都更適合內存應用程序。 我們的基準測試通常被視為正常的高壓力工作負載,這些工作負載將在 IT 運營的現實生活中出現。 相反,在這裡我們將研究一些不同的測試,我們將專門研究諸如 DRAM 與 PMem 與 DRAM + PMem 之類的東西,以及每種測試的結果。 對於這次審查,我們將使用 KDB Performance 進行批量插入和讀取測試,以及使用 ZeroIO 快照的 Redis 快速恢復和使用 ZeroIO 快照的 Redis 克隆。
KDB 性能測試
Kx 的 kdb+ 是一個時間序列內存數據庫。 它以其速度和效率而聞名,因此在金融服務行業非常受歡迎。 kdb 的一大限制是 DRAM 容量的限制。 MemVerge Memory Machine 非常適合這裡,因此 kdb 可以充分利用 PMem 來擴展內存空間,性能與 DRAM 相似。 對於批量插入測試,我們查看了單個插入、10、100 和 1000 個插入,並以每秒數百萬次批量插入為單位進行了測量。 我們只關注 DRAM 和具有 DRAM 分層的內存機器。
通過 KX kdb+ bulk,我們同時關注 Cascade Lake 和 Ice Lake。 結果以百萬記錄/秒 (MR/s) 記錄。 從 Cascade Lake 開始,在同一批次中,這三個都差不多。 一旦我們開始上升,DRAM 就一直領先,直到達到約 142 MR/s 的峰值。 帶 DRAM 分層的 MM 趕上了 1000 批次大關。
Ice Lake 上的相同測試開始時大致相同:一批看到兩者大致相等,在 10 批中 DRAM 和 MM w/DRAM 分層相同,但在 100 MM w/DRAM 分層時這次以 333 MR/秒。 兩者在 500 批次時以 1000 MR/s 的速度回升,這比 Cascade Lake 頂峰高出 3.5 多倍。
接下來,我們通過讀取測試查看了 kdb+。 這裡的測試設置有點不同。 讀取測試始終相同,但這次我們只查看 DRAM,然後查看具有 40GB DRAM 分層的 Memory Machine。 在 Xeon Gen 2 DRAM 上只能達到 4.22GB/s,而 MM w/40G DRAM 分層達到 4.83GB/s。
對新處理器的相同測試為我們提供了 5.13GB/s 的 DRAM 和高達 9.77GB/s 的 MM w/40G DRAM 分層。
結論
隨著新處理器的推出,新的 PMem,即英特爾傲騰持久內存 200 系列,該公司採用了現有產品,並在最有效的地方進行了改進。 該公司聲稱其性能比原來提高了 32%,現在內核數增加到 40 個,並支持 3200MT/s。 雖然它們的模塊容量與上一版本相同,分別為 128GB、256GB 和 512GB,但英特爾已經做到這一點,因此用戶可以在每個插槽中添加更多模塊,從而使總 RAM 佔用空間達到 6TB。 為了測試新的 PMem,我們與 MemVerge 及其新發布的 Memory Machine v1.2 合作。
在利用 MemVerge Memory Machine v3 的全新 Intel Xeon Gen1.2 平台的應用測試中,我們看到了與上一代 Intel Xeon 平台相比的巨大進步。 在測量單批、10 批、100 批或 1000 批批量插入速度的 Kdb+ 寫入測試中,我們測得 Gen3 Xeon 平台作為一個整體比接近頂級規格的 Gen2 平台獲得了巨大的收益。 在 1000 批插入的峰值時,我們看到 Xeon Gen142 上的差異約為 2 億條記錄/秒 (MR/s),而 Xeon Gen500 上為 3 MR/s,相差 3.5 倍。 在 Kdb+ 讀取測試中,比較 Memory Machine + Pmem + 40GB DRAM 分層,我們在 Xeon Gen4.83 上測得 2GB/s,而 Xeon Gen3 擴展到令人印象深刻的 9.77GB/s。
總體而言,正如我們在使用 MemVerge 進行的測試中看到的那樣,新的英特爾至強 Gen3 版本以及英特爾傲騰持久內存 200 系列有很多令人喜歡的地方。 雖然英特爾平台的最大變化包括更快的處理器、更快的 DRAM 和 Gen4 PCIe 支持,但英特爾的 PMem 200 和合適的應用程序可以真正改變許多關鍵任務用例的方程式。 SAP HANA 等本機與 PMem 交互的應用程序將很高興能夠訪問所有這些英特爾技術。 對於所有其他想要利用 PMem 200 的人,MemVerge 提供了一條簡單的採用途徑。
參與 StorageReview
電子通訊 | YouTube | LinkedIn | Instagram | Twitter | Facebook | 的TikTok | RSS訂閱