Dell PowerEdge C6615 節點提供單一 AMD EPYC CPU(最多 64 個核心)和六個支援 5GB DIMM 的 DDR96 插槽。
Dell PowerEdge C 系列平台具有 2U 機箱,支援戴爾模組化基礎架構類別中的四台伺服器。根據工作負載,C 系列系統可以配置兩種不同的節點類型:AMD 單路 C6615 節點或 Intel 雙路 C6620 節點。
我們的評測將重點放在 C 系列機箱,該機箱具有四個連接到 8 托架 E3.S PCIe Gen5 驅動器背板的單插槽 AMD EPYC 節點。
從儲存角度來看,該平台可配置 2.5 吋 SFF 驅動器背板,最多支援 24 個 NVMe SSD 或利用 5 碟位 E8.S 背板支援 Gen3。在內部,這些磁碟機直接連接到每個節點,均勻分佈在四台伺服器上。例如,在 24 盤位配置中,每個節點有 8 個驅動器;在 XNUMX 盤位設定中,每個節點都有兩個驅動器。
C6600 機箱為安裝的四個節點提供共用冗餘電源和冷卻,但除此之外,每個節點都是獨立管理的。因此,與帶有機箱管理入口網站的託管刀片機箱不同,它更像是一個金屬屋頂下的四台小型 PowerEdge 伺服器。每個 C6615 節點都有專用網路連線、iDRAC 介面和用於擴充的 PCIe 插槽。
Dell PowerEdge C6615 節點規格
C6615 規格 | |
---|---|
處理器 | 一顆 AMD EPYC 處理器,最多 64 核心 |
記憶體應用 | 6 個 DDR5 DIMM 插槽,最大支援 576 GB (6 x 96 GB) RDIMM,速度高達 4800 MT/s |
存儲控制器 | 內部控制器 (RAID):PERC H755N、PERC H355 內部啟動:啟動最佳化儲存子系統 (NVMe BOSS-N1):HWRAID 1、2 x M.2 SSD 內部 12 Gbps SAS HBA(非 RAID):HBA355i 軟件 RAID:S160 |
可用性 | 熱插拔冗餘驅動器和 PSU |
驅動器托架 | 前艙: 多達 16 個 2.5 吋 SAS/SATA (HDD/SSD) 驅動器,最大容量 61 TB 通用背板配置最多 16 個 2.5 吋 SATA/NVMe 驅動器,最大容量為 15.36 TB NVMe 背板上最大 16 x 2.5 英寸 NVMe SSD 硬碟背板上最多 8 個 E3.s |
熱插拔、冗餘電源 | 3200W 277 VAC 或 336 VDC 2800W 鈦金 200-240 VAC 或 240 VDC 2400W 鉑金 100-240 VAC 或 240 VDC 1800W 鈦金 200-240 VAC 或 240 VDC |
尺寸 | 高度 – 40.0 毫米(1.57 英寸) 寬度 – 174.4 毫米(6.86 英寸) 深度 – 549.7 毫米(21.64 吋)、561.3 mm(22.10 吋) – SAS/SATA 或 NVMe 或 E3.S 或通用配置 |
重量 | 3.7公斤(8.15磅) |
嵌入式管理 | IDRAC9 IDRAC 直接 IDRAC RESTful API 與 Redfish IDRAC 服務模組 |
開放管理軟件 | CloudIQ for PowerEdge 插件 開放管理企業 VMware Vcenter 的 OpenManage Enterprise 集成 適用於 Microsoft System Center 的 OpenManage Integration OpenManage 與 Windows 管理中心的集成 OpenManage 電源管理器插件 OpenManage 服務插件 OpenManage 更新管理器插件 |
集成 | BMC真視 微軟系統中心 OpenManage 與 ServiceNow 集成 OpenManage 與 Windows 管理中心的集成 OpenManage 電源管理器插件 OpenManage 服務插件 OpenManage 更新管理器插件 |
安全性 | AMD 安全加密虛擬化 (SEV) AMD 安全記憶體加密 (SME) 密碼簽名的固件 靜態數據加密(具有本地或外部密鑰管理的 SED) 安全啟動安全組件驗證(硬體完整性檢查) 安全擦除 矽信任根 系統鎖定(需要 IDRAC9 Enterprise 或 Datacenter) TPM 2.0 FIPS,CC-TCG認證,TPM 2.0 China NationZ |
嵌入式網卡 | 1 個 1GBE |
後端口 | 1 x的USB 3.0 1 個 IDRAC 乙太網路端口 1 個 IDRAC Direct (Micro-AB USB) 連接埠 1個Mini-DisplayPort |
PCIE插槽 | 多達 2 個 PCIe x16 Gen5 薄型插槽 1 個 OCP 3.0 x16 Gen5 |
操作系統和管理程序 | 規範的 Ubuntu 服務器 LTS 帶有 Hyper-V 的 Microsoft Windows 服務器 紅帽企業Linux SUSE Linux Enterprise Server VMware ESXi/vSAN |
構建和設計
Dell PowerEdge C6600 機箱和 C6615 節點為需要最大限度減少機架安裝環境中使用的實體空間的部署方案提供了極為密集的運算選項。這適用於在叢集環境中運行的超融合解決方案,需要多個節點或運算量大的工作負載,而無需透過傳統的 4U 或 8U 伺服器設計消耗 1U 或 2U。機箱佔地 2U,深度為 30 英吋。底盤的重量可能會達到這個高度,這取決於最終配置。戴爾列出了安裝所有驅動器的 16 碟位 C6600 配置的最大重量為 93.69 磅。
與其他 PowerEdge 平台相比,該系統的前端非常簡單,沒有太多戴爾品牌。這種伺服器類型不提供標準的 PowerEdge 邊框,而是將驅動器和風扇進氣口放在前面和中間。 E3.S C6600 的正面中間有八個 Gen5 NVMe SSD,兩側是冷卻風扇進氣口。
機箱的側耳包含每個節點的專用電源按鈕和指示該節點的狀態或問題的資訊按鈕。
與傳統的 6615U 或 1U 伺服器相比,每個 C2 節點在機箱後部均具有壓縮連接埠佈局。連接埠包括 USB、iDRAC、顯示器連接器和 USB 服務連接埠。
對於網絡,一個 OCP 插槽可用於不同的介面選項(我們有一個四埠 25GbE NIC),還提供兩個 PCIe 插槽。 OCP 和雙 PCIe 插槽均提供 Gen5 介面。
打開 PowerEdge C6600 機箱,您可以了解如何處理冷卻、配電和驅動器 I/O 路徑的佈局。驅動器背板的 PCIe/SAS 纜線透過也傳輸資料和電源的快速連接配件直接連接到每個節點。
根據每個節點的內部配置,驅動器連接直接連接到主機板或 PERC 卡以實現硬體 RAID 選項。
除了冷卻和電力之外,節點不共享任何其他資源。
戴爾 PowerEdge C6615 性能
測試節點規格
我們的所有四個 C6615 節點都具有相同的配置。我們將對它們進行比較並顯示節點之間的平均效能。
- 1 個 AMD EPYC 8534P 64 核心 CPU
- 6 個 96 GB DDR5 4800 MB/秒 (576 GB)
- Windows Server標準2022的
- 戴爾 RAID1 BOSS 啟動 SSD
- 2 個 PCIe Gen5 E3.S 固態硬碟
在我們的效能測試中,節點並行運行,以給出考慮共享電源和冷卻資源的總分。
存儲性能
四個 Dell Power Edge C6615 節點均包含一個用於啟動的 BOSS RAID1 SSD 和兩個用於 Gen3 企業 SSD 的 E5.S 托架。雖然 BOSS 卡並不遜色,但它提供的效能設定檔與 E3.S SSD 截然不同。
儘管本次審查的大部分內容將重點放在整體系統級效能,但我們稍微觸及了該系統上具有四角工作負載的兩種儲存類型。我們的第一個測試集中在 BOSS RAID1 啟動 SSD 群組。
戴爾 BOSS RAID1 | 讀取性能 | 寫入性能 |
---|---|---|
連續 1MB Q32/4T | 2,963MB /秒 | 1,067MB /秒 |
隨機4K Q32/8T | 600,786 IOPS(0.426 毫秒) | 249,819 IOPS(1.024 毫秒) |
接下來,我們查看了單一 Gen5 E3.S SSD,它 包括 7.68TB 鎧俠 CM7 我們的審核系統中的讀取密集型 SSD.
鎧俠 7.68TB CM7-R | 讀取性能 | 寫入性能 |
---|---|---|
連續 1MB Q32/4T | 13,736MB /秒 | 7,089MB /秒 |
隨機4K Q32/8T | 931,671 IOPS(0.266 毫秒) | 768,739 IOPS(0.329 毫秒) |
Cinebench R23
Maxon 的 Cinebench R23 是一個 CPU 渲染基準測試,利用所有 CPU 核心和執行緒。我們對其進行了多核心和單核心測試。分數越高越好。以下是所有 EPYC 晶片的結果。
在 Cinebench R23 中,所有四個節點在多核心部分的得分都在 74,000 左右,其中節點 3 的得分接近 75,000。所有四個節點的單核分數都非常接近,節點 1 和 4 為 1,088。節點3僅落後8分,節點2領先5分。總體而言,所有節點僅存在較小的效能差距,這是不同 CPU 之間的典型情況,即使它們都是相同型號。
Cinebench R23 | 節點1 | 節點2 | 節點3 | 節點4 | 中等 |
---|---|---|---|---|---|
CPU 多核 | 74,877 | 74,961 | 75,011 | 74,745 | 74,898.5 |
CPU單核 | 1,088 | 1,093 | 1,084 | 1,088 | 1,088.25 |
MP比率 | 64.84 | 68.60 | 69.17 | 68.70 | 67.83 |
Cinebench 2024
Maxon 的 Cinebench 2024 是一個 CPU 和 GPU 渲染基準測試,利用所有 CPU 核心和執行緒。我們對其進行了多核心和單核心測試。由於這些節點沒有 GPU,因此我們只有多核心和單核心數量。
在 Cinebench 2024 中,所有節點保持緊密結合,多核心和單核部分的差異最小。多核心平均性能為 4,509 分,單核心平均性能為 67.25 分,MP Ratio 為 66.98。
Cinebench 2024 | 節點1 | 節點2 | 節點3 | 節點4 | 中等 |
---|---|---|---|---|---|
CPU 多核 | 4,544 | 4,577 | 4,436 | 4,481 | 4,509.5 |
CPU單核 | 68 | 68 | 65 | 68 | 67.25 |
MP比率 | 66.79 | 67.23 | 68.21 | 65.69 | 66.98 |
極客跑分 6 CPU
Geekbench 6 是衡量整體系統效能的跨平台基準測試。測試包含CPU測試部分和GPU測試部分,但由於這些節點沒有GPU,所以我們只有CPU編號。分數越高越好。
在 Geekbench 中,我們看到節點 3 之前的數字很緊張,在單核和多核心上略有下降。所有節點之間的平均值在單核上為 1,687,在多核心上為 19,319.5。
極客跑分 6 CPU | 節點1 | 節點2 | 節點3 | 節點4 | 中等 |
---|---|---|---|---|---|
單核 | 1,707 | 1,708 | 1,625 | 1,708 | 1,687 |
多核 | 19,544 | 19,234 | 18,999 | 19,501 | 19,319.5 |
攪拌機 4.0 CPU
接下來是 Blender OptiX——一款開源 3D 建模應用程式。此基準測試是使用 Blender Benchmark CLI 實用程式運行的。分數是每分鐘的樣本數,越高越好。
C6615 節點的數字非常一致。 Monster 上的平均分數為 591.79,Junkshop 的平均分數為 415.88,Classroom 的平均分數為 311.74。
攪拌機 4.0 CPU | 節點1 | 節點2 | 節點3 | 節點4 | 中等 |
---|---|---|---|---|---|
Monster | 595.23 | 593.51 | 584.35 | 594.07 | 591.79 |
舊貨店 | 415.26 | 415.11 | 418.05 | 415.08 | 415.88 |
課堂 | 308.57 | 312.91 | 312.69 | 312.78 | 311.74 |
攪拌機 4.1 CPU
Blender OptiX 4.1 帶來了新功能,例如 GPU 加速去噪、簡化渲染過程以及減少去噪任務所需的時間。儘管有這些進步,但與 4.0 版本相比,基準分數的整體效能改進很小,表明效率僅略有提高。
我們再次看到各方面的數字一致,Monster 上的平均值為 587.22,Junkshop 上的平均值為 420.20,Classroom 上的平均值為 306.60。
攪拌機 4.1 CPU | 節點1 | 節點2 | 節點3 | 節點4 | 中等 |
---|---|---|---|---|---|
Monster | 590.46 | 590.58 | 584.76 | 583.08 | 587.22 |
舊貨店 | 418.38 | 416.71 | 426.73 | 419.03 | 420.20 |
課堂 | 306.86 | 304.81 | 308.95 | 305.79 | 306.60 |
7-Zip 壓縮
流行的 7-Zip 實用程式具有內建記憶體基準測試,可展示 CPU 效能。在此測試中,我們盡可能針對 128 MB 字典大小執行它。
在所有節點上都可以看到公平的分數。在總分中,我們看到 CPU 總使用率為 5,778.75%,總分/使用率為 4.355 GIPS,總分為 252 GIPS。
攪拌機 4.1 CPU | 節點1 | 節點2 | 節點3 | 節點4 | 中等 |
---|---|---|---|---|---|
壓縮 | |||||
當前 CPU 使用率 | 5,548% | 5,549% | 5,633% | 5,585% | 5,578.75% |
當前額定值/使用情況 | 4.256 吉普斯 | 4.210 吉普斯 | 4.156 吉普斯 | 4.177 吉普斯 | 4.20 吉普斯 |
額定電流 | 236.158 吉普斯 | 233.626 吉普斯 | 234.092 吉普斯 | 233.285 吉普斯 | 234.290 吉普斯 |
產生的 CPU 使用率 | 5,536% | 5,537% | 5,601% | 5,553% | 5,556.75% |
結果評級/使用情況 | 4.193 吉普斯 | 4.202 吉普斯 | 4.172 吉普斯 | 4.168 吉普斯 | 4.184 吉普斯 |
結果評級 | 232.118 吉普斯 | 232.631 吉普斯 | 233.691 吉普斯 | 231.443 吉普斯 | 232.470 吉普斯 |
解壓縮 | |||||
當前 CPU 使用率 | 5,973% | 6,027% | 5,992% | 6,014% | 6,001.5% |
當前額定值/使用情況 | 4.543 吉普斯 | 4.501 吉普斯 | 4.565 吉普斯 | 4.509 吉普斯 | 4.530 吉普斯 |
額定電流 | 271.343 吉普斯 | 271.287 吉普斯 | 273.507 吉普斯 | 271.196 吉普斯 | 271.833 吉普斯 |
產生的 CPU 使用率 | 5,997% | 6,015% | 5,999% | 5,990% | 6,000.25% |
結果評級/使用情況 | 4.537 吉普斯 | 4.519 吉普斯 | 4.550 吉普斯 | 4.499 吉普斯 | 4.526 吉普斯 |
結果評級 | 272.066 吉普斯 | 271.775 吉普斯 | 272.946 吉普斯 | 269.509 吉普斯 | 271.574 吉普斯 |
總評分 | |||||
總 CPU 使用率 | 5,767% | 5,776% | 5,800% | 5,772% | 5,778.75% |
總評分/使用情況 | 4.365 吉普斯 | 4.360 吉普斯 | 4.361 吉普斯 | 4.333 吉普斯 | 4.355 吉普斯 |
總評分 | 252.092 吉普斯 | 252.203 吉普斯 | 253.318 吉普斯 | 250.476 吉普斯 | 252.022 吉普斯 |
Blackmagic 原始速度測試
我們一直在利用 Blackmagic 的原始速度測試來評估機器如何進行現實世界的 RAW 解碼。此測試可以包含 CPU 和 GPU 使用情況,但我們只會測試 CPU 使用情況。
所有四個節點都表現出極其接近的性能,平均 119.75 FPS。
Blackmagic 原始速度測試 | 節點1 | 節點2 | 節點3 | 節點4 | 中等 |
---|---|---|---|---|---|
8K CPU | FPS 121 | FPS 121 | FPS 118 | FPS 119 | FPS 119.75 |
Blackmagic磁盤速度測試
接下來是 Blackmagic Disk 速度測試。此測試運行 5 GB 範例檔案的讀寫速度。由於它是單線程的,它不會顯示磁碟的最高速度,但它仍然提供了一個很好的視角。
C6615 內部有一個 BOSS 卡,在 RAID2 中使用雙 M.1 驅動器,因此可靠性方面的效能略有下降。對於寫入速度,我們看到平均為 991.6 MB/秒,對於讀取速度,平均為 2,801 MB/秒。
Blackmagic磁盤速度測試 | 節點1 | 節點2 | 節點3 | 節點4 | 中等 |
---|---|---|---|---|---|
寫 | 999.8 MB / s的 | 977.4 MB / s的 | 991.4 MB / s的 | 997.7 MB / s的 | 991.6 MB / s的 |
更多內容 | 2,807.4 MB / s的 | 2,790.1 MB / s的 | 2,828.0 MB / s的 | 2,780.4 MB / s的 | 2,801.5 MB / s的 |
Y 粉碎機
y-cruncher 是一個多線程和可擴展的程序,可以將 Pi 和其他數學常數計算到數万億位。 自 2009 年推出以來,它已成為超頻玩家和硬件愛好者的熱門基準測試和壓力測試應用程序。
對於我們的平均速度,9.5 億個資料需要 1 秒,24.20 億個資料需要 2.5 秒,50.73 億個資料需要 5 秒。在更有效的數位運算中,我們看到 105.73 億需要 10 秒,288.85 億需要 25 秒,633.5 億需要 50 秒。
Y Cruncher(總計算時間,以秒為單位) | 節點1 | 節點2 | 節點3 | 節點4 | 中等 |
---|---|---|---|---|---|
1億 | 9.587 | 9.459 | 9.350 | 9.633 | 9.507 |
2.5億 | 24.490 | 24.225 | 23.334 | 24.740 | 24.197 |
5億 | 51.427 | 50.990 | 49.303 | 51.214 | 50.734 |
10億 | 107.084 | 107.646 | 103.772 | 107.443 | 105.736 |
25億 | 291.918 | 290.944 | 280.632 | 291.902 | 288.849 |
50億 | 641.709 | 640.289 | 619.100 | 640.917 | 635.504 |
UL Procyon AI 電腦視覺基準
UL 南河三 AI 推理旨在衡量工作站在專業應用中的表現。要注意的是,這個測試並沒有利用多CPU能力。具體來說,該工具對工作站處理人工智慧驅動的任務和工作流程的能力進行了基準測試,提供了對其處理複雜人工智慧演算法和應用程式的效率和速度的詳細評估。
對於此測試,我們使用 Procyon V2.7.0。在此測試中,時間越短越好。在所有節點中,MobileNet V3.91 的平均值為 3 毫秒,Resnet8.4.0 的平均值為 50 毫秒,而 Resnet29.47 的平均值為 30.96 毫秒。在其餘分數上,我們在 DeepLab V3 上看到 44.68 毫秒,在 YOLO V3 上看到 2008.65 毫秒,在 Real-ESRGAN 上看到 133.5 毫秒。總體得分,節點平均分為 XNUMX。
UL Procyon 電腦視覺 (平均推理時間) |
節點1 | 節點2 | 節點3 | 節點4 | 中等 |
---|---|---|---|---|---|
移動網V3 | 3.87毫秒 | 3.94毫秒 | 3.84毫秒 | 4.00毫秒 | 3.91毫秒 |
殘差網絡50 | 8.47毫秒 | 8.45毫秒 | 8.23毫秒 | 8.46毫秒 | 8.40毫秒 |
盜夢空間V4 | 29.76毫秒 | 29.55毫秒 | 28.74毫秒 | 29.84毫秒 | 29.47毫秒 |
深實驗室V3 | 30.39毫秒 | 30.21毫秒 | 33.18毫秒 | 30.07毫秒 | 30.96毫秒 |
優洛V3 | 44.71毫秒 | 44.58毫秒 | 44.79毫秒 | 44.63毫秒 | 44.68毫秒 |
真實ESRGAN | 2003.18毫秒 | 1971.97毫秒 | 2018.26毫秒 | 2041.18毫秒 | 2008.65毫秒 |
總體得分 | 134 | 134 | 133 | 133 | 133.5 |
結論
Dell PowerEdge C6615 節點提供單一 AMD EPYC CPU(最多 64 個核心)和六個支援 5GB DIMM 的 DDR96 插槽。容納這些節點的 C6600 機箱提供了一些儲存配置。我們的評測系統具有 8 個 E3.S Gen5 SSD 背板。在 C6600 設計中,每個節點都可以存取其中兩個 SSD;機箱僅提供電源和對驅動器的直接電纜存取。對於管理,每個 C6615 提供 iDRAC;機箱沒有任何專門的管理。
我們在效能測試中獨立評估了每個 C6615 節點的功能,並對所有四個節點的得分進行平均,以識別效能異常。效能數據強調節點的效能一致,沒有異常值或效能不均勻。這種可預測性對於服務提供者和超大規模客戶來說至關重要,他們可以從此類密集系統中受益。
我們發現該系統針對其預期用例進行了精心設計;我們唯一的抱怨是 Gen5 SSD 支援相對有限——每個節點只有兩個驅動器。戴爾可能會建議計算密集型客戶不需要太多的本地存儲,並且冷卻更多Gen5 驅動器是一項嚴峻的技術挑戰,他們可能是對的,我們只是在幾乎每一次機會中更喜歡更多的驅動器而不是更少的驅動器。另外值得一提的是,我們正在此處評測 C6615,但正如本評測頂部所示,戴爾確實為該平台提供了其他節點類型,基於英特爾的 C6620 提供液冷版本,其中一些可能會覺得引人注目。
Dell PowerEdge C6615 運算節點為服務供應商提供了令人驚嘆的每機架U 效能組合。 ,從而實現擴展靈活性。將出色的設計與 iDRAC 和 OpenManage Enterprise 等管理軟體結合,我們非常喜歡最終結果。
參與 StorageReview
電子通訊 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱