Start Unternehmen Testbericht zum Dell EMC PowerEdge C6525 Server

Testbericht zum Dell EMC PowerEdge C6525 Server

by Adam Armstrong
Dell EMC PowerEdge c6525 Server

Der Dell EMC PowerEdge C6525 ist ein 2U-Server, der speziell für den Bedarf an hochleistungsfähigen Umgebungen mit dichtem Computing, wie z. B. HPC-Workloads, entwickelt wurde. Da der Name/die Nummer auf eine „5“ endet, bedeutet dies, dass es sich beim C6525 um einen AMD EPYC-basierten Server handelt, der beides unterstützt 7002 und 7003. Letzteres geht mit höherer Leistung (mehr Kerne und Threads), mehr RAM-Kapazität und PCIe-Gen4-Fähigkeiten einher. Der C6525 verfügt über vier Knoten, die jeweils zwei AMD EPYC-CPUs für insgesamt 512 Kerne, 1024 Threads und bis zu 8 TB Speicher im 2U-Cluster ermöglichen.

Der Dell EMC PowerEdge C6525 ist ein 2U-Server, der speziell für den Bedarf an hochleistungsfähigen Umgebungen mit dichtem Computing, wie z. B. HPC-Workloads, entwickelt wurde. Da der Name/die Nummer auf eine „5“ endet, bedeutet dies, dass es sich beim C6525 um einen AMD EPYC-basierten Server handelt, der beides unterstützt 7002 und 7003. Letzteres geht mit höherer Leistung (mehr Kerne und Threads), mehr RAM-Kapazität und PCIe-Gen4-Fähigkeiten einher. Der C6525 verfügt über vier Knoten, die jeweils zwei AMD EPYC-CPUs für insgesamt 512 Kerne, 1024 Threads und bis zu 8 TB Speicher im 2U-Cluster ermöglichen.

Da es sich bei diesem Server um eine C-Serie handelt, ist er auf die Cloud ausgerichtet. Ein Großteil des Geheimnisses dieses Servers liegt im Design der Hardware. Wir werden uns das in unserem Abschnitt „Design und Bau“ genauer ansehen. Aber kurz gesagt: Dell Technologies konnte innerhalb dieses 2U-Formfaktors vier Knoten einbauen, die jeweils zwei AMD EPYC-CPUs oder insgesamt acht haben können. Dies führt zwar zu einer sehr hohen Rechenleistung (ideal für digitale Fertigung, Forschung und Web-Technologie), kann jedoch andere Optionen wie den Gesamtspeicher einschränken. Bei den gegebenen Anwendungsfällen ist dies jedoch weniger problematisch.

Dell EMC PowerEdge c6525 Server

Wie alles, was mit Dell zu tun hat, verfügt auch der Dell EMC PowerEdge C6525 über hervorragende Sicherheits- und Verwaltungsoptionen, einschließlich der Verwendung von Dell EMC OpenManage, iDRAC und sogar vSphere. Die Sicherheit wird durch den Einsatz von AMD Secure Memory Encryption (SME) und Secure Encrypted Virtualization (SEV) weiter erhöht. Der Server nutzt die Siliziumwurzel des Vertrauens und sorgt mit digital signierten Firmware-Paketen für die Sicherheit der Server-Firmware.

Technische Daten des Dell EMC PowerEdge C6525

Prozessor Ein oder zwei AMD EPYC-Prozessoren der 2. oder 3. Generation pro Knotenkonfiguration mit bis zu 64 Kernen pro Prozessor und bis zu 280 W (TDP)
Memory Bis zu 16 x DDR4
RDIMM 2 TB max
LRDIMM 2 TB max
Bandbreite bis zu 3200 MT/S
Verfügbarkeit Redundante Hot-Plug-Festplatten, Lüfter, Netzteile
Regler HW-RAID: PERC 10.4-Port für H745-, H345-, HBA345-Chipsatz
SW-RAID (S150): Ja
Laufwerkseinschübe 2.5-Zoll-Direct-Backplane-Konfiguration mit bis zu 6 SAS/SATA-Laufwerken pro Knoten, bis zu 24 pro Gehäuse
2.5-Zoll-NVMe-Backplane-Konfiguration mit bis zu 2 NVMe-Laufwerken und 4 SAS/SATA-Laufwerken pro Knoten. Insgesamt bis zu 24 Laufwerke pro Gehäuse
3.5-Zoll-Direct-Backplane-Konfiguration mit bis zu 3 SAS/SATA-Laufwerken pro Knoten, bis zu 12 pro Gehäuse
Intern: microSD-Karte | M.2 SATA BOSS 1.0
Stromversorgungen Duales Hot-Plug-fähiges, redundantes 2000-W- und 2400-W-Wechselstromnetzteil
Duales Hot-Plug-fähiges, redundantes 2000-W-AC/DC-Mixmode-Netzteil
Kühloptionen: Luftkühlung, direkte Flüssigkeitskühlung (DLC)
Ventilatoren Hot-Plug-Lüfter
Abmessungen Höhe: 86.8 mm (3.4 Zoll)
Breite: 448.0 mm (17.6")
Tiefe: 790.0 mm (31.1 Zoll)
Gewicht: 45.53 kg (100.3 lbs) 3.5-Zoll-Direkt-Backplane-Chassis
41.5 kg (91.4 lbs) 2.5-Zoll-Direkt-/NVMe-Backplane-Chassis
35.15 kg (77.4 lbs), kein Backplane-Chassis
Rack-Einheiten 2HE/4N-Rack-Server
Eingebettete Verwaltung. iDRAC9
iDRAC RESTful API mit RedfishiDRAC Direct
Eingebettete Netzwerkkarte Einzelport 1GbE LOM
Netzwerkoptionen (NDC) 1x OCP 3.0
GPU-Optionen 1x Single-Wide-GPU
Ports Hintere Anschlüsse:
1 x iDRAC Direct Micro-USB-Anschluss
1 x Mini-Display-Anschluss
1 x iDRAC- oder NIC-Port
1 x USB-Port 3.0
PCIe 2x PCIe x16 Gen4-Riser
1x OCP 3.0 x16 Gen4
1x PCIe x8 Gen3 M.2-Riser
Betriebssysteme und Hypervisoren Kanonischer Ubuntu-Server LTS
CentOS basierend auf dem RHEL 8.0-Kernel
Citrix Hypervisor
Microsoft Windows Server mit Hyper-V
Red Hat Enterprise Linux
SUSE Linux Enterprise-Server
VMware ESXi

Dell EMC PowerEdge C6525 Design und Bau

Wie bereits erwähnt handelt es sich beim Dell EMC PowerEdge C6525 um einen 2U-Server. Abhängig von der Konfiguration verfügt die Vorderseite des Servers entweder über 24 2.5-Zoll-Schächte oder 12 3.5-Zoll-Schächte. Auf beiden Seiten befindet sich ein Bedienfeld mit Funktionen wie einem Netzschalter und LED-Anzeigen. Auf der rechten Seite befindet sich ein Informationsschild.

Wenn wir den Server nach hinten drehen, können wir die vier Knoten sehen. Jeder verfügt oben über zwei PCIe-Steckplätze, einen Schlittenentriegelungsgriff in der Mitte und ein Schloss auf der rechten Seite. Unten rechts an jedem Schlitten befindet sich außerdem ein OCP 3.0 SFF-Kartensteckplatz. Für die Konnektivität gibt es einen USB 3.0-Anschluss, einen iDRAC- oder NIC-Anschluss, einen Mini-Display-Anschluss und einen iDRAC Direct Micro-USB-Anschluss. Der Schlitten verfügt außerdem über eine Systemidentifikations-LED und ein EST-Tag.

Wenn wir einen Schlitten herausziehen, können wir die beiden Prozessoren und den umgebenden RAM sehen. Zwischen den CPUs befindet sich ein Luftgehäuse. In der Nähe der CPUs befindet sich ein M.2-Riser für Startlaufwerke, ohne dass die Nutzung der vorderen Laufwerksschächte beeinträchtigt wird.

Dell EMC PowerEdge c6525 Hot-Swap

Dell EMC PowerEdge C6525-Verwaltung

Wir haben iDRAC in der Vergangenheit mehrmals behandelt und sind dabei hier sehr ausführlich. Wir haben iDRAC auch für die Verwaltung des Dell EMC PowerEdge C6525 verwendet. Jeder Knoten wird einzeln verwaltet, ohne große Kenntnis der umliegenden Knoten oder Gehäuse. Dies steht im Gegensatz zu Plattformen wie dem Dell EMC FX2, die diese Ebene enthalten. Für diese Anwendung spielt es keine so große Rolle, wenn die Knoten keine gemeinsamen Ressourcen haben.

Bei gemeinsam genutzten Hardwareelementen wie Lüftersteuerungen gewinnt der Knoten mit der höchsten Nachfrage hinsichtlich des Kühlprofils. Wenn ein Knoten heiß ist, drei aber kühl sind, reagiert das Gehäuse so, als wären alle Knoten heiß. An erster Stelle steht das Dashboard. Hier erhalten Benutzer einen schnellen Überblick über alles, einschließlich Systemhilfe, Informationen, Aufgabenzusammenfassungen und aktuelle Protokolle. Hier finden Sie auch die Möglichkeit, den Server ordnungsgemäß herunterzufahren.

Unter der Registerkarte „System“ können wir uns die verschiedenen Komponenten ansehen. Wenn wir auf CPUs/Beschleuniger klicken, können wir sehen, welche CPUs wir auf jedem Knoten ausführen (in diesem Fall AMD EPYC 7452).

Ein wichtiger Aspekt von PowerEdge-Servern ist ihre Fähigkeit, kühl zu bleiben und gleichzeitig leistungsstarke Teile zu betreiben, die Wärme erzeugen. Obwohl er für maximale Leistung eingerichtet werden kann, muss der Server nicht immer auf diese Weise betrieben werden. Stattdessen können Benutzer in die Konfiguration gehen und die Kühlkonfiguration an ihre Bedürfnisse anpassen.

Eine Möglichkeit, mit der Dell die Verwaltung seiner Plattformen vereinfacht, besteht darin, mithilfe von iDRAC Änderungen auf BIOS-Ebene an jedem Knoten vorzunehmen, ohne manuell in das BIOS selbst gehen zu müssen. Sobald die Änderungen geplant sind, werden sie beim nächsten Neustart wirksam.

Leistung des Dell EMC PowerEdge C6525

Dell EMC PowerEdge C6525-Konfiguration, 4 Knoten mit jeweils:

Sysbench MySQL-Leistung

Unser erster Benchmark für lokale Speicheranwendungen besteht aus einer Percona MySQL OLTP-Datenbank, die über SysBench gemessen wird. Dieser Test misst die durchschnittliche TPS (Transaktionen pro Sekunde), die durchschnittliche Latenz und auch die durchschnittliche 99. Perzentil-Latenz.

Jede Sysbench-VM ist mit drei vDisks konfiguriert: eine für den Start (~92 GB), eine mit der vorgefertigten Datenbank (~447 GB) und die dritte für die zu testende Datenbank (270 GB). Aus Sicht der Systemressourcen haben wir jede VM mit 16 vCPUs und 60 GB DRAM konfiguriert und den LSI Logic SAS SCSI-Controller genutzt.

Sysbench-Testkonfiguration (pro VM)

  • CentOS 6.3 64-Bit
  • Percona XtraDB 5.5.30-rel30.1
    • Datenbanktabellen: 100
    • Datenbankgröße: 10,000,000
    • Datenbankthreads: 32
    • RAM-Puffer: 24 GB
  • Testdauer: 3 Stunden
    • 2 Stunden Vorkonditionierung von 32 Threads
    • 1 Stunde 32 Threads

Mit dem Sysbench OLTP sahen wir einen Gesamtwert von 49,701 TPS, wobei einzelne Knoten einen Gesamtwert zwischen 12,170 TPS und 12,606 TPS erreichten. Selbst ohne Top-CPUs und eine bescheidene Menge DRAM bot der Dell EMC C6525 eine enorme Leistung auf einer 2U-Grundfläche.

Bei der durchschnittlichen Latenz betrug die Gesamtsumme 10.3 ms, wobei einzelne Knoten zwischen 10.15 ms und 10.51 ms erreichten.

Für unser Worst-Case-Szenario betrug die Latenz (99. Perzentil) des C6525 insgesamt nur 18.3 ms, wobei einzelne Knoten 18.01 ms bis 18.8 ms erreichten.

VDBench-Workload-Analyse

Wenn es um das Benchmarking von Speicher-Arrays geht, sind Anwendungstests am besten und synthetische Tests stehen an zweiter Stelle. Obwohl sie keine perfekte Darstellung der tatsächlichen Arbeitslasten darstellen, helfen synthetische Tests dabei, Speichergeräte mit einem Wiederholbarkeitsfaktor zu vergleichen, der es einfach macht, Konkurrenzlösungen direkt miteinander zu vergleichen.

Diese Workloads bieten eine Reihe unterschiedlicher Testprofile, die von „Vier-Ecken“-Tests über allgemeine Tests der Datenbankübertragungsgröße bis hin zu Trace-Erfassungen aus verschiedenen VDI-Umgebungen reichen. Alle diese Tests nutzen den gemeinsamen vdBench-Workload-Generator mit einer Skript-Engine, um Ergebnisse über einen großen Computing-Testcluster zu automatisieren und zu erfassen. Dadurch können wir dieselben Arbeitslasten auf einer Vielzahl von Speichergeräten wiederholen, einschließlich Flash-Arrays und einzelnen Speichergeräten.

Profile:

  • 4K Random Read: 100 % Read, 128 Threads, 0-120 % Iorate
  • 4K Random Write: 100 % Schreiben, 128 Threads, 0-120 % Iorate
  • 64K sequentielles Lesen: 100 % Lesen, 32 Threads, 0-120 % Leserate
  • 64K Sequentielles Schreiben: 100 % Schreiben, 16 Threads, 0-120 % Iorate
  • Synthetische Datenbank: SQL und Oracle
  • VDI-Vollklon- und Linked-Clone-Traces

Für die VDBench-Leistung schauen wir uns jeden Knoten und seine Leistung sowie die Gesamtheit an.

Beim zufälligen 4K-Lesevorgang zeigten alle Knoten mehr oder weniger die gleiche Leistung, wobei ein einzelner Knoten einen Spitzenwert von 1,320,861 IOPS bei einer Latenz von 191 µs erreichte. Die Summe aller Knoten würde etwa 5.2 Millionen IOPS betragen.

Beim 4K-Zufallsschreibvorgang waren die SSDs in jedem Knoten nicht so nah beieinander. Knoten 4 hatte mit 411,075 IOPS bei einer Latenz von 337 µs den höchsten Spitzenwert. Ein Spitzenaggregat liegt bei über 1.2 Millionen IOPS.

Als wir mit unseren 64K-Workloads auf sequentielles Arbeiten umstellten, sahen wir beim Lesen erneut, dass die Knoten viel näher beieinander liefen. Der höchste Spitzenwert eines einzelnen Knotens betrug etwa 107 IOPS oder 6.7 GB/s bei einer Latenz von 488 µs. Der Gesamtwert würde etwa 428 IOPS oder 26.8 GB/s betragen.

Bei 64K-Schreibvorgängen sehen wir erneut, dass die Leistung jedes Knotens auseinanderfällt. Der höchste Spitzenwert eines einzelnen Knotens ist wiederum Knoten 4 mit 38,504 IOPS oder 2.4 GB/s bei einer Latenz von 828 µs. Die Kombination aller Spitzenwerte ergibt 137 IOPS oder 8.5 GB/s.

Unsere nächste Testreihe sind unsere SQL-Workloads: SQL, SQL 90-10 und SQL 80-20. Beginnend mit SQL lagen alle vier Knoten auf dem Dell EMC PowerEdge C6525 wieder sehr nahe beieinander. Der höchste Einzelknoten-Spitzenwert betrug 409,064 IOPS bei 157 µs. Ein aggregierter Spitzenwert lässt die IOPS auf über 1.6 Millionen steigen.

Mit SQL 90-10 reisten die Knoten mehr oder weniger gemeinsam bis zum Ende, wo Knoten 4 mit einem Spitzenwert von 391,425 IOPS bei einer Latenz von 154 µs noch einmal die Nase vorn hatte. Die kombinierten Spitzen liegen bei über 1.5 Millionen IOPS.

Bei SQL 80-20 war die Leistung der Knoten etwas anders. Knoten 2 erreichte mit 340,626 IOPS bei einer Latenz von 176 µs den höchsten Wert. Zusammengenommen bringen alle Knoten eine Leistung von über 1.34 Millionen IOPS.

Als nächstes folgen unsere Oracle-Workloads: Oracle, Oracle 90-10 und Oracle 80-20. Beginnend mit Oracle waren die vier miteinander verfolgten Knoten in Ordnung, wobei die vertrauenswürdige Nummer 4 mit 327,398 IOPS und einer Latenz von 188 µs den höchsten Spitzenwert erreichte. Damit liegt die Gesamtleistung bei über 1.26 Millionen IOPS.

Bei Oracle 90-10 waren die Knoten größtenteils enger ausgerichtet, obwohl Knoten 4 mit 325,058 IOPS bei einer Latenz von 132 µs erneut den höchsten Wert erreichte. Die kombinierte Leistung beträgt über 1.25 Millionen IOPS.

Bei Oracle 80-20 sind die Knoten hier etwas weiter auseinanderliegend, fallen aber mehr oder weniger in die gleiche Linie. Knoten 4 liegt mit 297,033 IOPS an der Spitze. Die Gesamtleistung beträgt über 1.1 Millionen IOPS.

Als nächstes wechselten wir zu unserem VDI-Klontest „Full and Linked“. Beim VDI Full Clone (FC) Boot liefen alle vier Knoten ziemlich nah beieinander, wobei Knoten 4 den höchsten Wert von 312,464 IOPS und eine Latenz von 202 µs erreichte. Die Kombination der Spitzenwerte bringt uns auf über 1.2 Millionen IOPS.

Beim VDI FC Initial Login ist der Knoten hier am Ende wirklich auseinandergefallen. Knoten 4 hatte mit 84,792 IOPS bei einer Latenz von 449 µs den höchsten Spitzenwert. Die Gesamtleistung beträgt über 331 IOPS.

VDI FC Monday Login verzeichnete gegen Ende eine weitere Divergenz der Knotenleistung. Die Spitzenleistung eines einzelnen Knotens betrug 84,346 IOPS bei einer Latenz von 310 µs. Die Gesamtleistung betrug über 323 IOPS.

Beim VDI Linked Clone (LC) Boot liefen die Knoten in der Leistung erneut sehr nahe beieinander. Ein einzelner Knoten erreichte einen Spitzenwert von 158,820 IOPS bei einer Latenz von 196 µs. Die Gesamtleistung belief sich auf über 628 IOPS.

Bei der ersten Anmeldung bei VDI LC war gegen Ende ein kleiner Unterschied in der Knotenleistung festzustellen. Der Spitzenwert eines einzelnen Knotens betrug 48,484 IOPS bei einer Latenz von 272 µs. Die Gesamtleistung beläuft sich auf über 181 IOPS.

Schließlich haben wir beim VDI LC Monday Login gesehen, dass sich die Knoten in der Leistung unterscheiden. Die Spitzenleistung eines einzelnen Knotens lag bei etwa 53 IOPS und 450 µs. Die kombinierte Spitzenleistung betrug über 197 IOPS.

Fazit

Der Dell EMC PowerEdge C6525 ist ein 2U-Server, der für Cloud-Bereitstellungen gedacht ist. Der Server ist dicht, bietet vier Knoten und ist mit AMD EPYC-CPUs ausgestattet (der hier getestete). zweite Generation aber Dell bietet einen C6525 mit an EPYCs der dritten Generation auch) mit einer potenziellen Gesamtzahl von 512 Kernen und 1,024 Threads. Die CPUs ermöglichen insgesamt 2 TB DDR4 3200 MT/S-Speicher pro Knoten. Jeder Knoten kann zwei AMD EPYC-Prozessoren, zwei PCIe-Schächte, einen OCP 3.0-Steckplatz und eine integrierte m.2-SSD zum Booten beherbergen. Dies gilt für alle Arten von Datenverarbeitung, allerdings gibt es eine Grenze hinsichtlich der Menge an Speicher, die auf dem Server Platz findet. Bei einer 2.5-Zoll-Laufwerkgehäusekonfiguration können jedem Knoten sechs Laufwerke zugewiesen werden, von denen bis zu zwei NVMe-Laufwerke mit der entsprechenden Rückwandplatine sind.

Für die Anwendungsleistung haben wir uns VDBench angesehen. Wir haben beide einzelnen Knoten getestet und uns die Gesamtpunktzahl angesehen. Dadurch erhalten Benutzer eine Vorstellung davon, wie die einzelnen Teile funktionieren, sowie ein Bild der Gesamtleistung. In der Anwendungs-Workload-Analyse haben wir nur Sysbench ausgeführt. Im transaktionalen Bereich sahen wir einen Gesamtwert von 49,701 TPS. Bei der durchschnittlichen Latenz gab uns der Server eine Gesamtlatenz von 10.3 ms. In unserem Worst-Case-Szenario erreichte der C6525 einen Gesamtwert von nur 18.3 ms.

Für unseren VDBench ergab die Gesamtleistung der vier Knoten 5.2 Millionen IOPS beim 4K-Lesen, 1.2 Millionen IOPS beim 4K-Schreiben, 26.8 GB/s beim 64K-Lesen und 8.5 GB/s beim 64K-Schreiben. Bei unseren SQL-Workloads verzeichneten wir Höchstwerte von 1.6 Millionen IOPS, 1.5 Millionen IOPS in SQL 90–10 und 1.34 Millionen IOPS in SQL 80–20. In Oracle erreichte der gesamte Server über 1.26 Millionen IOPS, 1.25 Millionen IOPS in Oracle 90-10 und 1.1 Millionen IOPS in Oracle 80-20. Als nächstes folgten unsere VDI-Klontests, vollständig und verknüpft. Bei FC verzeichneten wir beim Booten 1.2 Millionen IOPS, beim ersten Login waren es etwa 331 IOPS und beim Montag-Login waren es etwa 323 IOPS. Beim LC-Start waren es etwa 628 IOPS, bei der ersten Anmeldung 181 IOPS und bei der Montag-Anmeldung 197 IOPS.

Wir haben uns auch die Leistung einzelner Knoten in VDBench angesehen, wobei einige Leistungsunterschiede festgestellt wurden. Bei der kleineren SSD-Gruppengröße sind die meisten dieser Abweichungen höchstwahrscheinlich auf die SSDs selbst zurückzuführen. Die Leistung eines einzelnen Knotens ergab 1.3 Millionen IOPS beim 4K-Lesen, 411K IOPS beim 4K-Schreiben, 6.7 GB/s beim 64K-Lesen und 2.4 GB/s beim 64K-Schreiben. Bei unseren SQL-Workloads sahen wir Höchstwerte von 409 IOPS, 391 IOPS in SQL 90–10 und 341 IOPS in SQL 80–20. In Oracle erreichte der gesamte Server über 327 IOPS, 325 IOPS in Oracle 90-10 und 297 IOPS in Oracle 80-20. Als nächstes folgten unsere VDI-Klontests, vollständig und verknüpft. Im FC haben wir beim Booten 312 IOPS gesehen, bei der ersten Anmeldung waren es etwa 85 IOPS und bei der Montag-Anmeldung waren es etwa 84 IOPS. Beim LC-Start waren es etwa 159 IOPS, bei der ersten Anmeldung 48 IOPS und bei der Montag-Anmeldung 53 IOPS.

Der Dell EMC PowerEdge C6525 ist ein 2-HE-Server mit hoher Dichte, der vier Knoten und bis zu acht AMD EPYC-Prozessoren aufnehmen kann. Der Server kann bei geringem Platzbedarf eine enorme Leistung erbringen, allerdings auf Kosten des Speichers. Letztendlich ist der C6525 auf rechenintensive Cloud-Anwendungsfälle ausgerichtet, die von dieser erstklassigen Kombination aus Leistung und Dichte profitieren können. Für diejenigen, die eine solche Kombination benötigen, ist der C6525 eine phänomenale Option.

Dell EMC PowerEdge

Beteiligen Sie sich an StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS Feed