Vorige week bracht Intel hun 3e generatie Xeon-CPU's, dat voortbouwt op hun ecosysteemspel met Optane SSD-opslag in de P5800X en natuurlijk het nieuwste Permanente geheugenmodules uit de 200-serie (PMem). Nu onze eerste beoordelingen van Intel-opslag beschikbaar waren, hebben we besloten om de Intel-server en opslagtechnologie die we in het lab hebben opnieuw te gebruiken. We hebben Windows Server 2019 geïnstalleerd om Optane PMem 200, Optane P5800X SSD en TLC NAND te testen P5510 SSD's kop aan kop. Het doel van deze recensie is om de Intel-opslagprestaties in Windows Server te evalueren, zodat we beter kunnen begrijpen waar de sterke punten van elk van deze technologieën liggen in een bare metal-scenario.
Vorige week bracht Intel hun 3e generatie Xeon-CPU's, dat voortbouwt op hun ecosysteemspel met Optane SSD-opslag in de P5800X en natuurlijk het nieuwste Permanente geheugenmodules uit de 200-serie (PMem). Nu onze eerste beoordelingen van Intel-opslag beschikbaar waren, hebben we besloten om de Intel-server en opslagtechnologie die we in het lab hebben opnieuw te gebruiken. We hebben Windows Server 2019 geïnstalleerd om Optane PMem 200, Optane P5800X SSD en TLC NAND te testen P5510 SSD's kop aan kop. Het doel van deze recensie is om de Intel-opslagprestaties in Windows Server te evalueren, zodat we beter kunnen begrijpen waar de sterke punten van elk van deze technologieën liggen in een bare metal-scenario.
Optane PMem versus Optane SSD versus NAND SSD
Er zijn nog steeds een aantal vragen over welke opslagtechnologie geschikt is voor een bepaalde toepassing of gebruikssituatie, ondanks de al lang geliefde opslagpiramide van Intel. Tuurlijk, DRAM is de snelste, maar helaas ook duur. Optane PMem kan worden gebruikt als DRAM en biedt blijvende opslag die bij het opnieuw opstarten niet opnieuw hoeft te worden gehydrateerd. PMem maakt ook gebruik van traditionele DIMM-slots, dus het is gemakkelijk om binnen te komen. PMem heeft ook een indrukwekkend prestatieprofiel in vergelijking met traditionele SSD's.
Dan heb je natuurlijk Optane SSD's, die zijn geoptimaliseerd om schrijfbewerkingen te absorberen, een taak waar traditionele SSD's moeite mee hebben. Dit is de reden waarom ze doorgaans worden gebruikt als onderdeel van een meerlaagse opslagarchitectuur als een cache of een gelaagde pool. Optane SSD's zijn echter duurder dan TLC NAND SSD's en hebben een enorm capaciteitsnadeel, de P5800X komt bijvoorbeeld uit op 1.6 TB.
Verderop hebben we TLC SSD's, zoals de Intel P5510, wat past bij de goede plek voor prestaties per dollar. Ten slotte hebben we in het flash-rijk QLC SSD's. Deze bieden de grootste capaciteit en waarde per terabyte, maar geven er de voorkeur aan zich in een leesintensieve omgeving te bevinden, nog beter als ze zich achter een cache of laag bevinden die schrijfbewerkingen verzamelt en op een zachte en liefdevolle manier naar de QLC SSD's levert. Van daaruit gaat de opslagpiramide over in een moeras van harde schijven, tapedrives en permutaties van cloudopslag.
Intel-opslagprestaties in Windows Server
Om de prestaties van deze nieuwste Intel-opslagtechnologieën te evalueren, wilden we een situatie met zo min mogelijk overhead, terwijl we toch goede ondersteuning vonden voor specifiek PMem en onze bestaande testmethodologie. De eerste kandidaat is Microsoft Windows Server 2019. We testen op een Intel OEM-server die is ontworpen om de nieuwste platformtechnologieën zoals 3e generatie Xeon, PMem 200 en de ondersteuning voor PCIe Gen4-opslag te demonstreren.
Intel OEM-serverspecificaties
- 2 x Intel Xeon Platinum 8380 @ 2.3 GHz 40 cores
- 16x 32GB DDR4 3200MHz
- 16 x 128 GB Intel Persistent Memory 200-serie
- Opstart-SSD: Intel 1TB SATA
- Besturingssysteem: Windows Server 2019
Enterprise synthetische werklastanalyse
Ons benchmarkproces voor gedeelde opslag voor ondernemingen preconditioneert elk apparaat in een stabiele toestand met dezelfde werkbelasting waarmee het apparaat zal worden getest onder een zware belasting van 16 threads met een uitstekende wachtrij van 16 per thread, en vervolgens getest in vaste intervallen in meerdere threads/wachtrijen diepteprofielen om de prestaties bij licht en zwaar gebruik weer te geven. Aangezien we een kleine 20% opslagruimte op elk apparaat testen, zetten we alleen de belangrijkste onderdelen van elke test in kaart.
Voorconditionering en primaire steady-state tests:
- Doorvoer (lezen+schrijven IOPS aggregaat)
- Gemiddelde latentie (lees- en schrijflatentie samen gemiddeld)
- Maximale latentie (piek lees- of schrijflatentie)
- Latentie Standaarddeviatie (Lezen + Schrijven Standaarddeviatie samen gemiddeld)
Onze Enterprise Synthetic Workload Analysis omvat vier profielen op basis van real-world taken, met een 1T/1Q 4K-workload om zich te concentreren op prestaties bij lage belasting. Deze profielen zijn ontwikkeld om het gemakkelijker te maken om te vergelijken met onze eerdere benchmarks en met algemeen gepubliceerde waarden zoals max. 4k lees- en schrijfsnelheid en 8k 70/30, wat vaak wordt gebruikt voor zakelijke schijven.
- 4K 1T/1Q
- 100% lezen of 100% schrijven
- 100% 4K
- 4K 16T/16Q
- 100% lezen of 100% schrijven
- 100% 4K
- 8K 70/30
- 70% lezen, 30% schrijven
- 100% 8K
- 8K (opeenvolgend)
- 100% lezen of 100% schrijven
- 100% 8K
- 128K (opeenvolgend)
- 100% lezen of 100% schrijven
- 100% 128K
Voor onze tests hebben we gekeken naar drie opslagconfiguraties binnen het Intel 3e generatie serverplatform. Deze omvatten het volgende:
- 16 x 128 GB Intel Persistent Memory 200 Series in twee naamruimten (elk met ongeveer 1 TB opslagruimte)
- 2 x 800 GB Intel P5800X Optane SSD's
- 8 x 7.68 TB Intel P5510 SSD's
Elke apparaatgroep of naamruimte is rechtstreeks getest met een FIO-taak, waarbij een voetafdruk van 20% apparaatcapaciteit werd gebruikt om duurzame prestaties te meten. Elk apparaat per groep kreeg zijn eigen taak en de resultaten werden geaggregeerd. Voor twee apparaten die worden getest, kreeg elk bijvoorbeeld een 1T/1Q-workload, dus twee threads op 1 wachtrij in totaal voor die workload. Acht apparaten zouden in totaal acht threads in één wachtrij zijn, enzovoort.
In onze eerste test hebben we ons gericht op een enkele thread, een enkele wachtrijdiepte en 4K willekeurige lees- en schrijfwerklast. Off-the-line prestaties zijn belangrijk voor veel toepassingen, omdat sommige apparaten geen grote wachtrijdiepte van I/O achter zich nodig hebben om te schitteren.
Intel PMem toonde significante voordelen op het gebied van leesprestaties en meet bijna het dubbele in vergelijking met dubbele Intel P5800X SSD's of acht Intel P5510 SSD's. Kijkend naar de schrijfprestaties, had PMem nog steeds een voorsprong op de P5800X SSD's, maar acht P5510-schijven konden een hogere doorvoer leveren.
Vervolgens kijken we naar de gemiddelde latentie-impact van onze 1T/1Q 4K lees- en schrijftest.
Intel PMem mat 10 microseconden latentie in 4K random read, gevolgd door de P5800X met 24 microseconden en de P5510 SSD's met 81 microseconden. Kijkend naar schrijflatentie zagen we 11 microseconden van PMem, 23 van de P5800x SSD's en 27 ms van de P5510 SSD's.
We gaan naar een zwaardere vorm van dezelfde 4K lees- en schrijftest en kijken waar elk apparaattype uitkwam.
De groep van acht Intel P5510 SSD's bood de meeste leesdoorvoer met bijna 4.8 miljoen IOPS, gevolgd door PMem met 3.2 miljoen IOPS en de dubbele P5800X SSD's met 1.7 miljoen IOPS. Bij willekeurig schrijven in 4K hadden de twee P5800X SSD's de leiding met 1.91 miljoen IOPS, gevolgd door de acht P5510 SSD's met 1.78 miljoen IOPS en de twee PMem-naamruimten met 1.35 miljoen IOPS.
Hoewel doorvoer belangrijk is, is een van de meest interessante aspecten van Optane, zowel als PMem als SSD, hoe goed het omgaat met opslaglatentie. We zien dit ook doorkomen in onze zwaardere 4K willekeurige lees- en schrijfwerklast.
Intel PMem had de laagste leeslatentie van 159 microseconden, gevolgd door de twee P5800X SSD's met 296 microseconden en de acht P5510 SSD's aan de achterkant met 427 microseconden. Schrijflatentie had de twee P5800X SSD's aan de leiding met 265 microseconden, met PMem achterstand met 377 microseconden, en de acht traditionele P5510 SSD's met 1.147ms.
Als we de blokgrootte verhogen naar onze 8K 70/30-workload, kijken we naar de drie verschillende opslagtypen en hoe ze reageren op een steeds groter wordend aantal threads en wachtrijen.
Qua topprestaties heeft de groep van acht Intel P5510 SSD's echt de benen gestrekt en een aantal indrukwekkende piekcijfers neergezet. Aan de top was het maximaal met 4.34 miljoen IOPS bij 16T/16Q, hoewel het interessant is om te zien waar PMem en de twee P5800X een beetje vooruit konden springen op sommige van de lagere threads en wachtrijpunten.
Als we de focus verleggen naar gemiddelde latentie, zien we een ander beeld over de verschillende soorten opslag. Intel PMem, hoewel het niet de hoogste doorvoer had, kon voorbij komen met een van de laagste gemiddelde latentie in deze test, op de voet gevolgd door de P5800X SSD's. De acht P5510 SSD's hebben een veel hoger (relatief) latentieniveau dan de twee Optane-technologieën, ook al boden ze verreweg de hoogste doorvoer.
Vervolgens gaan we over naar onze sequentiële workloads, eerst beginnend met onze 8K-overdrachtsgrootte.
De groep van acht Intel P5510 SSD's overtrof deze test gemakkelijk met 4.45 miljoen IOPS, gevolgd door PMem met 1.92 miljoen IOPS, gevolgd door de twee P5800X SSD's met 1.71 miljoen IOPS. Bij schrijven kwam PMem bovenaan met 1.75 miljoen IOPS, gevolgd door de acht P5510 SSD's met 1.55 miljoen IOPS, gevolgd door de twee P5800X SSD's met 1.18 miljoen IOPS.
In onze laatste test kijken we naar de piekbandbreedte van de drie verschillende opslagmedia. Met beide U.2-apparaattypen komt een deel van de beperkte top-end voort uit het aantal rijstroken voor elke implementatie.
Beginnend bovenaan in leesbandbreedte kwamen de acht P5510's binnen met een indrukwekkende 54GB/s, gevolgd door PMem met twee naamruimten die 44GB/s bieden, en de twee P5800X SSD's volgden met 14GB/s lezen. Het is interessant om te zien hoe hoog PMem kan gaan als het gaat om bandbreedte. Bij het overschakelen naar schrijven met grote blokken kwamen de acht P5510 SSD's bovenaan met 32.7 GB/s, gevolgd door PMem met 14.3 GB/s en vervolgens de twee P5800X SSD's met 11.1 GB/s. Al met al zeer indrukwekkende cijfers over de hele linie.
Conclusie
Intel heeft de afgelopen jaren hard gewerkt met Optane met zowel de PMem- als SSD-varianten. Het is duidelijk dat deze opslagtechnologie van fundamenteel belang voor hen is, aangezien ze een uitgebreid Intel-platformverhaal samenvoegen in een poging om AMD in het datacenter af te weren. En voor bedrijfskritische workloads bevestigen de resultaten dit. Voor opslaglagen zit de P5800X netjes bovenaan de NVMe-apparaathiërarchie, met een gigantische prestatieverbetering ten opzichte van het model van de vorige generatie, grotendeels dankzij PCIe Gen4. Deze boost is zelfs zo groot dat het in de buurt begint te komen van de doorvoer, maar niet van de bandbreedte, aangeboden door PMem.
Tijdens onze tests zagen we precies wat we verwachtten te zien. PMem toonde een enorme prestatiewaarde als het gaat om latentie en doorvoer bij lage wachtrijdieptes. Het biedt ook enorme bandbreedtewinsten in leesprestaties. De P5800X Optane SSD, zelfs in implementaties van twee, begint over de hele linie heel dicht bij PMem te komen. Hierdoor kan de P5800X een fantastische combinatie zijn met TLC- of QLC-schijven in een oplossing die ze kan gebruiken als cache of laag.
Waar we ook kijken naar het Intel Gen3 Xeon-platform, er is veel om van te houden als het om opslag gaat. Onze bevindingen worden benadrukt door PMem's immense leesbandbreedte van meer dan 44 GB/s lezen, en 10 microseconden latentie in 4K willekeurige lees- en schrijfworkloads met lage wachtrijdiepte. De P5800X biedt vergelijkbare latentievoordelen, met een groter bereik in de meer gebruikelijke U.2-bay, die ruwweg het dubbele van de latentie van Intel PMem meet bij een laag aantal wachtrijen en threads. Zelfs de P5510 SSD's toonden hun kracht als het ging om werklasten in hogere wachtrijen, met topcijfers in sequentiële of willekeurige IO-benchmarks.
Het komt erop neer dat de laatste ronde Intel-opslagapparaten, zowel PMem als SSD's, aanzienlijke vooruitgang hebben geboekt in vergelijking met de producten van de vorige generatie. Dit geldt vooral nu Intel de snellere BUS voor DRAM en de PCIe Gen4-slots kan leveren. Met deze bare metal-gegevens kunnen we de specifieke plekken zien waar elke technologie uitblinkt. Door deze gegevens te begrijpen, kunnen systeembouwers op intelligente wijze platforms ontwerpen die elke toepassing kunnen laten uitblinken.
Neem contact op met StorageReview
Nieuwsbrief | YouTube | LinkedIn | Instagram | Twitter | Facebook | TikTok | RSS Feed