Förra veckan släppte Intel sina 3:e generationens Xeon-processorer, som bygger på deras ekosystemspel som inkluderar Optane SSD-lagring i P5800X och såklart det senaste 200-seriens beständiga minnesmoduler (PMem). När våra första Intel-lagringsrecensioner var klara, bestämde vi oss för att återanvända Intel-servern och lagringstekniken vi har i labbet. Vi installerade Windows Server 2019 för att testa Optane PMem 200, Optane P5800X SSD och TLC NAND P5510 SSD huvud mot huvud. Syftet med den här recensionen är att utvärdera Intels lagringsprestanda i Windows Server så att vi bättre kan förstå var styrkorna hos var och en av dessa teknologier ligger i ett scenario av ren metall.
Förra veckan släppte Intel sina 3:e generationens Xeon-processorer, som bygger på deras ekosystemspel som inkluderar Optane SSD-lagring i P5800X och såklart det senaste 200-seriens beständiga minnesmoduler (PMem). När våra första Intel-lagringsrecensioner var klara, bestämde vi oss för att återanvända Intel-servern och lagringstekniken vi har i labbet. Vi installerade Windows Server 2019 för att testa Optane PMem 200, Optane P5800X SSD och TLC NAND P5510 SSD huvud mot huvud. Syftet med den här recensionen är att utvärdera Intels lagringsprestanda i Windows Server så att vi bättre kan förstå var styrkorna hos var och en av dessa teknologier ligger i ett scenario av ren metall.
Optane PMem vs. Optane SSD vs. NAND SSD
Det finns fortfarande ett antal frågor om vilken lagringsteknik som är rätt för en viss applikation eller användningsfall, trots den länge gynnade lagringspyramiden från Intel. Visst, DRAM är det snabbaste, men tyvärr är det dyrt också. Optane PMem kan användas som DRAM, vilket ger beständig lagring som inte behöver återfuktas vid omstart. PMem utnyttjar också traditionella DIMM-platser, så det är lätt att komma in. PMem har också en imponerande prestandaprofil jämfört med traditionella SSD-enheter.
Sedan har du såklart Optane SSD:er, som har optimerats för att absorbera skrivningar, ett jobb traditionella SSD:er kan kämpa med. Det är därför de vanligtvis används som en del av en lagringsarkitektur med flera nivåer som en cache eller nivåpool. Optane SSD är dock dyrare än TLC NAND SSD och har en enorm kapacitetsnackdel, P5800X toppar till exempel på 1.6 TB.
När vi går nedåt har vi TLC SSD:er, som intel P5510, vilket passar bra för prestanda per dollar. Slutligen i flashområdet har vi QLC SSD:er. Dessa erbjuder den största kapaciteten och värdet per terabyte, men föredrar verkligen att vara i en lästung miljö, ännu bättre om de ligger bakom en cache eller nivå som samlar skrivningar och levererar dem till QLC SSD:erna på ett skonsamt och kärleksfullt sätt. Därifrån övergår lagringspyramiden till en mängd hårddiskar, bandenheter och permutationer av molnlagring.
Intel Storage Performance i Windows Server
För att utvärdera prestandan för dessa senaste Intel-lagringsteknologier ville vi ha en situation med så lite overhead som möjligt, samtidigt som vi fortfarande hittade bra stöd för PMem specifikt, och vår befintliga testmetod. Den första kandidaten är Microsoft Windows Server 2019. Vi testar på en Intel OEM-server som designades för att visa upp de senaste plattformsteknologierna som 3:e generationens Xeon, PMem 200 och stödet för PCIe Gen4-lagring.
Intel OEM-serverspecifikationer
- 2 x Intel Xeon Platinum 8380 @ 2.3 GHz 40-kärnor
- 16 x 32 GB DDR4 3200MHz
- 16 x 128 GB Intel Persistent Memory 200-serien
- Boot SSD: Intel 1TB SATA
- OS: Windows Server 2019
Syntetisk arbetsbelastningsanalys för företag
Vår benchmarkprocess för delad lagring för företag förutsätter att varje enhet till steady-state med samma arbetsbelastning som enheten kommer att testas med under en tung belastning på 16 trådar med en utestående kö på 16 per tråd, och sedan testas i fastställda intervall i flera trådar/köer djupprofiler för att visa prestanda under lätt och tung användning. Eftersom vi testar ett litet lagringsutrymme på 20 % på varje enhet, ritar vi bara ut huvuddelarna av varje test.
Förkonditionering och primära stationära tester:
- Genomströmning (Read+Write IOPS Aggregate)
- Genomsnittlig fördröjning (läs+skrivfördröjning i medeltal)
- Max fördröjning (maximal läs- eller skrivfördröjning)
- Latens standardavvikelse (läs+skriv standardavvikelse i genomsnitt)
Vår Enterprise Synthetic Workload Analysis inkluderar fyra profiler baserade på verkliga uppgifter, med en 1T/1Q 4K-arbetsbelastning för att fokusera på låg belastningsprestanda. Dessa profiler har utvecklats för att göra det lättare att jämföra med våra tidigare riktmärken samt allmänt publicerade värden som max 4k läs- och skrivhastighet och 8k 70/30, som vanligtvis används för företagsenheter.
- 4K 1T/1Q
- 100% Läs eller 100% Skriv
- 100 % 4K
- 4K 16T/16Q
- 100% Läs eller 100% Skriv
- 100 % 4K
- 8K 70/30
- 70 % läser, 30 % skriver
- 100 % 8K
- 8K (sekventiell)
- 100% Läs eller 100% Skriv
- 100 % 8K
- 128K (sekventiell)
- 100% Läs eller 100% Skriv
- 100 % 128K
För våra tester tittade vi på tre konfigurationer av lagring inuti Intel 3rd Gen serverplattform. Dessa inkluderade följande:
- 16 x 128 GB Intel Persistent Memory 200 Series i två namnutrymmen (var och en med cirka 1 TB lagringsutrymme)
- 2 x 800 GB Intel P5800X Optane SSD
- 8 x 7.68 TB Intel P5510 SSD-enheter
Varje enhetsgrupp eller namnområde testades direkt med ett FIO-jobb, med en kapacitet på 20 % för att mäta ihållande prestanda. Varje enhet per grupp fick sitt eget jobb, och resultaten sammanställdes. Till exempel, för två enheter som testas fick var och en en arbetsbelastning på 1T/1Q, så två trådar med totalt 1 kö för den arbetsbelastningen. Åtta enheter skulle vara totalt åtta trådar i en kö och så vidare.
I vårt första test fokuserade vi på en enda tråd, enkel ködjup 4K slumpmässig läs- och skrivbelastning. Off-the-line prestanda är viktigt för många applikationer, eftersom vissa enheter inte behöver ett stort ködjup av I/O bakom dem för att lysa.
Intel PMem visade betydande fördelar i läsprestanda och mätte nästan dubbelt jämfört med dubbla Intel P5800X SSD:er eller åtta Intel P5510 SSD:er. När man tittar på skrivprestandan hade PMem fortfarande ett försprång jämfört med P5800X SSD, men åtta P5510-enheter kunde ge högre genomströmning.
Därefter tittar vi på den genomsnittliga latenseffekten av vårt 1T/1Q 4K läs- och skrivtest.
Intel PMem mätte 10 mikrosekunders latens i 4K slumpmässig läsning, följt av P5800X med 24 mikrosekunder och P5510 SSD:erna med 81 mikrosekunder. När vi tittade på skrivfördröjningen såg vi 11 mikrosekunder från PMem, 23 från P5800x SSD:erna och 27ms från P5510 SSD:erna.
Går vi upp till en tyngre form av samma 4K läs- och skrivtest, tittar vi på var varje enhetstyp toppade.
Gruppen med åtta Intel P5510 SSD:er erbjöd den mest lästa genomströmningen som mätte nästan 4.8 miljoner IOPS, följt av PMem med 3.2 miljoner IOPS och de dubbla P5800X SSD:erna med 1.7 miljoner IOPS. I 4K slumpmässig skrivning hade de två P5800X SSD:erna ledningen med 1.91M IOPS, följt av de åtta P5510 SSD:erna med 1.78M IOPS och de två PMem-namnområdena med 1.35M IOPS.
Även om genomströmningen spelar roll, är en av de mest intressanta aspekterna av Optane, både som PMem och SSD, hur väl den hanterar lagringslatens. Vi ser detta komma igenom i vår tyngre 4K slumpmässiga läs- och skrivbelastning också.
Intel PMem hade den lägsta läslatensen som mätte 159 mikrosekunder, följt av de två P5800X SSD:erna med 296 mikrosekunder, och de åtta P5510 SSD:erna på baksidan med 427 mikrosekunder. Skrivfördröjningen hade de två P5800X SSD:erna i ledningen med 265 mikrosekunder, med PMem efterföljande med 377 mikrosekunder, och de åtta traditionella P5510 SSD:erna med 1.147ms.
När vi flyttar upp blockstorleken till vår 8K 70/30-arbetsbelastning tittar vi på de tre olika lagringstyperna och hur de svarar på ett ständigt ökande antal trådar och köer.
När det gäller toppprestanda sträckte gruppen på åtta Intel P5510 SSD:er verkligen på benen och bjöd på några imponerande toppsiffror. På toppen maxade det med 4.34M IOPS vid 16T/16Q, även om det som är intressant är att se var PMem och de två P5800X kunde hoppa framåt något vid några av de nedre tråd- och köpunkterna.
Om vi växlar fokus till genomsnittlig latens ser vi en annan bild målad över de olika lagringstyperna. Intel PMem, även om det inte hade den högsta genomströmningen, kunde gnissla förbi med några av de lägsta genomsnittliga latensen i detta test, tätt följt av P5800X SSD:erna. De åtta P5510 SSD:erna med en mycket högre (relativt) latensnivå än de två Optane-teknikerna, även om de erbjöd den överlägset högsta genomströmningen.
Därefter går vi över till våra sekventiella arbetsbelastningar, först med vår 8K-överföringsstorlek.
Gruppen med åtta Intel P5510 SSD:er toppade enkelt detta test med 4.45M IOPS, följt av PMem med 1.92M IOPS, följt av de två P5800X SSD:erna med 1.71M IOPS. Skrivet kom PMem i toppen med 1.75 M IOPS, följt av de åtta P5510 SSD:erna med 1.55 M IOPS följt av de två P5800X SSD:erna med 1.18M IOPS.
I vårt senaste test tittar vi på toppbandbredd från de tre olika lagringsmedierna. Med båda U.2-enhetstyperna kommer en del av de begränsade topenderna från antalet körfält för varje distribution.
Med början på toppen i läsbandbredd kom de åtta P5510:orna in med imponerande 54GB/s, följt av PMem med två namnutrymmen som erbjuder 44GB/s, och de två P5800X SSD:erna efterföljande med 14GB/s läsning. Det är intressant att se hur högt PMem kan gå när det kommer till bandbredd. Byte till storblocksskrivning kom de åtta P5510 SSD:erna överst med 32.7 GB/s, följt av PMem med 14.3 GB/s, och sedan de två P5800X SSD:erna med 11.1GB/s. Sammantaget mycket imponerande siffror över hela linjen.
Slutsats
Intel har jobbat hårt med Optane under de senaste åren med både PMem- och SSD-varianterna. Det är tydligt att se att denna lagringsteknik är fundamentalt viktig för dem eftersom de väver ihop en omfattande Intel-plattformshistoria i ett försök att avvärja AMD i datacentret. Och för uppdragskritiska arbetsbelastningar bekräftar resultaten detta. När det gäller lagringsnivåer, sitter P5800X snyggt ovanpå NVMe-enhetshierarkin och ser en gigantisk ökning av prestanda jämfört med den tidigare generationens modell, till stor del tack vare PCIe Gen4. Denna ökning är så stor att den börjar närma sig genomströmningen, men inte bandbredden, som erbjuds av PMem.
Under hela vår testning såg vi exakt vad vi förväntade oss att se. PMem visade ett enormt prestandavärde när det gäller latens och genomströmning vid låga ködjup. Det ger också enorma bandbreddsvinster i läsprestanda. P5800X Optane SSD, även i installationer av två, börjar komma riktigt nära PMem över hela linjen. Detta gör att P5800X kan vara en fantastisk parning med TLC- eller QLC-enheter i en lösning som kan utnyttja dem som en cache eller nivå.
Oavsett var vi tittar på Intel Gen3 Xeon-plattformen finns det mycket att älska när det kommer till lagring. Våra resultat framhävs av PMems enorma läsbandbredd på 44 GB/s läsning och 10 mikrosekunders latens i 4K slumpmässiga läs- och skrivbelastningar med lågt ködjup. P5800X erbjuder liknande latensfördelar, med en bredare räckvidd i det vanligare U.2-facket, som mäter ungefär dubbelt så mycket latens som Intel PMem vid låga kö- och trådantal. Till och med P5510 SSD:erna visade sin styrka när det gällde högre arbetsbelastningar, och erbjöd toppsiffror i sekventiellt eller slumpmässigt IO-riktmärken.
Summan av kardemumman är att den senaste omgången av Intel-lagringsenheter, både PMem och SSD, har gjort betydande framsteg jämfört med föregående generations produkter. Detta gäller särskilt nu när Intel kan leverera den snabbare BUS för DRAM och PCIe Gen4-platserna. Med denna blotta metalldata kan vi se de specifika platserna där varje teknologi utmärker sig. Genom att förstå dessa data kan systembyggare på ett intelligent sätt designa plattformar som kan få alla applikationer att utmärka sig.
Engagera dig med StorageReview
Nyhetsbrev | Youtube | LinkedIn | Instagram | Twitter | Facebook | TikTok | Rssflöde