Memblaze heeft een serie 64-laags, 3D NAND NVMe SSD's uitgebracht in de PBlaze5 910-916-serie. De schijven zijn uitgebracht in zowel U.2- als AIC-vormfactoren, waarbij de 910 een capaciteit heeft van maximaal 15.36 TB. De versie met een hoger uithoudingsvermogen van de schijf is de 916. We hebben eerder de 916 U.2 SSD en richten zich nu op de beter presterende HHHL AIC-versie.
Memblaze heeft een serie 64-laags, 3D NAND NVMe SSD's uitgebracht in de PBlaze5 910-916-serie. De schijven zijn uitgebracht in zowel U.2- als AIC-vormfactoren, waarbij de 910 een capaciteit heeft van maximaal 15.36 TB. De versie met een hoger uithoudingsvermogen van de schijf is de 916. We hebben eerder de 916 U.2 SSD en richten zich nu op de beter presterende HHHL AIC-versie.
De Memblaze PBlaze5 916 AIC SSD wordt geleverd met alle voordelen van de U.2-versie, waaronder AES 256-gegevenscodering, volledige gegevenspadbeveiliging en verbeterde stroomuitvalbeveiliging. De 916-versies hebben ook een groter uithoudingsvermogen en ondersteunen 3 DWPD versus de 910 die slechts 1 DWPD ondersteunt. De 916 AIC maakt gebruik van de vier extra rijstroken om nog betere prestaties te leveren met vermelde snelheden tot 5.9 GB/s voor lezen en 2.8 GB/s voor schrijven met een doorvoer van maar liefst 1 miljoen IOPS voor lezen en 303K IOPS voor schrijven.
De Memblaze PBlaze5 916 AIC SSD komt in zowel 3.2TB als 6.4TB, voor deze review kijken we naar de 6.4TB versie.
Memblaze PBlaze5 916-serie AIC-specificaties
Gebruikerscapaciteit (TB) | 3.2, 6.4 |
Form Factor | HHHL AIC |
Interface: | PCIe 3.0 x 8 |
Sequentieel lezen (128 KB) (GB/s) | 5.5, 5.9 |
Opeenvolgend schrijven (128 KB) (GB/s) | 3.1, 3.8 |
Aanhoudend willekeurig lezen (4KB) IOPS | 850K, 1,000K |
Continu willekeurig schrijven (4KB) IOPS (Steady State) | 210K, 303K |
Latentie lezen/schrijven | 87 / 11 µs |
Levenslang uithoudingsvermogen | 3 DWPD |
UBER | <10-17 |
MTBF | 2 miljoen uur |
Protocol | NVMe 1.2a |
NAND Flash-geheugen | 3D eTLC NAND |
Operation System | RHEL, SLES, CentOS, Ubuntu, Windows Server, VMware ESXi |
Energieverbruik | 7 ~ 25 W. |
Ondersteuning voor basisfuncties | Stroomuitvalbeveiliging, hot-pluggable, volledige gegevenspadbeveiliging, SMART: TRIM, multi-namespace, AES 256-gegevenscodering, snel opnieuw opstarten, crypto wissen, |
Ondersteuning voor geavanceerde functies | TRIM, multi-namespace, AES 256 gegevenscodering, snel opnieuw opstarten, crypto wissen, dubbele poort |
Software Ondersteuning | Open source-beheertool, CLI-foutopsporingstool, in-box stuurprogramma voor besturingssysteem (Eenvoudige systeemintegratie) |
Prestatie
Proefbank
Onze Enterprise SSD-beoordelingen maken gebruik van een Lenovo ThinkSystem SR850 voor toepassingstests en een Dell PowerEdge R740xd voor synthetische benchmarks. De ThinkSystem SR850 is een goed uitgerust quad-CPU-platform, dat veel meer CPU-kracht biedt dan nodig is om krachtige lokale opslag te benadrukken. Synthetische tests die niet veel CPU-bronnen vereisen, gebruiken de meer traditionele dual-processor server. In beide gevallen is het de bedoeling om lokale opslag in het best mogelijke licht te presenteren dat overeenkomt met de maximale schijfspecificaties van de opslagleverancier.
Lenovo Think System SR850
- 4 x Intel Platinum 8160 CPU (2.1 GHz x 24 cores)
- 16 x 32 GB DDR4-2666 MHz ECC DRAM
- 2 x RAID 930-8i 12Gb/s RAID-kaarten
- 8 NVMe-bays
- VMware ESXI 6.5
Dell PowerEdge R740xd
- 2 x Intel Gold 6130 CPU (2.1 GHz x 16 kernen)
- 4 x 16 GB DDR4-2666 MHz ECC DRAM
- 1x PERC 730 2GB 12Gb/s RAID-kaart
- Add-in NVMe-adapter
- Ubuntu-16.04.3-desktop-amd64
Achtergrond en vergelijkingen testen
De StorageReview Enterprise-testlaboratorium biedt een flexibele architectuur voor het uitvoeren van benchmarks van zakelijke opslagapparaten in een omgeving die vergelijkbaar is met wat beheerders tegenkomen in echte implementaties. Het Enterprise Test Lab bevat een verscheidenheid aan servers, netwerken, stroomconditionering en andere netwerkinfrastructuur waarmee ons personeel real-world omstandigheden kan vaststellen om de prestaties tijdens onze beoordelingen nauwkeurig te meten.
We nemen deze details over de laboratoriumomgeving en protocollen op in beoordelingen, zodat IT-professionals en degenen die verantwoordelijk zijn voor opslagverwerving de voorwaarden kunnen begrijpen waaronder we de volgende resultaten hebben bereikt. Geen van onze beoordelingen wordt betaald of gecontroleerd door de fabrikant van de apparatuur die we testen. Aanvullende informatie over de StorageReview Enterprise-testlaboratorium en een overzicht van de netwerkmogelijkheden zijn beschikbaar op die respectievelijke pagina's.
Vergelijkingen voor deze beoordeling:
- Memblaze PBlaze5 3.2 TB
- Vloeibaar element AIC 7.68 TB
- Intel SSD DC P4610 1.6 TB
- Huawei ES3000 V5 3.2 TB
- Intel SSD DC P4510 2 TB, 8 TB
- Memblaze PBlaze5 910 AIC 7.68TB
Analyse van de werkbelasting van applicaties
Om de prestatiekenmerken van opslagapparaten voor ondernemingen te begrijpen, is het van essentieel belang om de infrastructuur en de applicatieworkloads in live-productieomgevingen te modelleren. Onze benchmarks voor de Memblaze PBlaze5 916 zijn dan ook de MySQL OLTP-prestaties via SysBench en Microsoft SQL Server OLTP-prestaties met een gesimuleerde TCP-C-workload. Voor onze applicatieworkloads draait elke schijf 2-4 identiek geconfigureerde VM's.
SQL Server-prestaties
Elke SQL Server VM is geconfigureerd met twee vDisks: een volume van 100 GB voor opstarten en een volume van 500 GB voor de database en logbestanden. Vanuit het perspectief van systeemresources hebben we elke VM geconfigureerd met 16 vCPU's, 64 GB DRAM en maakten we gebruik van de LSI Logic SAS SCSI-controller. Terwijl onze Sysbench-workloads het platform eerder verzadigden in zowel opslag-I/O als capaciteit, zoekt de SQL-test naar latentieprestaties.
Deze test maakt gebruik van SQL Server 2014 op Windows Server 2012 R2 gast-VM's en wordt benadrukt door Quest's Benchmark Factory for Databases. OpslagReview's Microsoft SQL Server OLTP-testprotocol maakt gebruik van de huidige versie van Benchmark C (TPC-C) van de Transaction Processing Performance Council, een online transactieverwerkingsbenchmark die de activiteiten in complexe applicatieomgevingen simuleert. De TPC-C-benchmark komt dichterbij dan synthetische prestatiebenchmarks bij het meten van de sterke punten en knelpunten van opslaginfrastructuur in database-omgevingen. Elke instantie van onze SQL Server VM voor deze beoordeling gebruikt een SQL Server-database van 333 GB (schaal 1,500) en meet de transactieprestaties en latentie onder een belasting van 15,000 virtuele gebruikers.
SQL Server-testconfiguratie (per VM)
- Windows Server 2012 R2
- Opslagcapaciteit: 600 GB toegewezen, 500 GB gebruikt
- SQL Server 2014
- Databasegrootte: schaal 1,500
- Virtuele clientbelasting: 15,000
- RAM-buffer: 48 GB
- Testduur: 3 uur
- 2.5 uur voorconditionering
- 30 minuten proefperiode
Voor onze SQL Server-transactiebenchmark bevond de Memblaze PBlaze5 916 AIC zich op de derde plaats met 12,645.0 TPS, hoewel het slechts 1.1 TPS was vanaf de eerste plaats.
Om een beter inzicht te krijgen in de prestaties, moet ook naar de latentie worden gekeken. Hier werd de 916 AIC tweede met slechts 1.3 ms, waarmee hij de rest van de 910/916-serie versloeg.
Sysbench-prestaties
De volgende applicatiebenchmark bestaat uit een Percona MySQL OLTP-database gemeten via SysBench. Deze test meet ook de gemiddelde TPS (Transactions Per Second), de gemiddelde latentie en de gemiddelde latentie van het 99e percentiel.
Elke sysbench VM is geconfigureerd met drie vDisks: een voor opstarten (~ 92 GB), een met de vooraf gebouwde database (~ 447 GB) en de derde voor de database die wordt getest (270 GB). Vanuit het perspectief van systeemresources hebben we elke VM geconfigureerd met 16 vCPU's, 60 GB DRAM en de LSI Logic SAS SCSI-controller gebruikt.
Sysbench-testconfiguratie (per VM)
- CentOS 6.3 64-bits
- Percona XtraDB 5.5.30-rel30.1
- Databasetabellen: 100
- Databasegrootte: 10,000,000
- Database-threads: 32
- RAM-buffer: 24 GB
- Testduur: 3 uur
- 2 uur preconditionering 32 threads
- 1 uur 32 draden
Met de Sysbench transactionele benchmark belandde de 916 AIC op de tweede plaats met 9,298 TPS.
Voor de gemiddelde latentie van Sysbench bleef de 916 AIC tweede met 13.8 ms.
Voor onze worst case scenario latentie (99e percentiel) nam de 916 AIC de eerste plaats in met slechts 25.2 ms latentie.
Houdini van SideFX
De Houdini-test is specifiek ontworpen om de opslagprestaties te evalueren met betrekking tot CGI-weergave. Het proefbed voor deze toepassing is een variant van de kern Dell PowerEdge R740xd servertype dat we in het lab gebruiken met dubbele Intel 6130 CPU's en 64 GB DRAM. In dit geval hebben we Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) op bare metal geïnstalleerd. De uitvoer van de benchmark wordt gemeten in seconden om te voltooien, waarbij minder beter is.
De Maelstrom-demo vertegenwoordigt een deel van de renderingpijplijn dat de prestatiemogelijkheden van opslag benadrukt door aan te tonen dat het het wisselbestand effectief kan gebruiken als een vorm van uitgebreid geheugen. De test schrijft de resultaatgegevens niet weg en verwerkt de punten niet om het muurtijdeffect van de latentie-impact op de onderliggende opslagcomponent te isoleren. De test zelf bestaat uit vijf fasen, waarvan we er drie uitvoeren als onderdeel van de benchmark, en wel als volgt:
- Laadt ingepakte punten van schijf. Dit is het moment om van schijf te lezen. Dit is single-threaded, wat de algehele doorvoer kan beperken.
- Pakt de punten uit in een enkele platte reeks zodat ze kunnen worden verwerkt. Als de punten niet afhankelijk zijn van andere punten, kan de werkset worden aangepast om in de kern te blijven. Deze stap is multi-threaded.
- (Niet uitgevoerd) Verwerkt de punten.
- Verpakt ze opnieuw in emmerblokken die geschikt zijn om terug op schijf op te slaan. Deze stap is multi-threaded.
- (Niet uitgevoerd) Schrijft de gebuckte blokken terug naar schijf.
Met de Houdini-test had de 916 AIC een score van 3,070.7 seconden en landde hij ongeveer in het dode punt van de niet-Optane-schijven en precies tegen de 910 AIC.
VDBench-werkbelastinganalyse
Als het gaat om het benchmarken van opslagapparaten, is het testen van applicaties het beste en komt het synthetische testen op de tweede plaats. Hoewel ze geen perfecte weergave zijn van de werkelijke werkbelasting, helpen synthetische tests wel om opslagapparaten te baseren met een herhaalbaarheidsfactor die het gemakkelijk maakt om appels met appels te vergelijken tussen concurrerende oplossingen. Deze workloads bieden een scala aan verschillende testprofielen, variërend van "four corners"-tests, algemene tests voor de grootte van databaseoverdrachten tot het traceren van gegevens uit verschillende VDI-omgevingen. Al deze tests maken gebruik van de gemeenschappelijke vdBench-workloadgenerator, met een scripting-engine om resultaten te automatiseren en vast te leggen over een groot rekentestcluster. Hierdoor kunnen we dezelfde workloads herhalen op een breed scala aan opslagapparaten, waaronder flash-arrays en individuele opslagapparaten. Ons testproces voor deze benchmarks vult het volledige schijfoppervlak met gegevens en verdeelt vervolgens een schijfgedeelte dat gelijk is aan 25% van de schijfcapaciteit om te simuleren hoe de schijf zou kunnen reageren op applicatieworkloads. Dit is anders dan volledige entropietests die 100% van de schijf gebruiken en deze in stabiele toestand brengen. Als gevolg hiervan weerspiegelen deze cijfers hogere aanhoudende schrijfsnelheden.
profielen:
- 4K willekeurig lezen: 100% lezen, 128 threads, 0-120% joate
- 4K willekeurig schrijven: 100% schrijven, 64 threads, 0-120% snelheid
- 64K sequentieel lezen: 100% lezen, 16 threads, 0-120% jorate
- 64K sequentieel schrijven: 100% schrijven, 8 threads, 0-120% snelheid
- Synthetische database: SQL en Oracle
- VDI volledige kloon en gekoppelde kloonsporen
In onze eerste VDBench Workload Analysis, Random 4K Read, werd de Memblaze PBlaze5 916 AIC vergeleken met twee andere AIC-drives: de Memblaze PBlaze5 910 en de Liqid Element. Hier liep de 916 nek aan nek en viel net achter de 910, met de Liqid ver weg aan de leiding. De 916 begon bij 81,010 IOPS met 99μs en piekte op 809,069 IOPS met een latentie van 157μs.
Willekeurig 4K-schrijven toonde dezelfde plaatsing voor de 916, als laatste. Hier begon de 916 bij 64,157 IOPS met slechts 17.7 μs. De schijf kon onder de 100 μs blijven, echt 25 μs, tot ongeveer 578 IOPS, waar hij een hoogtepunt bereikte voordat hij stopte.
Als we overschakelen naar sequentiële workloads, kijken we eerst naar 64K sequentiële reads. Hier kwam de 916 opnieuw aan de onderkant van ons peloton, net achter de 910. De 916 piekte op 50,011 IOPS of 3.13 GB / s met een latentie van 319 μs.
64K schrijven zag de 916 naar de tweede plaats glijden net achter de 910. Hier begon de 916 met 4,308 IOPS of 256MB/s en reed de 50μs latentielijn tot 30K IOPS of 1.85GB/s voordat hij piekte op 42,319 IOPS of 2.65 GB/s bij 370μs latentie.
De volgende stap is onze SQL-workloads, ook hier was de 916 onderaan, maar slechts een haarbocht de 916. De 916 begon met 27,120 IOPS bij 100.9 μs latentie en piekte op 269,845 IOPS met een latentie van 118.1 μs. Slechts een latentieverschil van 18 μs begint te eindigen.
Voor SQL 90-10 stond de 916 op de derde plaats, beginnend met 27,381 IOPS en een latentie van 97.7 μs. De 916 ging over 100μs bij ongeveer 82K IOPS en bereikte een piek van 273,081 IOPS met een latentie van 116.3μs.
Met SQL 80-20 was de plaatsing van de 916 hetzelfde, beginnend bij 28,023 IOPS en 88.9 μs latentie en piekte op 277,572 IOPS met een latentie van 114.6 μs.
Voor onze Oracle-workload versloeg de 916 de 910 nauwelijks. Hier begon de schijf bij 30,716 IOPS met een latentie van 91.2 μs en piekte op 282,888 IOPS met een latentie van 126.2 μs.
Oracle 90-10 zag de 916 terugvallen om nauwelijks mee te gaan. Hier begon de schijf bij 40,494 IOPS met een latentie van 98.2 μs en piekte op 202,512 IOPS met een latentie van 107.9 μs.
Voor Oracle 80-20 zien we dat de 916 opnieuw amper tweede wordt van de 910. De drive begon bij 42,276 IOPS met een latentie van 87.6 μs en bleef onder de 100 μs totdat ongeveer 169 IOPS piekte op 210,628 IOPS met een latentie van 103.8 μs .
Vervolgens gaan we verder met onze VDI-kloontest, Full en Linked. Voor VDI Full Clone Boot werd de 916 derde, beginnend bij 22,788 IOPS met 107.9 μs latentie en piekte op 218,323 IOPS met 158.9 μs latentie.
Voor VDI FC Initial Login kwam de 916 op de tweede plaats na de 910, beginnend bij 15,487 IOPS bij een latentie van 69.7μs en bleef onder de 100μs tot ongeveer 65K IOPS. De schijf piekte op 147,777 IOPS en een latentie van 199.4 μs.
VDI FC Monday Login liet de 916 als eerste starten vanaf 10,213 IOPS en een latentie van 89.4 μs. De schijf bleef onder de 100 μs tot ongeveer 35 IOPS en bereikte een piek van 101,673 IOPS met een latentie van 155.5 μs.
Voor de VDI Linked Clone (LC) beginnen we weer met de boottest. Hier werd de 916 derde, beginnend bij 9,598 IOPS bij 127μs latentie en piekte op 98,621 IOPS met een latentie van 161.6μs.
In VDI LC Initial Login versloeg de 916 de 910 en werd tweede. Hier begon de schijf bij 5,599 IOPS met een latentie van 94.2 μs en ging boven de 100 μs bij ongeveer 20 IOPS. De 916 piekte op 55,416 IOPS met een latentie van 142.1 μs.
Eindelijk zag de VDI LC Monday Login de 916 als eerste eindigen met een piekprestatie van 78,483 IOPS en een latentie van 201.3 μs.
Conclusie
De Memblaze PBlaze5 916 is een van de 64-laags, 3D NAND NVMe SSD's van het bedrijf. Voor deze specifieke review hebben we gekeken naar de AIC-vormfactor. De AIC-vormfactor zorgt voor dezelfde voordelen van de 916-lijn, AES 256-gegevenscodering, volledige gegevenspadbeveiliging, verbeterde stroomuitvalbeveiliging en een groter uithoudingsvermogen, terwijl het nog betere prestaties levert dan zijn U.2-tegenhanger. De 916 AIC heeft snelheden tot 5.9 GB/s voor lezen en 2.8 GB/s voor schrijven met een doorvoer van maar liefst 1 miljoen IOPS voor lezen en 303 IOPS voor schrijven samen met 3DWPD.
Voor onze Application Workload Analysis toonde de Memblaze PBlaze5 916 AIC sterke prestaties in zowel SQL Server als Sysbench. De schijf werd derde in SQL Server-uitvoer met 12,645 TPS en een gemiddelde latentie van 1.3 ms, waardoor hij tweede werd. Voor Sysbench had de 916 AIC 9,298 TPS, een gemiddelde latentie van 13.8 ms, en nam de eerste plaats in in ons worstcasescenario met 25.2 ms. Houdini liet met 3070.7 seconden een minder sterke prestatie zien.
Voor onze VDBench hebben we de 916 AIC getest tegen twee andere AIC-modellen, de Memblaze PBlaze5 910 AIC en de Liqid Element AIC. Hier waren de prestaties goed, maar door de plaatsing leek het gemengd. Vaak eindigde de 916 als laatste tegen de andere twee schijven, maar hij was elke keer binnen snuffelafstand van de 910. Hoogtepunten zijn onder meer een willekeurige 4K-leesscore van 809K IOPS, een willekeurige 4K-schrijfscore van 578K IOPS, een 64K sequentiële score van 3.13 GB/s en een sequentiële schrijfscore van 2.65 GB/s. Wat hier interessanter is, was latentie. Zelfs op het hoogtepunt was 370 μs het hoogst, waarbij de schijf onder de 25 μs liep gedurende het grootste deel van de willekeurige 4K-schrijfbewerkingen. SQL vertoonde piekscores van meer dan een kwart miljoen IOPS in elke test en de latentie varieerde van 88.9 μs tot slechts 118.1 μs, erg laag en consistent in alle tests. Oracle-piekscores waren niet zo sterk als SQL (hoewel de eerste 283K IOPS was), maar het had wel weer een lage consistente latentie, variërend van 87.6 μs tot 126.2 μs bij de hoogste piek.
De Memblaze PBlaze5 916 AIC is een ideale keuze voor toepassingen die een consistente, lage latentie nodig hebben. Hoewel de aard van de add-in-kaart ervoor zorgt dat het de hot-swappability opgeeft (waardoor het potentieel meer onderhoud vereist, hoewel het ook een hoog uithoudingsvermogen heeft), maakt het dat ruimschoots goed in prestaties, met name latentieprestaties.
Meld u aan voor de StorageReview-nieuwsbrief