Tijdens hun Step Ahead-evenement in Beijing lanceerde Memblaze een nieuwe serie van 500 NVME-drives, evenals een uitbreiding van de 900-lijn naar 910 en 916. We zullen in deze review kijken naar de 910-serie. De nieuwe 910-schijven worden aangeboden in twee vormfactoren en maken gebruik van 64-laags 3D NAND, waardoor de schijven capaciteiten tot 16 TB kunnen hebben. Deze hogere dichtheid kan leiden tot dichtere racks of rackconsolidatie in het datacenter.
Tijdens hun Step Ahead-evenement in Beijing lanceerde Memblaze een nieuwe serie van 500 NVME-drives, evenals een uitbreiding van de 900-lijn naar 910 en 916. We zullen in deze review kijken naar de 910-serie. De nieuwe 910-schijven worden aangeboden in twee vormfactoren en maken gebruik van 64-laags 3D NAND, waardoor de schijven capaciteiten tot 16 TB kunnen hebben. Deze hogere dichtheid kan leiden tot dichtere racks of rackconsolidatie in het datacenter.
Afgezien van het gebruik van 64-lagen om hogere capaciteiten te bereiken, claimt de Memblaze PBlaze5 910 hogere prestaties dan eerdere modellen. Het bedrijf stelt dat de schijf sequentiële leessnelheden tot 3.5 GB/s en een doorvoer tot 835 IOPS kan halen, terwijl het een latentie van minder dan een milliseconde heeft. De schijf wordt ook geleverd met ingebouwde hoge beschikbaarheid, omdat hij dubbel geporteerd is, waardoor er geen enkel storingspad meer is. De 910 heeft 1 DWPD uithoudingsvermogen en twee miljoen uur MTBF. Ideale use-cases zijn onder meer: database, zoeken, indexeren, CDN, Cloud en Hyper-scale, SDS, deep learning en big data-analyse, ERP, SAP HANA, BOSS, bankieren, belastingheffing, high frequency trading en online betaling.
Voor deze review gaan we kijken naar de 3.84TB, U.2 van de PBlaze5 910.
Memblaze PBlaze5 910 NVMe SSD-specificaties
Vormfactor | U.2 | ||
Inhoud | 3.84TB | 7.68TB | 15.36TB |
NAND | 3D eTLC | ||
Interface | PCIe 3.0 x 4 | ||
Protocol | NVMe 1.2a | ||
Prestatie | |||
Sequentieel lezen (128KB) | 3.5GB / s | 3.5GB / s | 3.3GB / s |
Opeenvolgend schrijven (128KB) | 3.1GB / s | 3.5GB / s | 3.3GB / s |
Aanhoudend willekeurig lezen (4KB) | 835K IOPS | 830K IOPS | 826K IOPS |
Aanhoudend willekeurig schrijven (4KB) | 99K IOPS | 135K IOPS | 150K IOPS |
Latentie R/W | 87 / 12μs | ||
DWPD | 1 | ||
UBER | <10^-17 | ||
MTBF | 2 miljoen uur | ||
Stroomverbruik | 7 ~ 25W |
Prestatie
Proefbank
Onze Enterprise SSD-beoordelingen maken gebruik van een Lenovo ThinkSystem SR850 voor toepassingstests en een Dell PowerEdge R740xd voor synthetische benchmarks. De ThinkSystem SR850 is een goed uitgerust quad-CPU-platform, dat veel meer CPU-kracht biedt dan nodig is om krachtige lokale opslag te benadrukken. Synthetische tests die niet veel CPU-bronnen vereisen, gebruiken de meer traditionele dual-processor server. In beide gevallen is het de bedoeling om lokale opslag in het best mogelijke licht te presenteren dat overeenkomt met de maximale schijfspecificaties van de opslagleverancier.
Lenovo Think System SR850
- 4 x Intel Platinum 8160 CPU (2.1 GHz x 24 cores)
- 16 x 32 GB DDR4-2666 MHz ECC DRAM
- 2 x RAID 930-8i 12Gb/s RAID-kaarten
- 8 NVMe-bays
- VMware ESXI 6.5
Dell PowerEdge R740xd
- 2 x Intel Gold 6130 CPU (2.1 GHz x 16 kernen)
- 16 x 16 GB DDR4-2666 MHz ECC DRAM
- 1x PERC 730 2GB 12Gb/s RAID-kaart
- Add-in NVMe-adapter
- Ubuntu-16.04.3-desktop-amd64
Achtergrond en vergelijkingen testen
De StorageReview Enterprise-testlaboratorium biedt een flexibele architectuur voor het uitvoeren van benchmarks van zakelijke opslagapparaten in een omgeving die vergelijkbaar is met wat beheerders tegenkomen in echte implementaties. Het Enterprise Test Lab bevat een verscheidenheid aan servers, netwerken, stroomconditionering en andere netwerkinfrastructuur waarmee ons personeel real-world omstandigheden kan vaststellen om de prestaties tijdens onze beoordelingen nauwkeurig te meten.
We nemen deze details over de laboratoriumomgeving en protocollen op in beoordelingen, zodat IT-professionals en degenen die verantwoordelijk zijn voor opslagverwerving de voorwaarden kunnen begrijpen waaronder we de volgende resultaten hebben bereikt. Geen van onze beoordelingen wordt betaald of gecontroleerd door de fabrikant van de apparatuur die we testen. Aanvullende informatie over de StorageReview Enterprise-testlaboratorium en een overzicht van de netwerkmogelijkheden zijn beschikbaar op die respectievelijke pagina's.
Vergelijkingen voor deze beoordeling:
- Memblaze PBlaze5 3.2 TB
- Memblaze PBlaze4 3.2 TB
- Intel P3700 2 TB
- Intel P4500 2 TB
- HGST SN100 3.2 TB
- Toshiba PX04 1.6 TB
Analyse van de werkbelasting van applicaties
Om de prestatiekenmerken van opslagapparaten voor ondernemingen te begrijpen, is het essentieel om de infrastructuur en de applicatieworkloads in live-productieomgevingen te modelleren. Onze benchmarks voor de Memblaze PBlaze5 910 zijn dan ook de MySQL OLTP-prestaties via SysBench en Microsoft SQL Server OLTP-prestaties met een gesimuleerde TCP-C-workload. Voor onze applicatieworkloads draait elke schijf 2-4 identiek geconfigureerde VM's.
SQL Server-prestaties
Elke SQL Server VM is geconfigureerd met twee vDisks: een volume van 100 GB voor opstarten en een volume van 500 GB voor de database en logbestanden. Vanuit het perspectief van systeemresources hebben we elke VM geconfigureerd met 16 vCPU's, 64 GB DRAM en maakten we gebruik van de LSI Logic SAS SCSI-controller. Terwijl onze Sysbench-workloads het platform eerder verzadigden in zowel opslag-I/O als capaciteit, zoekt de SQL-test naar latentieprestaties.
Deze test maakt gebruik van SQL Server 2014 op Windows Server 2012 R2 gast-VM's en wordt benadrukt door Quest's Benchmark Factory for Databases. OpslagReview's Microsoft SQL Server OLTP-testprotocol maakt gebruik van de huidige versie van Benchmark C (TPC-C) van de Transaction Processing Performance Council, een online transactieverwerkingsbenchmark die de activiteiten in complexe applicatieomgevingen simuleert. De TPC-C-benchmark komt dichterbij dan synthetische prestatiebenchmarks bij het meten van de sterke punten en knelpunten van opslaginfrastructuur in database-omgevingen. Elke instantie van onze SQL Server VM voor deze beoordeling gebruikt een SQL Server-database van 333 GB (schaal 1,500) en meet de transactieprestaties en latentie onder een belasting van 15,000 virtuele gebruikers.
SQL Server-testconfiguratie (per VM)
- Windows Server 2012 R2
- Opslagcapaciteit: 600 GB toegewezen, 500 GB gebruikt
- SQL Server 2014
- Databasegrootte: schaal 1,500
- Virtuele clientbelasting: 15,000
- RAM-buffer: 48 GB
- Testduur: 3 uur
- 2.5 uur voorconditionering
- 30 minuten proefperiode
Voor onze SQL Server-transactiebenchmark kwam de Memblaze PBlaze5 910 U.2 aan de onderkant van het peloton binnen met 12,546.5 TPS, lager dan drie andere PBlaze-schijven.
Verrassend genoeg had de 910 ook de hoogste latentie met 38.8 ms.
Sysbench-prestaties
De volgende applicatiebenchmark bestaat uit een Percona MySQL OLTP-database gemeten via SysBench. Deze test meet ook de gemiddelde TPS (Transactions Per Second), de gemiddelde latentie en de gemiddelde latentie van het 99e percentiel.
Elke sysbench VM is geconfigureerd met drie vDisks: een voor opstarten (~ 92 GB), een met de vooraf gebouwde database (~ 447 GB) en de derde voor de database die wordt getest (270 GB). Vanuit het perspectief van systeemresources hebben we elke VM geconfigureerd met 16 vCPU's, 60 GB DRAM en de LSI Logic SAS SCSI-controller gebruikt.
Sysbench-testconfiguratie (per VM)
- CentOS 6.3 64-bits
- Percona XtraDB 5.5.30-rel30.1
- Databasetabellen: 100
- Databasegrootte: 10,000,000
- Database-threads: 32
- RAM-buffer: 24 GB
- Testduur: 3 uur
- 2 uur preconditionering 32 threads
- 1 uur 32 draden
Met de Sysbench-transactiebenchmark deed de U.2 910 het beter door 6,664.6 TPS te halen die ongeveer in het midden van het geteste pakket landde.
Met de gemiddelde latentie van Sysbench bevond de U.2 910 zich opnieuw in het midden van het peloton met een latentie van 19.2 ms.
Onze latency-benchmark in het slechtste geval zag de U.2 910 opnieuw in het midden landen met 37.8 ms.
Houdini van SideFX
De Houdini-test is specifiek ontworpen om de opslagprestaties te evalueren met betrekking tot CGI-weergave. Het proefbed voor deze toepassing is een variant van de kern Dell PowerEdge R740xd servertype dat we in het lab gebruiken met dubbele Intel 6130 CPU's en 64 GB DRAM. In dit geval hebben we Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) op bare metal geïnstalleerd. De uitvoer van de benchmark wordt gemeten in seconden om te voltooien, waarbij minder beter is.
De Maelstrom-demo vertegenwoordigt een deel van de renderingpijplijn dat de prestatiemogelijkheden van opslag benadrukt door aan te tonen dat het het wisselbestand effectief kan gebruiken als een vorm van uitgebreid geheugen. De test schrijft de resultaatgegevens niet weg en verwerkt de punten niet om het muurtijdeffect van de latentie-impact op de onderliggende opslagcomponent te isoleren. De test zelf bestaat uit vijf fasen, waarvan we er drie uitvoeren als onderdeel van de benchmark, en wel als volgt:
- Laadt ingepakte punten van schijf. Dit is het moment om van schijf te lezen. Dit is single-threaded, wat de algehele doorvoer kan beperken.
- Pakt de punten uit in een enkele platte reeks zodat ze kunnen worden verwerkt. Als de punten niet afhankelijk zijn van andere punten, kan de werkset worden aangepast om in de kern te blijven. Deze stap is multi-threaded.
- (Niet uitgevoerd) Verwerk de punten.
- Verpakt ze opnieuw in emmerblokken die geschikt zijn om terug op schijf op te slaan. Deze stap is multi-threaded.
- (Niet uitgevoerd) Schrijf de gebuckte blokken terug naar schijf.
Met de Houdini-test plaatste de 910 U.2 zich midden tot onder, maar precies in lijn met andere Memblaze-producten met een score van 3,093.8 seconden.
VDBench-werkbelastinganalyse
Als het gaat om het benchmarken van opslagapparaten, is het testen van applicaties het beste en komt het synthetische testen op de tweede plaats. Hoewel ze geen perfecte weergave zijn van de werkelijke werkbelasting, helpen synthetische tests wel om opslagapparaten te baseren met een herhaalbaarheidsfactor die het gemakkelijk maakt om appels met appels te vergelijken tussen concurrerende oplossingen. Deze workloads bieden een scala aan verschillende testprofielen, variërend van "four corners"-tests, algemene tests voor de grootte van databaseoverdrachten tot het traceren van gegevens uit verschillende VDI-omgevingen. Al deze tests maken gebruik van de gemeenschappelijke vdBench-workloadgenerator, met een scripting-engine om resultaten te automatiseren en vast te leggen over een groot rekentestcluster. Hierdoor kunnen we dezelfde workloads herhalen op een breed scala aan opslagapparaten, waaronder flash-arrays en individuele opslagapparaten. Ons testproces voor deze benchmarks vult het volledige schijfoppervlak met gegevens en verdeelt vervolgens een schijfsectie die gelijk is aan 25% van de schijfcapaciteit om te simuleren hoe de schijf zou kunnen reageren op applicatieworkloads. Dit is anders dan volledige entropietests die 100% van de schijf gebruiken en deze in stabiele toestand brengen. Als gevolg hiervan weerspiegelen deze cijfers hogere aanhoudende schrijfsnelheden.
profielen:
- 4K willekeurig lezen: 100% lezen, 128 threads, 0-120% joate
- 4K willekeurig schrijven: 100% schrijven, 64 threads, 0-120% snelheid
- 64K sequentieel lezen: 100% lezen, 16 threads, 0-120% jorate
- 64K sequentieel schrijven: 100% schrijven, 8 threads, 0-120% snelheid
- Synthetische database: SQL en Oracle
- VDI volledige kloon en gekoppelde kloonsporen
In onze eerste VDBench Workload Analysis, Random 4K Read, kon de Memblaze PBlaze5 910 U.2 de hele tijd onder de 1 ms blijven met een piek van 665,679 IOPS en een latentie van 191.3 μs, waardoor de schijf ongeveer in het midden kwam te liggen.
4K willekeurig schrijven zorgde opnieuw voor een latentie van minder dan een milliseconde. De 910 U.2 eindigde als een na laatste met een piekprestatie van 296,639 IOPS en een latentie van 429.6 μs.
Bij het overschakelen naar sequentiële workloads, eindigde de 910 U.2 opnieuw als een na laatste in 64K sequentiële reads met een piekscore van 38,472 IOPS of 2.4 GB/s met een latentie van 415.3 μs.
De 910 U.2 bleef op de voorlaatste plaats en piekte met ongeveer 18K IOPS of 1.1GB/s bij een latentie van ongeveer 870μs in de 64K sequentiële schrijfbewerking.
Op weg naar SQL-workloads piekte de 910 U.2 op 243,228 IOPS met slechts 130.4 μs latentie, waardoor de schijf op de vierde plaats kwam.
SQL 90-10 zorgde ervoor dat de 910 de vierde plaats behield met een piekscore van 232,061 IOPS en een latentie van 136.5 μs.
Nog steeds vierde, bereikte de 910 U.2 een piek van 220,195 IOPS met een latentie van 144.6 μs in de SQL 80-20-benchmark.
Met onze Oracle-workload bleef de 910 U.2 op de vierde plaats staan met een piekscore van 212,052 IOPS en een latentie van 168.5 μs.
Voor Oracle 90-10 schoof de 910 U.2 naar de derde plaats met een piek van 180,723 IOPS en een latentie van 121.1μs.
In Oracle 80-20 was de 910 bijna gelijk met de 900 voor de derde plaats met een piekprestatie van 177,143 IOPS en een latentie van 123.5 μs.
Vervolgens gaan we verder met onze VDI-kloontest, Full en Linked. Voor VDI Full Clone Boot belandde de 910 U.2 op de vierde plaats met een piekprestatie van 176,239 IOPS en een latentie van 197.9 μs.
VDI FC Initial Login zag de 910 U.2 nog steeds vierde worden, maar verder achter de top drie schijven met een piekprestatie van 66,925 IOPS en een latentie van 445.1 μs.
Met VDI FC Monday Login eindigde de 910 U.2 op de vierde plaats met 67,309 IOPS en een latentie van 235.7μs.
Bij het overschakelen naar Linked Clone (LC) kijken we eerst naar de opstarttest. Hier werd de 910 U.2 vierde met 83,210 IOPS en een latentie van 191.2 μs.
VDI LC Initial Login had de 910 U.2 stabiel op de vierde plaats met 40,035 IOPS en een latentie van 197.4 μs.
Eindelijk had de VDI LC Monday Login de 910 U.2-piek op 45,349 IOPS en een latentie van 349μs voor de vierde plaats.
Conclusie
De Memblaze PBlaze5 910 is de nieuwe NVMe-datacenterschijf van het bedrijf die gebruikmaakt van 64-laags 3D NAND. De schijf wordt geleverd in twee vormfactoren (U.2 voor deze recensie) en met een capaciteit van 3.84 TB, 7.68 TB en 15.36 TB. Memblaze claimt prestaties tot 3.5 GB/s lezen, 3.5 GB/s schrijven en doorvoer tot 835 IOPS lezen en 150 IOPS schrijven. De schijf voldoet aan de criteria voor een groot aantal gebruiksscenario's en wordt geleverd met beveiligingsopties zoals AES 256-gegevenscodering en ondersteunt de TRIM-functie tot 8TB/s.
Als we kijken naar de prestaties van de analyse van de werklast van applicaties, kwam de 910 U.2 op de laatste plaats in onze SQL Server-benchmarks met 12,546.5 TPS en een gemiddelde latentie van 38.8 ms. In Sysbench deed de schijf het iets beter toen hij midden in het peloton landde met 6,664.6 TPS en een gemiddelde latentie van 19.2 ms, en een latentie in het slechtste geval van 37.8 ms. In onze Houdini by SideFX-benchmark had de 910 U.2 een score van 3,093.8 seconden, waarmee hij zich aan de onderkant van het veld bevond, maar in lijn met andere Memblaze-producten.
Voor VDBench had de Memblaze PBlaze5 910 U.2 een latentie van minder dan een milliseconde tijdens alle tests. De schijf viel bij alle tests in het midden tot midden onderaan het pakket. De belangrijkste resultaten zijn 666K IOPS bij 4K lezen, 297K IOP's bij 4K schrijven, 2.4 GB/s bij 64K lezen en 1.1 GB/s bij 64K schrijven. De SQL-resultaten bevatten ongeveer een kwart miljoen IOPS, waarbij de Oracle-tests tussen 177 IOPS en 212 IOPS liepen.
Over het algemeen leverde het goede prestaties, maar de prestaties begonnen af te nemen in vergelijking met de vorige generatie PBlaze5 900.
Meld u aan voor de StorageReview-nieuwsbrief