Vorig jaar publiceerden we een gedetailleerde reeks recensies over VSAN 6.0 in een hybride configuratie. In februari van dit jaar VMware heeft VSAN 6.2 gelanceerd, die datareductie via deduplicatie en compressie bracht, evenals een aantal andere functies op de markt. Datareductie is een grote stap voorwaarts voor VSAN, aangezien het meelift op de enorme toename van het gebruik van flash, grotendeels dankzij dalende prijzen en hoogwaardige opties. Wanneer VSAN is ingeschakeld in een all-flash-configuratie, kunnen gebruikers die profiteren van datareductie hun capaciteit effectief verdrievoudigen (of meer), afhankelijk van de werklast, wat echt de waarde van flash oplevert voor iedereen, van ROBO tot de onderneming.
Vorig jaar publiceerden we een gedetailleerde reeks recensies over VSAN 6.0 in een hybride configuratie. In februari van dit jaar VMware heeft VSAN 6.2 gelanceerd, die datareductie via deduplicatie en compressie bracht, evenals een aantal andere functies op de markt. Datareductie is een grote stap voorwaarts voor VSAN, aangezien het meelift op de enorme toename van het gebruik van flash, grotendeels dankzij dalende prijzen en hoogwaardige opties. Wanneer VSAN is ingeschakeld in een all-flash-configuratie, kunnen gebruikers die profiteren van datareductie hun capaciteit effectief verdrievoudigen (of meer), afhankelijk van de werklast, wat echt de waarde van flash oplevert voor iedereen, van ROBO tot de onderneming.
Terwijl we doorgaan met onze beoordeling van VSAN, hebben we hetzelfde Dell PowerEdge R730xd-cluster gebruikt dat we in de vorige hybride beoordeling gebruikten. We hebben het platform geüpdatet, inclusief BIOS, firmware en ESXi om het compatibel te maken met VSAN 6.2. Een van de grootste veranderingen is echter het vervangen van onze bestaande HDD's en SSD's door een nieuwe all-flash-configuratie, met dank aan Toshiba. Door gebruik te maken van enkele van de snelste SAS3 SSD's op de markt, kunnen we al onze aandacht richten op de VSAN zelf, zonder dat hardware dit tegenhoudt.
Dell PowerEdge R730xd VMware All-Flash VSAN-specificaties
- Dell PowerEdge R730xd-servers (x4)
- CPU's: acht Intel Xeon E5-2697 v3 2.6 GHz (14C/28T)
- Geheugen: 64 x 16 GB DDR4 RDIMM
- SSD:
- Cache: 16 x 400 GB Toshiba PX04 schrijfintensieve SAS3
- Capaciteit: 80 x 960 GB Toshiba PX04 leesintensieve SAS3
- Netwerken: 4 x Intel X520 DP 10Gb DA/SFP+, + I350 DP 1Gb Ethernet
- Opslagcapaciteit: 69.86TB
De Toshiba-schijven die voor deze beoordeling werden gebruikt, waren de Toshiba PX04S-modellen. In onze vorige review ontdekten we dat de PX04S-modellen de snelste SAS enterprise SSD's waren die we tot nu toe hebben getest. De PX04S was ook de dual-port SAS SSD met de hoogste capaciteit toen hij werd getest. De PX04S-serie is verkrijgbaar in meerdere uithoudingsniveaus, variërend van high-endurance tot low-endurance met ook mid- en value-endurance-modellen. Voor deze review hebben we de Dell PowerEdge R730xd gevuld met zestien 400GB schrijfintensieve (PX04SHB040) en tachtig 960GB value-endurance (PX04SVB096) schijven. De schrijfintensieve schijven hebben tot 25DWPD en de duurzame schijven tot 3DWPD. Ter vergelijking: in de hybride configuratie met dezelfde servers bestond de cachelaag uit vier Toshiba PX02 800GB SSD's per host, wat het dubbele van de capaciteit van de cachelaag opleverde.
PX04SHB040 400GB schrijfintensieve drive specificaties:
- Prestatie
- Aanhoudende 64KiB sequentieel lezen: 1,900MiB/s
- Aanhoudende 64KiB sequentiële schrijfsnelheid: 850MiB/s
- Aanhoudende 4KiB willekeurig lezen: 270K IOPS
- Aanhoudende 4KiB willekeurig schrijven: 125K IOPS
- DWPD: 25
PX04SVB096 960GB waarde-endurance drive specificaties:
- Prestatie
- Aanhoudende 64KiB sequentieel lezen: 1,900MiB/s
- Aanhoudende 64KiB sequentiële schrijfsnelheid: 850MiB/s
- Aanhoudende 4KiB willekeurig lezen: 270K IOPS
- Aanhoudende 4KiB willekeurig schrijven: 60K IOPS
- DWPD: 3
Analyse van de werkbelasting van applicaties
Voor deze review hebben we de Dell PowerEdge R730xd VMware VSAN opnieuw gevuld met alle Toshiba PX04 SAS3 SSD's. De eerste benchmarks bestaan uit de MySQL OLTP-prestaties via SysBench en Microsoft SQL Server OLTP-prestaties met een gesimuleerde TPC-C-workload.
Elke SQL Server VM is geconfigureerd met twee vDisks, één 100 GB voor opstarten en één 500 GB voor de database en logbestanden. Vanuit het perspectief van systeemresources hebben we elke VM geconfigureerd met 16 vCPU's, 64 GB DRAM en de LSI Logic SAS SCSI-controller gebruikt. Deze tests zijn ontworpen om te controleren hoe een latentiegevoelige toepassing presteert op het cluster met een matige, maar niet overweldigende reken- en opslagbelasting.
SQL Server-testconfiguratie (per VM)
- Windows Server 2012 R2
- Opslagcapaciteit: 600 GB toegewezen, 500 GB gebruikt
- SQL Server 2014
- Databasegrootte: schaal 1,500
- Virtuele clientbelasting: 15,000
- RAM-buffer: 48 GB
- Testduur: 3 uur
- 2.5 uur voorconditionering
- 30 minuten proefperiode
In de SQL Server TPC-C-test op hypergeconvergeerde platforms kijken we naar de werklastverdeling over het cluster in hybride modus, all-flash (AF)-modus en all-flash datareductie (AF DR). De AF-versie presteerde iets beter dan de hybride met individuele VM's die liepen van 3,112.4 TPS tot 3,130.4 TPS, met een totale score van 12,472.8 TPS, de hoogste algemene score. De DR-configuratie bevond zich aan de onderkant van de testconfiguraties, met individuele VM's die liepen van 2,982.1 TPS tot 3,009.6 TPS, met een totale score van 11,969.1 TPS.
Voor de SQL Server TPC-C-test besteden we de meeste aandacht aan de variabele gemiddelde latentie. Kleine hiaten in de transactieprestaties laten niet het volledige verhaal zien. In onze gemiddelde latentietest zagen we dat de hoogste score van de AF-versie, 64 ms, hetzelfde was als de slechtste score van de hybride. De AF had ook een gemiddelde score van 53ms. Nogmaals, de DR-configuratie bevindt zich onderaan het peloton, met een dieptepunt van 236 ms, een hoogtepunt van 278 ms en een gemiddelde van 261 ms.
Sysbench-prestaties
Elke Sysbench VM is geconfigureerd met drie vDisks: één voor opstarten (~ 92 GB), één met de vooraf gebouwde database (~ 447 GB) en de derde voor de database die wordt getest (400 GB). Vanuit het perspectief van systeemresources hebben we elke VM geconfigureerd met 16 vCPU's, 64 GB DRAM en de LSI Logic SAS SCSI-controller gebruikt.
Sysbench-testconfiguratie (per VM)
- CentOS 6.3 64-bits
- Opslagcapaciteit: 1 TB, 800 GB gebruikt
- Percona XtraDB 5.5.30-rel30.1
- Databasetabellen: 100
- Databasegrootte: 10,000,000
- Database-threads: 32
- RAM-buffer: 24 GB
- Testduur: 12 uur
- 6 uur preconditionering 32 threads
- 1 uur 32 draden
- 1 uur 16 draden
- 1 uur 8 draden
- 1 uur 4 draden
- 1 uur 2 draden
Met de Sysbench OLTP kijken we voor elk naar de 8VM-configuratie. De AF kwam als beste uit de bus, iets voorbij de hybride met 4,273 TPS tot 4,259 TPS. De DR-configuratie scoorde 3,625 TPS.
Kijkend naar de gemiddelde latentie, is het een beetje een verrassing om te zien dat de AF niet aanzienlijk hoger was dan de hybride, respectievelijk 60.1 ms tot 60.3 ms. De DR scoorde veel hoger met 71ms latency.
De gemiddelde latentie van het 99e percentiel vertoonde opnieuw een kleine afname van de latentie voor de AF versus de hybride, respectievelijk 126 ms tot 131 ms. De DR had een veel hogere latentie bij 212 ms.
VMmark-prestatieanalyse
Zoals bij al onze analyses van toepassingsprestaties, proberen we te laten zien hoe producten presteren in een live productieomgeving in vergelijking met de prestatieclaims van het bedrijf. We begrijpen hoe belangrijk het is om opslag te evalueren als onderdeel van grotere systemen, vooral hoe responsief opslag is bij interactie met belangrijke bedrijfsapplicaties. In deze test gebruiken we de VMmark virtualisatiebenchmark door VMware in een omgeving met meerdere servers.
VMmark is door zijn ontwerp een zeer resource-intensieve benchmark, met een brede mix van VM-gebaseerde applicatieworkloads die de nadruk leggen op opslag-, netwerk- en rekenactiviteiten. Als het gaat om het testen van virtualisatieprestaties, is er bijna geen betere benchmark voor, aangezien VMmark naar zoveel facetten kijkt, waaronder opslag-I/O, CPU en zelfs netwerkprestaties in VMware-omgevingen.
Hier kijken we naar de uitbraak van VMmark Overall en Application-prestaties in zowel onze hybride als All-Flash met datareductie VSAN-configuraties.
VSAN is geschikt voor 18 tegels met ingeschakelde compressie en deduplicatie en is het best presterende opslagsysteem met gegevensreductie dat we tot nu toe hebben getest. In eerdere benchmarks bereikten we 8 tegels met een speciaal dedup-apparaat voor een all-flash array.
Kijkend naar CPU-bronnen op een van de hosts tijdens deze 18-tile All-Flash VSAN-run, zweefde het systeem rond 80-85% CPU-gebruik. Dus hoewel het opslagaspect niet hoger kon, had het cluster nog steeds wat bronnen over.
HCIbench-testconfiguratie
- 16 VM's
- 10 VMDK per virtuele machine
- 10 GB VMDK (voetafdruk van 1.6 TB)
- 50 GB VMDK (voetafdruk van 8 TB)
- 100 GB VMDK (voetafdruk van 16 TB)
- Initialisatie van volledige schrijfopslag
- Testintervallen van 1.5 uur (voorconditionering van 30 minuten, testmonsterperiode van 60 minuten)
Voor het testen van de hybride en AF DR-configuraties van onze VMware VSAN hebben we twee verschillende configuraties voor onze workloadprofielen geïmplementeerd. Deze omvatten een voetafdruk van 1.6 TB (volledig in de cache voor de hybride), 800 GB (volledig in de cache voor de AF DR) en 16 TB (buiten de cache gemorst) om te laten zien hoe het platform reageert als hete gegevens groeien. Deze formaten kunnen voor elk platform worden aangepast, afhankelijk van hoeveel flash beschikbaar is voor cache of tiering.
HCIbench Workloadprofielen van StorageReview
- 4K Willekeurig 100% gelezen
- 4K Willekeurig 100% schrijven
- 8K Willekeurig 70% lezen / 30% schrijven
- 32K sequentieel 100% gelezen
- 32K sequentieel 100% schrijven
De eerste HCIbench-test kijkt naar piek willekeurige doorvoer van het VMware VSAN-platform met een volledig willekeurig 4K-werklastprofiel. Volledig opgewarmd met gegevens verplaatst naar de cache, gaf de hybride ons 888 MB/s lezen en 249 MB/s schrijven met een voetafdruk van 1.6 TB in de cache. De AF DR, met een cache van 800 GB, gaf ons 1,414 MB/s lezen en 160 MB/s schrijven. Met een dataset tot 16 TB (buiten de cache gemorst), gaf de hybride ons 26 MB/s lezen en 56 MB/s schrijven, terwijl de AF DR een niet verrassend sterkere prestatie had van 423 MB/s lezen en 151 MB/s schrijven.
Vervolgens kijken we naar piek-I/O in hetzelfde 4k-profiel, en hier zagen we vergelijkbare resultaten. De dataset van 1.6 TB in de cache had de hybride met resultaten van 227,342 IOPS gelezen en 63,868 IOPS schrijven, terwijl de 800 GB dataset voor de AF DR in cache resultaten had van 361,923 IOPS gelezen en 41,031 IOPS schrijven. De dataset van 16 TB had de hybride gaf ons 6,747 IOPS lezen en 14,404 IOPS schrijven en de AF DR had 108,365 IOPS gelezen en 38,778 IOPS schrijven.
De volgende statistiek kijkt naar de gemiddelde latentie van het volledig willekeurige 4K-workloadprofiel. De in-cache footprint van 1.6 TB voor de hybride had een leeslatentie van 1 ms en een schrijflatentie van 4 ms. De 800 GB footprint in cache voor de AF DR had een leeslatentie van 0.88 ms en een schrijflatentie van 8.29 ms. Met de dataset van 16 TB die uit de cache stroomt, zal er duidelijk een veel grotere discrepantie in de resultaten zijn, aangezien de hybride zal overlopen op 10K-draaiende schijven die altijd een hogere latentie hebben, versus de AF DR die op flashdrives blijft. Hier gaf de hybride ons een latentie van 47 ms lezen en 23 ms schrijven, terwijl de AF DR ons een latentie gaf van 1.65 ms lezen en 4.66 ms schrijven.
Onze volgende test kijkt naar een groter 8K dataprofiel met een mix van 70% lees- en 30% schrijfactiviteit. Hier bereikte de hybride in cache (met een voetafdruk van 1.6 TB) 947.9 MB/s. De AF DR in cache (met 800 GB) had een prestatie van 631.5 MB/s. Met de grotere dataset van 16 TB die uit de cache lekte, daalden de prestaties van de hybride tot 67 MB/s, terwijl de AF DR een daling zag tot 530 MB/s.
Vervolgens kijken we naar de I/O-prestaties van dezelfde 8k 70/30-workload. De hybride voetafdruk van 1.6 TB registreerde 121,329 IOPS terwijl de AF DR 80,834 IOPS registreerde. Nadat de dataset van 16 TB uit de cache was gemorst, zagen beide configuraties de prestaties afnemen, waarbij de hybride nu 8,584 IOPS registreerde en de AF DR 67,882 IOPS opnam.
Kijkend naar een gemiddelde latentie van 8k 70/30, zagen we een vergelijkbare plaatsing als hierboven. Binnen de cache had de hybride een latentie van 2 ms en de AF DR had een latentie van 3.94 ms. Met de grote dataset die uit de cache liep, sprong de hybride tot 37 ms, terwijl de AF DR in feite daalde tot 2.63 ms.
De laatste workload schakelt over naar een piekbandbreedtefocus, bestaande uit een 32K sequentieel lees- en schrijfprofiel. De prestaties in de cache van de hybride lieten 2,699 MB/s lezen en 1,193 MB/s zien, en de prestaties in de cache van de AF DR toonden 1,971 MB/s lezen en 1,353 MB/s schrijven. Met de grotere dataset van 16 TB zagen we 2,490 MB/s lezen en 1,082 MB/s schrijven met de hybride en 975 MB/s lezen en 495 MB/s schrijven met de AF DR.
I/O-prestaties lieten vergelijkbare resultaten zien, waarbij de hybride meestal betere prestaties leverde dan de AF DR. In de cache had de hybride prestaties van 86,379 IOPS gelezen en 38,184 IOPS schrijven, terwijl de AF DR prestaties had van 63,068 IOPS gelezen en 43,302 IOPS schrijven. Met de grotere dataset uit de cache zagen we dat de hybride 79,703 IOPS gelezen en 34,611 IOPS geschreven had, terwijl de AF DR 31,205 IOPS gelezen en 15,830 IOPS geschreven had.
Met een gemiddelde latentie gaf de hybride ons 3 ms lezen en 8 ms schrijven in de cache en 4 ms lezen en 9 ms schrijven uit de cache. De AF DR daarentegen gaf ons 5.29 ms lezen en 7.46 ms schrijven in de cache en 5.78 ms en 11.47 ms schrijven uit de cache.
Conclusie
VMware VSAN 6.2 geeft organisaties de kans om flash op nieuwe en opwindende manieren te benutten, waardoor zowel efficiëntie als prestatiewinst wordt behaald. Hoogtepunten van de nieuwe release zijn onder meer uitwiscodering, RAID5-ondersteuning, deduplicatie en compressie, die er allemaal duidelijk toe leiden om het maximale uit flash te halen vanuit het oogpunt van capaciteit. Hoewel de voordelen van datareductie variëren op basis van werklast en configuratie, is het redelijk om een capaciteitswinst van 3-6x te verwachten. Dit betekent in feite dat een relatief betaalbare schijf van 1 TB effectief 3-6 TB kan leveren. Dit voordeel alleen al maakt 6.2 een waardige upgrade en geeft Flash een geweldige plek om uit te blinken.
Als het gaat om prestaties, heeft de all-flash-configuratie een beetje nuancering nodig om goed uit te leggen. VSAN 6.2 levert geen exponentiële winst op in vergelijking met de hybride configuratie die we eerder hebben getest. Hiervoor zijn een aantal fundamentele redenen. Ten eerste heeft VSAN een enkele thread per schijfgroep, wat het vermogen beperkt om alle flashdrives zo effectief mogelijk te benutten. Dit is een ontwerpbeslissing aangezien de nadruk van VMware ligt op het minimaliseren van VSAN-overhead op systeemniveau; dit kan het gebied zijn waar VMware voor kiest om in toekomstige releases opnieuw in evenwicht te brengen. Ten tweede, wanneer we functies voor gegevensreductie inschakelen, zien we lagere prestaties op de all-flash-configuratie dan hybride. Op het eerste gezicht lijkt dit misschien een probleem, maar voor iedereen die ervaring heeft met datareductie, is er in elk geval dat we hebben gezien een enorme prestatiebeperking. We hebben vaak een overheadhit van meer dan 80% gezien met concurrerende HCI-oplossingen. Deze context is belangrijk; aangezien VSAN all-flash met ingeschakelde gegevensreductie in dit opzicht eigenlijk heel goed werk deed, overeenkomend met de 18-tegel VMmark-score waartoe onze oudere hybride configuratie in staat was. Verder geeft VMware aan dat de meeste klanten die all-flash-configuraties kopen, werken met datareductiefuncties ingeschakeld, waardoor VSAN-efficiëntie erg belangrijk is.
Momenteel is datareductie een alles-of-niets-instelling, waar het van toepassing is op de hele datastore; VMware doet dit om de effectiviteit van deduplicatie te maximaliseren. De hit van de datareductieserver wordt gecompenseerd door de capaciteitsuitbreiding, wat in dit geval een cruciaal verkoopargument is. In onze configuratie met vier knooppunten en 24 schijven per server (wat heel gebruikelijk is voor VSAN), betekent dit dat er kleinere/minder SSD's kunnen worden gebruikt om de HDD-capaciteit te evenaren of te overtreffen. Dit komt natuurlijk bovenop alle andere voordelen die SSD's bieden, zoals een lager stroomverbruik, minder behoefte aan koeling of grotere bedrijfstoleranties.
Voor het testen hebben we ons assortiment applicatietests uitgevoerd, waaronder onze MySQL en Microsoft SQL Server OLTP-prestaties, evenals VMmark virtualisatiebenchmark door VMware en HCIbench. Bij SQL Server presteerde de all-flash-versie het best met een totale score van 12,472.8 TPS. De all-flash (AF) met datareductie (AF DR) presteerde ook goed met een totale score van 11,969.1 TPS. Met SQL Server-latentie had de AF VSAN de laagste algehele latentie met een totale score van 53 ms, ongeveer 30% lager dan de hybride versie. Het is niet verwonderlijk dat AF DR VSAN een veel hogere latentie had met een totaal van 261 ms. Met onze SysBench-test is het interessant om hier op te merken dat de AF slechts een haar beter presteerde dan de hybride versie (4,273 tot 4,259 TPS, geschaalde gemiddelde latentie van 60.1 ms tot 60.3 ms en in het slechtste geval latentie van 126 ms tot 131 ms). Met datareductie ingeschakeld, zag AF DR VSAN een prestatiedip, maar had nog steeds een geschaalde transacties per seconde van 3,625, een geschaalde gemiddelde latentie van 71 ms en een latentie in het slechtste geval van 212 ms.
Met VMmark en datareductie ingeschakeld kon AF DR VSAN 18 tegels raken (het vorige beste datareductiesysteem bereikte slechts 8 tegels). Dat maakt de AF DR VSAN de best presterende opslagarray met datareductie in onze VMmark-test. De laatste test waar we naar keken was HCIbench die, hoewel het niet de maximale mogelijkheden van een systeem laat zien, ons een goede maatstaf geeft om de AF DR VSAN te vergelijken met de hybride VSAN. In onze 4k HCIbench-test presteerde de AF DR VSAN beter dan de hybride versie in zowel de in-cache- als de spilling-out-cache-test, met name in reads. De AF DR was in staat om 4k-leesnummers te halen tot wel 1,1414 MB/s, 361,923 IOPS en een gemiddelde latentie van 0.9 ms. Als we naar onze 8k 70/30-tests kijken, presteerde de hybride beter in de cache en presteerde de AF DR dramatisch beter toen hij uit de cache kwam. In onze 32k sequentiële tests presteerde de hybride VSAN zowel in als buiten de cache beter dan de AF DR VSAN.
We hebben in deze review veel vergelijkingen gemaakt tussen onze initiële hybride VSAN-configuratie en een all-flash-implementatie. De hybride hield goed stand tijdens de eerste tests en toont zelfs vandaag de dag nog steeds kracht. Als de cachelagen hetzelfde zijn in een hybride configuratie en alle flashconfiguraties en werksets in de cache blijven, zullen de prestaties van de twee relatief dicht bij elkaar liggen. De all-flash-configuratie profiteert echter van alle nieuwe functies in 6.2, naast de overkoepelende voordelen die flash biedt. Verder kan de neerwaartse prijsdruk op SSD's in combinatie met datareductie alle flash VSAN zelfs kosteneffectiever maken per TB dan hybride.
VOORDELEN
- Het best presterende platform met gegevensreductie dat we tot nu toe hebben getest
- VSAN 6.2 brengt een reeks nieuwe functies die gebruikmaken van de voordelen van flash
- Zeer eenvoudig in te stellen; comfortabel voor virtualisatiebeheerders om te beheren
NADELEN
- VSAN scheidt schijven voor cache- en capaciteitslagen; een enkellaagse architectuur voor flash zou waardevol kunnen zijn
- Single-threaded schijfgroepen binnen VSAN beperken het opwaartse prestatiepotentieel
Tot slot
VMware VSAN 6.2 voegt een hele reeks functies voor gegevensefficiëntie toe aan het platform, waardoor alle flash-VSAN-implementaties een overtuigende mix van functies, prestaties en capaciteit kunnen bieden, terwijl ze profiteren van alle perifere voordelen die flash met zich meebrengt.
Meld u aan voor de StorageReview-nieuwsbrief