Home Enterprise VMware vSAN met Intel Optane Review

VMware vSAN met Intel Optane Review

by Adam Amstrong
VMware vSAN met Intel Optane

We hebben het erover gehad en plaagde je ermee, en nu leveren we eindelijk de VMware vSAN met Intel Optane Review. Dit markeert de derde grote herziening van vSAN beginnend met een meerdelige beoordeling van een hybride vSAN 6.0 gevolgd door een all-flash review van vSAN 6.2. In plaats van gebruik te maken van ons Dell PowerEdge R730xd-cluster, gebruiken we nu Supermicro's 2029U-TN24R4T+ 2U, 24-bay server met vSAN 6.7. Voor opslag gebruiken we een volledige NVMe-configuratie met Intel Optane P4800X (375GB) SSD's voor de schrijflaag en Intel P4500 (2TB) SSD's voor capaciteitslaag.

We hebben het erover gehad en plaagde je ermee, en nu leveren we eindelijk de VMware vSAN met Intel Optane Review. Dit markeert de derde grote herziening van vSAN beginnend met een meerdelige beoordeling van een hybride vSAN 6.0 gevolgd door een all-flash review van vSAN 6.2. In plaats van gebruik te maken van ons Dell PowerEdge R730xd-cluster, gebruiken we nu Supermicro's 2029U-TN24R4T+ 2U, 24-bay server met vSAN 6.7. Voor opslag gebruiken we een volledige NVMe-configuratie met Intel Optane P4800X (375GB) SSD's voor de schrijflaag en Intel P4500 (2TB) SSD's voor capaciteitslaag.

Voor degenen die niet bekend zijn met vSAN: het is de hypergeconvergeerde infrastructuur van VMware, geoptimaliseerd voor vSphere, die neigt naar opslag. Met andere woorden, vSAN is een stap op de softwaregedefinieerde datacenterbouwstenen die tot doel hebben opslag en opslagbeheer eenvoudig te maken en tegelijkertijd betere prestaties te leveren. vSAN wordt meestal verkocht via een certificeringsprogramma dat bekend staat als VMware vSAN ReadyNodes, een combinatie van gecertificeerde hardware gecombineerd met VMware-software. De meeste grote serverleveranciers bieden ReadyNode-configuraties en sommige bieden ook vSAN als apparaat aan.

Vergelijkbaar met het ReadyNode-idee is Intel's Select Solutions. Intel Select Solutions zijn geverifieerde hardware- en softwarestacks die voldoen aan de vereisten van Intel. De oplossingen die door grote serverleveranciers op de markt worden gebracht, moeten de door Intel beschreven benchmarkprestaties kunnen repliceren of overtreffen, en ze moeten gedetailleerde implementatiehandleidingen voor klanten hebben. De setup die we voor deze review gebruiken, valt in deze categorie, het is met name een Intel Select-oplossing voor VMware vSAN. Zoals de naam al aangeeft, is de oplossing specifiek ontworpen voor VMware-omgevingen.

De Intel Select-oplossing voor VMware vSAN wordt geleverd in twee configuraties: een "Base" en een "Plus". Onze configuratie zit ergens in het midden van deze configuraties; het is eigenlijk een basisconfiguratie met verbeterde CPU's. Met Optane SSD's voor de schrijflaag zijn onze systemen ontworpen om te voldoen aan de latentie-eisen van bedrijfskritische applicaties.

Supermicro 2029U-TN24R4T+ specificaties:

  • Supermicro 2029U-TN24R4T+-servers (x4)
  • CPU: 2 x Intel Xeon Gold 6152-processor, 2.10 GHz, 22 kernen
  • Geheugen: 384 GB RAM (12 x 32 GB 2,666 MHz DDR4 DIMM)
  • vSAN-schijfgroepen, 2x per knooppunt:
    • vSAN Cache-laag: 2 x 375 GB Intel Optane SSD DC P4800X-serie NVMe SSD's
    • vSAN Capaciteitsniveau: 4 x 2TB Intel DC P4500 Series NVMe SSD's
  • Netwerken:
    • Intel Ethernet Converged Network Adapter X710 10/40 GbE (speciale link voor vSAN, vMotion/VM-verkeer/beheer gesplitst op zijn eigen VLAN).

Intel Optane P4800X 375 GB

  • Prestatie
    • 4KB willekeurig, wachtrijdiepte 16, R/W: tot 550/500K IOPS
    • 4KB willekeurig, wachtrijdiepte 16, gemengd 70/30 R/W: tot 500K IOPS
  • DWPD: 30

Intel P4500 2 TB

  • Prestatie
    • Sequentieel lezen: 3200 MB/s
    • Sequentieel schrijven: 1050 MB/s
    • Willekeurig lezen in 4K: 490,000 IOPS
    • Willekeurig schrijven in 4K: 38,000 IOPS
  • DWPD 0.75 willekeurig; 4.62 sequentieel

Analyse van de werkbelasting van applicaties

De eerste benchmarks bestaan ​​uit de MySQL OLTP-prestaties via SysBench en Microsoft SQL Server OLTP-prestaties met een gesimuleerde TPC-C-workload.

Elke SQL Server VM is geconfigureerd met twee vDisks, één 100 GB voor opstarten en één 500 GB voor de database en logbestanden. Vanuit het perspectief van systeemresources hebben we elke VM geconfigureerd met 16 vCPU's, 64 GB DRAM en de LSI Logic SAS SCSI-controller gebruikt. Deze tests zijn ontworpen om te controleren hoe een latentiegevoelige toepassing presteert op het cluster met een matige, maar niet overweldigende reken- en opslagbelasting.

SQL Server-testconfiguratie (per VM)

  • Windows Server 2012 R2
  • Opslagcapaciteit: 600 GB toegewezen, 500 GB gebruikt
  • SQL Server 2014
    • Databasegrootte: schaal 1,500
    • Virtuele clientbelasting: 15,000
    • RAM-buffer: 48 GB
  • Testduur: 3 uur
    • 2.5 uur voorconditionering
    • 30 minuten proefperiode

In de SQL Server TPC-C-test op hypergeconvergeerde platforms kijken we naar de werklastverdeling over het cluster in hybride modus, all-flash (AF)-modus en all-flash datareductie (AF DR). De AF-modus voor Optane presteerde, niet verwonderlijk, net iets beter met een totale score van 12,605 TPS met individuele VM's variërend van 3,148.56 TPS tot 3,152.66 TPS. Dit is over het algemeen iets beter dan de niet-Optane-versie van vSAN met een totale score van 12,472 TPS. Met DR aan zagen we dat de Optane een totale score behaalde van 12,604 TPS (slechts één TPS lager dan met DR uit) met individuele VM's variërend van 3,148.7 TPS tot 3,153.5 TPS. Dit was een behoorlijk grote sprong ten opzichte van de niet-Optane-versie met DR's totale score van 11,969 TPS. Het is de moeite waard hier op te merken dat de Gold CPU's waarschijnlijk een beperkende factor zijn en met Platinum CPU's is er meer voordeel te behalen.

Voor de SQL Server TPC-C-test besteden we de meeste aandacht aan de variabele gemiddelde latentie. Kleine hiaten in de transactieprestaties laten niet het volledige verhaal zien. In onze gemiddelde latentietest had de AF Optane een totale score van slechts 16.5 ms met individuele VM's variërend van 14 ms tot 21 ms. Met DR op de Optane-versie sprong alleen naar 17 ms voor aggregaat met 13 ms tot 21 ms latentie voor individuele VM's. Dit is een grote verbetering ten opzichte van de niet-Optane vSAN met een totale score van 52.5 ms zonder DR en 261 ms met DR aan.

Sysbench-prestaties

Elke Sysbench VM is geconfigureerd met drie vDisks: één voor opstarten (~ 92 GB), één met de vooraf gebouwde database (~ 447 GB) en de derde voor de database die wordt getest (400 GB). Vanuit het perspectief van systeemresources hebben we elke VM geconfigureerd met 16 vCPU's, 64 GB DRAM en de LSI Logic SAS SCSI-controller gebruikt.

Sysbench-testconfiguratie (per VM)

  • CentOS 6.3 64-bits
  • Opslagcapaciteit: 1 TB, 800 GB gebruikt
  • Percona XtraDB 5.5.30-rel30.1
    • Databasetabellen: 100
    • Databasegrootte: 10,000,000
    • Database-threads: 32
    • RAM-buffer: 24 GB
  • Testduur: 12 uur
    • 6 uur preconditionering 32 threads
    • 1 uur 32 draden
    • 1 uur 16 draden
    • 1 uur 8 draden
    • 1 uur 4 draden
    • 1 uur 2 draden

Met de Sysbench OLTP kijken we voor elk naar de 8VM-configuratie. De Optane AF had een totale score van 10,699 TPS, meer dan tweemaal de 4,273 TPS van de niet-Optane-versie. Met DR aan, bereikte de Optane 8,668 TPS in vergelijking met de niet-Optane met DR's 3,625 TPS.

Voor de gemiddelde latentie van Sysbench was de op Optane gebaseerde vSAN echt in staat om te schitteren met totale scores van 23.95 ms en 29.62 ms met DR aan. Dit wordt vergeleken met de niet-Optane's 60.05ms en 71.05ms met DR aan. In beide gevallen had de Optane minder dan de helft van de latentie.

De gemiddelde latentie van het 99e percentiel toonde opnieuw aan dat de op Optane gebaseerde vSAN dramatisch sneller was met totale scores van 42.9 ms en 55.63 ms met DR aan in vergelijking met de niet-Optane's 126.02 ms en met DR aan, 212.42 ms.

VDBench-werkbelastinganalyse

Als het gaat om het benchmarken van opslagarrays, is het testen van toepassingen het beste en komt het synthetische testen op de tweede plaats. Hoewel ze geen perfecte weergave zijn van de werkelijke werkbelasting, helpen synthetische tests wel om opslagapparaten te baseren met een herhaalbaarheidsfactor die het gemakkelijk maakt om appels met appels te vergelijken tussen concurrerende oplossingen. Deze workloads bieden een scala aan verschillende testprofielen, variërend van "four corners"-tests, algemene tests voor de grootte van database-overdrachten, evenals het vastleggen van sporen uit verschillende VDI-omgevingen. Al deze tests maken gebruik van de gemeenschappelijke vdBench-workloadgenerator, met een scripting-engine om resultaten te automatiseren en vast te leggen over een groot rekentestcluster. Hierdoor kunnen we dezelfde workloads herhalen op een breed scala aan opslagapparaten, waaronder flash-arrays en individuele opslagapparaten.

profielen:

  • 4K willekeurig lezen: 100% lezen, 128 threads, 0-120% joate
  • 4K willekeurig schrijven: 100% schrijven, 64 threads, 0-120% irate
  • 64K sequentieel lezen: 100% lezen, 16 threads, 0-120% jorate
  • 64K sequentieel schrijven: 100% schrijven, 8 threads, 0-120% snelheid
  • Synthetische database: SQL en Oracle
  • VDI volledige kloon en gekoppelde kloonsporen

Voor de VDBench-test kijken we alleen naar de Optane Supermicro-versie van vSAN en kijken we of DR aan staat (vanaf nu DR genoemd) of uitgeschakeld (vanaf nu Raw genoemd). In onze eerste test voor piek 4K willekeurig lezen, had de Raw een latentie van minder dan een milliseconde tot ongeveer 440K IOPS en piekte hij op 521,599 IOPS met een latentie van 4.65 ms. De DR begon iets minder dan 1 ms voordat hij overging en piekte op 406,322 IOPS met een latentie van 7.32 ms.

Met 4K willekeurig schrijven reed de Raw de lijn van 1 ms, maar bleef eronder tot ongeveer 150K IOPS en piekte op 202,081 IOPS met een latentie van 8.4 ms. De DR bereikte ongeveer 114 IOPS met een latentie van minder dan een milliseconde en piekte op 183,947 IOPS met een latentie van 1.43 ms, waarna de prestaties sterk achteruitgingen en de latentie piekte.

Vervolgens kijken we naar 64K sequentiële workloads. Voor lezen had de Raw een latentieprestatie van minder dan een milliseconde tot ongeveer 54K IOPS of 3.5 GB/s en piekte op 85,319 IOPS of 5.33 GB/s met een latentie van 4.69 ms. De DR begon boven 1 ms en piekte op 73,583 IOPS of 4.6 GB/s met een latentie van 4.23 ms.

Voor 64K schrijven haalde de Raw slechts ongeveer 12K IOPS voordat hij 1 ms brak, en piekte op 40,869 IOPS of 2.55 GB / s met een latentie van 5.58 ms. DR had de hele tijd een latentie van minder dan een milliseconde, maar piekte op slechts 7,303 IOPS of 456 MB/s met een latentie van 623 μs.

Als we verder gaan met onze SQL-workloads, had de Raw een latentie van minder dan een milliseconde tot ongeveer 330 IOPS en piekte hij op 385,159 IOPS met een latentie van 2.34 ms. De DR bleef vrijwel de hele tijd boven de 1 ms met een piek van 321,504 IOPS met een latentie van 3.02 ms.

Voor SQL 90-10 bereikte de Raw ongeveer 300 IOPS voordat hij 1 ms brak en piekte op 363,550 IOPS met een latentie van 2.52. De DR piekte op 299,132 IOPS met een latentie van 3.26 ms.

Onze SQL 80-20-test zag de Raw over 277K IOPS lopen met minder dan 1 ms en piekte op 332,949 IOPS met een latentie van 2.79 ms. De DR piekte op 285,010 IOPS met een latentie van 3.42 ms.

De volgende stap is onze Oracle-workloads. De Raw had een latentie van minder dan een milliseconde tot ongeveer 262 IOPS en piekte op 323,706 IOPS met een latentie van 3.27 ms. De DR piekte op 211,993 IOPS met een latentie van 2.07 ms voordat de prestaties opnieuw afnamen en de latentie piekte.

Voor Oracle 90-10 had de Raw een latentieprestatie van minder dan een milliseconde tot ongeveer 315 IOPS en piekte hij op 354,590 IOPS met een latentie van 1.67 ms. De DR piekte op 279,356 IOPS met een latentie van 2.24 ms.

De Oracle 80-20-test zag de Raw onder 1 ms lopen tot ongeveer 273K IOPS en piekte op 322,616 IOPS met een latentie van 1.85 ms. De DR bereikte een piek van 263,425 IOPS en een latentie van 2.36 ms.

Vervolgens zijn we overgestapt op onze VDI-kloontest, Full en Linked. Voor VDI Full Clone Boot had de Raw een latentieprestatie van minder dan een milliseconde tot ongeveer 240 IOPS, met een piek van 293,335 IOPS en een latentie van 3.3 ms. De DR piekte op 181,527 IOPS en een latentie van 5.31 ms voordat hij wegviel.

VDI FC Initial Login had de Raw-start bijna 1 ms en passeerde het snel en bereikte een piek van 153,513 IOPS met een latentie van 5.6 ms voordat een lichte daling plaatsvond. De DR piekte eerder met ongeveer 68 IOPS en een latentie van 5.3 ms voordat de prestaties achteruit gingen en de latentie piekte.

Met VDI FC Monday Login had de Raw een latentie van minder dan een milliseconde tot ongeveer 58K IOPS en bereikte een piek van 152,660 IOPS met een latentie van 3.14 ms. De DR had een betere pieklatentie (1.64 ms), maar bereikte slechts een prestatie van 64,201 IOPS.

Voor VDI LC Boot had de Raw een latentie van minder dan een milliseconde tot ongeveer 170 IOPS en piekte op 209,676 IOPS met een latentie van 2.21 ms. Met de DR piekte het op 119,036 IOPS en een latentie van 3.99 ms.

Op weg naar VDI LC Initial Login bleef de Raw onder de 1 ms tot 29K IOPS en piekte op 92,951 IOPS met een latentie van 2.62 ms. Voor de DR piekte het op iets minder dan 64K IOPS met een latentie van ongeveer 2.3 ms voordat het wegviel.

Eindelijk, met een blik op VDI LC Monday Login, haalde de Raw het tot ongeveer 35K IOPS voordat hij 1 ms brak en piekte op 101,997 IOPS met een latentie van 4.65 ms. Met DR was de piek ongeveer 47 IOPS bij een latentie van 1.82 ms voordat de prestaties terugliepen.

Conclusie

De hypergeconvergeerde opslagoplossing van VMware is er in vele soorten en maten; deze specifieke iteratie gebruikt vier Supermicro 2029U-TN24R4T+ servers voor rekenkracht. Voor opslag maakt deze versie van vSAN gebruik van zowel Intel Optane in de vorm van Intel Optane P4800X SSD's als NVME-opslag in de vorm van Intel P4500 SSD's. Deze specifieke build maakt deel uit van Intel's nieuwe Select Solutions, met name Intel Select Solutions voor VMware vSAN. Het kan worden gezien als een vSAN ReadyNode die is gecertificeerd door zowel VMware als Intel om de noodzakelijke prestatiestatistieken te halen.

Als we naar de prestaties kijken, hebben we in onze Application Workload Analysis de Optane-versie van vSAN vergeleken met onze eerder geteste all-flash-versie van vSAN op Dell/Toshiba-apparatuur. Voor SQL Sever had de Optane-configuratie bijna identieke scores met datareductie (DR) aan en uit, een totale score van 12,605 TPS zonder DR en 12,604 TPS met DR. Dit markeert een vrij grote sprong ten opzichte van de all-flash, niet-Optane-versie met DR aan (11,969 TPS). Kijkend naar latentie, liet de Optane-versie een drastische verbetering zien met totale scores van slechts 16.5 ms zonder DR en slechts 17 ms met DR aan, minder dan de helft van de latentie van de SAS all-flash-versie op vSAN 6.2. Met Sysbench had de Optane-versie van vSAN meer dan tweemaal de TPS van de all-flash-versie met totale scores van 10,699 TPS Raw en 8,668 TPS met DR aan. Deze trend zet zich voort met latentie en latentie in het slechtste geval, in beide gevallen minder dan de helft met totale scores van 24 ms en 30 ms met DR voor gemiddeld, en 60 ms en 71 ms met DR voor worst-case.

Voor onze VDBench had de Optane vSAN verschillende hoogtepunten voor Raw-prestaties, waaronder 4K lezen van 522K IOPS, 4K schrijven van 202K IOPS, 64K lezen van 5.33 GB/s en 64K schrijven van 2.55 GB/s. Met DR aan, zagen we de vSAN 406K IOPS 4K lezen, 184K IOPS schrijven (gevolgd door een scherpe daling), 4.6 GB/s lezen op 64K en slechts 456 MB/s schrijven op 64K, maar met een latentie van minder dan 1 ms. vSAN ging door met sterke prestaties in SQL met 385 IOPS, 364 IOPS in 90-10 en 333 IOPS in 80-20 en de DR met 322 IOPS, 299 IOPS in 90-10 en 285 IOPS in 80-20. In Oracle presteerde de Raw redelijk goed met 324K IOPS, 355K IOPS in 90-10 en 323K IOPS in 80-20. De DR was ook sterk in Oracle met pieken van 212K IOPS (voor het wegvallen), 279K IOPS in 90-10 en 263K IOPS in 80-20.

De opname van Optane SSD's heeft duidelijk een grote impact op de schrijfprestaties voor vSAN. Dit is zelfs als je bedenkt dat de schijven slechts 375 GB zijn en dat vSAN een capaciteit van 600 GB ondersteunt voor de schijven met schrijfniveau. Het is dus mogelijk dat we daar wat meer schrijfprestaties kunnen behalen door grotere schijven te hebben. Er is ook behoorlijk wat opwaarts potentieel voor deze Intel-configuraties, aangezien snellere verbindingen gekwalificeerd zijn en agressievere RAM- en CPU-configuraties worden gebruikt, zoals in de Plus-opties. Intel heeft nu ook snellere/betere schijven beschikbaar voor de leeslaag; de P4510 was een substantiële verbetering ten opzichte van de P4500. Het punt is dat deze gegevens, in plaats van deze gegevens te beschouwen als de beste die Optane kan doen, meer gaan over het instellen van de basislijn voor midrange serverconfiguraties die nog veel meer te bieden hebben, mocht de gelegenheid daarom vragen. Het is ook belangrijk om te bedenken dat vSAN goed gepositioneerd is om te blijven profiteren van nieuwe opslag- en servertechnologie wanneer deze op de markt komt - iets dat voor traditionele leveranciers van apparaten veel moeilijker te realiseren is.

De conclusie is echter duidelijk dat naarmate vSAN volwassener is geworden, VMware slim is geweest om voorop te lopen in opkomende technologie zoals Intel Optane SSD's. Dit geeft vSAN een aanzienlijk voordeel in termen van hoe prestaties eruit kunnen zien in de HCI-markt. Hoewel veel HCI-oplossingen graag voldoen aan de behoeften van ROBO-use-cases met matige prestatieprofielen, blijft vSAN op zoek naar de beste partners om oplossingen te creëren die even gelukkig zijn aan de rand als ze de basis leggen voor wat datacenters van de volgende generatie eruit zien in de SDDC-wereld. Optane-gebaseerde vSAN-clusters zijn uitermate geschikt voor de laatste en bieden de best mogelijke schrijflatentie voor alle applicatieworkloads.

VMware vSAN

Bespreek deze recensie

Meld u aan voor de StorageReview-nieuwsbrief