Tijdens het Open Compute Project dit jaar kondigde Toshiba de release aan van zijn nieuwe software rond NVMe over Fabrics (NVMe-oF), KumoScale. KumoScale is ontworpen om de prestatievoordelen van direct aangesloten NVMe-schijven via het datacenternetwerk te maximaliseren door desaggregatie, abstractie en beheerintegratie. De software brengt de toch al goed presterende NVMe SSD's door schijfloze rekenknooppunten (met alleen een opstartschijf) toegang te geven tot deze flash-opslag via high-speed fabrics-netwerkconnectiviteit. Dit type verbinding zorgt ervoor dat de netwerkopslag bijna topprestaties levert.
Tijdens het Open Compute Project dit jaar kondigde Toshiba de release aan van zijn nieuwe software rond NVMe over Fabrics (NVMe-oF), KumoScale. KumoScale is ontworpen om de prestatievoordelen van direct aangesloten NVMe-schijven via het datacenternetwerk te maximaliseren door desaggregatie, abstractie en beheerintegratie. De software brengt de toch al goed presterende NVMe SSD's door schijfloze rekenknooppunten (met alleen een opstartschijf) toegang te geven tot deze flash-opslag via high-speed fabrics-netwerkconnectiviteit. Dit type verbinding zorgt ervoor dat de netwerkopslag bijna topprestaties levert.
Hoewel deze software kan worden gebruikt in elk standaard x86-systeemplatform, maken we voor onze beoordeling gebruik van de Newisys NSS-1160G-2N dual node-server. Het Newisys NSS-1160G-2N-platform is geoptimaliseerd voor een hyperschaal servicemodel met hot-swap van NVMe-schijven, gebalanceerde doorvoer van netwerk naar schijven, FRU-gebaseerd onderhoud in koude gangen, redundante voeding en koeling en andere belangrijke schaal- out datacenter eisen. Onze server presenteert opslag via twee 100G Mellanox-kaarten met 8x Toshiba NVMe SSD's op één knooppunt, het tweede knooppunt wordt gebruikt voor beheerdoeleinden. De belasting wordt gegenereerd door een enkele Dell PowerEdge R740xd die rechtstreeks is verbonden met de Newisys via dubbele 100G Mellanox ConnectX-5 NIC's. De Newisys kan tot 16 NVMe- en dubbele Xeon-serverkaarten bevatten in zijn compacte 1U-vormfactor en is geoptimaliseerd voor de laagste latentie en de hoogste prestaties met direct-attach-drives, hoewel de server iets langer is dan wat we gewend zijn in onze racks .
KumoScale heeft verschillende andere voordelen ten opzichte van traditionele direct aangesloten SSD's. Gebruikmakend van NVMe-oF-gebruikers hebben minder nodes nodig om nog meer rekenkracht en opslag te bereiken. Het hebben van minder nodes betekent dat ze beter kunnen worden beheerd en de kosten kunnen worden verlaagd. Een deel van de verlaging van de kosten zou het gevolg zijn van het elimineren van gestrande opslag en rekenkracht. KumoScale gebruikt rustgevende API's om te integreren met meerdere orkestratieframeworks; het meest interessante is dat het werkt met Kubernetes. Hierdoor kunnen degenen die Kubernetes gebruiken voor containeropslag dit doen met veel hogere prestaties, met precies de juiste hoeveelheid ingerichte opslag. Naast Kubernetes werkt KumoScale ook met OpenStack, Lenovo XClarity en Intel RSD.
beheer
Als een beetje een opvallende verschijning, wordt KumoScale geleverd met een vrij slanke en intuïtieve GUI. Meestal wordt dit type oplossing beheerd via de CLI (en in feite zullen verschillende aspecten dat nog steeds zijn). Op het dashboardtabblad kunnen gebruikers eenvoudig de opslagprestaties, systeemcapaciteit en hardwarestatus zien en een beetje inzoomen op de individuele SSD-status.
Het volgende tabblad is het netwerktabblad dat de beschikbaarheid en verbindingsstatus van de controller(s) toont, samen met het type, de snelheid, het MAC-adres en de MTU.
Het opslagtabblad valt uiteen in vier subtabbladen. Het eerste subtabblad is de fysieke SSD's. Hier kunnen gebruikers de schijven zien op naam, of ze al dan niet beschikbaar zijn, hun serienummers, hun capaciteit, hun groepsgebruik en het resterende percentage van de levensduur.
Het volgende subtabblad in gevirtualiseerde opslaggroepen. Dit subtabblad is vergelijkbaar met het bovenstaande met naam, beschikbaarheid, capaciteit, evenals beschikbare ruimte, de fysieke SSD waarvan het is gevirtualiseerd en het doel.
Het volgende subtabblad, Doelen, breidt de bovenstaande doelen uit en toont de gevirtualiseerde opslag die aan de host wordt blootgesteld, inclusief groepsvolumes.
Het laatste subtabblad onder opslag is het tabblad Initiators. Dit tabblad geeft de naam van de initiator, de alias (in dit geval Dell) en het aantal toegangen. De gebruiker kan Access Control (ACL) verlenen voor het doel-initiatorpaar.
Het volgende hoofdtabblad is Opslagprestaties. Hier kunnen gebruikers een uitlezing zien van doorvoer, IOPS en latentie voor een bepaald tijdsbestek.
En tot slot komen we bij de netwerkprestaties, die gebruikers ook een uitsplitsing geven van prestatiestatistieken, bandbreedte en pakketten voor een bepaalde tijd.
Prestatie
VDBench-werkbelastinganalyse
Als het gaat om het benchmarken van opslagarrays, is het testen van toepassingen het beste en komt het synthetische testen op de tweede plaats. Hoewel het geen perfecte weergave is van de daadwerkelijke werkbelasting, helpen synthetische tests wel om opslagapparaten te baseren met een herhaalbaarheidsfactor die het gemakkelijk maakt om appels met appels te vergelijken tussen concurrerende oplossingen. Deze workloads bieden een scala aan verschillende testprofielen, variërend van "four corners"-tests, algemene tests voor de grootte van database-overdrachten, evenals het vastleggen van sporen uit verschillende VDI-omgevingen. Al deze tests maken gebruik van de gemeenschappelijke vdBench-workloadgenerator, met een scripting-engine om resultaten te automatiseren en vast te leggen over een groot rekentestcluster. Hierdoor kunnen we dezelfde workloads herhalen op een breed scala aan opslagapparaten, waaronder flash-arrays en individuele opslagapparaten. Aan de arrayzijde gebruiken we ons cluster van Dell PowerEdge R740xd-servers:
profielen:
- 4K willekeurig lezen: 100% lezen, 128 threads, 0-120% joate
- 4K willekeurig schrijven: 100% schrijven, 64 threads, 0-120% snelheid
- 64K sequentieel lezen: 100% lezen, 16 threads, 0-120% jorate
- 64K sequentieel schrijven: 100% schrijven, 8 threads, 0-120% snelheid
- Synthetische database: SQL en Oracle
- VDI volledige kloon en gekoppelde kloonsporen
In 4K piekleesprestaties presteerde de Newisys met KumoScale (in de rest van deze review "het opslagknooppunt" genoemd omdat dit het enige apparaat is dat wordt bekeken) tijdens de test minder dan een milliseconde, met een piek van 2,981,084 IOPS met een latentie van 260μs.
In 4K piekschrijfprestaties piekte het opslagknooppunt op 1,926,637 IOPS met een latentie van 226μs.
Overschakelend naar 64K piekuitlezing, had het opslagknooppunt een piekprestatie van 213,765 IOPS of 13.36 GB/s met een latentie van 441 μs.
Voor 64K sequentiële piekschrijven bereikte het opslagknooppunt 141,454 IOPS of 8.83 GB/s met een latentie van 432 μs.
In onze SQL-workload piekte het opslagknooppunt op 1,361,815 IOPS met een latentie van 179μs.
In de SQL 90-10-benchmark zagen we piekprestaties van 1,171,467 IOPS bij een latentie van slechts 210 μs.
De SQL 80-20-benchmark liet zien dat het opslagknooppunt een piekprestatie behaalde van 987,015 IOPS met een latentie van 248 μs.
Met de Oracle Workload had het opslagknooppunt een piekprestatie van 883,894 IOPS met een latentie van 280μs.
De Oracle 90-10 vertoonde piekprestaties van 967,507 IOPS met een latentie van 176μs.
In de Oracle 80-20 kon het opslagknooppunt 829,765 IOPS bereiken met een latentie van 204 μs.
Vervolgens zijn we overgestapt op onze VDI-kloontest, Full en Linked. Voor VDI Full Clone Boot bereikte het opslagknooppunt een piek van 889,591 IOPS met een latentie van 261μs.
Bij de eerste login van VDI Full Clone bereikte het opslagknooppunt een piek van 402,840 IOPS met een latentie van 562 μs.
De VDI Full Clone Monday-login toonde een piekprestatie van 331,351 IOPS en een latentie van 369μs.
Toen we overgingen op VDI Linked Clone, toonde de opstarttest een piekprestatie van 488,484 IOPS en een latentie van 234 μs.
In het Linked Clone VDI-profiel dat de initiële aanmeldingsprestaties meet, bereikte het opslagknooppunt een piek van 194,781 IOPS met een latentie van 318 μs.
In ons laatste profiel kijken we naar de VDI Linked Clone Monday Login-prestaties. Hier piekte het opslagknooppunt op 247,806 IOPS met een latentie van 498 μs.
Conclusie
KumoScale-software is ontworpen om de prestaties van blokopslag te maximaliseren en bundelt NVMe SSD's om de juiste hoeveelheid capaciteit en IOPS te leveren die kunnen worden gedeeld door duizenden taakinstanties via NVMe-oF. Dit geeft cloudgebruikers meer flexibiliteit, schaalbaarheid en efficiëntie. Hoewel KumoScale in verschillende hardware-opties kan worden gebruikt om het opslagknooppunt te maken (Toshiba raadt Intel Xeon CPU E5-2690 v4 @2.30 GHz of gelijkwaardig en 64 GB DRAM aan), gebruikten we de Newisys NSS-1160G-2N dual node-server. Niet alleen zal NVMe-oF storage naar bijna topprestaties brengen, KumoScale werkt ook met meerdere orkestratieframeworks, waaronder Kubernetes, OpenStack, Lenovo XClarity en Intel RSD.
Het Newisys-systeem, mogelijk gemaakt door Toshiba KumoScale, kan zeker de donder brengen op het gebied van prestaties. Nergens kwam het opslagknooppunt in de buurt van het breken van 1 ms, de hoogste latentie was 562 μs bij de eerste aanmelding van VDI FC. Enkele hoogtepunten zijn bijna 3 miljoen IOPS in 4K lezen, bijna 2 miljoen in 4K schrijven, 1.3 miljoen IOPS in de SQL-workload, 1.1 miljoen IOPS in de SQL 90-10 en bijna 1 miljoen in de SQL 80-20. Voor 64K sequentiële prestaties bereikte het opslagknooppunt 13.36 GB.s lezen en 8.83 GB/s schrijven.
Hoewel er geen twijfel over bestaat dat de prestaties astronomisch zijn, laat het plaatsen van KumoScale in de juiste context het echt schitteren. Latentie en prestaties zijn aanzienlijk beter via dit platform dan andere niet-NVMe-oF-platforms. Latentie ligt dichter bij die van lokale opslagprestaties, en dat is precies waar het NVMe-oF-protocol naar streeft en wat de applicaties vereisen waarop deze systemen zijn gepositioneerd. Prestaties op schaal van dit systeem zijn echter wat er echt toe doet. We hebben gekeken naar de prestaties van 8 SSD's in één opslagknooppunt, waarbij productiesystemen meerdere opslagknooppunten zouden hebben, elk met hun eigen opslagpools. Prestaties in dat beoogde scenario blazen traditionele opslagarraystatistieken met gemak uit het water, waardoor KumoScale een doorbraak maakt als het gaat om NVMe-oF-arrays. Toshiba heeft het buitengewoon goed gedaan in het leveren van prestatie-efficiëntie met KumoScale en het heeft zelfs een GUI voor evaluatie en ontwikkeling. In combinatie met het Newisys-chassis zal deze oplossing zeker succes hebben in grote datacenters die gebruik kunnen maken van de doorvoer- en latentievoordelen die Toshiba KumoScale-software biedt.
Meld u aan voor de StorageReview-nieuwsbrief