Home Enterprise HCI at the Edge profiteert van Intel Optane & QLC NVMe SSD's

HCI at the Edge profiteert van Intel Optane & QLC NVMe SSD's

by StorageReview Enterprise Lab

Wij in de IT-gemeenschap zijn vaak geobsedeerd door showpaarden - de snelste en/of krachtigste apparaten of systemen - omdat we houden van die grote en kleine aantallen die ze laten zien. De realiteit is echter dat de meeste gebruikers de opzichtige kracht van showpaarden simpelweg niet nodig hebben. Zij hebben nodig werkpaarden, systemen die dagelijkse werklasten kunnen verwerken tegen een betaalbare prijs. We hebben behoorlijk wat tijd besteed aan het onderzoeken van DataON's Hyperconverged Infrastructure (HCI)-aanbiedingen, en hebben zelfs de DataON HCI-224 met Intel® Optane™ SSD's onze Editor's Choice onderscheiding vorig jaar. In dit artikel zullen we kijken naar een ander HCI-224-cluster met twee knooppunten. Deze heeft echter een unieke mix van opslag: Intel Optane SSD's front-end Intel® SSD D5-P4326 15.36 TB met QLC 3D NAND, waardoor een systeem ontstaat dat capaciteit, prestaties en kosten optimaliseert.

Wij in de IT-gemeenschap zijn vaak geobsedeerd door showpaarden - de snelste en/of krachtigste apparaten of systemen - omdat we houden van die grote en kleine aantallen die ze laten zien. De realiteit is echter dat de meeste gebruikers de opzichtige kracht van showpaarden simpelweg niet nodig hebben. Zij hebben nodig werkpaarden, systemen die dagelijkse werklasten kunnen verwerken tegen een betaalbare prijs. We hebben behoorlijk wat tijd besteed aan het onderzoeken van DataON's Hyperconverged Infrastructure (HCI)-aanbiedingen, en hebben zelfs de DataON HCI-224 met Intel® Optane™ SSD's onze Editor's Choice onderscheiding vorig jaar. In dit artikel zullen we kijken naar een ander HCI-224-cluster met twee knooppunten. Deze heeft echter een unieke mix van opslag: Intel Optane SSD's front-end Intel® SSD D5-P4326 15.36 TB met QLC 3D NAND, waardoor een systeem ontstaat dat capaciteit, prestaties en kosten optimaliseert.

Voordat we echter in dit cluster duiken, zullen we eerst bespreken waarom DataON voor QLC koos voor zijn opslagcapaciteitsniveau, en een overzicht geven van Microsoft Azure Stack-HCI, DataON en HCI-clusters met twee knooppunten. 

Intel® SSD D5-P4326-serie

Het gebruik van op QLC gebaseerde Intel SSD D5-P4326 voor capaciteitsopslag in dit HCI-cluster is een logische keuze, omdat het solide, betrouwbare en kostenefficiënte prestaties levert. We hebben zeker snellere SSD's gezien, maar de SSD D5-P4326 vindt de juiste balans tussen prestaties en kosten, met een enorme capaciteit van 15.36 TB per schijf. Deze combinatie is te danken aan de onderliggende architectuur. Met behulp van Intel® QLC 3D NAND-technologie kan Intel de kosten van dit apparaat verlagen en tegelijkertijd de capaciteit vergroten. 

HCI QLC-SSDIntel was een van de eerste opslagleveranciers die op QLC gebaseerde schijven maakte. QLC of quad-level celtechnologie slaat vier bits aan gegevens op een enkele cel op, terwijl oudere technologie zoals TLC, MLC en SLC slechts drie, twee of één bit(s) per cel opslaat. Dankzij QLC-opslag met hogere dichtheid kunnen ze lagere kosten per GB opslag hebben. Bovendien zorgt de 3D NAND-technologie van Intel ervoor dat deze cellen horizontaal op de chip kunnen worden gestapeld, waardoor de opslagdichtheid verder wordt vergroot.  rand HCI Optane QLC SSDEr is wel een compromis. Om effectief te profiteren van de Intel SSD D5-P4326 SSD, moeten schrijfworkloads worden gebufferd voordat ze naar de op QLC gebaseerde schijf gaan. QLC SSD's zijn bij uitstek geschikt voor voor capaciteit geoptimaliseerde, leesintensieve workloads. Als zodanig moeten platforms zoals een HCI-cluster een geschikt cache-apparaat vóór de QLC SSD's gebruiken om gelijkmatige prestaties te leveren. In het geval van de DataON HCI-224, per node worden vier Intel Optane SSD DC P4800X NVMe 750GB 2.5-inch schijven gebruikt om schrijfbewerkingen te absorberen voordat gegevens naar de QLC-laag worden verplaatst. Deze aanpak voorkomt dat overmatig schrijven de prestaties van de QLC-laag verslechtert. Het netto resultaat is dat klanten een naadloze ervaring krijgen en een ideale combinatie van op Intel Optane gebaseerde prestaties met op QLC gebaseerde capaciteit. 

Microsoft Azure Stack-HCI

In het kort, Microsoft Azure Stack HCI is een on-premise implementatie van Microsoft Azure Cloud Services. In feite heeft Microsoft hun bestaande HCI-technologie in de Azure Stack-familie opgenomen, zodat hun klanten gevirtualiseerde applicaties on-premises kunnen uitvoeren met directe toegang tot Azure-beheerservices zoals back-up en noodherstel. 

Azure Stack HCI moet niet worden verward met Azure of Azure Stack Hub. Terwijl Azure een openbare cloudservice is, zijn Azure Stack Hub en Azure Stack HCI oplossingen op locatie. Bovendien draait Azure Stack Hub Azure OS met Azure Services en is het een IaaS- en PaaS-oplossing. Azure Stack HCI draait daarentegen Windows Server OS met Azure Services en stelt u in staat om gevirtualiseerde workloads uit te voeren op dezelfde manier als u gewend bent, met als bijkomend voordeel dat u verbinding kunt maken met de Azure-cloud voor aanvullende services. Dit is een enorm verschil en stelt IT-beheerders in staat om dezelfde tools en beheerstack op Azure Stack HCI te gebruiken als bij Azure.

Microsoft Azure-implementatieoptiesAzure Stack HCI gebruikt Hyper-V voor zijn hypervisor, Storage Spaces Direct voor opslag, Microsoft Software Defined Networking (SDN) voor netwerken en Windows Admin Center (WAC) voor het beheer ervan. Azure Stack HCI draait op standaard x86-servers en andere commodity-componenten.

Microsoft Azure Stack HCI-oplossingWAC is een lokaal geïmplementeerd, browsergebaseerd beheerplatform dat zowel on-premise als Azure cloud-based instances van Windows 10 en Windows Server kan beheren. WAC is geïnstalleerd op een Windows-systeem en maakt gebruik van PowerShell-scripts. Het maakt ook gebruik van Microsoft Windows Management Framework (WMF) via WinRM (Windows Remote Management) om Windows-systemen te bewaken en te beheren, inclusief HCI-clusters en virtuele Azure-machines. 

Het hoofddashboard van WAC geeft een overzicht van CPU-, geheugen-, netwerk- en schijfactiviteit voor de systemen die worden gecontroleerd. Aan de linkerkant van het scherm bevat WAC ook een aantal hulpprogramma's voor systeembeheer en browsen, waaronder certificaten, apparaten, gebeurtenissen, bestanden, lokale gebruikers en groepen, firewall, processen, register, rollen en functies, services en opslag.

DataON WAC Optane QLC SSDDataON was een van de eerste bedrijven die profiteerde van het open raamwerk van WAC en de MUST-extensie (Management Utility Software Tool) overzette naar WAC. DataON MUST biedt zichtbaarheid, monitoring en beheer van de infrastructuur voor op Windows server gebaseerde HCI, netwerken en opslag.

DataON MOET

DataON HCI

Hoewel Azure Stack HCI basishardwarecomponenten gebruikt, moeten deze items zo worden ontworpen dat ze samenwerken om optimale resultaten te leveren. In sommige opzichten is het gemakkelijker om hoogwaardige systemen te ontwerpen dan werkpaardsystemen. Met hoogwaardige systemen kunt u de beste componenten selecteren en de kosten negeren. Maar met werkpaarden moet u de kosten/prestaties van de componenten evalueren en ze vervolgens afstemmen om hun prestaties te optimaliseren. Er is net zoveel, zo niet meer, technische inspanning voor nodig om een ​​waardegericht systeem en dit systeem te leveren engineering is waar we nog steeds onder de indruk van zijn DataON.

DataON HCI Optane QLC SSDDataON heeft een sterke samenwerking met zowel Microsoft als Intel, en zij profiteerden van deze relaties bij het ontwikkelen van systemen voor Azure Stack HCI. DataON's HCI Intel Select-oplossingen kunnen vooraf worden geconfigureerd en geleverd in hun eigen rack, klaar voor onmiddellijke implementatie. Deze leveringsmethode is niet alleen handig in het datacenter, maar blijkt ook gunstig te zijn voor systemen die aan de rand worden ingezet waar de bestaande IT-infrastructuur en het personeel beperkt of niet aanwezig zijn.

HCI-clusters met 2 knooppunten

We hebben onlangs een artikel over Microsoft Azure Stack HCI 2-knooppuntclusters (2NC). Hieronder een samenvatting van dat artikel. We ontdekten dat een 2NC voor veel use-cases de veerkracht kan bieden die nodig is voor een organisatie en dat 2NC's minder complex en kostbaar zijn dan een traditioneel cluster met drie knooppunten of vier knooppunten. DataON was een van de eerste leveranciers die de waarde van 2NC's inzag en de integratie ervan omarmde. Maar 2NC's zijn niet nieuw voor DataON, want in september 2017 kondigde DataON de eerste twee commercieel verkrijgbare Kepler-47 HCI voor Windows Server 2016 Storage Spaces Direct-systemen (nu Azure Stack HCI). 

DataON's 2NC-implementatie ondersteunt zowel een schijfstoring als een serverstoring op hetzelfde moment. Het doet dit door RAID 5 + 1 te gebruiken om pariteitsveerkracht te doen en dat naar de andere server te spiegelen. Microsoft noemt deze mogelijkheid "geneste veerkracht" en heeft deze mogelijkheid toegevoegd aan Storage Spaces Direct in Windows Server 2019. Nogmaals, 2NC is niet voor iedereen de juiste technologiekeuze, maar ze kunnen voor veel organisaties een betrouwbare en kosteneffectieve oplossing bieden.

Bouw en Ontwerp

Het Azure Stack HCI-cluster waarmee we hier werken, is gebouwd op het DataON HCI-224 all-flash NVMe-platform. Deze servers waren 2U groot met 24-NVMe-sleuven aan de voorkant en boden aan de achterkant voldoende uitbreiding voor op PCIe gebaseerde componenten. De labeling was hoog in tegenstelling tot de matzwarte schijfcaddy's, waardoor het gemakkelijk was om specifieke schijven te herkennen in het geval van een noodzakelijke vervanging. Alles was gelabeld, wat niet zo ongewoon is, maar de omvang van de labeling was buitengewoon. Onze implementatie had elk knooppunt het label (1 en 2), evenals verschillende andere items, waardoor het gemakkelijk was om DataON-systemen in het datacenter te implementeren en te beheren.

De knooppunten in deze tests bevatten dual 2nd Gen Intel® Xeon® Scalable Gold 6248 2.5 GHz, 20-core, 28 MB cacheprocessors, evenals acht Samsung 32 GB DDR4 2933 MHz ECC-geregistreerde RDIMM's (256 GB totaal per node) en dubbele Intel S4510 480 GB SATA M.2-opstartschijven.

Voor opslag werd elk knooppunt geleverd met vier Intel Optane SSD DC P4800X NVMe 750 GB 2.5-inch schijven (gebruikt voor caching) en vier Intel SSD D5-P4326 15.36 TB 2.5-inch QLC-schijven (capaciteitsopslaglaag). 

De knooppunten waren met elkaar verbonden via Mellanox ConnectX-4 EN dual-port QSFP28 40/56 GbE-kaarten met behulp van 3M Mellanox LinkX ETH 40GbE, 40Gb/s, QSFP passieve koperen kabels.

Het is duidelijk dat DataON behoorlijk wat tijd en aandacht heeft besteed aan de configuratie en componentselectie voor dit systeem om de prestaties en kosten in evenwicht te houden. We waren erg benieuwd hoe de Intel SSD D5-P4326 SSD's zouden presteren als opslaglaag. Door Intel Optane SSD's en Intel QLC 3D NAND SSD's te combineren, zouden de D5-P4326 SSD's een hoog prestatieniveau en kosteneffectieve flashopslag moeten bieden, wat vroeger het domein was van trage, maar grote harde schijven.

In het StorageReview-lab hebben we de twee opslagknooppunten en -switches geïmplementeerd zoals hieronder weergegeven.

HCI Optane QLC SSD met 2 knooppunten

Testen 

Om een ​​idee te krijgen van hoe zo'n klein cluster kan presteren in een edge use case, hebben we verschillende Microsoft SQL Server-tests opgezet. Het doel was om de volledige clusterprestaties te onderzoeken om ervoor te zorgen dat DataON correct gebruik kon maken van de Intel Optane-technologie en Intel QLC SSD's. Ten tweede wilden we de mogelijkheden van slechts één knooppunt onderzoeken, om een ​​idee te krijgen van hoe deze oplossing omgaat met het verlies van een knooppunt, hetzij voor geplande updates, hetzij in het geval van een ernstiger defect. 

Ons testplan maakte gebruik van Quest's Benchmark Factory met behulp van het TPC-C-profiel als de load-generator voor de SQL Server VM's die we hebben geïmplementeerd. We hebben acht VM's geconfigureerd (vier per node), wat een goede balans bood tussen CPU- en schijfactiviteit voor het cluster. De werklastgeneratoren werden gehost op een systeem buiten deze omgeving en verbonden met dit cluster via 10GbE-netwerken.

SQL Server-testconfiguratie (per VM)

  • Windows Server 2019
  • Opslagcapaciteit: 800 GB toegewezen, 620 GB gebruikt
  • 8 vCPU's
  • 60 GB RAM (55 GB in mislukte modusconfiguratie)
  • SQL Server 2019
    • Databasegrootte: schaal 1,500
    • Virtuele clientbelasting: 15,000
    • RAM-buffer: 48 GB
  • Testduur: 3 uur
    • 15 minuten voorconditionering
    • 45 minuten proefperiode

In onze tests hebben we ons gericht op latentieprestaties, waarbij het transactieprestatieniveau constant bleef met Benchmark Factory.

DataON K2N HCI-224 Intel D5-P4326 prestaties1Met een belasting van in totaal 4 VM's (2 per knooppunt), hebben we een gemiddelde latentie van 2.5 ms gemeten met een totale transactiebelasting van 12,649TPS.

DataON K2N HCI-224 Intel D5-P4326 prestaties2Door de belasting te verhogen tot 6 VM's, nam de gemiddelde latentie licht toe tot 4 ms met een totale transactiebelasting van 18,967 TPS.

HCI SQL Server-prestaties ZwaarBij de piekbelasting van 8 VM's (4 per node) piekte de latentie op gemiddeld 6.5 ms, met een totale transactiebelasting van 25,277. 

Tijdens deze tests zagen we duidelijk het voordeel van het hebben van de Optane SSD's in deze mix. Ze namen de dupe van de schrijfbewerkingen, waardoor de QLC SSD's vrijkwamen voor responsieve leesbewerkingen als de high-speed capaciteitslaag. Zelfs toen we de werklast verdubbelden tot acht SQL Server VM's die dit HCI-cluster raakten, steeg de latentie slechts een klein beetje, wat aantoont dat deze configuratie zeer geschikt is voor werklasten die van tijd tot tijd kunnen barsten. 

Hoewel prestaties in een volledig operationele omgeving belangrijk zijn, is een andere overweging hoe de workloads zullen werken als een knooppunt in het cluster offline gaat of als workloads moeten worden gemigreerd voor systeemonderhoud. Om dit scenario te testen, hebben we onze volledige belasting van 8 VM's behouden en deze naar één knooppunt gemigreerd. In deze opstelling hebben we een gemiddelde latentie van slechts 4.5 ms gemeten, wat beter was dan beide knooppunten online. Een deel hiervan is afkomstig van het verwijderen van opslagoverhead bij werking met één knooppunt.

Conclusie 

Voor dit project hebben we een reeks SQL-tests op het systeem uitgevoerd om de performance-workloads te illustreren die vaak worden aangetroffen in edge- en SMB-use-cases. Ons doel was om te begrijpen hoe effectief Microsoft Azure Stack HCI in dit DataON-cluster hardware kon gebruiken om de gewenste resultaten te bereiken. Concreet betekent dit het bieden van een oplossing die een zeldzame combinatie van prestaties en waarde biedt.

We kunnen door onze tests bevestigen dat de selectie van componenten van DataON inderdaad succesvol was in het creëren van een kosteneffectieve Azure Stack HCI SDS-oplossing die buitengewoon goed presteert. Dit is deels te danken aan hun keuze om de Intel SSD D5-P4326 te gebruiken voor capaciteitsopslag, die op efficiënte wijze profiteert van Intel Optane SSD's voor tiering. 

Dit is een cruciaal begrip, aangezien de QLC SSD's enorme, dichte capaciteit bieden aan het cluster, terwijl ze nog steeds de TCO-voordelen bieden die gepaard gaan met flash-opslag. Als klap op de vuurpijl maken de QLC-schijven 15.36 TB aan capaciteit per 2.5-inch schijfpositie mogelijk. Er zouden 8 HDD's van 2 TB in RAID 0 nodig zijn om qua capaciteit overeen te komen, of overschakelen naar een 3.5-inch chassis om te profiteren van grotere, maar zelfs langzamere HDD's. Hoe dan ook, de prestatiedaling van de Intel QLC-schijf naar harde schijven is meer dan aanzienlijk; het is een exponentieel verschil als het gaat om de responsiviteit van applicaties.

Hoe graag we ook zouden willen dat alle lees- en schrijfbewerkingen afkomstig zijn van de Optane SSD's (aangezien ze de best presterende media zijn in deze configuratie), soms zal er een misser zijn. In dat geval zullen de prestaties van de QLC SSD de harde schijven verslaan, waardoor het HCI-cluster wordt beschermd tegen onregelmatigheden in de prestaties die vaak voorkomen in topologieën die flash- en harde schijven combineren. We zagen hier zelfs zulke gebalanceerde prestaties dat bedrijven in het algemeen in de toekomst wellicht het HDD/flash-ontwerp moeten heroverwegen en meer naar QLC/Optane-ontwerp moeten leunen om de meeste voordelen van HCI te kunnen benutten. 

De andere grote zorg rond clusters met 2 knooppunten zijn de prestaties in een gedegradeerde staat. We hebben dit getest door een node te laten falen en alle SQL-workload aan één node te geven. In dit geval reageerde SQL beter en presteerde het iets beter dan in 2-node, voornamelijk vanwege de lagere overhead van node-to-node-communicatie. Het wordt natuurlijk niet aangeraden om lang in een dergelijke gedegradeerde staat te werken, maar het is geruststellend om te weten dat dit kan worden gedaan zonder in te leveren op prestaties. 

Over het algemeen was het HCI-224 HCI-cluster met D5-P4326 QLC SSD's eenvoudig te implementeren, gebruiksvriendelijk en krachtig genoeg voor een breed scala aan workloads. De prijs maakt het ook beschikbaar voor een groot aantal gebruikers. Bovendien is dit systeem gecertificeerd voor Microsoft Windows Server 2019 en gevalideerd als Intel Select Solution. 

DataON Intel QLC-infographic

GegevensAAN

Neem contact op met StorageReview

Nieuwsbrief | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS Feed

Dit rapport wordt gesponsord door DataON. Alle standpunten en meningen in dit rapport zijn gebaseerd op onze onbevooroordeelde kijk op het (de) product(en) in kwestie.