Tot nu toe hebben we diep in de Microsoft Azure Stack HCI gedoken, de on-premise implementatie van de Azure-cloudservice van Microsoft. Azure Stack HCI kan worden gezien als een type platform dat het beste van beide werelden biedt. Het heeft alle beheertools van Azure, zoals Azure Monitor, Azure Security Center, Azure Update Management, Azure Network Adapter en Azure Site Recovery, terwijl de gegevens op locatie worden ondergebracht en aan bepaalde voorschriften wordt voldaan. Azure Stack HCI is onderverdeeld in drie delen: softwaregedefinieerde architectuur, Azure-services en hardware.
Tot nu toe hebben we diep in de Microsoft Azure Stack HCI gedoken, de on-premise implementatie van de Azure-cloudservice van Microsoft. Azure Stack HCI kan worden gezien als een type platform dat het beste van beide werelden biedt. Het heeft alle beheertools van Azure, zoals Azure Monitor, Azure Security Center, Azure Update Management, Azure Network Adapter en Azure Site Recovery, terwijl de gegevens op locatie worden ondergebracht en aan bepaalde voorschriften wordt voldaan. Azure Stack HCI is onderverdeeld in drie delen: softwaregedefinieerde architectuur, Azure-services en hardware.
Het kiezen van de juiste hardware is belangrijk, zoals we hebben beschreven in ons artikel: "Het belang van hardware in Microsoft Azure Stack HCI.” De eerste stap bij het implementeren van Azure Stack HCI is het vinden van een gecertificeerde hardwareleverancier, in dit geval DataON. DataON heeft al enkele jaren een sterke samenwerking met zowel Microsoft als Intel en brengt deze samenwerking tot volle realisatie in de hardware-layout voor Azure Stack HCI in een Intel Select-configuratie. Een interessant aspect van de samenwerking met Intel is de mogelijkheid om gebruik te maken van de PMEM van het bedrijf (en natuurlijk de nieuwste processors) met Azure Stack HCI.
In veel gevallen worden de DataON HCI Intel Select-oplossingen geconfigureerd en verzonden in hun eigen rack, klaar om onmiddellijk te implementeren. Deze leveringsmethode is met name handig aan de edge, waar de bestaande IT-infrastructuur beperkt of niet bestaat. In het StorageReview-lab hebben we de vier opslag- en rekenknooppunten, domeincontroller en switches geïmplementeerd zoals hieronder weergegeven.
Bouw en Ontwerp
Het Microsoft Azure Stack HCI-cluster dat we hebben beoordeeld, is gebouwd op het DataON HCI-224 All Flash NVMe-platform. Deze servers zijn 2U groot met 24-NVMe-bays aan de voorkant en bieden aan de achterkant voldoende uitbreidingsmogelijkheden voor op PCIe gebaseerde componenten. De labeling is hoog in tegenstelling tot de matzwarte schijfcaddy's, waardoor het gemakkelijk is om specifieke schijven te herkennen als het tijd is om ze uit te wisselen. Alles is gelabeld, wat niet zo ongewoon is, maar de omvang van de labeling wel. Onze implementatie heeft elk knooppunt gelabeld (1 tot en met 4), evenals een aantal andere items die het gemakkelijk maken om te implementeren en te beheren in het datacenter.
Onze configuratie was uitgerust met 48 NVMe SSD's, of 12 per node. Deze omvatten vier Intel Optane P375X SSD's van 4800 GB en acht Intel P4510 SSD's van 2 TB.
Aan de achterkant hebben we twee dual-port 100G Mellanox Connect-X 5 NIC's, die een volledig redundante verbinding bieden via twee Mellanox 100G-switches (SN2100) voor clusternetwerkverkeer. Niet weergegeven in onze studiofotografie zijn alle verbindingen met volledige labels aan elk uiteinde van de juiste netwerkkabel om een foutloze bekabeling in de implementatiefase mogelijk te maken.
Voordien hebben we nog nooit een oplossing gehad met dit documentatieniveau in het label. Microsoft en DataON maken de implementatie van Azure Stack tot een probleemloos proces, zodat klanten onmiddellijk operationeel kunnen worden. Elke kabel is kleurgecodeerd voor het specifieke gebruik en gelabeld voor waar elk uiteinde naartoe gaat. In combinatie met de op maat gemaakte sheet die DataON klanten biedt, garandeert dit bijna een foutloze implementatie. Bij onze implementatie was het systeem voorafgaand aan verzending vooraf geconfigureerd met IP-adressen, met de IP-adressen voor beheer en IPMI-gelabeld.
Beheer en bruikbaarheid
Voor kopers die een Hyper-V-winkel draaien die op Windows Server draait, zal de Microsoft Azure Stack HCI een gemakkelijke overgang zijn. Veel van dezelfde beheertools zijn aanwezig, en vele bieden een meer geïntegreerde en eenvoudige workflow. Tijdens ons beoordelingsproces hebben we zowel de Windows Failover Cluster Manager gebruikt om de DataOn HCI-cluster te beheren, als het Windows Admin Center om de werkbelasting te bewaken en te zien hoe ze presteerden.
Als we eerst meer van het knooppuntniveau bekeken via een Microsoft Remote Desktop (RDP)-sessie die was aangemeld bij een van de knooppunten, keken we naar de Windows Failover Cluster Manager. Dit biedt zowel beheermogelijkheden op knooppuntniveau als zichtbaarheid op clusterniveau. Dit type toegang zou meer gericht zijn op de initiële implementatie, waarbij de dagelijkse monitoring zou plaatsvinden vanuit het Windows Admin Center.
Eerst klikken we op ons specifieke cluster en krijgen we algemene informatie erover, de mogelijkheid om het te configureren en een kijkje in bronnen. Dit geeft een overzichtsweergave van het geselecteerde cluster, zodat u kunt zien waar problemen zijn en kunt beginnen met het boren naar specifieke gebieden.
De volgende stap zijn failover-rollen. Hier kunnen we alle Hyper-V VM's zien die op het cluster draaien. Weergegeven zijn de vele vmfleet VM's die we hebben gebruikt voor stresstests van het cluster.
Met Netwerken kunnen we zien welke clusternetwerken beschikbaar zijn en de status van elk. Als u een clusternetwerk selecteert, ziet u de onderliggende netwerkkaart die eraan is gekoppeld, evenals het IP-adres.
Onder de opslagoptie bevindt zich Schijven, Pools en Behuizingen. Voor schijven kan men op virtuele schijven klikken en informatie krijgen zoals de status, waar deze is toegewezen, het eigenaarsknooppunt, het schijfnummer, partitiestijl en capaciteit. Gebruikers kunnen ook een beetje dieper inzoomen met nog meer informatie, zoals Pool-ID, naam en beschrijving, evenals virtuele schijf-ID, naam en beschrijving, gezondheid en operationele status en veerkracht.
Pools zijn vergelijkbaar, met de informatie van bepaalde opslagpools zoals status, gezondheid, eigenaarsknooppunt, operationele toestanden en algehele capaciteit, evenals vrije en gebruikte ruimte.
Onder Nodes kan men eenvoudig alle nodes in het cluster en hun status zien.
Aan de rechterkant kan men overschakelen naar failover-schijven en onderaan de individuele schijf voor een bepaald knooppunt zien.
Vanuit dezelfde zijbalk kan men ook kijken naar het netwerk voor een bepaald knooppunt.
Hoewel de Windows Failover Cluster Manager een meer "tot in de details" beheerapparaat is, moeten gebruikers via Windows Remote Desktop verbinding maken met een server zelf (of een andere server die op dat cluster is aangesloten) om ermee te werken. Hoewel deze beheerstijl voor veel toepassingen prima is, heeft Microsoft het gemakkelijker gemaakt met een nieuw platform genaamd Windows Admin Center. In tegenstelling tot de Failover Cluster Manager, is Windows Admin Center volledig gebaseerd op de webbrowser, waardoor het gemakkelijker is om vanaf elke computer of tablet op de werkplek verbinding te maken. Het biedt ook een gemoderniseerde en esthetisch aantrekkelijke look en feel, waardoor de dagelijkse bewaking een aangenamere taak wordt. Het biedt een kijkje in veel van dezelfde informatie, met een sterkere focus op activiteitenmonitoring die Failover Cluster Manager niet in dezelfde mate biedt.
Zodra Windows Admin Center aan een cluster is gekoppeld, kunt u inzoomen op specifieke gebieden om bewerkingen te bekijken en te beheren. Hier zien we algemene informatie over de prestaties van het cluster, die de algehele bronnen bijhoudt die de VM's gebruiken.
Hoewel het Windows Admin Center geweldig is voor het bekijken van activiteiten, kunt u nog steeds communiceren met VM's in uw cluster. Hieronder zetten we een aantal vmfleet VM's aan.
Gebruikers kunnen ook inzoomen op informatie over specifieke VM's.
Onder rollen krijgen we een iets andere kijk op rollen, maar grotendeels dezelfde belangrijke informatie.
Onder instellingen kunnen gebruikers extensies voor Azure downloaden, installeren en bijwerken.
Via Windows Admin Center kunnen we ook naar de Hyper-Converged Cluster Manager gaan om rekenkracht en opslag nader te bekijken. We openen het dashboard met algemene informatie zoals het aantal servers, schijven, VM's, volumes, evenals het gebruik van CPU, geheugen en opslag. Onderaan het dashboard staan de clusterprestaties die zijn onderverdeeld in een specifiek tijdsbestek en IOPS en latentie.
Onder compute kunnen beheerders zelf inzoomen op de servers voor beheer, inclusief het verwijderen van de server uit het cluster. Hier vindt u algemene informatie over de gebruikte server, zoals uptime, locatie, domein, fabrikant, model, serienummer, OS-naam, versie en buildnummer. Gebruikers kunnen ook kijken naar de prestaties die specifiek zijn voor de server.
Door op het tabblad Volumes te klikken, krijgen gebruikers een samenvatting van alle volumes op het cluster. De gezondheid van de volumes heeft een kleurcode: groen voor gezond, rood voor kritiek en geel voor waarschuwing. De prestaties worden ook bijgehouden voor alle volumes, uitgesplitst naar tijdsbestek en naar IOPS, latentie en doorvoer.
Door in te zoomen op een enkel volume, worden specifieke eigenschappen van het volume weergegeven, waaronder status, bestandssysteem, pad, bewustzijn van het foutdomein, totale grootte, gebruikte grootte, veerkracht en voetafdruk. Er zijn optionele functies (deduplicatie en compressie evenals integriteitscontrolesommen) die hier kunnen worden in- of uitgeschakeld. De capaciteit wordt grafisch weergegeven, waarbij gebruikt versus beschikbaar wordt weergegeven. En nogmaals, we zien prestaties.
Onder het tabblad Drives krijgen we een samenvatting van alle drives in het systeem. Hier zien we het totale aantal schijven en of er al dan niet waarschuwingen zijn met dezelfde kleurcodering als volumes. Ook zien we de capaciteit: gebruikt, beschikbaar en gereserveerd.
Clinking on Inventory, we krijgen een lijst met alle schijven en verschillende details. De details omvatten de status van de schijf, het model, de capaciteit, het type, waarvoor het wordt gebruikt en de hoeveelheid gebruikte opslagruimte.
We kunnen inzoomen op een enkele schijf en eigenschappen bekijken zoals status, locatie, grootte, type, gebruikt voor, fabrikant, model, serienummer, firmwareversie en de opslagpool waarin deze zich bevindt. We kunnen de hoeveelheid gebruikte capaciteit zien versus beschikbaar voor de individuele schijf en de prestaties ervan in IOPS, latentie en doorvoer.
Onder de prestaties kunnen we ook rijlatentie- en foutstatistieken zien.
Prestatie
Prestaties binnen het Microsoft Azure Stack-ecosysteem zijn altijd geweldig geweest, een sterk voorbeeld dat zijn weg heeft gevonden vanaf de Storage Spaces-dagen. Met dat in gedachten hebben we in deze review gekeken naar enkele veelvoorkomende benchmarking-workloads, zodat gebruikers kunnen zien hoe goed dit platform zich verhoudt tot andere HCI-oplossingen op de markt. Met dat in gedachten hebben we workloads gebruikt om zowel willekeurige small-block-groottes als grote-block-overdrachten te benadrukken om te laten zien welk potentieel deze Microsoft-oplossing te bieden heeft. In onze Azure Stack HCI-review gebruikten we vmfleet voor prestatiebenchmarks, terwijl we op VMware of bare-metal Linux vdbench gebruikten.
Voor de prestaties hier hebben we het systeem getest met zowel 2-weg spiegel als 3-weg spiegel. De spiegel verwijst naar de methode van gegevensbescherming (twee exemplaren of drie exemplaren). Het is duidelijk dat gebruikers met meer exemplaren wat capaciteit verliezen. Vanuit een prestatieperspectief zou 3-weg moeten leiden tot betere leesprestaties door de toename van parallellisme en 2-weg is beter voor schrijfprestaties met een derde minder netwerkverkeer.
Voor onze willekeurige 4K-test zag de 2-weg spiegel een verwerkingscapaciteit van 2,204,296 IOPS bij een gemiddelde latentie van 247 µs en een schrijfdoorvoer van 564,601 IOPS bij een gemiddelde latentie van 3.69 ms. De 3-weg zag een leesdoorvoer van 2,302,610 IOPS gelezen met een gemiddelde latentie van 170 µs en voor schrijven was het een doorvoer van 338,538 IOPS met een gemiddelde latentie van 9.12 ms. Om dit enigszins in perspectief te plaatsen: het vSAN-aanbod van VMware met twee Optane SSD's en vier NVMe Capacity SSD's per node meet 521K IOPS 4K lezen op zijn hoogtepunt en 202K IOPS schrijven.
Vervolgens kijken we naar onze 32K sequentiële benchmark. Voor het lezen zagen we de tweevoudige hit 2 GB/s en de drievoudige hit 42.59 GB/s. Voor schrijven gaf de HCI ons 3 GB/s voor de 39.48-weg en 13.8 GB/s voor de 2-weg.
We gaan door met ons sequentiële werk en gaan verder met onze 64K-tests. Hier de 2-weg hit 39.5 GB/s lezen en 15.24 GB/s schrijven en de 3-weg hit 46.47 GB/s lezen en 7.72 GB/s schrijven. Vergeleken met vSAN komen de verschillen in leesbandbreedte niet eens in de buurt, waar de bandbreedte in zijn tests uitkwam op iets meer dan 5.3 GB/s met een blokgrootte van 64K. De schrijfbandbreedte had een vergelijkbaar verschil, waarbij vSAN uitkwam op 2.55 GB/s.
Onze volgende benchmark is SQL met gemengde lees-/schrijfprestaties. Hier had de 2-weg een doorvoer van 1,959,921 IOPS bij een gemiddelde latentie van 324µs. De 3-weg bereikte 1,929,030 IOPS met een gemiddelde latentie van 185µs. De SQL-workload is een ander gebied waarop Azure Stack HCI zijn kracht kan laten zien, met een meetwaarde van iets minder dan 2 miljoen IOPS, terwijl vSAN van VMware in hetzelfde workloadprofiel 321 IOPS meet.
Met SQL 90-10 bereikte de 2-way 1,745,560 IOPS met een gemiddelde latentie van 411 µs en de 3-way had 1,547,388 IOPS en 285 µs voor latentie.
Voor SQL 80-20 had de 2-weg een doorvoer van 1,530,319 IOPS bij 581 µs voor latentie. De 3-weg bereikte 1,175,469 IOPS en 681 µs voor latentie.
SPECIF'S
De volgende is onze SPECsfs 2014 SP2-benchmark - een nieuwe test voor ons hier. De SPECsfs is een benchmarksuite die de doorvoer en responstijd van de bestandsserver meet. De benchmark biedt ons een gestandaardiseerde methode om de prestaties van verschillende leveranciersplatforms te vergelijken. De benchmark werkt door een schaal in te stellen en te verhogen totdat de puntlatentie te groot is voor de specificaties van de benchmark. Hier kijken we naar de schaal die kan worden gedaan totdat 11 ms wordt overschreden, evenals de bandbreedte die de server bereikt wanneer deze het latentienummer niet haalt.
We zullen hier eerst naar latentie kijken, omdat het meer licht zal werpen op waarom de bandbreedte stopte waar het deed in het tweede deel. De schaal en hun latenties voor zowel de 2-weg als de 3-weg staan in de onderstaande tabel:
SPECsfs Latentie (ms) | ||
---|---|---|
Scale | DataON HCI-224 2-weg spiegel | DataON HCI-224 3-weg spiegel |
100 | 0.243 | 0.262 |
200 | 0.329 | 0.371 |
300 | 0.466 | 0.499 |
400 | 0.636 | 0.699 |
500 | 0.753 | 0.896 |
600 | 0.953 | 1.083 |
700 | 1.113 | 1.314 |
800 | 1.326 | 1.557 |
900 | 1.501 | 1.826 |
1000 | 1.88 | 2.167 |
1100 | 2.061 | 2.807 |
1200 | 2.323 | 4.64 |
1300 | 2.749 | 8.557 |
1400 | 5.47 | 10.449 |
1500 | 8.616 | 11.285 (mislukt) |
1600 | 10.485 | 11.414 (mislukt) |
1700 | 11.069 | |
1800 | 11.697 (mislukt) | |
1900 | 12.51 (mislukt) |
Zoals je kunt zien, begonnen beide configuraties bij 250 µs, de 2-weg iets lager en bleef zo. Op een schaal van 1500 faalde de 3-weg tot 11.285 ms, waardoor het een bereik kreeg van 262 µs tot 10.45 ms. De 2-weg faalde op een schaal van 1800 en bereikte 11.7 ms, waardoor het een bereik kreeg van 243 µs tot 11.07 ms.
De volgende tabel toont de bandbreedte voor elke configuratie bij elke build, met de hierboven vermelde fout in latentie.
SPECsfs-bandbreedte (KB/s) | ||
Scale | DataON HCI-224 2-weg spiegel | DataON HCI-224 3-weg spiegel |
100 | 300897 | 300880 |
200 | 600372 | 600857 |
300 | 901672 | 902964 |
400 | 1202779 | 1203106 |
500 | 1504492 | 1503394 |
600 | 1805952 | 1806455 |
700 | 2105973 | 2108432 |
800 | 2408183 | 2406171 |
900 | 2710895 | 2707106 |
1000 | 3007499 | 3009280 |
1100 | 3308648 | 3308168 |
1200 | 3608244 | 3610219 |
1300 | 3910414 | 3888303 |
1400 | 4212976 | 4026720 |
1500 | 4513454 | 4000079 (mislukt) |
1600 | 4587183 | 4229678 (mislukt) |
1700 | 4621067 | |
1800 | 4630352 (mislukt) | |
1900 | 4569824 (mislukt) |
Voor bandbreedte liepen beide configuraties nek-in-nek met intervallen van 300 MB/s totdat de 3-weg de latentie doorbrak met zijn uiteindelijke passerende bandbreedte van 4.02 GB/s, en de 2-weg een uiteindelijke passerende bandbreedte van 4.62 GB/s had. S.
Conclusie
Het is al een tijdje geleden dat we zo diep zijn gegaan met iets in de opslaggerichte stapel van Microsoft; en jongen, zijn we blij om terug te zijn. Met de omgedoopte Microsoft Azure Stack HCI-oplossing heeft Microsoft iets gedaan dat zo eenvoudig en fundamenteel is dat het gemakkelijk te onderschatten is. Microsoft heeft hun HCI-oplossing doodeenvoudig gemaakt om te gebruiken zonder iets te overlappen om de prestaties te verminderen. Zoals te zien is in onze cijfers, heeft het DataON-cluster dat we hebben getest enorme aantallen gepost, de snelste die we hebben gezien in een mid-market 4-node HCI-cluster. Om eerlijk te zijn, testen we ook niet eens de nieuwste en beste hardware van DataON. Hoewel deze configuratie duidelijk niet traag is, compleet met Intel Optane DC SSD's, biedt DataON snellere oplossingen die profiteren van Intel Xeon 2e generatie CPU's, permanent geheugen en sneller netwerken. Het feit dat er nog meer prestaties beschikbaar zijn in een Azure Stack HCI-oplossing is opwindend, maar het is ook belangrijk om te onthouden dat de oplossing ook kan worden geschaald naar implementaties zo klein als twee knooppunt HCI die switchless kan worden geconfigureerd voor een voordelige edge- of MKB-oplossing.
Door de prestatiecijfers door te boren, kon het Microsoft Azure Stack HCI-cluster een ongelooflijke hoeveelheid I/O en bandbreedte bieden. In het vierhoekenrijk hebben we meer dan 2.3 miljoen IOPS 4K willekeurig gelezen met een 3-weg spiegelconfiguratie en 338 IOPS 4K willekeurig schrijven gemeten. Als je betere schrijfprestaties nodig hebt, kon een 2-weg mirror-configuratie de 4K willekeurige schrijfsnelheden verhogen tot 564k IOP's. Kijkend naar bandbreedte is echter waar de Microsoft Azure Stack echt uitblinkt. In onze sequentiële overdrachtsbelasting van 64K-blokken meet de 2-weg spiegel 39.5 GB/s lezen en 15.24 GB/s schrijven, terwijl de 3-weg spiegel 46.47 GB/s leest en 7.72 GB/s schrijft. Dit gaat veel verder dan wat we hebben gemeten van eerdere HCI-clusters.
Over het algemeen bleek de Azure Stack HCI-oplossing van Microsoft zowel eenvoudig te implementeren als eenvoudig te beheren en uitzonderlijk goed te presteren, precies wat u wilt. DataON, als partner van een oplossing, blonk uit in het leveren van een kant-en-klare build, het aanbieden van op maat gemaakte hardware met duidelijke instructies die uiteindelijk wordt verkocht in een configuratie die in een mum van tijd operationeel kan zijn. Klanten kunnen in veel gevallen zelfs de bedrading overslaan, dus het komt echt neer op de specifieke behoefte. Hoe dan ook, Azure Stack HCI in combinatie met Intel Optane, Intel NVMe SSD's en Mellanox 100G-netwerken bleek een kracht om rekening mee te houden.
Meld u aan voor de StorageReview-nieuwsbrief