Der Einsatz und die laufende Verwaltung von Computerressourcen in kleinen Büros und Remote-/Zweigstellenumgebungen (ROBO) waren schon immer problematisch, da viele verschiedene und konkurrierende Faktoren eine Rolle spielten. Viele Unternehmen sowie kleine und mittlere Unternehmen (KMU) verlassen sich auf ROBO HCI-Systeme, um die täglichen geschäftskritischen Transaktionen abzuwickeln, die das Lebenselixier dieser Organisationen sind. Diese Systeme müssen kostengünstig und dennoch leistungsstark sein, Redundanz bieten, aber möglichst wenige Komponenten enthalten und gut gewartet werden, ohne dass für jeden Standort teure IT-Ressourcen und Personal erforderlich sind.
mit Dell EMC Lösungen für Microsoft Azure Stack HCI
Der Einsatz und die laufende Verwaltung von Computerressourcen in kleinen Büros und Remote-/Zweigstellenumgebungen (ROBO) waren schon immer problematisch, da viele verschiedene und konkurrierende Faktoren eine Rolle spielten. Viele Unternehmen sowie kleine und mittlere Unternehmen (KMU) verlassen sich auf ROBO HCI-Systeme, um die täglichen geschäftskritischen Transaktionen abzuwickeln, die das Lebenselixier dieser Organisationen sind. Diese Systeme müssen kostengünstig und dennoch leistungsstark sein, Redundanz bieten, aber möglichst wenige Komponenten enthalten und gut gewartet werden, ohne dass für jeden Standort teure IT-Ressourcen und Personal erforderlich sind.
Glücklicherweise haben IT-Anbieter die einzigartigen Herausforderungen von ROBO-Systemen erkannt und Lösungen für deren Bewältigung entwickelt. In diesem Artikel werden wir untersuchen, wie Hardware von Dell Technologies, auf der Microsoft-Software läuft, diese Herausforderungen bewältigt. Unser Ansatz unterscheidet sich ein wenig von dem unserer regulären Artikel, in denen wir uns normalerweise auf die Systemleistung konzentrieren. Obwohl wir Leistungstests für das System durchführen werden, werden wir auch einen Blick auf seinen gesamten Lebenszyklus werfen, beginnend mit der anfänglichen Dimensionierung.
Einführung in ROBO HCI
Das System, das wir in diesem Artikel betrachten werden, ist ein Dell EMC-Lösungen für Microsoft Azure Stack HCI Cluster mit 2 AX-Knoten unter Windows Server 2019 (2NC). Anfang dieses Jahres veröffentlichte Dell Technologies AX-Knoten, die speziell (mit Validierung und Zertifizierung) für die Ausführung von Azure Stack HCI entwickelt wurden. Dell Technologies bietet derzeit drei verschiedene Knotentypen in seinem Lösungskatalog an: AX-640, AX-740xd und AX-6515. Jedes dieser Modelle bietet Kunden die Möglichkeit, durch Konfiguration mit verschiedenen Komponenten die ideale Plattform für ihre ROBO-HCI-Bereitstellungen zu entwerfen.
Bei den AX-640- und AX-740xd-Knoten handelt es sich um Dual-Socket-Knoten, die skalierbare Intel Mit den AX-Modellen von Dell EMC können Kunden die Knoten auswählen, die am besten zu ihrem Anwendungsfall passen. Der AX-6515 ist für Workloads mit hoher Rechendichte ausgelegt, der AX-64xd für Workloads mit hoher Speicherkapazität und der AX-2 für Benutzer, die in ihren Unternehmensrechenzentren ein wertoptimiertes System und eine Prozessordiversifizierung benötigen.
Das System, das wir uns in diesem Artikel genauer ansehen werden, ist der AX-640, ein 1U-Knoten mit zwei Sockeln, der 96 bis 768 GB RAM unterstützt. Es kann mit 3 bis 92 TB NVMe-, SSD- und/oder HDD-Speicher konfiguriert werden, um Hybrid- oder All-Flash-Speicher zu erstellen. Es ist derzeit der einzige Knoten im AX-Portfolio, der ultrahochleistungsfähige Optane Persistent Memory- und SSD-Geräte von Intel unterstützt. Bei richtiger Konfiguration ist der AX-640-Knoten ein starker Anwärter auf den Titel des schnellsten im Handel erhältlichen HCI-Knotens. Dell Technologies verfügt über ein schönes Diagramm, das die Azure Stack HCI-Konfigurationsoptionen für seine AX-Knoten beschreibt.
Der AX-640-Knoten, den wir in diesem Artikel verwenden werden, war mit zwei Intel Xeon 6230-CPUs, 384 GB DDR4-Speicher sowie zehn 4 TB NVMe-SSDs ausgestattet.
Zuverlässige und leistungsstarke Hardware ist bei der Bereitstellung einer ROBO HCI-Lösung nur die halbe Miete; Die andere Hälfte ist die Software. In diesem Fall werden wir ein von Azure Stack HCI validiertes System betreiben. Azure Stack HCI ermöglicht Kunden die Ausführung eines Windows-Server-Betriebssystems mit dem zusätzlichen Vorteil einer nahtlosen Verbindung mit der Azure-Cloud für zusätzliche Dienste (wie Backups und Notfallwiederherstellung) über Microsoft Windows Admin Center. Die Azure-Dienste werden über WAC-Erweiterungen aus derselben Verwaltungsebene integriert.
Azure Stack HCI verwendet Hyper-V für seinen Hypervisor und Storage Spaces Direct für seinen lokalen Speicher. Durch die Verwendung eines 2NC für ROBO-HCI-Bereitstellungen können die Implementierungskosten erheblich gesenkt werden. Für äußerst kostenbewusste Implementierungen kann es so konfiguriert werden, dass es in einer 2NC-Konfiguration ohne Switch in einer Single- oder Dual-Link-Konfiguration für seine Speicherstruktur arbeitet. Für Switch-Implementierungen funktioniert ein 10-GbE-Netzwerk. Dell Technologies empfiehlt ein 25-GbE-Speichernetzwerk, da es nicht viel mehr kostet als das 10-GbE-Netzwerk.
Offensichtlich ist eine Verringerung der Investitionen eines Unternehmens in Ausrüstung kein Ansatzpunkt, wenn das System nicht widerstandsfähig ist. Auf Systembasis unterstützt Storage Spaces Direct Zwei- und Drei-Wege-Spiegelung sowie Single- und Dual-Parity-Erasure-Coding. Microsoft hat gute Arbeit geleistet und die Speichereffizienz sowie die allgemeinen Vorteile und Kompromisse dieser verschiedenen Schutzsysteme dokumentiert. Wir empfehlen Ihnen, es noch einmal durchzulesen, um zu entscheiden, welches Schema für Ihre Umgebung am besten geeignet ist. Die Spiegelung ist in der Regel am leistungsstärksten, was wir in unseren Tests verwendet haben.
Azure Stack HCI kann verschachtelte bidirektionale Spiegelung oder verschachtelte spiegelbeschleunigte Parität als eine Option für die Ausfallsicherheit verwenden. Ersteres bietet eine bessere Leistung und letzteres ermöglicht eine höhere Dateneffizienz. Durch die verschachtelte Zwei-Wege-Spiegelung wird eine RAID-1-Kopie der Daten auf dem Host und auf dem anderen Knoten erstellt. Durch die verschachtelte spiegelbeschleunigte Parität wird eine Kopie der Daten auf jedem Server erstellt, für die Datenstabilität wird jedoch Erasure Coding anstelle von RAID 1 verwendet (mit Ausnahme der letzten Schreibvorgänge, bei denen zur Gewährleistung der Zuverlässigkeit eine bidirektionale Spiegelung verwendet wird). Die verschachtelte Zwei-Wege-Spiegelung hat eine Dateneffizienzrate von 25 %, da vier Kopien der Daten auf die Festplatte geschrieben werden; Im Vergleich dazu weist die verschachtelte spiegelbeschleunigte Parität eine Dateneffizienzrate von 33 % bis 40 % auf.
Beide Schemata sind in der Lage, gleichzeitig einen Laufwerksausfall und einen Serverausfall zu unterstützen.
Keines der verschachtelten Ausfallsicherheitsschemata erfordert spezielle RAID-Hardware.
Die Microsoft 2NC-Topologie erfordert einen Zeugen, der als neutraler Dritter fungiert, um dem überlebenden Knoten eine Stimme hinzuzufügen, um ein „Split-Brain“-Szenario zu verhindern. Als Zeuge können Sie entweder eine Dateifreigabe (die wir in unseren Tests verwendet haben) oder die Azure-Cloud verwenden. Letzteres empfiehlt Microsoft, wenn beide Knoten im Cluster über eine zuverlässige Internetverbindung verfügen. Der Azure-Cloudzeuge ist ein Blob-Storage-Objekt, während die Dateifreigabe eine SMB-Dateifreigabe ist. Der Zeuge enthält nur die Zeugenprotokolldatei.
Beschaffung und Bereitstellung von ROBO HCI
Wie versprochen wollten wir einen ganzheitlichen Blick darauf werfen, was zur Beschaffung, Bereitstellung und Verwaltung eines AX-Knotenclusters in einer ROBO-Situation erforderlich ist.
Der erste Schritt bei der Bereitstellung eines neuen Systems besteht darin, dessen Größe festzulegen. Mit Live Optics, einem kostenlosen Online-Tool zum Sammeln von Daten über Speicher, Datenschutz, Server und Dateisysteme einer Umgebung, erleichtert Dell Technologies die Berechnung der für die Bereitstellung erforderlichen Ausrüstung. Obwohl Live Optics bereits 24 Stunden nach der Bereitstellung Erkenntnisse über Ihre Umgebung gewinnen kann, ist es umso besser, die Eigenschaften der von Ihnen ausgeführten Workloads zu verstehen, je länger Sie Live Optics laufen lassen. Live Optics kann Daten von Microsoft Windows-, VMware vCenter- oder Linux/Unix-Servern sammeln.
Das Live Optics-Dashboard präsentiert zusammengestellte gesammelte Daten zur CPU-, Arbeitsspeicher- und Speichernutzung Ihrer gesamten Umgebung, die Ihnen ein genaues Bild davon liefern, welche Art von System Sie in Ihrer Umgebung benötigen. Sie können diese Daten auch mit anderen Benutzern (z. B. Kollegen, VARs usw.) teilen, wenn Sie möchten, dass diese Größenempfehlungen geben.
Die von Live Optics gesammelten Daten werden im Azure Stack HCI-Sizer-Tool verwendet, das über das Dell Technologies-Kontoteam verfügbar ist. Das Sizer-Tool verfügt über alle bewährten Methoden des Ingenieurwesens, um Konfigurationsoptionen zu erstellen, die nicht nur Ihren aktuellen Anforderungen entsprechen, sondern auch Ihr zukünftiges Wachstum berücksichtigen können.
Eines der Probleme bei ROBO-Umgebungen besteht darin, lokale IT-Fachleute zu finden, die sie einrichten und konfigurieren. Eine Möglichkeit, dies zu erreichen, ist die Nutzung von Dell EMC ProDeploy Services. Diese Option hilft Unternehmen, die Bereitstellung an entfernten Standorten zu beschleunigen, sodass sie sofort online sind und einen Mehrwert schaffen. Wenn Sie über lokale Ressourcen verfügen und diese selbst bereitstellen möchten, verfügt Dell alternativ über Dokumentation und Skripte, die Sie durch den Prozess führen.
Eines der größten Probleme für jedes Unternehmen ist die Unterstützung eines Systems. Ein großer Teil des Aufwands bei der Unterstützung komplexer Systeme ist auf die Vielzahl beteiligter Hardware- und Softwareanbieter zurückzuführen. Beispielsweise kann es sein, dass ein Anbieter die Server und den Speicher bereitstellt, ein anderer Netzwerk-Switches bereitstellt und ein dritter das Betriebssystem bereitstellt. Dell EMC ProSupport hat dazu beigetragen, diesen Prozess zu rationalisieren, indem es engagierte Supportmitarbeiter für seine HCI-Lösungen bereitstellt. Diese Supporttechniker sind geschult und kennen sich sowohl mit der Hardware als auch mit der Software eines Dell Azure Stack HCI-Systems aus. Bei Bedarf kennen sie die richtigen Personen, an die sie Probleme weiterleiten können.
Wir hatten die Gelegenheit, das dedizierte Support-Personal von Dell Technologies HCI in Anspruch zu nehmen, als wir bei der Installation unseres Systems versehentlich eine Fehlkonfiguration hatten. Der Support-Techniker, mit dem wir zusammengearbeitet haben, war sehr kompetent und konnte uns helfen, das Chaos, in das wir geraten waren, zu lösen.
Tägliche Verwaltung des AX-Knotens
In einer perfekten Welt würden ROBO-HCI-Bereitstellungen überhaupt keine Verwaltung erfordern. Das ist jedoch nicht die Realität und Dell Technologies und Microsoft haben die nächstbeste Option. Wenn sich die Systeme an einem entfernten Standort befinden und es kaum oder keinen lokalen IT-Support gibt, ist es wichtig, über die für die Systemwartung erforderlichen Tools zu verfügen. Dell Technologies erreicht dies durch die Verwendung von Windows Admin Center (WAC) mit einigen Erweiterungen, die auf die eigene IP, Dell EMC OpenManage Integration für Windows Admin Center, ausgerichtet sind.
WAC ist ein browserbasiertes Verwaltungsplattform-Tool zur Verwaltung von Windows 10 und Windows Server. Es wird auf einem Clientsystem installiert und nutzt Remote-PowerShell und Windows Management Instrumentation (WMI) über Windows Remote Management (WinRM), um die Windows-Systeme sowie die Azure Stack HCI-Cluster zu überwachen und zu verwalten.
Der Übersichtsbereich von WAC bietet eine Zusammenfassung der Ressourcennutzung eines Systems sowie Tools zum Verwalten der Zertifikate und Geräte eines Systems. Mit WAC können Sie außerdem Ereignisse und Prozesse anzeigen, Rollen und Funktionen installieren sowie lokale Benutzer und Gruppen, Firewalls, Dienste und Speicher verwalten.
Dell Technologies nutzte die Erweiterbarkeit von WAC und entwickelte Dell EMC OpenManage Integration mit Microsoft Windows Admin Center (OMIMSWAC). Dies wurde entwickelt, um den Prozess der umfassenden Hardwareüberwachung und -inventarisierung sowie die Orchestrierung von BIOS-, Firmware- und Treiberaktualisierungen zu erleichtern und zu vereinfachen. OMIMSWAC verwendet die Cluster-Aware-Updating-Funktion von Windows Server 2019, um AX-Knoten und den Azure Stack HCI-Cluster zu aktualisieren. Um OMIMSWAC zu starten, klicken Sie auf Dell EMC OpenManage-Integration befindet sich in der Multifunktionsleiste von WAC.
Wir haben OMIMSWAC zu unserem System hinzugefügt, indem wir WAC gestartet und auf geklickt haben Einstellungen und dann Erweiterungen Eingabe Dell EMC im Suchtextfeld, Auswählen Dell EMC Open Manage-Integrationund dann klicken Installieren.
Durch die Verwendung von OMIMSWAC zur Untersuchung unseres Clusters konnten wir den Zustand des Systems erkennen und tief genug in die Hardware eintauchen, um eine Bestandsaufnahme ihrer Komponenten und der von ihnen verwendeten Firmware zu sehen.
Sie können OMIMSWAC sogar verwenden, um die iDRAC-Konsole für die Out-of-Band-Verwaltung der AX-Knoten zu starten.
Sobald Sie den Cluster erkannt haben, können Sie OMIMSWAC verwenden, um einen Compliance-Bericht für die Knoten auf Clusterebene anzuzeigen. Wenn das System, auf dem OMIMSWAC ausgeführt wird, über eine Internetverbindung verfügt, lädt es automatisch die Dienstprogramme Dell EMC System Update (DSU) und Dell EMC Inventory Collector (IC) von downloads.dell.com herunter, um die Compliance sicherzustellen und die Zielknoten (falls vorhanden) zu aktualisieren und IC sind in den Einstellungen nicht konfiguriert.
OMIMSWAC glänzt wirklich bei der Bewältigung von Routineaufgaben, wie zum Beispiel Updates. OMIMSWAC lädt nicht nur automatisch die benötigten Dell Update Packages (DUPs) herunter, sondern führt auch ein fortlaufendes Update eines Clusters durch, um Ausfallzeiten zu vermeiden.
AX-Knotentests
Als wir uns den Dell EMC 2-Knoten-HCI-Cluster ansahen, wollten wir sowohl seine Leistung als auch die Anwendungsverfügbarkeit bei verschiedenen Ausfallszenarien untersuchen. Zu diesem Zweck haben wir einen SQL Server-Leistungstest konfiguriert, der aus bis zu 8 SQL Server 2019-VMs mit Windows Server 2019 besteht, die auf unserem 2-Knoten-Cluster verteilt sind. Jede SQL Server-Instanz erhielt dann eine TPC-C-Datenbank im Maßstab 1,500, wobei die Datenbank- und Protokolldateien einer Kapazität von 350 GB pro Instanz entsprachen. Dies ergab einen Datenbankspeicherbedarf von 1.4 TB mit 4 VMs bis zu 2.8 TB mit 8 VMs. Wir haben die Benchmark Factory von Quest als Workload-Generator für dieses Projekt verwendet, wobei 15,000 virtuelle Benutzer mit jeder VM interagierten.
Jeder VM wurden 8 virtuelle CPUs und 60 GB RAM zusammen mit ihrem Speicherbedarf zugewiesen. Da unser Cluster mit 384 GB RAM pro Host konfiguriert war, haben wir in unserem Szenario mit ausgefallenen Knoten die VM-RAM-Zuteilung auf 40 GB gesenkt, um alle 8 VMs auf einem einzelnen Host unterzubringen.
Unsere vier Datenbanktestszenarien waren:
- Arbeitscluster: insgesamt 8 VMs, 4 VMs pro Knoten
- 1 SSD auf einem Knoten ausgefallen: 8 VMs insgesamt, 4 VMs pro Knoten
- Ein Knoten ausgefallen: 8 VMs insgesamt, 8 VMs pro Knoten
In unserem ersten Test zur Messung der Leistung von 8 VMs, 4 auf jedem Knoten, betrug die Latenz durchschnittlich 5 ms.
Während eine hohe Leistung und eine geringe Datenbanklatenz großartig sind, ist es genauso wichtig zu wissen, wie eine Plattform unter nicht optimalen Bedingungen funktioniert. In unserem ersten Szenario ging es darum, wie die Plattform auf eine ausgefallene SSD reagieren würde. Wir haben mit der Arbeitslast begonnen und gleich nachdem sie sich stabilisiert hatte, eine einzelne SSD von einem Knoten gezogen. In dieser Situation verlangsamte sich die Leistung geringfügig von 6.5 ms unter normalen Bedingungen auf 5 ms.
Unser zweites Szenario befasste sich damit, wie der Cluster funktionieren würde, wenn ein Knoten wegen Wartungsarbeiten offline wäre, oder wie die Dinge funktionieren würden, wenn einer ausfällt. In beiden Fällen fällt alles auf nur einen Knoten zurück, obwohl es einen subtilen Vorteil gibt, dass kein Datenverkehr über das Backend-Netzwerk geleitet wird. In dieser Situation haben wir eine durchschnittliche Latenz von 5.875 ms gemessen.
Abschließende Überlegungen
Wir sehen ein immer größeres Interesse an 2NCs für ROBO-Anwendungen. Unternehmen sind auf der Suche nach Systemen, die preiswert und grundsolide sind und nur ein minimales Maß an Interaktion mit dem IT-Personal erfordern, da der Zugriff darauf problematisch sein kann. Dell EMC Solutions für Azure Stack HCI erfüllt alle diese Anforderungen.
Wir haben uns angesehen, was erforderlich ist, um ein 2NC ROBO HCI-System richtig zu dimensionieren, zu erwerben und einzurichten. Wir waren beeindruckt, wie einfach es mit Dell Technologies war. Nachdem wir uns die anfängliche Systemeinrichtung angesehen hatten, schauten wir uns an, was zur Wartung des Systems erforderlich wäre, und waren erneut beeindruckt, wie einfach WAC diesen Prozess gestaltete. Was uns jedoch wirklich umgehauen hat, war die OMIMSWAC-Integration von Dell Technologies, da sie ein fortlaufendes Upgrade unseres Systems durchführte, das alles von der Firmware an aufwärts abdeckte, und das mit wenig Bedienereingriff. Dies ist ein grundlegendes Unterscheidungsmerkmal für Dell Technologies, da diese Integrationstiefe einzigartig für Azure Stack HCI-Anbieter ist.
Als wir unsere Benchmarks auf dem System durchführten, stellten wir unter optimalen Bedingungen eine starke Anwendungs-Workload-Leistung fest. Unsere SQL Server TPC-C-Workloads betrugen 2.25 ms auf vier VMs mit einer Größe von 1,500, die gleichmäßig im Cluster verteilt waren, und 5 ms, als diese Workload auf acht VMs erhöht wurde. Noch beeindruckender war jedoch, wie gut der Cluster mit einer ausgefallenen SSD oder nur einem betriebsbereiten Knoten funktionierte. Im ersten Szenario einer ausgefallenen SSD erhöhte sich unsere 8VM-Arbeitslast von 5 auf 6.5 ms Latenz. Da der Knoten jedoch vollständig offline war, stieg die Latenz kaum auf 5.875 ms.
Um unsere Tests mit diesem System zusammenzufassen: Wir haben festgestellt, dass es die Belastung, die ROBO-Bereitstellungen mit sich bringen würden, problemlos bewältigen kann. Das ist wichtig; Bei solchen Bereitstellungen sollten Sie sich viel weniger Gedanken über die Leistungsfähigkeit eines solchen Systems als vielmehr über den langfristigen Betrieb machen. Was den ersten Punkt betrifft: Dell Technologies hat diese AX-Knoten so weit entwickelt, dass die Leistung weitgehend irrelevant ist. Alle unsere Tests bestätigen, dass selbst aggressive SQL Server-Workloads problemlos verarbeitet wurden.
Wenn die Leistung für ROBO-HCI-Anwendungsfälle effektiv gelöst wird, müssen sich Unternehmen dem Tag-2-Betrieb zuwenden. Hier beginnen die Dell EMC AX-Knoten wirklich auf dem Rückzug zu sein. Die Integration mit WAC für Cluster-Updates ist aus Sicht der laufenden Verwaltung von entscheidender Bedeutung. Dell Technologies ist in dieser Hinsicht klarer Marktführer, wenn es um Azure Stack HCI geht. Schließlich sollten sich Unternehmen mit der Systemstabilität befassen. Da nur zwei Knoten vorhanden sind und in vielen Fällen kein unmittelbarer Vor-Ort-Support erfolgt, ist die Betriebszeit geschäftskritisch. Bei unseren Tests in mehreren heruntergefahrenen Zuständen arbeiteten die AX-Knoten ohne Unterbrechung weiter, was bedeutet, dass das Büro ohne Einbußen bei der Anwendungsleistung online bleibt. Es gibt eine Reihe von Möglichkeiten, Azure Stack HCI bereitzustellen, aber es gibt keine umfassendere Lösung als die, die Dell Technologies mit AX-Knoten bietet.
Sehen Sie sich die Infografik an
Dell EMC Azure Stack HCI-Lösungen
Dieser Bericht wird von Dell Technologies gesponsert. Alle in diesem Bericht geäußerten Ansichten und Meinungen basieren auf unserer unvoreingenommenen Sicht auf das/die betrachtete(n) Produkt(e).