L'implementazione e la gestione continua delle risorse informatiche in piccoli uffici e ambienti ROBO (remoti/filiali) sono sempre state problematiche, con molti fattori diversi e concorrenti in gioco. Molte imprese, così come le piccole e medie imprese (PMI), dipendono dai sistemi ROBO HCI per gestire le transazioni aziendali quotidiane fondamentali che sono la linfa vitale di queste organizzazioni. Questi sistemi devono essere economici ma performanti, offrire ridondanza ma avere il minor numero di componenti possibile ed essere ben mantenuti ma non avere costose risorse IT e personale dedicato a ciascun sito.
con le soluzioni Dell EMC per Microsoft Azure Stack HCI
L'implementazione e la gestione continua delle risorse informatiche in piccoli uffici e ambienti ROBO (remoti/filiali) sono sempre state problematiche, con molti fattori diversi e concorrenti in gioco. Molte imprese, così come le piccole e medie imprese (PMI), dipendono dai sistemi ROBO HCI per gestire le transazioni aziendali quotidiane fondamentali che sono la linfa vitale di queste organizzazioni. Questi sistemi devono essere economici ma performanti, offrire ridondanza ma avere il minor numero di componenti possibile ed essere ben mantenuti ma non avere costose risorse IT e personale dedicato a ciascun sito.
Fortunatamente, i fornitori IT hanno riconosciuto le sfide uniche dei sistemi ROBO e hanno trovato soluzioni per affrontarle. In questo articolo esamineremo come l'hardware Dell Technologies che esegue il software Microsoft affronta queste sfide. Il nostro approccio sarà leggermente diverso da quello dei nostri articoli regolari in cui solitamente ci concentreremmo sulle prestazioni del sistema. Sebbene effettueremo test sulle prestazioni del sistema, daremo anche uno sguardo al suo intero ciclo di vita a partire dal dimensionamento iniziale.
ROBO HCI Introduzione
Il sistema che esamineremo in questo articolo è a Soluzioni Dell EMC per Microsoft Azure Stack HCI cluster con 2 nodi AX che eseguono Windows Server 2019 (2NC). All'inizio di quest'anno, Dell Technologies ha rilasciato nodi AX appositamente progettati (con convalida e certificazione) per eseguire Azure Stack HCI. Dell Technologies offre attualmente tre diversi tipi di nodo nel proprio catalogo di soluzioni: AX-640, AX-740xd e AX-6515. Ciascuno di questi modelli offre ai clienti la possibilità di progettare la piattaforma ideale per le proprie implementazioni ROBO HCI attraverso la configurazione con diversi componenti.
I nodi AX-640 e AX-740xd sono nodi dual-socket che utilizzano processori scalabili Intel Xeon di seconda generazione, mentre AX-6515 è un nodo single-socket che esegue un processore AMD EPYC Gen 64 a 2 core. I modelli AX di Dell EMC consentono ai clienti di scegliere i nodi che meglio si adattano al loro caso d'uso. L'AX-640 è pensato per carichi di lavoro ad alta densità di elaborazione, l'AX-740xd per carichi di lavoro pesanti con capacità di storage e l'AX-6515 per gli utenti che richiedono un sistema a valore ottimizzato e una diversificazione dei processori nei propri data center aziendali.
Il sistema a cui daremo uno sguardo più da vicino in questo articolo è l'AX-640, un nodo 1U dual-socket che supporta da 96 a 768 GB di RAM. Può essere configurato con da 3 a 92 TB di storage NVMe, SSD e/o HDD per creare storage ibrido o all-flash. Attualmente è l'unico nodo nel portafoglio AX che supporta i dispositivi Intel Optane Persistent Memory e SSD ad altissime prestazioni. Se configurato correttamente, il nodo AX-640 è un forte contendente al titolo di nodo HCI più veloce disponibile in commercio. Dell Technologies ha un bel grafico che delinea le opzioni di configurazione di Azure Stack HCI per i nodi AX.
Il nodo AX-640 che utilizzeremo in questo articolo è dotato di doppie CPU Intel Xeon 6230, 384 GB di memoria DDR4 e dieci SSD NVMe da 4 TB.
Avere un hardware affidabile e performante è solo metà della storia quando si implementa una soluzione ROBO HCI; l'altra metà è il software. In questo caso, eseguiremo un sistema convalidato Azure Stack HCI. Azure Stack HCI consente ai clienti di eseguire un sistema operativo Windows Server con l'ulteriore vantaggio di connettersi facilmente al cloud di Azure per servizi aggiuntivi (come backup e ripristino di emergenza) tramite Centro di amministrazione di Microsoft Windows. I servizi di Azure sono integrati tramite estensioni WAC dallo stesso piano di gestione.
Azure Stack HCI usa Hyper-V per l'hypervisor e Storage Spaces Direct per l'archiviazione locale. L'utilizzo di un 2NC per le implementazioni ROBO HCI può ridurre notevolmente i costi di implementazione. Per implementazioni estremamente attente ai costi, può essere configurato per funzionare in una configurazione 2NC senza switch in una configurazione single o dual-link per la struttura di storage. Per le implementazioni commutate, funzionerà una rete 10GbE. Dell Technologies consiglia una rete di storage da 25 GbE poiché non costerà molto di più della rete da 10 GbE.
Ovviamente, ridurre l’investimento effettuato da un’azienda in attrezzature è un fallimento se il sistema non è resiliente. A livello di sistema, Storage Spaces Direct supporta il mirroring bidirezionale e tridirezionale e la codifica di cancellazione a parità singola e doppia. Microsoft ha svolto un ottimo lavoro documentando l'efficienza dello storage, nonché i vantaggi e i compromessi generali di questi diversi schemi di protezione. Ti consigliamo di leggerlo per decidere quale schema sarebbe più adatto al tuo ambiente. Il mirroring è solitamente il più performante, ed è quello che abbiamo utilizzato nei nostri test.
Azure Stack HCI può usare il mirroring bidirezionale annidato o la parità con accelerazione mirroring annidata come opzione per la resilienza. Il primo offre prestazioni migliori e il secondo consente una maggiore efficienza dei dati. Il mirroring bidirezionale annidato crea una copia RAID 1 dei dati sull'host e sull'altro nodo. La parità annidata con accelerazione mirror crea una copia dei dati su ciascun server ma utilizza la codifica di cancellazione, anziché RAID 1, per la resilienza dei dati (ad eccezione delle scritture recenti che utilizzano il mirroring bidirezionale per garantire l'affidabilità). Il mirroring bidirezionale nidificato ha un tasso di efficienza dei dati del 25% poiché quattro copie dei dati vengono scritte su disco; in confronto, la parità annidata con accelerazione mirror ha un tasso di efficienza dei dati compreso tra il 33% e il 40%.
Entrambi gli schemi sono in grado di supportare contemporaneamente un guasto dell'unità e un guasto del server.
Nessuno degli schemi di resilienza nidificati richiede hardware RAID speciale.
La topologia Microsoft 2NC richiede un testimone che agisca come terza parte neutrale per aggiungere un voto al nodo sopravvissuto per evitare uno scenario di "cervello diviso". Puoi utilizzare una condivisione file (che abbiamo utilizzato nei nostri test) o il cloud di Azure come testimone. Microsoft consiglia quest'ultima soluzione se entrambi i nodi del cluster dispongono di una connessione Internet affidabile. Il testimone cloud di Azure è un oggetto di archiviazione BLOB mentre la condivisione file è una condivisione file SMB. Il testimone contiene solo il file di registro del testimone.
Approvvigionamento e implementazione di ROBO HCI
Come promesso, volevamo dare uno sguardo olistico a ciò che serve per acquisire, distribuire e gestire un cluster di nodi AX in una situazione ROBO.
Il primo passo quando si distribuisce un nuovo sistema è dimensionarlo. Dell Technologies semplifica il calcolo delle apparecchiature necessarie per l'implementazione con Live Optics, uno strumento online gratuito utilizzato per raccogliere dati su storage, protezione dei dati, server e file system di un ambiente. Sebbene sia in grado di acquisire informazioni dettagliate sul tuo ambiente già 24 ore dopo la distribuzione, più a lungo lasci funzionare Live Optics, migliore sarà la comprensione delle caratteristiche dei carichi di lavoro in esecuzione. Live Optics può raccogliere dati da server Microsoft Windows, VMware vCenter o Linux/Unix.
La dashboard di Live Optics presenterà i dati raccolti raccolti dall'utilizzo della CPU, della memoria e dell'archiviazione dell'intero ambiente, che ti forniranno un quadro accurato del tipo di sistema di cui avrai bisogno nel tuo ambiente. Puoi anche condividere questi dati con altri utenti (ad esempio colleghi, VAR, ecc.) se desideri che forniscano consigli sulle taglie.
I dati raccolti da Live Optics vengono utilizzati nello strumento di dimensionamento Azure Stack HCI disponibile tramite il team dell'account Dell Technologies. Lo strumento di dimensionamento integra tutte le migliori pratiche di Engineering per produrre opzioni di configurazione non solo per le tue esigenze attuali, ma possono tenere conto della tua crescita futura.
Uno dei problemi con gli ambienti ROBO è trovare talenti IT locali per impostarli e configurarli. Un modo per eseguire questa operazione è utilizzare i servizi Dell EMC ProDeploy. Questa opzione aiuta le organizzazioni ad accelerare l'implementazione nei siti remoti, il che significa che sono online e aggiungono immediatamente valore. In alternativa, se disponi di risorse locali e desideri distribuirle da solo, Dell dispone di documentazione e script per guidarti attraverso il processo.
Uno dei maggiori grattacapi per qualsiasi organizzazione è supportare un sistema. Gran parte dei problemi legati al supporto di sistemi complessi sono dovuti ai molteplici fornitori di hardware e software coinvolti. Ad esempio, potresti avere un fornitore che fornisce server e spazio di archiviazione, un altro che fornisce switch di rete e un terzo che fornisce il sistema operativo. Dell EMC ProSupport ha contribuito a semplificare questo processo disponendo di personale di supporto dedicato per le soluzioni HCI. Questi tecnici del supporto sono formati e competenti sia sull'hardware che sul software di un sistema HCI Dell Azure Stack e, se necessario, conoscono le persone giuste a cui inoltrare i problemi.
Abbiamo avuto l'opportunità di utilizzare lo staff di supporto dedicato di Dell Technologies HCI quando abbiamo inavvertitamente configurato erroneamente il nostro sistema installandolo. Il tecnico dell'assistenza con cui abbiamo lavorato era molto ben informato ed è stato in grado di aiutarci a risolvere il caos in cui ci siamo cacciati.
Gestione quotidiana del nodo AX
Nel mondo perfetto, le implementazioni ROBO HCI non richiederebbero alcuna gestione. Tuttavia non è la realtà e Dell Technologies e Microsoft hanno la migliore opzione successiva. Quando i sistemi sono ubicati in una posizione remota con poco o nessun supporto IT locale, è importante disporre degli strumenti necessari per la manutenzione del sistema. Dell Technologies esegue questa operazione utilizzando Windows Admin Center (WAC) con alcune estensioni adattate al proprio IP, Dell EMC OpenManage Integration for Windows Admin Center.
WAC è uno strumento di piattaforma di gestione basato su browser per la gestione di Windows 10 e Windows Server. Viene installato su un sistema client e utilizza PowerShell remoto e Strumentazione gestione Windows (WMI) su Gestione remota Windows (WinRM) per monitorare e gestire i sistemi Windows nonché i cluster Azure Stack HCI.
Il riquadro di panoramica di WAC fornisce un riepilogo dell'utilizzo delle risorse di un sistema e degli strumenti per la gestione dei certificati e dei dispositivi di un sistema. WAC consente inoltre di visualizzare eventi e processi, installare ruoli e funzionalità e gestire utenti e gruppi locali, firewall, servizi e archiviazione.
Dell Technologies ha sfruttato l'estensibilità di WAC e ha creato Dell EMC OpenManage Integration con Microsoft Windows Admin Center (OMIMSWAC). Questo è stato progettato per facilitare e semplificare il processo di monitoraggio approfondito dell'hardware, inventario e orchestrazione degli aggiornamenti di BIOS, firmware e driver. OMIMSWAC usa la funzionalità di aggiornamento compatibile con cluster di Windows Server 2019 per aggiornare i nodi AX e il cluster Azure Stack HCI. Per avviare OMIMSWAC, fare clic su Integrazione di Dell EMC OpenManage situato sulla barra multifunzione di WAC.
Abbiamo aggiunto OMIMSWAC al nostro sistema avviando WAC, facendo clic Impostazioni profilo e poi estensioni entrare Dell EMC nella casella di testo di ricerca, selezionando Integrazione Dell EMC Open Managee quindi facendo clic Installazione.
Utilizzando OMIMSWAC per esaminare il nostro cluster, abbiamo potuto vedere lo stato di salute del sistema e immergerci nell'hardware abbastanza in profondità da vedere un inventario dei suoi componenti e quale firmware stavano utilizzando.
Puoi anche utilizzare OMIMSWAC per avviare la console iDRAC per la gestione fuori banda dei nodi AX.
Una volta individuato il cluster, puoi utilizzare OMIMSWAC per visualizzare un report di conformità per i nodi a livello di cluster. Se il sistema su cui è in esecuzione OMIMSWAC dispone di una connessione Internet, scaricherà automaticamente le utilità Dell EMC System Update (DSU) e Dell EMC Inventory Collector (IC) da downloads.dell.com per eseguire la conformità e aggiornare i nodi di destinazione se DSU e IC non sono configurati nelle Impostazioni.
OMIMSWAC eccelle davvero nell'esecuzione di attività di routine, come gli aggiornamenti. OMIMSWAC non solo scaricherà automaticamente i pacchetti di aggiornamento Dell (DUP) necessari, ma eseguirà anche un aggiornamento in sequenza di un cluster per eliminare i tempi di inattività.
Test del nodo AX
Osservando il cluster HCI a 2 nodi Dell EMC, volevamo esaminarne sia le prestazioni, sia la disponibilità delle applicazioni attraverso diversi scenari di errore. A tal fine, abbiamo configurato un test delle prestazioni di SQL Server composto da un massimo di 8 VM SQL Server 2019 che eseguono Windows Server 2019 bilanciate sul nostro cluster a 2 nodi. A ciascuna istanza di SQL Server è stato quindi assegnato un database TPC-C su scala 1,500 in cui il database e i file di registro avevano una capacità pari a 350 GB per istanza. Ciò ci ha fornito un ingombro di archiviazione del database che va da 1.4 TB con 4 VM fino a 2.8 TB con 8 VM. Abbiamo utilizzato Benchmark Factory di Quest come generatore di carico di lavoro per questo progetto, con 15,000 utenti virtuali che interagiscono con ciascuna VM.
A ogni VM sono state assegnate 8 CPU virtuali e 60 GB di RAM insieme al suo spazio di archiviazione. Dato che il nostro cluster è configurato con 384 GB di RAM per host, nel nostro scenario di nodo guasto abbiamo ridotto l'allocazione della RAM della VM a 40 GB per adattare tutte le 8 VM su un singolo host.
I nostri quattro scenari di test del database erano:
- Cluster di lavoro: 8VM totali, 4VM per nodo
- 1 SSD guasto su un nodo: 8 VM totali, 4 VM per nodo
- Un nodo guasto: 8 VM totali, 8 VM per nodo
Nel nostro primo test che ha misurato le prestazioni di 8 VM, 4 su ciascun nodo, la latenza è stata in media di 5 ms.
Sebbene prestazioni elevate e bassa latenza del database siano ottime, sapere come funziona una piattaforma in condizioni non ottimali è altrettanto importante. Il nostro primo scenario riguardava il modo in cui la piattaforma avrebbe risposto a un SSD guasto. Abbiamo avviato il carico di lavoro e, subito dopo che si è stabilizzato, abbiamo estratto un singolo SSD da un nodo. In quella situazione, le prestazioni rallentavano leggermente a 6.5 ms da 5 ms in condizioni normali.
Il nostro secondo scenario riguardava il modo in cui funzionerebbe il cluster se un nodo fosse offline per manutenzione o come funzionerebbero le cose se uno si guastasse. In entrambe le condizioni, tutto ricade su un solo nodo, sebbene vi sia il sottile vantaggio di non far passare alcun traffico sulla rete backend. In questa situazione, abbiamo misurato una latenza media di 5.875 ms.
Considerazioni finali
Stiamo riscontrando un interesse sempre maggiore nei confronti dei 2NC per applicazioni ROBO. Le aziende sono alla ricerca di sistemi a prezzi ragionevoli, solidi e che richiedano solo una minima interazione con il personale IT poiché l'accesso ad essi può essere problematico. Le soluzioni Dell EMC per Azure Stack HCI soddisfano tutti questi requisiti.
Abbiamo esaminato cosa sarebbe necessario per dimensionare, acquisire e configurare correttamente un sistema HCI ROBO 2NC. Siamo rimasti colpiti dalla facilità con cui è stato possibile utilizzare Dell Technologies. Dopo aver esaminato la configurazione iniziale del sistema, abbiamo esaminato cosa sarebbe stato necessario per mantenere il sistema e siamo rimasti ancora una volta colpiti dalla facilità con cui WAC ha reso questo processo. Ciò che ci ha davvero stupito, tuttavia, è stata l'integrazione di Dell Technologies OMIMSWAC poiché ha eseguito un aggiornamento progressivo del nostro sistema, coprendo tutto, dal firmware in poi, con poca interazione da parte dell'operatore. Questo è un elemento di differenziazione fondamentale per Dell Technologies, poiché questa profondità di integrazione è unica per i provider HCI Azure Stack.
Quando abbiamo eseguito i nostri benchmark sul sistema, abbiamo riscontrato ottime prestazioni del carico di lavoro delle applicazioni in condizioni ottimali. I nostri carichi di lavoro TPC-C di SQL Server hanno misurato 2.25 ms su quattro VM su scala 1,500 posizionate uniformemente sul cluster e 5 ms quando il carico di lavoro è stato aumentato a otto VM. Ciò che è stato ancora più impressionante, tuttavia, è stata la qualità delle prestazioni del cluster con un SSD guasto o con un solo nodo operativo. Nel primo scenario di un SSD guasto, il nostro carico di lavoro di 8 VM è aumentato da 5 a 6.5 ms di latenza. Con un nodo completamente offline, tuttavia, la latenza è arrivata a malapena a 5.875 ms.
Per riassumere i nostri test su questo sistema, abbiamo scoperto che potrebbe facilmente gestire il carico che le implementazioni ROBO gli avrebbero imposto. Questo è importante; questi tipi di implementazioni dovrebbero preoccuparsi molto meno delle capacità prestazionali di un sistema come questo e più delle operazioni a lungo termine. Per quanto riguarda il primo punto, Dell Technologies ha progettato questi nodi AX a un livello in cui le prestazioni sono in gran parte irrilevanti. Tutti i nostri test confermano che anche i carichi di lavoro aggressivi di SQL Server sono stati assorbiti senza problemi.
Se le prestazioni vengono effettivamente risolte per i casi d'uso ROBO HCI, le organizzazioni devono passare alle operazioni del secondo giorno. Qui i nodi Dell EMC AX iniziano davvero ad allontanarsi, l'integrazione con WAC per gli aggiornamenti del cluster è fondamentale dal punto di vista della gestione continua. Dell Technologies è un chiaro leader su questo fronte quando si tratta di Azure Stack HCI. Infine, le organizzazioni dovrebbero considerare la resilienza del sistema. Con solo due nodi e in molti casi senza supporto immediato in loco, il tempo di attività è fondamentale per l'azienda. Nei nostri test su diversi stati degradati, i nodi AX hanno funzionato senza interruzioni, il che significa che l'ufficio rimarrà online senza alcun impatto sulle prestazioni delle applicazioni. Esistono diversi modi per distribuire Azure Stack HCI, ma non esiste una soluzione più completa di quella offerta da Dell Technologies con i nodi AX.
Soluzioni HCI Dell EMC Azure Stack
Questo rapporto è sponsorizzato da Dell Technologies. Tutti i pareri e le opinioni espressi in questo rapporto si basano sulla nostra visione imparziale dei prodotti in esame.