Casa Impresa Recensione di Microsoft Azure Stack HCI (DataON HCI-224 con Intel Optane NVMe)

Recensione di Microsoft Azure Stack HCI (DataON HCI-224 con Intel Optane NVMe)

Revisione dell'HCI di Microsoft Azure Stack DataON

Finora lo abbiamo fatto ha approfondito l'HCI di Microsoft Azure Stack, l'implementazione on-premise del servizio cloud Azure di Microsoft. Azure Stack HCI può essere visto come un tipo di piattaforma che offre il meglio di entrambi i mondi. Dispone di tutti gli strumenti di gestione di Azure come Monitoraggio di Azure, Centro sicurezza di Azure, Gestione aggiornamenti di Azure, Adattatore di rete di Azure e Azure Site Recovery, pur ospitando i dati in sede e rispettando determinate normative. Azure Stack HCI è suddiviso in tre parti: architettura definita dal software, servizi di Azure e hardware.


Finora lo abbiamo fatto ha approfondito l'HCI di Microsoft Azure Stack, l'implementazione on-premise del servizio cloud Azure di Microsoft. Azure Stack HCI può essere visto come un tipo di piattaforma che offre il meglio di entrambi i mondi. Dispone di tutti gli strumenti di gestione di Azure come Monitoraggio di Azure, Centro sicurezza di Azure, Gestione aggiornamenti di Azure, Adattatore di rete di Azure e Azure Site Recovery, pur ospitando i dati in sede e rispettando determinate normative. Azure Stack HCI è suddiviso in tre parti: architettura definita dal software, servizi di Azure e hardware.

La scelta dell'hardware giusto è importante, come spiegato in dettaglio nel nostro articolo: "L'importanza dell'hardware nell'HCI di Microsoft Azure Stack.” Il primo passaggio per distribuire Azure Stack HCI sarebbe trovare un fornitore di hardware certificato, in questo caso DataON. DataON ha una forte partnership sia con Microsoft che con Intel da diversi anni e porta questa partnership alla piena realizzazione nel layout hardware per Azure Stack HCI in una configurazione Intel Select. Un aspetto interessante della partnership con Intel è la capacità di sfruttare il PMEM dell'azienda (e, ovviamente, i suoi processori più recenti) con Azure Stack HCI.

In molti casi, le soluzioni DataON HCI Intel Select vengono configurate e spedite nel proprio rack, pronte per l'implementazione immediata. Questo metodo di distribuzione è particolarmente utile all'edge, dove l'infrastruttura IT esistente è limitata o inesistente. Nel lab StorageReview abbiamo distribuito i quattro nodi di archiviazione e calcolo, controller di dominio e switch come illustrato di seguito.

Costruire e disegnare

Il cluster HCI Microsoft Azure Stack che abbiamo esaminato è basato sulla piattaforma DataON HCI-224 All Flash NVMe. Questi server hanno dimensioni 2U con alloggiamenti da 24 NVMe nella parte anteriore, offrendo molta espansione nella parte posteriore per componenti basati su PCIe. L'etichettatura è in alto rispetto ai contenitori per unità in nero opaco, rendendo facile individuare unità specifiche se arriva il momento di sostituirle. Tutto è etichettato, il che non è così raro, ma la portata dell’etichettatura lo è. Nella nostra distribuzione ogni nodo è etichettato (da 1 a 4), oltre a una serie di altri elementi che semplificano la distribuzione e la gestione nel data center.

La nostra configurazione era dotata di 48 SSD NVMe o 12 per nodo. Questi includevano quattro SSD Intel Optane P375X da 4800 GB e otto SSD Intel P4510 da 2 TB.

Sul retro, abbiamo due NIC Mellanox Connect-X 100 da 5G a doppia porta, che forniscono una connessione completamente ridondante tramite due switch Mellanox 100G (SN2100) per il traffico di rete del cluster. Nella fotografia del nostro studio non sono mostrati tutti i collegamenti con etichettatura completa su ciascuna estremità del cavo di rete appropriato per consentire un cablaggio senza errori in fase di installazione.

StorageReview Diagramma del cluster DataON HCI di Microsoft Azure Stack

Prima di questo, non era mai arrivata una soluzione con questo livello di documentazione nell’etichetta. Microsoft e DataON rendono la distribuzione di Azure Stack un processo indolore in modo che i clienti possano diventare immediatamente operativi. Ogni cavo è codificato a colori per l'uso specifico ed etichettato per dove va ciascuna estremità. In combinazione con il foglio personalizzato che DataON fornisce ai clienti, garantisce un'implementazione quasi priva di errori. Nella nostra implementazione, il sistema è stato preconfigurato con indirizzi IP prima della spedizione, con gli indirizzi IP per la gestione e IPMI etichettati.

Gestione e usabilità

Per gli acquirenti che gestiscono un negozio Hyper-V che opera su Windows Server, Microsoft Azure Stack HCI rappresenterà una transizione facile. Sono presenti molti degli stessi strumenti di gestione, molti dei quali offrono un flusso di lavoro più integrato e semplice. Nel nostro processo di revisione, abbiamo sfruttato sia Windows Failover Cluster Manager per gestire il cluster DataOn HCI, sia Windows Admin Center per monitorare i carichi di lavoro e verificarne le prestazioni.

Analizzando prima il livello del nodo tramite una sessione Microsoft Remote Desktop (RDP) connessa a uno dei nodi, abbiamo esaminato Windows Failover Cluster Manager. Ciò offre sia funzionalità di gestione a livello di nodo che visibilità a livello di cluster. Questo tipo di accesso sarebbe più orientato alla distribuzione iniziale, in cui il monitoraggio quotidiano verrebbe effettuato da Windows Admin Center.

Per prima cosa, facciamo clic sul nostro cluster particolare e otteniamo informazioni generali su di esso, la possibilità di configurarlo e uno sguardo alle risorse. Ciò fornisce una visualizzazione riepilogativa del cluster selezionato, consentendoti di vedere dove sono i problemi e iniziare ad approfondire aree specifiche.

Il prossimo passo sono i ruoli di failover. Qui possiamo vedere tutte le VM Hyper-V in esecuzione sul cluster. Vengono mostrate le numerose VM vmfleet che abbiamo utilizzato per lo stress test del cluster.

Le reti ci consentono di vedere quali reti di cluster sono disponibili e lo stato di ciascuna. La selezione di una rete cluster ti consente di vedere la scheda di rete sottostante ad essa associata, nonché il suo indirizzo IP.

Sotto l'opzione di archiviazione sono presenti dischi, pool e contenitori. Per i dischi, è possibile fare clic sui dischi virtuali e ottenere informazioni quali lo stato, la posizione in cui sono assegnati, il nodo proprietario, il numero del disco, lo stile della partizione e la capacità. Gli utenti possono anche approfondire il tutto con ancora più informazioni presentate come ID del pool, nome e descrizione, nonché ID, nome e descrizione del disco virtuale, stato di integrità e operativo e resilienza.

I pool sono simili, con le informazioni di alcuni pool di archiviazione come stato, integrità, nodo proprietario, stati operativi e capacità complessiva, nonché spazio libero e utilizzato.

Sotto Nodi è possibile vedere facilmente tutti i nodi del cluster e il loro stato.

A destra è possibile passare ai dischi di failover e in basso vedere il singolo disco per un determinato nodo.

Dalla stessa barra laterale è anche possibile osservare la rete per un dato nodo.

Sebbene Windows Failover Cluster Manager sia un apparato di gestione più "giù nei dettagli", richiede agli utenti di connettersi tramite Windows Remote Desktop a un server stesso (o un altro server connesso a quel cluster) per lavorare con esso. Sebbene questo stile di gestione vada bene per molti usi, Microsoft ha reso le cose più semplici con una nuova piattaforma chiamata Windows Admin Center. A differenza di Failover Cluster Manager, Windows Admin Center è completamente basato su browser Web, semplificando la connessione da qualsiasi computer o tablet sul posto di lavoro. Offre inoltre un aspetto modernizzato ed esteticamente gradevole, rendendo il monitoraggio quotidiano un compito più piacevole. Offre uno sguardo su gran parte delle stesse informazioni, con una maggiore attenzione al monitoraggio delle attività che Failover Cluster Manager non offre nella stessa misura.

Una volta associato Windows Admin Center a un cluster, puoi approfondire aree specifiche per visualizzare e gestire le operazioni. Qui vediamo informazioni generali sulle prestazioni di calcolo del cluster, che tengono traccia delle risorse complessive utilizzate dalle VM.

Anche se Windows Admin Center è ottimo per visualizzare l'attività, puoi comunque interagire con le VM nel tuo cluster. Di seguito stiamo accendendo una serie di VM vmfleet.

Gli utenti possono anche approfondire le informazioni su VM specifiche.

Sotto i ruoli, otteniamo un approccio leggermente diverso ai ruoli ma la maggior parte delle stesse informazioni chiave.

Nelle impostazioni gli utenti possono scaricare, installare e aggiornare le estensioni per Azure.

Tramite Windows Admin Center, possiamo anche accedere a Hyper-Converged Cluster Manager per esaminare più da vicino l'elaborazione e l'archiviazione. Ci apriamo alla Dashboard che contiene informazioni generali come il numero di server, unità, VM, volumi, nonché l'utilizzo di CPU, memoria e spazio di archiviazione. Nella parte inferiore della dashboard sono presenti le prestazioni del cluster suddivise in un intervallo di tempo specifico, nonché IOPS e latenza.

In modalità di calcolo, gli amministratori possono approfondire i server stessi per la gestione, inclusa la rimozione del server dal cluster. Qui sono presenti informazioni generali sul server utilizzato come tempo di attività, posizione, dominio, produttore, modello, numero di serie, nome del sistema operativo, versione e numero di build. Inoltre, gli utenti possono visualizzare le prestazioni specifiche del server.

Facendo clic sulla scheda Volumi gli utenti vengono portati a un riepilogo di tutti i volumi nel cluster. Lo stato dei volumi è codificato a colori: verde per integro, rosso per critico e giallo per avviso. Vengono inoltre monitorate le prestazioni per tutti i volumi, suddivise per intervallo di tempo e in IOPS, latenza e throughput.

Il drill-down di un singolo volume fornisce proprietà specifiche del volume tra cui stato, file system, percorso, riconoscimento del dominio di errore, dimensione totale, dimensione utilizzata, resilienza e ingombro. Sono presenti funzionalità opzionali (deduplicazione, compressione e checksum dell'integrità) che possono essere attivate o disattivate qui. La capacità viene mostrata graficamente, mostrando quella utilizzata rispetto a quella disponibile. E ancora, vediamo le prestazioni.

Nella scheda Unità otteniamo un riepilogo di tutte le unità nel sistema. Qui vediamo il numero totale di unità e se sono presenti o meno avvisi con lo stesso codice colore dei volumi. Possiamo anche vedere la capacità: usata, disponibile e prenotata.

Facendo clic su Inventario, otteniamo un elenco di tutte le unità e diversi dettagli. I dettagli includono lo stato dell'unità, il suo modello, la dimensione della capacità, il tipo, a cosa serve e la quantità di spazio di archiviazione utilizzato.

Possiamo analizzare in dettaglio una singola unità e visualizzare proprietà quali stato, posizione, dimensione, tipo, utilizzo, produttore, modello, numero di serie, versione firmware e pool di archiviazione in cui si trova. Possiamo vedere la quantità di capacità utilizzata rispetto a quello disponibile per la singola unità e le relative prestazioni in termini di IOPS, latenza e velocità effettiva.

Sotto le prestazioni possiamo anche vedere la latenza del disco e le statistiche degli errori.

Performance

Le prestazioni all'interno dell'ecosistema Microsoft Azure Stack sono sempre state eccezionali, un punto di forza che si è fatto strada fin dai tempi di Storage Spaces. Con questo in mente, in questa recensione abbiamo esaminato alcuni carichi di lavoro di benchmarking comuni per consentire agli utenti di vedere come questa piattaforma si confronta con altre soluzioni HCI sul mercato. Con questo in mente, abbiamo utilizzato i carichi di lavoro per stressare le dimensioni casuali dei blocchi piccoli e i trasferimenti dei blocchi grandi per mostrare il potenziale che questa soluzione Microsoft può offrire. Nella nostra recensione di Azure Stack HCI, abbiamo sfruttato vmfleet per i benchmark delle prestazioni, mentre su VMware o Linux bare metal abbiamo utilizzato vdbench.

Per le prestazioni in questo caso, abbiamo testato il sistema sia con uno specchio a 2 vie che con uno specchio a 3 vie. Lo specchio si riferisce al metodo di protezione dei dati (due copie o tre copie). Ovviamente con più copie gli utenti perderanno parte della capacità. Dal punto di vista delle prestazioni, la modalità a 3 vie dovrebbe portare a letture migliori grazie all'aumento del parallelismo, mentre la modalità a 2 vie è migliore per le prestazioni di scrittura con un terzo di traffico di rete in meno.

Per il nostro test casuale 4K, lo specchio a 2 vie ha registrato un throughput di 2,204,296 IOPS in lettura con una latenza media di 247 µs e un throughput in scrittura di 564,601 IOPS con una latenza media di 3.69 ms. Il modello a 3 vie ha registrato un throughput in lettura di 2,302,610 IOPS con una latenza media di 170 µs e in scrittura con un throughput di 338,538 IOPS con una latenza media di 9.12 ms. Per mettere in prospettiva alcuni di questi dati, l'offerta vSAN di VMware che utilizza due SSD Optane e quattro SSD con capacità NVMe per nodo ha misurato 521 IOPS in lettura 4K al suo picco e 202 IOPS in scrittura.

Successivamente esamineremo il nostro benchmark sequenziale da 32K. Per quanto riguarda le letture, abbiamo visto il raggiungimento di 2 GB/s a 42.59 vie e 3 GB/s a 39.48 vie. Per le scritture, l'HCI ci ha fornito 13.8 GB/s per la modalità a 2 vie e 7.19 GB/s per la modalità a 3 vie.

Continuando con il nostro lavoro sequenziale, passiamo ai nostri test da 64K. Qui il modello a 2 vie ha raggiunto 39.5 GB/s in lettura e 15.24 GB/s in scrittura e il modello a 3 vie ha raggiunto 46.47 GB/s in lettura e 7.72 GB/s in scrittura. Rispetto a vSAN, le differenze nella larghezza di banda in lettura non si avvicinano nemmeno, dove la larghezza di banda nei test ha superato poco più di 5.3 GB/s con una dimensione del blocco di 64 KB. La larghezza di banda in scrittura ha avuto una differenza simile, dove vSAN ha raggiunto i 2.55 GB/s.

Il nostro prossimo benchmark è SQL con prestazioni miste di lettura/scrittura. In questo caso il 2-way ha avuto un throughput di 1,959,921 IOPS con una latenza media di 324μs. Il 3-way ha raggiunto 1,929,030 IOPS con una latenza media di 185μs. Il carico di lavoro SQL è un'altra area in cui Azure Stack HCI è in grado di mostrare la sua forza, misurando poco meno di 2 milioni di IOPS, mentre vSAN di VMware nello stesso profilo di carico di lavoro ha misurato 321 IOPS.

Con SQL 90-10, il modello a 2 vie ha raggiunto 1,745,560 IOPS con una latenza media di 411 µs mentre il modello a 3 vie ha registrato 1,547,388 IOPS e 285 µs di latenza.

Per SQL 80-20, la bidirezionale ha registrato un throughput di 2 IOPS a 1,530,319 µs di latenza. Il 581 vie ha raggiunto 3 IOPS e 1,175,469μs di latenza.

SPECIFICHE

Il prossimo è il nostro benchmark SPECsfs 2014 SP2: un nuovo test per noi qui. SPECsfs è una suite di benchmark che misura la velocità effettiva e il tempo di risposta del file server. Il benchmark ci fornisce un metodo standardizzato per confrontare le prestazioni tra le diverse piattaforme dei fornitori. Il benchmark funziona impostando una scala e incrementandola fino a quando la latenza del punto è troppo grande per le specifiche del benchmark. Qui esaminiamo la scala che può essere raggiunta fino al superamento degli 11 ms, nonché la larghezza di banda che il server raggiunge quando non supera il numero di latenza.

Qui esamineremo prima la latenza poiché farà più luce sul motivo per cui la larghezza di banda si è fermata dove si trovava nella seconda parte. La scala e le rispettive latenze sia per il 2 vie che per il 3 vie sono nella tabella seguente:

Latenza SPECsfs (ms)
Scala Specchio a 224 vie DataON HCI-2 Specchio a 224 vie DataON HCI-3
100 0.243 0.262
200 0.329 0.371
300 0.466 0.499
400 0.636 0.699
500 0.753 0.896
600 0.953 1.083
700 1.113 1.314
800 1.326 1.557
900 1.501 1.826
1000 1.88 2.167
1100 2.061 2.807
1200 2.323 4.64
1300 2.749 8.557
1400 5.47 10.449
1500 8.616 11.285 (fallito)
1600 10.485 11.414 (fallito)
1700 11.069
1800 11.697 (fallito)
1900 12.51 (fallito)

Come si può vedere, entrambe le configurazioni sono iniziate intorno ai 250μs, quella a 2 vie leggermente al di sotto e rimanendo tale per tutto il tempo. Su una scala di 1500, il 3 vie non è riuscito andando a 11.285 ms, offrendo un intervallo compreso tra 262 µs e 10.45 ms. Il 2 vie ha fallito su una scala di 1800 raggiungendo 11.7 ms, dandogli un intervallo da 243 µs a 11.07 ms.

La tabella successiva mostra la larghezza di banda per ciascuna configurazione in ciascuna build, con l'errore elencato sopra in latenza.

SPECsfs Larghezza di banda (KB/s)
Scala Specchio a 224 vie DataON HCI-2 Specchio a 224 vie DataON HCI-3
100 300897 300880
200 600372 600857
300 901672 902964
400 1202779 1203106
500 1504492 1503394
600 1805952 1806455
700 2105973 2108432
800 2408183 2406171
900 2710895 2707106
1000 3007499 3009280
1100 3308648 3308168
1200 3608244 3610219
1300 3910414 3888303
1400 4212976 4026720
1500 4513454 4000079 (fallito)
1600 4587183 4229678 (fallito)
1700 4621067
1800 4630352 (fallito)
1900 4569824 (fallito)

Per quanto riguarda la larghezza di banda, entrambe le configurazioni hanno funzionato in parallelo con intervalli di 300 MB/s fino a quando la soluzione a 3 vie non ha superato la latenza con una larghezza di banda di passaggio finale di 4.02 GB/s e quella a 2 vie ha avuto una larghezza di banda di passaggio finale di 4.62 GB/s. S.

Conclusione

È passato del tempo dall'ultima volta che siamo stati così approfonditi con qualcosa nello stack incentrato sullo storage di Microsoft; e ragazzi, siamo contenti di essere tornati. Con la soluzione Microsoft Azure Stack HCI rinominata, Microsoft ha fatto qualcosa di così elementare e fondamentale che è facile sottovalutarlo. Microsoft ha reso la propria soluzione HCI estremamente semplice da utilizzare senza sovrapporre nulla che possa smorzare le prestazioni. Come si vede dai nostri numeri, il cluster DataON che abbiamo testato ha registrato numeri straordinari, i più veloci che abbiamo visto in un cluster HCI a 4 nodi di fascia media. Ad essere onesti, non stiamo nemmeno testando l’hardware più recente e migliore di DataON. Sebbene questa configurazione non sia chiaramente trascurabile, completa di SSD Intel Optane DC, DataON offre soluzioni più veloci che sfruttano le CPU Intel Xeon di seconda generazione, memoria persistente e reti più veloci. Il fatto che siano disponibili prestazioni ancora maggiori in una soluzione Azure Stack HCI è entusiasmante, ma è anche importante ricordare che la soluzione può essere scalata anche fino a distribuzioni di piccole dimensioni. HCI a due nodi che può essere configurato senza switch per una soluzione edge o PMI a basso costo.

Analizzando i numeri delle prestazioni, il cluster Microsoft Azure Stack HCI è stato in grado di offrire un'incredibile quantità di I/O e larghezza di banda. Nel regno dei quattro angoli, abbiamo misurato oltre 2.3 milioni di IOPS in lettura casuale 4K con una configurazione mirror a 3 vie e 338 IOPS in scrittura casuale 4K. Se hai bisogno di maggiori prestazioni di scrittura, una configurazione mirror a 2 vie è in grado di aumentare le velocità di scrittura casuale da 4K a 564k IOP. Guardando alla larghezza di banda, tuttavia, è il punto in cui Microsoft Azure Stack brilla davvero. Nel nostro carico di lavoro di trasferimento sequenziale a blocchi da 64K, il mirroring a 2 vie ha misurato 39.5 GB/s in lettura e 15.24 GB/s in scrittura, mentre il mirror a 3 vie ha misurato 46.47 GB/s in lettura e 7.72 GB/s in scrittura. Questo supera di gran lunga quanto abbiamo misurato dai precedenti cluster HCI.

Nel complesso, la soluzione Azure Stack HCI di Microsoft si è rivelata semplice da implementare, facile da gestire ed eccezionalmente performante, tutto ciò che desideri. DataON, in qualità di partner della soluzione, si è distinta nel fornire una build chiavi in ​​mano, offrendo hardware costruito su specifica con istruzioni chiare che alla fine viene venduto in una configurazione che può essere operativa in pochissimo tempo. In molti casi i clienti possono anche saltare il cablaggio, quindi tutto dipende dalle esigenze specifiche. In ogni caso, però, Azure Stack HCI combinato con Intel Optane, SSD Intel NVMe e rete Mellanox 100G si è dimostrato una forza da non sottovalutare.

Soluzioni DataON HCI

Discuti questa recensione

Iscriviti alla newsletter di StorageReview