Datrium offre "convergenza aperta", che è ciò che chiamano la prossima generazione di infrastrutture convergenti. Potrebbero esserci tanti riff sulla convergenza quanti sono i fornitori nello spazio IT aziendale e, da parte loro, Datrium non è timido nel promuovere la propria visione di come potrebbe essere l'infrastruttura. Secondo Datrium, elaborazione, archiviazione primaria, archiviazione secondaria e cloud si uniscono in una configurazione altamente resiliente, scalabile e facile da gestire senza un silo per ogni classe di archiviazione. Inoltre, poiché la maggior parte delle chiamate dati colpiranno i nodi di calcolo con cache flash integrata, Datrium può offrire prestazioni straordinarie senza dover accedere ai nodi dati in quasi tutti i casi. Ciò si traduce in una larghezza di banda massima in lettura e scrittura di 200 GB/s e 16 GB/s e 32 milioni di IOPS in lettura casuale 18K.
Datrium offre "convergenza aperta", che è ciò che chiamano la prossima generazione di infrastrutture convergenti. Potrebbero esserci tanti riff sulla convergenza quanti sono i fornitori nello spazio IT aziendale e, da parte loro, Datrium non è timido nel promuovere la propria visione di come potrebbe essere l'infrastruttura. Secondo Datrium, elaborazione, archiviazione primaria, archiviazione secondaria e cloud si uniscono in una configurazione altamente resiliente, scalabile e facile da gestire senza un silo per ogni classe di archiviazione. Inoltre, poiché la maggior parte delle chiamate dati colpiranno i nodi di calcolo con cache flash integrata, Datrium può offrire prestazioni straordinarie senza dover accedere ai nodi dati in quasi tutti i casi. Ciò si traduce in una larghezza di banda massima in lettura e scrittura di 200 GB/s e 16 GB/s e 32 milioni di IOPS in lettura casuale 18K.
Fondamentalmente, Datrium è costituito da nodi di calcolo e nodi di archiviazione che compongono il sistema DVX. I nodi di elaborazione possono essere forniti da Datrium oppure i clienti possono sfruttare la propria infrastruttura server esistente. I nodi di calcolo gestiscono l'elaborazione I/O, mantenendo una cache localmente su flash. La memoria flash può essere praticamente qualsiasi cosa, dalle unità SATA a basso costo e ad alta capacità, alle unità NVMe ad alte prestazioni. La decisione sulla flash dipende interamente dal carico di lavoro e può essere ottimizzata per soddisfare le esigenze del cliente. Poiché i dati persistenti risiedono sui nodi dati, i nodi di calcolo sono senza stato e possono andare offline senza rischiare la perdita o il danneggiamento dei dati, mantenendo la disponibilità n-1. Datrium supporta una varietà di ambienti tra cui vSphere 5.5-6.5, Red Hat 7.3, CentOS 7 1611 e bare metal Docker 1.2.
I nodi dati mantengono copie persistenti dei dati e sono disponibili in configurazioni disco o flash. All'interno di Datrium DVX, i dati vengono sempre compressi, deduplicati a livello globale e codificati per la cancellazione con tolleranza a doppio errore. Datrium offre anche crittografia, istantanee e replica all'interno di DVX. I nodi dati si affidano ai nodi di elaborazione per tutta l'elaborazione, mantenendo il sistema di storage libero di fornire I/O tramite doppi controller hot-swap. I nodi dati includono NVRAM con mirroring e batteria tampone per scritture veloci e rete Ethernet ad alta velocità con bilanciamento del carico e failover del percorso. Gli ultimi nodi di Datrium includono DVX con Flash End-to-End. Ciò significa che è presente flash nei nodi di calcolo, insieme ai nodi dati DVX all-flash. Il nodo dati F12X2 dispone di 16 TB di spazio di archiviazione utilizzabile (12 SSD da 1.92 TB), con una capacità effettiva fino a 32-96 TB con riduzione dei dati da 2 a 6 volte e supporto per la rete 25GbE. L'ultimo nodo di elaborazione, CN2100, aggiunge nuove CPU Skylake, supporto NVMe e reti fino a 25GbE.
Questa recensione è alquanto unica in quanto abbiamo avuto accesso a un ambiente di test Datrium da remoto, configurato con 32 nodi di elaborazione Dell PowerEdge C6320 e 10 nodi dati all-flash Datrium DVX.
- 32 server Dell PowerEdge C6320
- VMware ESXi 6.0 Update3 installato
- Doppia CPU Xeon E5-2697 v4
- memoria 128GB
- 4 SSD Samsung PM1.92a da 863 TB come cache dati
- 2 NIC da 10 Gb/s (gestione/dati)
- Configurazione di rete
- 10 nodi dati F12X2 sullo switch principale
- 32 nodi di calcolo su 8 switch TOR
- Ogni switch TOR ha un uplink da 160 Gbps allo switch principale
Management
Il DVX è gestito con un'interfaccia utente basata su HTML5 tramite il browser o come plug-in VMware vCenter. L'intera premessa dell'interfaccia utente DVX si basa sulla semplicità, eliminando la necessità di gestire l'archiviazione in modo tradizionale. Tutto avviene dalla stessa interfaccia utente, dal provisioning dello storage alla gestione delle repliche.
Con una rapida occhiata, gli utenti sono in grado di trovare informazioni sulle prestazioni relative agli IOPS delle VM del cluster, al throughput, alle velocità di trasferimento di rete, nonché alla latenza media di lettura/scrittura di Datrium insieme ai tassi di successo del flash dell'host. Data la struttura a livelli della piattaforma Datrium DVX, il controllo dei livelli di prestazioni tra gli host e i nodi dati sottostanti è utile per misurare le prestazioni complessive. Oltre ai parametri prestazionali, viene fornita la capacità utilizzabile totale che mostra l'impronta totale dei dati insieme allo spazio per gli snapshot, nonché i parametri attuali di riduzione dei dati.
Un elemento interessante da notare negli screenshot qui sopra è il traffico di rete (dove uno mostra l'attività di scrittura casuale 4K e l'altro l'attività di lettura). Poiché Datrium DVX sfrutta la flash lato host per l'attività di lettura e affida l'attività di scrittura ai nodi dati, puoi vederlo rappresentato nelle velocità di rete. Nel nostro test casuale 4K, l'attività di rete è stata misurata a 7.3 GB/s, mentre nel nostro test di lettura in cui i dati sono stati estratti dalla memoria flash interna dell'host, il traffico di rete era inesistente.
Benchmark delle prestazioni
Per misurare le prestazioni di un cluster così grande, abbiamo scelto HCIBench di VMware per la sua facilità di implementazione e la capacità di aggregare i dati sulle prestazioni tra centinaia di VM vdbench. Per un cluster di grandi dimensioni, questo strumento ci ha consentito di aumentare rapidamente i carichi di lavoro comunemente utilizzati per misurare lo spazio di archiviazione aziendale, oltre a consentirci di lavorare con dati che presentano uno schema ripetuto definito dall'utente. Per le piattaforme che offrono servizi di riduzione dei dati, offre agli utenti la possibilità di mostrare le prestazioni in situazioni più vicine al mondo reale. In questo caso, abbiamo utilizzato un'impostazione di compressione 2:1 per ciascuno dei nostri carichi di lavoro. Va notato che tutti i benchmark erano in esecuzione, compressione, deduplicazione e codifica di cancellazione in linea. In altre parole, tutti i benchmark sono stati condotti in condizioni operative reali.
Nel nostro HCIbench 4K, esaminiamo il picco di throughput casuale con un profilo di carico di lavoro 4K completamente casuale. Il Datrium DVX è stato in grado di raggiungere 9.5725 GB/s in lettura e 2.524 GB/s in scrittura.
Successivamente esamineremo l'I/O di picco nello stesso profilo 4K. Qui Datrium DVX ha avuto un altro risultato impressionante con oltre 2.45 milioni di IOPS in lettura e 646,162 IOPS in scrittura.
Il parametro successivo esamina la latenza media del profilo di carico di lavoro 4K completamente casuale. Pur non avendo una latenza inferiore al millisecondo, il DVX è stato comunque in grado di raggiungere un impressionante 1.05 ms in lettura e 3.96 ms in scrittura.
Il nostro prossimo test esamina un profilo di dati casuali più ampio da 8K con un misto di attività di lettura del 70% e di scrittura del 30%. Il throughput del DVX qui è stato di 9,229.5 GB/s. Considerando il picco di I/O, il DVX è stato in grado di raggiungere oltre 1.18 milioni di IOPS. La latenza 8K 70/30 è risultata essere di soli 2.17 ms.
L'ultimo carico di lavoro passa al focus sulla larghezza di banda di picco, costituito da un profilo di lettura e scrittura sequenziale di 32K. Qui il DVX è stato in grado di raggiungere l'enorme velocità di lettura di 42.16 GB/s e di scrittura di 13.26 GB/s.
Considerando i picchi di I/O per lo stesso carico di lavoro, il DVX continua a registrare numeri impressionanti con oltre 1.349 milioni di IOPS in lettura e 424,282 IOPS in scrittura.
Con tutti i numeri elevati che il DVX ha ottenuto nel test da 32K, ha superato il tutto con una latenza piuttosto bassa di 1.9 ms in lettura e 6.02 ms in scrittura.
Trattandosi di una piattaforma convergente, l'utilizzo della CPU è un fattore importante da considerare poiché parte del sovraccarico dello storage proviene dagli stessi sistemi utilizzati per gestire i carichi di lavoro stessi. Durante il monitoraggio della piattaforma durante ciascun carico di lavoro, abbiamo esaminato le prestazioni totali del cluster (entrambi i lati dell'equazione), inclusi i lavoratori HCIbench che sfruttano vdbench, distribuiti nel cluster insieme al sovraccarico delle stesse VM di storage.
Durante l'intensa attività di scrittura sequenziale (in cui gran parte del lavoro viene scaricato direttamente sui nodi flash), abbiamo rilevato meno del 40% delle risorse di sistema totali utilizzate. Durante l'attività di lettura intensa, come nel carico di lavoro di lettura casuale 4K, questa metrica è aumentata fino a poco più del 60%. Quindi, anche con il sistema che serviva il carico di lavoro e le VM che lo consumavano, avevamo il 60% delle risorse della CPU rimaste per altre applicazioni e carichi di lavoro e, nel caso peggiore, erano scese al 40%. Pertanto, con la modalità Insane in esecuzione (40% di utilizzo massimo dell'host rispetto al 20% normale) nello scenario peggiore con servizi dati in linea completi in funzione, la piattaforma Datrium aveva ancora molte risorse di sistema rimaste.
Conclusione
La famiglia Datrium DVX è stata aggiornata per supportare l'ultima generazione di risorse di storage ed elaborazione. In questo caso, abbiamo esaminato la configurazione flash end-to-end, che include una cache flash nei nodi di calcolo, insieme a nodi dati all-flash per l'archiviazione persistente. La piattaforma di “convergenza aperta” di Datrium include anche i servizi dati generalmente presenti su prodotti più maturi; con Datrium DVX, i dati vengono sempre compressi, deduplicati a livello globale e codificati per la cancellazione con doppia tolleranza agli errori. I clienti possono scegliere di utilizzare i nodi di calcolo di Datrium ma, come nel caso di questa recensione, ciò non è obbligatorio (i nostri test hanno utilizzato 32 nodi Dell PowerEdge). Questi nodi di calcolo gestiscono l'elaborazione I/O e la cache con un sovraccarico minimo fino al 20%. Per le istanze che richiedono maggiori prestazioni di archiviazione, tuttavia, DVX può essere messo in modalità Insane in cui DVX può utilizzare fino al 40% delle risorse di elaborazione.
Dal punto di vista delle prestazioni, abbiamo optato per i benchmark HCIbench poiché rifletterebbero al meglio ciò che Datrium DVX è veramente in grado di fare in un ambiente su larga scala. Fin dall'inizio, il DVX all-flash ha registrato numeri davvero impressionanti. Nei benchmark 4K, il DVX ha raggiunto un throughput di oltre 9.57 GB/s e 2.45 milioni di IOPS in lettura e oltre 2.52 GB/s e 646K IOPS in scrittura. Il DVX ha ottenuto questi numeri con una latenza di soli 1.05 ms in lettura e 3.96 ms in scrittura. Passando all'8K 70% in lettura e 30% in scrittura, il DVX ha impressionato ancora una volta con un throughput superiore a 9.2 GB/s, oltre 1.18 milioni di IOPS, il tutto con una latenza di 2.17 ms. Nel nostro test sequenziale da 32K, il DVX ha raggiunto l'incredibile velocità di lettura di 42.16 GB/s e oltre 1.349 milioni di IOPS, con una latenza di 1.9 ms.
Chiaramente la visione di Datrium sulla convergenza è unica. Sfruttare la CPU "rimanente" dai nodi di calcolo con flash localizzato è molto sensato, pur essendo in grado di mantenere la flash per lo storage persistente per tutti i vantaggi in termini di TCO. Un fattore chiave per garantire questo funzionamento sono le efficienze di archiviazione offerte dal sistema DVX, fondamentali per ottenere il massimo dalla memoria flash nei nodi dati. Per coloro che necessitano di prestazioni ancora maggiori, è abbastanza semplice eliminare lo storage NVMe nei nodi di elaborazione, anche se chiaramente abbiamo fatto molto bene con un'opzione a basso costo. Tuttavia, nessuna delle prestazioni significa molto senza resilienza. Con DVX, i nodi di elaborazione sono senza stato e supportano un modello di tolleranza agli errori del server N-1. Ciò significa che potremmo perdere 31 dei 32 server nella nostra configurazione di test e tutti i dati rimarranno disponibili. Anche se tutti i server venissero persi, DVX non perderà i dati poiché la copia autorevole dei dati viene archiviata e protetta sui nodi dati, non sui nodi di calcolo.
In definitiva, al momento, nell’IT aziendale, c’è poco di più entusiasmante dell’infrastruttura convergente. Sebbene esistano molti modi per realizzare questa visione, Datrium ha messo insieme la propria proposta per DVX che include servizi di gestione dei dati approfonditi abbinati a un eccellente profilo di prestazioni. Tuttavia, pochi nello spazio di convergenza hanno dato risultati sia in termini di prestazioni che di funzionalità, rendendo il DVX di Datrium un'offerta ben armata che si distingue nettamente dalla massa.
Iscriviti alla newsletter di StorageReview