Qumulo File System è l'esclusivo file system distribuito definito dal software di Qumulo che si estende al data center, al cloud privato e pubblico. Il suo software è progettato per il cloud ibrido, consentendone l'esecuzione su piattaforme hardware standard di settore preconfigurate e prequalificate, nonché in modo nativo su più cloud pubblici. Nel nostro laboratorio abbiamo avuto l’opportunità di studiare il software Qumulo e alcune delle sue funzionalità più significative. In questa recensione particolare, diamo uno sguardo al file system di Qumulo e alla sua interfaccia utente grafica (GUI).
Qumulo File System è l'esclusivo file system distribuito definito dal software di Qumulo che si estende al data center, al cloud privato e pubblico. Il suo software è progettato per il cloud ibrido, consentendone l'esecuzione su piattaforme hardware standard di settore preconfigurate e prequalificate, nonché in modo nativo su più cloud pubblici. Nel nostro laboratorio abbiamo avuto l’opportunità di studiare il software Qumulo e alcune delle sue funzionalità più significative. In questa recensione particolare, diamo uno sguardo al file system di Qumulo e alla sua interfaccia utente grafica (GUI).
Per innovare, le organizzazioni dipendono da storage moderno, infrastruttura dati, applicazioni e servizi legacy e basati su cloud e storage cloud, nonché da piattaforme e gestione dei dati non strutturati. Tuttavia, i dati non strutturati stanno diventando una seccatura per le aziende che desiderano migrare nel cloud o sfruttare un modello di cloud ibrido, poiché questo tipo di dati crea un nuovo silo di dati; nella maggior parte delle piattaforme cloud disponibili. Il reparto IT si trova ad affrontare questa conseguenza che, il più delle volte, è sopraffatto dalla gestione dei carichi di lavoro in due diversi file system: quello locale e quello nel cloud.
Tuttavia, il vero problema non sono le piattaforme cloud né le piattaforme dati non strutturate. Stiamo ancora utilizzando l'archiviazione di file legacy che non è adatta per effettuare la transizione al cloud. Come sottolinea Qumulo, l’IT è cambiato, ma l’archiviazione dei file no. Le ultime architetture di archiviazione di file di successo sono state create più di 15 anni fa, prima del boom del cloud. Al contrario, il moderno storage di file dovrebbe essere pronto per il cloud: unificare tutti i tipi di dati non strutturati, scalare fino a miliardi di file, estendersi su più data center e sul cloud stesso. Inoltre, fornisci visibilità e automazione con analisi in tempo reale e controllo basato su API.
Qumulo: un file system pronto per il cloud
Identificandosi come un diverso tipo di società di storage, Qumulo afferma di avere il primo file system in grado di affrontare carichi di lavoro cloud ibridi e di fornire servizi di dati di file nativi del cloud. Con questo software, l'azienda si rivolge a piattaforme dati non strutturate e alimenta applicazioni e microservizi per costruttori e sviluppatori. Il software del file system Qumulo è disponibile nel cloud pubblico, privato e ibrido.
I livelli del software Qumulo includono:
- Piattaforme. Le attuali piattaforme hardware includono HPE e Fujitsu e cloud pubblici AWS e GCP. Qumulo ha inoltre recentemente annunciato la possibilità di spostare i dati da file a oggetto per sfruttare applicazioni e servizi nativi del cloud che sfruttano i dati degli oggetti.
- Il sistema operativo. Basato su Ubuntu Linux standard.
- Archivio blocchi scalabile (SBS). La fondazione di Qumulo. Consente scalabilità, portabilità, protezione e prestazioni.
- Il file system. Consente conteggi di file scalabili e operazioni sui file ad alte prestazioni. Inoltre, fornisce informazioni in tempo reale su prestazioni e capacità.
- Servizi dati. Proteggi, proteggi e gestisci i dati nella piattaforma Qumulo utilizzando strumenti di livello aziendale. Questo livello è costituito da cinque funzionalità: snapshot, replica, quote, audit e controllo degli accessi in base al ruolo (RBAC).
- Gestione e Programmabilità. Permetti agli amministratori di creare soluzioni integrate con la piattaforma Qumulo e agli amministratori di automatizzare e gestire i propri servizi dati.
- Accesso ai dati e autenticazione. Consenti l'accesso ai dati utilizzando applicazioni e sistemi operativi standard garantendo al tempo stesso una sicurezza di livello aziendale. Questo livello supporta i protocolli di accesso aziendale, inclusi NFS, SMB e FTP.
Il nostro focus qui è il file system, che si basa sul concetto di organizzazione dei dati in strutture logiche e di abilitazione di carichi di lavoro con un numero enorme di file. Il file system utilizza un'architettura distribuita che presenta un unico spazio dei nomi. Le piattaforme utilizzate sono cluster senza condivisione di nodi indipendenti, ciascun nodo fornisce capacità e prestazioni. Inoltre, i singoli nodi si coordinano costantemente tra loro, consentendo a qualsiasi client di connettersi a qualsiasi nodo e leggere e scrivere nello spazio dei nomi. Questa struttura è molto interessante; lo scopo è che i creatori collaborino sui set di dati mentre si muovono attraverso il ciclo di vita dei dati. Fornisce inoltre informazioni in tempo reale sulle prestazioni e sull'utilizzo della capacità, anche quando i sistemi raggiungono petabyte e miliardi di file.
Il file system Qumulo organizza i dati in directory e li presenta ai client SMB e NFS con la possibilità di condividere i dati tra protocolli, offrendo a più utenti e tipi di applicazioni diversi l'accesso agli stessi dati. Il file system ha proprietà uniche in cui si distingue: l'uso di B-tree e un motore di analisi dei dati in tempo reale integrato.
Con l'uso della struttura B-tree, Qumulo può scalare fino a miliardi di file senza riscontrare i problemi prevalenti in altri sistemi. Gli alberi B sono particolarmente adatti per i sistemi che leggono e scrivono un gran numero di blocchi di dati perché sono strutture di dati "superficiali" che riducono al minimo la quantità di I/O richiesta per ciascuna operazione all'aumentare del numero di dati. Queste strutture sono ideali per file system e indici di database estesi.
Un'altra parte fondamentale del Qumulo File System è la capacità di riconoscere i dati con un motore di analisi in tempo reale. La consapevolezza dei dati significa visibilità multidimensionale nel sistema di storage, fornendo informazioni approfondite su contenuti, attività, utenti e altro ancora. Con l'analisi in tempo reale di Qumulo, gli amministratori dello storage possono monitorare rapidamente l'utilizzo e le prestazioni dello storage, inclusi throughput e latenza. Questa visibilità consente alle organizzazioni di acquisire il controllo sui propri dati non strutturati e di ridurre i costi operativi e di capitale complessivi, gestendo in modo proattivo le esigenze attuali e prevedendo meglio i futuri requisiti di storage. L'interfaccia utente web di Qumulo, come esaminato nella sezione seguente, porta questa visibilità al livello successivo di gestione del sistema.
Grazie alla sua architettura software e al suo particolare file system, Qumulo consente alle organizzazioni di raggiungere obiettivi di business precedentemente impossibili nel solo data center on-premise. Uno dei vantaggi di Qumulo è quello di eseguire il proprio file system in locale e quindi eseguire esattamente lo stesso software nel cloud. L'azienda è nota come fornitore di archiviazione di file scalabile. Ora, l’utilizzo dell’elasticità del cloud e della scalabilità dell’infrastruttura di cloud computing e di storage cloud, insieme al software di Qumulo, rende molto potente lo spostamento dei dati avanti e indietro e la scalabilità orizzontale o verticale del data center. Ad esempio, le aziende potrebbero prendere le proprie app on-premise così come sono, spostarle nel cloud e funziona. E se un utente dispone di dati di file che desidera sfruttare con servizi cloud come l’apprendimento automatico o l’intelligenza artificiale, la funzionalità Shift di Qumulo copierà i dati in un archivio di oggetti cloud per ottenere l’accesso all’innovazione delle applicazioni native del cloud.
Quando le organizzazioni spostano questi carichi di lavoro nel cloud, vogliono anche comprendere le prestazioni dei loro dati. La stessa esperienza offerta dall’analisi di Qumulo per le piattaforme hardware si trova nel cloud, offrendo un’esperienza completa di cloud ibrido. Se le aziende eseguono il software in un dispositivo fisico o nel cloud, il software è lo stesso, inclusa la stessa GUI e le stesse funzionalità.
Per maggiori dettagli su caratteristiche e capacità, ti invitiamo a visitare la documentazione tecnica sul sito web di Qumulo.
Prestazioni Qumulo
Configurazione delle prestazioni
La configurazione dei nodi Qumulo nel nostro cluster a 5 nodi includeva doppie porte 25GbE in LACP con quattro SSD SATA da 480 GB e dodici HDD SATA da 6 TB ciascuno. Per i nostri test di storage abbiamo eseguito il provisioning di un singolo spazio dei nomi NFS sui nostri otto server Dell EMC PowerEdge R740xd, ciascuno con una singola porta 25G assegnata al vSwitch che si connette alla condivisione NFS. Abbiamo quindi utilizzato i nostri 16 CentOS LoadGen in VMware, ciascuno con due vDisk da 125 GB allocati, per un totale di 4 TB di spazio sul cluster.
Quando si tratta di effettuare benchmark sugli array di storage, il test delle applicazioni è la soluzione migliore, mentre il test sintetico viene al secondo posto. Pur non essendo una rappresentazione perfetta dei carichi di lavoro effettivi, i test sintetici aiutano a definire i dispositivi di storage con un fattore di ripetibilità che semplifica il confronto tra soluzioni concorrenti. Questi carichi di lavoro offrono una gamma di profili di test diversi che vanno dai test "quattro angoli", test comuni sulle dimensioni di trasferimento del database, nonché acquisizioni di tracce da diversi ambienti VDI. Tutti questi test sfruttano il comune generatore di carichi di lavoro vdBench, con un motore di scripting per automatizzare e acquisire risultati su un ampio cluster di test di calcolo. Ciò ci consente di ripetere gli stessi carichi di lavoro su un'ampia gamma di dispositivi di storage, inclusi array flash e singoli dispositivi di storage.
Poiché l'array di archiviazione Qumulo è stato ottimizzato per trasferimenti di blocchi di grandi dimensioni, i nostri test si sono concentrati sui trasferimenti sequenziali da 64K, 1024K e 2048K.
Profili:
- Lettura sequenziale 64K: lettura al 100%, 32 thread, 0-120% irate
- Scrittura sequenziale 64K: scrittura al 100%, 32 thread, 0-120% irate
- Lettura sequenziale 1024K: lettura al 100%, 32 thread, 0-120% irate
- Scrittura sequenziale 1024K: scrittura al 100%, 32 thread, 0-120% irate
- Lettura sequenziale 2048K: lettura al 100%, 32 thread, 0-120% irate
- Scrittura sequenziale 2048K: scrittura al 100%, 32 thread, 0-120% irate
Il primo è il nostro benchmark sequenziale a 64K: 74,619 IOPS o 4.66 GB/s con una latenza di 11.3 ms.
La scrittura a 64K ha registrato prestazioni di picco di circa 9K IOPS o 555 MB/s con una latenza di 110 ms.
Successivamente passiamo ai nostri test 1024K. In lettura abbiamo riscontrato prestazioni di picco di 7,128 IOPS o 7.13 GB/s con una latenza di 108 ms.
La scrittura a 1024K ha visto un picco di circa 1,670 IOPS o 1.6 GB/s con una latenza di 557 ms prima di ridurne un po'.
I nostri benchmark sequenziali finali sono i nostri 2048K. Nelle prestazioni di lettura abbiamo riscontrato un picco di 3,858 IOPS o 7.7 GB/s con una latenza di 184 ms.
Infine, nella nostra scrittura da 2048K abbiamo riscontrato un picco di 1,055 IOPS o 2.1 GB/s con una latenza di 433 ms.
Panoramica dell'interfaccia utente Web di Qumulo
Nella sezione seguente, presentiamo una panoramica dell’interfaccia utente web di Qumulo e alcune delle sue configurazioni chiave. L'azienda offre questa interfaccia utente basata sul Web agli amministratori per distribuire, gestire e monitorare data center e ambienti cloud.
Dopo aver effettuato l'accesso al cluster come amministratore, veniamo portati direttamente alla pagina Dashboard. A questo punto ci rendiamo subito conto della Web UI unica e dall'aspetto moderno proposta da Qumulo. Questa interfaccia utente web è costituita da un menu intuitivo ben organizzato in schede; lo vediamo in alto a sinistra dello schermo, che include rapidamente tutte le categorie necessarie per distribuire, gestire e monitorare la nostra infrastruttura. Il menu principale è costituito dalle schede Dashboard, Analisi, Condivisione, Cluster, API e Strumenti e Supporto. Puntando su queste schede, l'interfaccia utente visualizza un elenco a discesa per accedere a tutte le diverse pagine offerte dall'interfaccia utente. Nell'angolo in alto a destra, gli utenti possono visualizzare la versione corrente del software, l'ora (in base all'ora locale del client del browser Web) e l'utente attualmente registrato.
Tuttavia, nella pagina Dashboard, notiamo un layout accattivante dell'interfaccia utente che facilita il monitoraggio delle infrastrutture e dove possiamo osservare diverse aree critiche come Panoramica del cluster, Tendenze della capacità, Attività del cliente e, in tempo reale, Attività del cluster.
Un concetto che ci è particolarmente piaciuto della UI, nell'area Dashboard, è l'interazione dinamica con tutti i suoi elementi. Ad esempio, in Attività cluster, è possibile trascinare facilmente per spostare, espandere o restringere l'attività informativa desiderata che si desidera monitorare, entro 24 ore. Qui abbiamo anche alcune preimpostazioni con periodi di 1 minuto, 5 minuti, 1 ora e il valore predefinito 3 ore. I parametri (IOPS e throughput) si adatteranno di conseguenza ai dati di picco.
Scorrendo verso il basso nella pagina Dashboard, troviamo l'area Attività cliente.
Ora passiamo direttamente all’area in cui Qumulo spicca, l’analisi. Come accennato in precedenza, Qumulo consente agli amministratori di gestire i dati e gli utenti in tempo reale. In Analisi > Analisi integrata, possiamo vedere il riquadro delle informazioni a sinistra popolato con i client che utilizzano la maggior parte delle risorse del sistema e con le directory e i file che vengono attivamente letti e scritti. Queste informazioni vengono visualizzate dopo aver fatto clic su una directory o sottodirectory specifica.
Passando alla pagina Capacità Explorer, sempre nella scheda Analytics, possiamo vedere come è distribuita la capacità sul sistema. Innanzitutto, abbiamo una panoramica generale della capacità della directory, elencata dalla più grande alla più piccola.
Cliccando su una directory, possiamo scavare ed esplorare ciascuna di esse in una prospettiva più dettagliata. Ad esempio, l'immagine seguente mostra le sottodirectory contenute nella directory denominata "vmw".
E se continuiamo a fare clic sulle sottodirectory, alla fine potremo raggiungere i dettagli a livello di file. Questa volta abbiamo fatto clic sulla sottodirectory denominata "netapp-centos01".
La pagina successiva sotto analisi è Tendenze capacità. Da qui possiamo ottenere tutti i dettagli necessari per monitorare e gestire l'utilizzo straordinario della capacità del cluster. Le due aree principali qui sono Cronologia capacità e Modifica capacità. Queste capacità includono metadati, dati e snapshot (esclusi solo in Modifica capacità). La cronologia e le modifiche della capacità possono essere filtrate rapidamente in base agli intervalli di tempo delle ultime 72 ore, degli ultimi 30 giorni o delle ultime 52 settimane. Si tratta di ottime opzioni che aiutano gli amministratori dello storage a visualizzare e gestire il cluster su larga scala e ad esplorare eventi significativi di modifica della capacità.
La sezione successiva che abbiamo esplorato nella scheda Analisi è Attività, dove possiamo trovare Hot Spot di throughput, Hot Spot IOPS, Client e Percorsi. La pagina Hot Spot IOPS ci consente di identificare gli hotspot di input/output al secondo nel nostro sistema di storage. Il grafico mostra le directory più attive in termini di operazioni di lettura/scrittura di file e metadati. Il livello di dettaglio di questi dati può essere regolato utilizzando il cursore in alto a destra del grafico. È disponibile anche un'ottima opzione per mettere in pausa il display, dal pulsante di opzione Aggiornamento automatico.
Possiamo anche monitorare l'attività per cliente. L'analisi ci consente di vedere quali clienti sono più attivi in termini di throughput e IOPS.
Inoltre, monitoriamo l'attività nel cloud in base al percorso.
La scheda successiva nel menu principale è Condivisione e qui la prima pagina che analizziamo è Quote. Qumulo consente quote di capacità in tempo reale, consentendo agli amministratori di specificare la quantità di capacità che una determinata directory può utilizzare per i file. Da questa pagina possiamo creare, modificare o eliminare le quote.
Le due pagine successive sono Esportazioni NFS e Condivisioni SMB che consentono ai client di condividere i dati archiviati in una directory particolare. Sotto Esportazioni NFS, ad esempio, possiamo creare nuove esportazioni, nonché modificarle ed eliminarle.
Il prossimo nel menu principale è Cluster. Nel menu Cluster troviamo varie configurazioni e opzioni relative al cluster e al sistema in generale. Nella prima pagina, Panoramica, abbiamo informazioni vitali sulla capacità del nostro cluster e dei suoi nodi.
Facendo clic su uno dei nodi, possiamo approfondire dettagli hardware più specifici. Ad esempio, facciamo clic sul nodo "sr-qumulo-1" per scoprire informazioni di rete rilevanti e determinare lo stato di integrità.
Nel menu Cluster troviamo anche funzionalità di archiviazione critiche come istantanee e replica. E altre opzioni, tra cui la configurazione della rete, la ridenominazione del cluster, l'aggiunta di un nuovo host al cluster e altro ancora. Inoltre, impostazione dei protocolli FTP e SMB. Infine, in questo menu possiamo gestire l'autenticazione e l'autorizzazione. L'immagine seguente mostra come esempio la pagina Utenti e gruppi locali.
Dalla scheda API e strumenti possiamo accedere alla pagina Qumulo Core direttamente nell'interfaccia utente. Qui potremmo scaricare i wrapper della libreria client Python e la CLI per l'API REST Qumulo Core.
L'ultima scheda nel menu è Supporto e la prima pagina che abbiamo trovato qui è Qumulo Care, un servizio di monitoraggio basato su cloud che possiamo abilitare per inviare dati a Qumulo. In questo modo, il team di Qumulo potrebbe risolvere meglio e accelerare qualsiasi problema relativo al cluster.
Infine, nel menu, abbiamo la pagina Aggiornamento software.
Conclusione
Per innovare, le organizzazioni dipendono da piattaforme dati non strutturate e storage data-aware, che sono scarsamente serviti dalle soluzioni disponibili. In questa recensione, abbiamo studiato Qumulo File System, sviluppato per offrire dati non strutturati in tutti gli ambienti. Qumulo è tra i pionieri dell'archiviazione data-aware e dei servizi di dati di file cloud, con la sua esclusiva soluzione software-fined per il cloud ibrido.
Nell'ultima sezione di questo articolo, abbiamo dato un'occhiata all'interfaccia utente Web di Qumulo. In passato, abbiamo presentato una panoramica delle interfacce utente grafiche (GUI) di alcuni dei server e dei dispositivi di archiviazione più popolari e questa volta siamo stati entusiasti di presentare una panoramica della nuova GUI di Qumulo. A prima vista, ci rendiamo conto del design elegante di questa GUI, dell'eccellente esperienza utente e di quanto sia semplice con le operazioni di gestione quotidiana dell'amministratore.
Nel complesso, il software Qumulo offre ai propri clienti un insieme eccezionale di funzionalità, strumenti di monitoraggio e pianificazione. Il software semplifica il viaggio verso il cloud. Supporta lo spostamento dei dati con la migrazione al cloud lift-and-shift, fornendo al contempo potenti analisi in tempo reale per rilevare e ottenere informazioni immediate su ciò che sta accadendo ai nostri preziosi dati.
Interagisci con StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS feed