Casa Impresa GIGABYTE Bigtera VirtualStor Scaler Approfondimento

GIGABYTE Bigtera VirtualStor Scaler Approfondimento

GIGABYTE, un rinomato produttore di componenti e sistemi hardware per computer, è entrato nel mercato dell'archiviazione dei dati collaborando con Bigtera per offrire una soluzione di archiviazione definita dal software unica e ad alte prestazioni. GIGABYTE fornisce l'hardware, associandolo alla piattaforma software VirtualStor di Bigtera per offrire una gamma di dispositivi di archiviazione per soddisfare diversi requisiti di capacità e prestazioni. Sebbene la maggior parte delle persone abbia familiarità con GIGABYTE (che è in attività da oltre 30 anni), Bigtera potrebbe essere un nome nuovo per alcuni. Bigtera, fondata nel 2012, ha due centri di sviluppo e oltre un centinaio di clienti che utilizzano VirtualStor in ambienti di produzione.


GIGABYTE, un rinomato produttore di componenti e sistemi hardware per computer, è entrato nel mercato dell'archiviazione dei dati collaborando con Bigtera per offrire una soluzione di archiviazione definita dal software unica e ad alte prestazioni. GIGABYTE fornisce l'hardware, associandolo alla piattaforma software VirtualStor di Bigtera per offrire una gamma di dispositivi di archiviazione per soddisfare diversi requisiti di capacità e prestazioni. Sebbene la maggior parte delle persone abbia familiarità con GIGABYTE (che è in attività da oltre 30 anni), Bigtera potrebbe essere un nome nuovo per alcuni. Bigtera, fondata nel 2012, ha due centri di sviluppo e oltre un centinaio di clienti che utilizzano VirtualStor in ambienti di produzione.

Scalatore VirtualStor

La famiglia Bigtera VirtualStor è composta da tre diverse linee di prodotti: Scaler, Converger ed Extreme, ciascuna delle quali è una soluzione di storage definito dal software distribuita su un'architettura x86 standard. Lo scaler è l'archiviazione dei dati per soluzioni di scalabilità orizzontale ibrida; Converger è una soluzione di storage che può essere utilizzata per creare un'infrastruttura iperconvergente abbinandola a VMware, Hyper-V o KVM; ed Extreme è una soluzione di storage scale-out all-flash progettata per fornire I/O ad applicazioni che richiedono una latenza costantemente bassa e consumano una grande quantità di larghezza di banda. In questo approfondimento esamineremo la soluzione VirtualStor Scaler.

VirtualStor Scaler è una soluzione di storage scalabile, piuttosto che una soluzione di infrastruttura scalabile o iperconvergente (HCI), il che significa che è possibile aggiungere più dischi o nodi a un cluster di storage VirtualStor Scaler quando è necessaria una maggiore capacità di storage. In altre parole, ottieni la quantità corretta di spazio di archiviazione per il tuo data center che può essere modificata in base alle circostanze attuali. Questa flessibilità elimina di fatto sia il provisioning eccessivo dell'hardware (un requisito delle soluzioni scale-up) sia la necessità di aggiungere più potenza di elaborazione (necessaria o meno) quando si utilizza una soluzione HCI.

Rack dello scaler VirtualStor

GIGABYTE offre sei diverse piattaforme per il sistema VirtualStor Scaler. A un'estremità dello spettro, ottimizzato per gli utenti più piccoli, c'è un sistema con 48 TB di capacità di archiviazione utilizzabile composto da tre nodi 1U. D'altra parte, per i clienti che hanno bisogno di gestire un'enorme quantità di dati, c'è un sistema in grado di archiviare 4 PB di dati ed è composto da otto nodi 4U. Per garantire la qualità di questi sistemi, GIGABYTE utilizza i propri server top di gamma dotati di dual CPU scalabili Intel Xeon di seconda generazione per soddisfare le esigenze di calcolo di questi nodi di storage. Per l'archiviazione dei dati, i dispositivi di archiviazione VirtualStor utilizzano una combinazione di HDD e unità cache SSD NVMe o SATA. Per garantire che i dati continuino a fluire dall'appliance, i nodi utilizzano Intel SFP+ e NIC e la gestione dei nodi offline viene eseguita con i controller di gestione remota Aspeed.

Supporto multiprotocollo VirtualStor
Protocolli di storage dello scaler VirtualStor

I data center di oggi devono fornire storage in grado di soddisfare le esigenze di un gruppo di utenti esigente e diversificato nel modo più rapido ed economicamente efficiente possibile. Per soddisfare le diverse esigenze di storage di un data center, VirtualStor supporta tutti i protocolli di storage comunemente utilizzati (NAS, SAN e storage di oggetti) da un unico pool di storage unificato. Per garantire che i requisiti prestazionali siano soddisfatti, allo spazio di archiviazione possono essere applicati attributi di qualità del servizio (QoS) a file, cartelle o volumi. Le quote, che impediscono a un utente o a un'applicazione di consumare eccessivamente spazio di archiviazione, possono essere applicate a una cartella o a un volume.

VirtualStor è progettato per fornire in modo affidabile e coerente le esigenze prestazionali per le applicazioni più esigenti. Uno dei modi in cui sono riusciti a raggiungere questo obiettivo è il modo in cui il motore di archiviazione back-end di VirtualStor, BigteraStore, gestisce il posizionamento dei dati. BigteraStore utilizza dispositivi flash per la memorizzazione nella cache dei dati e per consolidare e unire piccoli blocchi di dati in blocchi sequenziali più grandi. Ciò non solo ha un impatto enorme sulle prestazioni di un sistema VirtualStor quando si gestiscono dati casuali, ma aumenta anche la durata del dispositivo con meno scritture effettuate su un dispositivo flash. BigteraStore migliora inoltre le prestazioni dei suoi sistemi di archiviazione identificando dati sequenziali (che vengono consegnati in blocchi di dati più grandi) e leggerà e scriverà questi dati direttamente sui suoi dischi rigidi. Poiché lo streaming di dati sequenziali direttamente su un disco rigido non subisce le stesse penalità in termini di prestazioni della lettura e scrittura di dati casuali su un disco rigido, ciò preserva anche la capacità dei costosi dispositivi flash da utilizzare con dati casuali dove ha il maggiore impatto.

Cache SSD dello scaler VirtualStor
Utilizzo di Flash per scaler VirtualStor

L'efficienza, la protezione e la resilienza dei dati sono tre fattori che devono essere affrontati dalle moderne soluzioni di storage odierne e VirtualStor utilizza le tecniche e gli strumenti più recenti per fornire una soluzione solida ed efficiente per affrontare questi fattori.

La caratteristica più importante di qualsiasi sistema di storage è la capacità di proteggere l'integrità dei dati in esso archiviati. Per fare ciò, VirtualStor supporta la replica dei dati, la codifica di cancellazione, il RAID, il rilevamento degli errori e l'autoriparazione dei dati danneggiati. Poiché i dati vengono replicati e bilanciati su molti nodi di storage diversi, nell'improbabile caso in cui un componente hardware o un server si guasti, un altro nodo di storage subentrerà senza problemi e nella maggior parte dei casi l'utente o l'applicazione non si accorgeranno nemmeno del guasto . Una volta identificato e sostituito il componente guasto, verrà automaticamente reintegrato nel sistema. Puoi proteggere i dati sensibili che richiedono la massima protezione su un VirtualStor utilizzando la tecnologia di crittografia Intel AES-NI, ma ovviamente, altri dati meno sicuri possono essere lasciati in uno stato non crittografato sull'appliance di archiviazione VirtualStor.

Panoramica dell'architettura dello scaler VirtualStor
Panoramica dell'architettura dello scaler VirtualStor

Un fattore che viene spesso trascurato dalla maggior parte degli utenti al momento di decidere quale soluzione di archiviazione adottare è la difficoltà nel ritagliare lo spazio di archiviazione sottostante per l'utilizzo. Il fatto che tutto lo storage VirtualStor, indipendentemente dal tipo o dal protocollo, provenga da un unico pool di cui è possibile eseguire l'overprovisioning, elimina in modo efficace sia il compito dispendioso in termini di tempo di ri-provisioning dello storage sottostante per renderlo disponibile, sia isole o silos, di storage di cui è stato effettuato il provisioning ma che non sono utilizzati.

Pannello di controllo di VirtualStor Scaler
Dashboard dello scaler VirtualStor

Il valore di una soluzione di storage può essere ridotto al minimo se la sua gestibilità è difficile o scadente, ma fortunatamente VirtualStor ha reso semplice la gestione del proprio storage offrendo una console di gestione intuitiva, moderna e basata sul web. In passato, abbiamo visto alcuni sistemi di storage unificato legacy pubblicizzati per avere un'unica console di gestione, ma a un esame più attento, la console di gestione era composta solo dai componenti di gestione di vari sistemi posizionati come funzioni su una console di gestione. Sfortunatamente, questa situazione crea confusione poiché vengono utilizzati termini diversi per i componenti di storage e sono necessari flussi di lavoro diversi a seconda del tipo di storage gestito: un modo a dir poco contorto e sconcertante di gestire lo storage.

Abbiamo anche visto sistemi di storage che richiedono l'interazione della riga di comando per completare attività comuni in cui una voce errata può causare risultati catastrofici. Al contrario, con le apparecchiature VirtualStor, tutti i flussi di lavoro relativi alla gestione quotidiana del sistema sono basati su GUI e non richiedono l'interazione della riga di comando. Inoltre, poiché sono stati progettati con il supporto multiprotocollo fin dall'inizio, non come un ripensamento, non sono gravati da funzionalità legacy integrate, il che rende la gestione di VirtualStor intuitiva e priva di errori.

Prestazioni dello scaler VirtualStor

Oltre ad assemblare la soluzione e a semplificarne il funzionamento, il cluster deve comunque offrire prestazioni adatte ai casi d'uso dei clienti target. Inoltre, Bigtera offre supporto multiprotocollo, qualcosa che apporta maggiore flessibilità a questa soluzione. Per diverse settimane abbiamo testato la soluzione con la seguente configurazione hardware:

  • Nodi client
    • 1 x GIGABYTE H261-3C0 – 2U 4 nodi, 3 nodi sono stati utilizzati per 3 server client
    • Per nodo:
      • 2 CPU Xeon Gold 6140 (18 core, 2.3 GHz)
      • 8 moduli di memoria RDIMM DDR16 da 2666 GB a 4 MHz
      • 1 GIGABYTE CLNOQ42 Scheda LAN SFP+ OCP da 25 GB a doppia porta (QLogic FastLinQ QL41202-A2G)
      • 1 unità SSD SATA Seagate da 960" da 2.5 GB
  • Nodi di archiviazione
    • 3 x Server di archiviazione GIGABYTE S451-3R0
    • Per nodo:
      • 2 CPU Intel Xeon Silver 4114 (10 core, 2.2 GHz)
      • 8 moduli di memoria RDIMM DDR16 da 2666 GB a 4 MHz
      • 36 unità disco fisso Seagate Exos SATA da 8" da 3.5 TB
      • 2 SSD Adata SR3.84CP AIC da 2000 TB
      • 1 unità SSD SATA Seagate da 960" da 2.5 GB
      • 1 porta LAN GIGABYTE CLN4C44 4 porte LAN SFP25 da 28 GbE (Mellanox ConnectX-4 Lx)
      • 1 scheda RAID HW GIGABYTE CRA4648, GIGABYTE MR 3108 BBU

Come notato, la soluzione utilizza sia dischi rigidi che flash. Ogni nodo utilizza un SSD Seagate da 960 GB per l'avvio. Per il livello di capacità, GIGABYTE utilizza HDD aziendali Seagate Exos da 8 TB, con 36 unità per nodo di archiviazione. Per ottenere il miglior profilo prestazionale da questa configurazione, GIGABYTE utilizza una coppia di SSD Adata SR2000CP 3D eTLC per nodo di archiviazione. Le schede aggiuntive da 3.84 TB gestiscono le attività di journaling oltre a fornire l'elemento cache per il cluster. La famiglia SR2000CP è disponibile con capacità fino a 11 TB, ma le schede da 3.84 TB soddisfano gli obiettivi di prestazioni (velocità di scrittura/scrittura fino a 6000/3800 MB al secondo) e gli obiettivi di costo di questo dispositivo.

Osservando le prestazioni, è importante capire come le aziende guardano alle piattaforme SDS su larga scala. In genere sono ottimi per le prestazioni del protocollo a oggetti, ma quando si desidera sfruttare un protocollo più tradizionale come iSCSI, è visto più come un caso d'uso di "compatibilità". In altre parole, funzionano, ma sono molto più lenti dei protocolli primari su cui è stato costruito l'array di archiviazione. Questo non è il caso di tutte le piattaforme, però, il che è parte di ciò che rende VirtualStor Scaler così unico. Per dimostrare questo punto, abbiamo eseguito test consecutivi, uno sfruttando il protocollo RBD e uno con iSCSI. Vale la pena notare che testare tutti i protocolli supportati da VirtualScaler non rientrava nell'ambito di questo articolo, poiché l'elenco è ampio (NFS, CIFS/SMB e API S3). 

Per le specifiche del test, abbiamo sfruttato FIO per misurare le prestazioni di 30 condivisioni RBD da 10 GB rispetto a 30 LUN iSCSI da 10 GB. L'abbiamo suddiviso in modo che dei nostri tre sistemi client ciascuno accedesse a 10 condivisioni o LUN. Abbiamo quindi applicato un carico di lavoro di 1 thread per dispositivo di archiviazione e una profondità di coda di 16 (in totale al cluster, si arrivava a 30 thread ciascuno con un carico di 16 Q). Abbiamo quindi confrontato le prestazioni dei trasferimenti sequenziali di grandi dimensioni e del traffico casuale 4K più piccolo.

Nel nostro primo carico di lavoro che misurava un trasferimento sequenziale di 1024K, abbiamo riscontrato una media di poco più di 1600 MB/s in lettura e 960 MB/s in scrittura da ciascuno dei nostri tre client che sfruttano iSCSI. Nel complesso, abbiamo ottenuto 4.9 GB/s in lettura e 2.9 GB/s in scrittura. Sfruttando RBD, abbiamo riscontrato un traffico di scrittura simile di oltre 960 MB/s per client, ma le prestazioni di lettura erano più elevate con oltre 2700 MB/s per client. Nel complesso, i totali RBD hanno misurato 8.1 GB/s in lettura e 2.9 GB/s in scrittura.

Riducendo le dimensioni del carico di lavoro a un trasferimento sequenziale di 128k, abbiamo riscontrato nuovamente un equilibrio simile tra prestazioni iSCSI e RBD. Utilizzando iSCSI, ogni client ha registrato circa 440 MB/s in scrittura e 1600 MB/s in lettura, per un totale di 1.3 GB/s in scrittura e 4.9 GB/s in lettura. Concentrandoci su RBD, abbiamo riscontrato prestazioni di scrittura leggermente inferiori di oltre 410 MB/s per client e prestazioni di lettura più elevate di oltre 2500 MB/s per client. Il risultato è stato un totale di 1.2 GB/s in scrittura e 7.8 GB/s in lettura su RBD.

Spostando la nostra attenzione su prestazioni di trasferimento casuale più piccole, ci concentriamo sul nostro test 4K. Osservando entrambi i protocolli in scrittura casuale 4K, iSCSI e RBD offrivano entrambi prestazioni simili di oltre 23 IOPS per client o circa 71 IOPS in totale, con un vantaggio rispetto a RBD. Analizzando le prestazioni di lettura, abbiamo riscontrato che iSCSI ha registrato circa 64 IOPS per client o 193 IOPS in totale e RBD ha misurato 97 IOPS per client o 291 IOPS in totale.

Concentrandoci sulla latenza media nei nostri test di trasferimento casuale da 4K, con un carico aggregato del cluster di 30 thread e 16 code per thread, abbiamo misurato poco più di 6.7 ms in scrittura sia per i trasferimenti iSCSI che per quelli RBD, con RBD che ha un piccolo vantaggio. Nei trasferimenti di lettura, le prestazioni RBD hanno avuto un vantaggio maggiore, misurando 1.647 ms in totale, rispetto ai 2.489 ms complessivi di iSCSI.

Conclusione

VirtualStor Scaler è una soluzione software-based flessibile e scalabile che viene eseguita su server x86 standard del settore, offrendo archiviazione di file, blocchi o oggetti. In questo caso, abbiamo combinato nodi client e di archiviazione di GIGABYTE per evidenziare la facilità di gestione e il supporto multiprotocollo della soluzione convergente. È anche importante evidenziare la resilienza disponibile nella piattaforma. Ciò avviene grazie in gran parte alle basi Ceph di VirutalStor. Bigtera preferisce non dare il via a questo messaggio, perché spesso si presume che Ceph offra fantastiche funzionalità di protezione dei dati, ma non ha la capacità di raccontare una storia di prestazioni e flessibilità, entrambe fondamentali nella maggior parte delle applicazioni di storage aziendale. Durante il tempo trascorso con VirtualStor Scaler, siamo rimasti continuamente colpiti dalla capacità di fornire prestazioni iSCSI molto elevate insieme all'interfaccia a blocchi RADOS. Aggiungete il fatto che c'è una bella GUI in alto, che è utile per coloro che preferiscono non dilettarsi con la CLI: Bigtera ha fatto bene qui. La soluzione VirtualStor è chiaramente in grado di essere molto più di un data warehouse per implementazioni tipiche di analisi, HPC e AI/ML. L'azienda farebbe bene a considerarlo come un sostituto diretto per un'ampia varietà di casi d'uso, dal cloud on-premise, al consolidamento dello storage e ai carichi di lavoro virtualizzati più tipici, grazie alla flessibilità della soluzione.

Pagina del prodotto GIGABYTE VirtualStor Scaler