Casa Impresa Recensione ScaleFlux CSD 2000

Recensione ScaleFlux CSD 2000

by Adam Armstrong

ScaleFlux è un'azienda focalizzata esclusivamente sullo storage computazionale, più specificamente sullo storage computazionale su larga scala. L'azienda lo fa principalmente con le sue unità di archiviazione computazionale ScaleFlux (CSD). Come avrai intuito dal nome, il CSD è un SSD NVMe integrato con motori di calcolo in grado di migliorare le prestazioni dell'unità e del sistema. Ma l’archiviazione computazionale significa molte cose diverse, a seconda di chi stai parlando. In questa recensione, abbiamo un assaggio della prospettiva di ScaleFlux, con ScaleFlux CSD 2000.

ScaleFlux è un'azienda focalizzata esclusivamente sullo storage computazionale, più specificamente sullo storage computazionale su larga scala. L'azienda lo fa principalmente con le sue unità di archiviazione computazionale ScaleFlux (CSD). Come avrai intuito dal nome, il CSD è un SSD NVMe integrato con motori di calcolo in grado di migliorare le prestazioni dell'unità e del sistema. Ma l’archiviazione computazionale significa molte cose diverse, a seconda di chi stai parlando. In questa recensione, abbiamo un assaggio della prospettiva di ScaleFlux, con ScaleFlux CSD 2000.

ScaleFluxCSD2000

Che cos'è l'archiviazione computazionale?

In realtà scriviamo di storage computazionale da diversi anni qui su StorageReview. In poche parole, lo storage computazionale prende le risorse di calcolo (che non sono l’architettura di calcolo e/o di memoria del sistema) e le inserisce all’interno dello storage stesso.

A volte queste risorse di calcolo vengono posizionate anche tra l'host e lo spazio di archiviazione. Ciò può ridurre lo spostamento dei dati, alleggerire le risorse di elaborazione del sistema e potenzialmente aumentare le prestazioni o almeno la coerenza delle prestazioni. Tuttavia, sono molti i fornitori che partecipano allo storage computazionale, quindi è importante capire che il termine “storage computazionale” può significare cose molto diverse, a seconda del prodotto.

ScaleFlux CSD 2000 e archiviazione computazionale

ScaleFlux CSD si distingue introducendo motori di compressione/decompressione del percorso dati. Secondo l'azienda, questo può effettivamente quadruplicare la capacità e raddoppiare le prestazioni. Naturalmente, ciò presuppone che i dati siano comprimibili, cosa fondamentale affinché questa piattaforma funzioni bene. Supponendo che le condizioni siano giuste, la capacità effettiva diventa un forte punto di vendita.

ScaleFlux CSD 2000 indietro

C’è anche un argomento da sostenere in termini di costi e densità. Comprimendo i dati e ottenendo una capacità più effettiva, ScaleFlux stima che le organizzazioni possano risparmiare fino al 50% sul costo della flash. Possono anche offrire “più” flash nello stesso slot grazie alla compressione.

Costo ed efficienza significano poco senza prestazioni, che secondo ScaleFlux possono essere raddoppiate rispetto agli SSD tradizionali? L'unità è disponibile sia in versione Data Center che Data Scale, ma diamo un'occhiata ai numeri migliori qui. Il numero massimo con una compressione dati 1:1 è 750 IOPS in lettura 4K e 490 IOPS in scrittura 4K per una compressione dati 2:1. Per velocità sequenziali, si stima che l'unità raggiunga 3 GB/s in entrambe le compressioni e fino a 2.3 GB/s in scrittura in compressione 1:1.

Alcune altre differenze con il CSD sono che ha FTL/FM sintonizzabile che consente agli utenti di ottimizzare le prestazioni e il prezzo per GB. Il funzionamento ad alte prestazioni può portare a problemi di alimentazione e temperatura, sebbene questi possano essere limitati per evitare il surriscaldamento. La protezione dei dati sembra essere ormai sempre nelle notizie e, a tal fine, il CSD rivendica la protezione dei dati end-to-end e l'ECC su tutte le memorie interne nel percorso dei dati, nonché la protezione in caso di perdita di alimentazione.

Per partecipare a questa azione CSD con ScaleFlux, ci sono un paio di inconvenienti. Uno è che l'unità che stiamo esaminando è di terza generazione, in un momento in cui gli SSD tradizionali sono migrati a PCIe di quarta generazione. Questo è un problema risolvibile. Un altro problema è che attualmente il supporto dei driver è limitato a Linux. Windows e VMware sono usciti. La virtualizzazione localizzata sarebbe un caso d'uso interessante e maturo per i vantaggi della riduzione dei dati. Si spera che arrivi un sostegno più ampio.

Specifiche chiave ScaleFlux CSD 2000

Fattori di forma PCIe AIC e 2.5" U.2
Interfaccia Dispositivo di archiviazione a blocchi PCIe Gen3 x4 a bassa latenza
Supporti NAND TLC 3D e QLC 3D
Protezione da perdita di potenza Si
Protezione dei dati
  • Protezione end-to-end
  • ECC su tutte le memorie
  • CRC percorso dati completo
  • Protezione LDPC e RAID a livello di die
Potenza
  • 18 Watt tipici attivi
  • 25 W al massimo
  • 12 W in modalità inattiva (latenza di uscita zero)
Temperatura di esercizio 50°C a 200 LFM (AIC) 35°C a 200 LFM (U.2)
protezione di temperatura Limitazione termica abilitata
MTTF 2 milioni di ore
Capacità di calcolo
  • Compressione trasparente del percorso dati
  • Prestazioni accelerate
  • Capacità estesa
Compatibilità Software Solo kernel OS Linux 2.6 o successivo

  • Supporto repository: Ubuntu 16/18/20, RedHat/CentOS 6/7/8

Compressione con ScaleFlux

Volevamo capire subito come viene implementata la compressione. Per iniziare con Linux, è necessario caricare il driver personalizzato per visualizzare e interagire con l'unità, che è un ramo del comune set di strumenti nvme-cli. Ciò consente di visualizzare l'unità così com'è, formattarla, nonché interagire e/o modificare la capacità utilizzabile in base al set di dati corrente. Di seguito è riportato un rapido esempio dell'output prima e dopo il test del carico di lavoro. Il primo comando di "sfx-nvme list" mostra l'unità installata.

root@storagereview:~# elenco sfx-nvme
Nodo SN Modello Spazio dei nomi Utilizzo Formato FW Rev BUS:slot:funz
/dev/sfdv0n1 UC1945A7112M CSDU3RF040B1 1 3.20 TB / 3.20 TB 512 B + 0 B 4870 0000:d8:00.0

Dopo il nostro primo giro di benchmark con dati completamente non comprimibili (il nostro normale set di dati di lavoro) vediamo l'unità mostrare un rapporto di compressione di 1.00.

root@storagereview:~# cat /sys/block/sfdv*/sfx_smart_features/sfx_capacity_stat
spazio_libero dimensione_fisica dimensione_logica comp_ratio provisioned_cap spazio_flag
2736 6251231232 6251231312 1.00 6251233968 0

Successivamente, abbiamo impostato il livello di compressione vdbench su 4x, consentendo all'unità di svolgere parte della sua magia dietro le quinte. Dopo aver completato ciò e aver interrogato nuovamente l'SSD, vediamo la dimensione aumentata e il rapporto di compressione 4.10. Quindi la buona notizia è che con questa modifica di base, le unità fanno quello che affermano di fare, in termini di funzionalità di compressione.

root@storagereview:~# cat /sys/block/sfdv*/sfx_smart_features/sfx_capacity_stat
spazio_libero dimensione_fisica dimensione_logica comp_ratio provisioned_cap spazio_flag
4728607824 1522626144 6251231312 4.10 6251233968 0

Prestazioni di ScaleFlux CSD 2000

Analisi del carico di lavoro VDBench

Quando si tratta di confrontare i dispositivi di archiviazione, il test delle applicazioni è la soluzione migliore e il test sintetico viene al secondo posto. Pur non essendo una rappresentazione perfetta dei carichi di lavoro effettivi, i test sintetici aiutano a definire i dispositivi di storage con un fattore di ripetibilità che semplifica il confronto tra soluzioni concorrenti.

Questi carichi di lavoro offrono una gamma di profili di test diversi che vanno dai test dei "quattro angoli", ai test comuni sulle dimensioni di trasferimento del database, alle acquisizioni di traccia da diversi ambienti VDI. Tutti questi test sfruttano il comune generatore di carichi di lavoro vdBench, con un motore di scripting per automatizzare e acquisire risultati su un ampio cluster di test di calcolo. Ciò ci consente di ripetere gli stessi carichi di lavoro su un'ampia gamma di dispositivi di storage, inclusi array flash e singoli dispositivi di storage.

Il nostro processo di test per questi benchmark riempie l'intera superficie dell'unità con i dati, quindi partiziona una sezione dell'unità pari al 25% della capacità dell'unità per simulare il modo in cui l'unità potrebbe rispondere ai carichi di lavoro delle applicazioni. Questo è diverso dai test entropici completi, che utilizzano il 100% dell'unità e la portano in uno stato stazionario. Di conseguenza, queste cifre rifletteranno velocità di scrittura più sostenute.

Profili:

  • Lettura casuale 4K: 100% di lettura, 128 thread, 0-120% irate
  • Scrittura casuale 4K: scrittura al 100%, 64 thread, 0-120% irate
  • Lettura sequenziale 64K: lettura al 100%, 16 thread, 0-120% irate
  • Scrittura sequenziale 64K: scrittura al 100%, 8 thread, 0-120% irate
  • Database sintetici: SQL e Oracle
  • Clonazione completa VDI e tracce di clonazione collegata

Per fare un confronto, esamineremo l'SSD ScaleFlux con VDBench che invia dati incomprimibili e dati comprimibili 4x. In 4K casuale, il CSD incomprimibile è iniziato sotto i 100 µs e ha raggiunto il picco a 588,893 IOPS con una latenza di 216 µs. Con la compressione, il disco è stato solo leggermente più lento con un picco di 573,460 IOPS con una latenza di 222μs.

Lettura ScaleFlux CSD 2000 4k

La scrittura casuale 4K ha visto il picco dell'unità incomprimibile a circa 355 IOPS a circa 325μs prima di ridurne un po'. Con la compressione, l'unità è rimasta per la maggior parte sotto i 100μs con un picco di circa 572 IOPS con 168μs di latenza.

Passando ai carichi di lavoro sequenziali da 64K, per la lettura l'unità incomprimibile ha raggiunto un picco di 33,785 IOPS o 2.11 GB/s con una latenza di 473 µs. Con la compressione, abbiamo visto l'unità raggiungere 47,489 IOPS o 2.97 GB/s con una latenza inferiore di 336 µs.

Lettura ScaleFlux CSD 2000 64k

Nella scrittura a 64K entrambe le configurazioni hanno funzionato sotto i 100μs per gran parte del test. La configurazione incomprimibile ha raggiunto il picco di 24,074 IOPS o 1.5 GB/s con una latenza di 643 µs. Con la compressione 4x, abbiamo riscontrato un picco di 36,364 IOPS o 2.27 GB/s con una latenza di 397 µs.

ScaleFlux CSD 2000 mq

La prossima serie di test riguarda i carichi di lavoro SQL: SQL, SQL 90-10 e SQL 80-20. A partire da SQL, entrambe le configurazioni dei dati erano molto simili. L'incomprimibile ha raggiunto il picco di 188,269 IOPS e 167μs di latenza mentre i dati compressi inviati all'unità hanno raggiunto il picco di 190,370 IOPS con una latenza di 167μs.

In SQL 90-10 l'incomprimibile ScaleFlux CSD 2000 ha raggiunto un picco di 185,310 IOPS con una latenza di 172μs. Con la compressione 4x inviata all'unità, ha raggiunto un picco di 220,615 IOPS e una latenza di 144μs.

SQL 80-20 ha avuto il picco dell'unità incomprimibile a 179,482 IOPS con una latenza di 177μs. Osservando la compressione diretta al CSD, abbiamo riscontrato un picco di 221,851 IOPS con una latenza di 143 µs.

Successivamente ci sono i nostri carichi di lavoro Oracle: Oracle, Oracle 90-10 e Oracle 80-20. A partire da Oracle, l'incomprimibile ha raggiunto il picco di 184,048 IOPS e una latenza di 194 µs. Osservando l'unità con compressione abbiamo riscontrato un picco di 245,385 IOPS e una latenza di 135μs.

Oracolo ScaleFlux CSD 2000

Oracle 90-10 aveva iniziato entrambi quasi allo stesso modo in termini di prestazioni e latenza. La versione incomprimibile ha raggiunto il picco di 155,641 IOPS con una latenza di 141 µs. Con la versione di compressione che raggiunge un picco di 175,681 IOPS con una latenza di 125μs.

Le configurazioni di unità per cabina Oracle 80-20 sono iniziate con meno di 100 µs. Con dati incomprimibili, il picco è stato di 151,983 IOPS a 144μs di latenza. Con i dati compressi, abbiamo riscontrato una prestazione di picco di 182,640 IOP con una latenza di 120μs.

Successivamente, siamo passati al nostro test clone VDI, Completo e Collegato. Per l'avvio VDI Full Clone (FC), ScaleFlux CSD 2000 senza dati incomprimibili, l'unità ha raggiunto un picco di 127,616 IOPS con una latenza di 263 µs. L'invio della compressione 4x ha aumentato le prestazioni fino a 161,543 IOPS con 216μs di latenza.

Avvio ScaleFlux CSD 2000 vdi fc

L'accesso iniziale VDI FC ci ha fornito picchi di 78,125 IOPS a 379 µs con dati incomprimibili e 154,077 IOPS a 189 µs con dati compressi.

Per VDI FC Monday l'unità incomprimibile ha raggiunto il picco di 62,922 IOPS con una latenza di 251μs. Con la compressione 4x, si è verificato un picco molto più elevato a 100,680 IOPS con una latenza di soli 156μs.

Per l'avvio VDI Linked Clone (LC), i dati incomprimibili da guidare hanno raggiunto un picco di 58,705 IOPS con una latenza di 271 µs. Quando abbiamo inviato una compressione 4x all'unità, il picco è stato di 81,137 IOPPS e una latenza di 196μs.

Avvio ScaleFlux CSD 2000 vdi lc

VDI LC Initial Login ha fatto sì che l'unità con dati incomprimibili raggiungesse prestazioni massime di 36,537 IOPS con una latenza di 215 µs. Quando i dati compressi 4x hanno raggiunto l'unità, hanno raggiunto il picco di 56,739 IOPS e una latenza di 137μs.

Infine, con VDI LC Monday Login l'unità incomprimibile ha raggiunto un picco di 48,814 IOPS con una latenza di 323μs. Con la compressione, l'SSD ha raggiunto un picco di 81,799 IOPS con una latenza di 192μs.

Conclusione

ScaleFlux si concentra esclusivamente sull'archiviazione computazionale. Ciò avviene principalmente attraverso i suoi SSD, noti come ScaleFlux Computational Storage Drives (CSD). Si tratta di SSD PCIe Gen3 con motori di calcolo per migliorare le prestazioni e l'efficienza dei dati. L'azienda offre una manciata di unità diverse, ma per questa recensione abbiamo esaminato lo ScaleFlux CSD 2000.

Il principale elemento di differenziazione tra l'unità ScaleFlux e altri dispositivi di archiviazione computazionali è il motore di compressione/decompressione del percorso dati. ScaleFlux afferma di quadruplicare la capacità raddoppiando le prestazioni, grazie alla loro tecnologia computazionale. Ciò non solo ha un impatto negativo sulle prestazioni, ma potrebbe anche ridurre il costo per TB di spazio di archiviazione SSD, date le efficienze di archiviazione quando i dati sono altamente comprimibili.

La preoccupazione principale quindi è: il motore di compressione funziona? È stato un sì facile, poiché abbiamo manipolato la compressione nei nostri test fin dall'inizio. Abbiamo iniziato con dati del tutto incomprimibili e, come previsto, abbiamo riscontrato un rapporto dall'unità di 1:1. Passando a un rapporto di compressione 4X, abbiamo ottenuto un rapporto di compressione di 4.1:1 sull'unità. Il primo passaggio fondamentale è stato contrassegnato con un segno di spunta prima di esaminare le prestazioni.

Per prima cosa, diamo un'occhiata all'unità senza che vi vengano inviati dati incomprimibili. Le caratteristiche principali includono 589 IOPS in lettura 4K, 355 IOPS in scrittura 4K, 2.11 GB/s in lettura 64K e 1.5 GB/s in scrittura 64K. In SQL abbiamo riscontrato picchi di 188 IOPS, 185 IOPS in SQL 90-10 e 179 IOPS in SQL 80-20. Per i nostri carichi di lavoro Oracle, abbiamo riscontrato picchi di 184 IOPS, 156 IOPS in Oracle 90-10 e 152 IOPS in Oracle 80-20. Con i nostri test di clonazione VDI, CSD 2000 senza compressione ci ha fornito 128 IOPS all'avvio, 78 IOPS nell'accesso iniziale e 63 IOPS nell'accesso del lunedì per la clonazione completa. Per Linked Clone, l'unità ci ha fornito 59 IOPS all'avvio, 37 IOPS nell'accesso iniziale e 49 IOPS nell'accesso del lunedì.

Una volta inviati i dati compressi 4X, siamo rimasti piacevolmente sorpresi nel vedere il miglioramento delle prestazioni in ogni test tranne la lettura 4K, dove non era così distante. Le caratteristiche principali includono 573 IOPS in lettura 4K, 572 IOPS in scrittura 4K, 2.97 GB/s in lettura 64K e 2.27 GB/s in scrittura 64K. In SQL abbiamo riscontrato picchi di 190 IOPS, 221 IOPS in SQL 90-10 e 222 IOPS in SQL 80-20. Per Oracle, abbiamo riscontrato picchi di 245 IOPS, 176 IOPS in Oracle 90-10 e 183 IOPS in Oracle 80-20. Con i nostri test di clonazione VDI, ScaleFlux con compressione ci ha fornito 162 IOPS all'avvio, 154 IOPS nell'accesso iniziale e 101 IOPS nell'accesso del lunedì per la clonazione completa. Per Linked Clone, l'unità ci ha fornito 81 IOPS all'avvio, 57 IOPS nell'accesso iniziale e 82 IOPS nell'accesso del lunedì.

Lo ScaleFlux CSD 2000 è davvero un prodotto interessante e indica un potenziale cambiamento nel tradizionale spazio SSD man mano che lo storage computazionale guadagna terreno. Il CSD esiste ormai da molti anni, quindi il concetto non è nuovo. Ciò che probabilmente manca è l’esecuzione. Da parte loro, ScaleFlux è il primo dei ragazzi di CSD a ottenere qualcosa nel nostro laboratorio. La fiducia da sola, però, non basta, la spinta deve funzionare.

In questo caso, la performance non è rappresentata solo dai numeri che vedi nei nostri grafici, anche se lì è andata bene. La prova in questo budino SSD riguarda la sua capacità di funzionare bene con dati comprimibili. Lo fa esattamente come previsto nei nostri test, offrendo anche un po' di miglioramento delle prestazioni in tutti i profili di test tranne uno. Affinché questo SSD abbia senso, il caso d'uso necessita solo di allineamento. I dati comprimibili trarranno grandi benefici dalla tecnologia ScaleFlux, senza dubbio lì. Finché non hai bisogno del supporto per la virtualizzazione di VMware o Windows in questo momento, vale sicuramente la pena esplorare CSD 2000 in un PoC per vedere quanto può trarne vantaggio il tuo carico di lavoro.

ScalaFlux

Pianifica un PoC con ScaleFlux

Interagisci con StorageReview

Newsletter | YouTube | LinkedIn | Instagram | Twitter | Facebook | TikTokRSS feed