Casa Impresa Recensione dell'SSD ScaleFlux CSD 3000

Recensione dell'SSD ScaleFlux CSD 3000

by Charles P. Jefferies

ScaleFlux si concentra esclusivamente sullo storage computazionale su larga scala. Il suo nuovo Computational Storage Device (CSD) 3000 è un SSD Gen4 con motori di compressione e decompressione dei dati integrati, che secondo l'azienda può quadruplicare la capacità e raddoppiare le prestazioni. Metteremo alla prova queste affermazioni.

ScaleFlux si concentra esclusivamente sullo storage computazionale su larga scala. Il suo nuovo Computational Storage Device (CSD) 3000 è un SSD Gen4 con motori di compressione e decompressione dei dati integrati, che secondo l'azienda può quadruplicare la capacità e raddoppiare le prestazioni. Metteremo alla prova queste affermazioni.

ScaleFluxCSD3000

Specifiche ScaleFlux CSD 3000

Per informazioni generali sull'archiviazione computazionale, ns Recensione ScaleFlux CSD 2000 (la versione precedente del CSD 3000 recensita qui) è una lettura utile. In breve, lo storage computazionale integra le risorse di calcolo nello storage stesso invece di fare affidamento sulle risorse di calcolo del sistema host.

La potenza di calcolo del CSD 3000 proviene dal processore di archiviazione SFX 3000, un chip SoC ARM personalizzato con accelerazione hardware dedicata. Questa unità è disponibile nel fattore di forma U.2.5 da 2 pollici con capacità di 3.2 TB, 3.84 TB, 6.4 GB e 7.68 TB. Utilizza un'interfaccia PCIe Gen4 x4, un miglioramento rispetto all'interfaccia Gen2000 del CSD 3.

Porta ScaleFlux CSD 3000

ScaleFlux offre un'unità simile, l'NSD 3000. Ha una compressione integrata ma non ha il moltiplicatore di capacità del CSD 3000.

Le specifiche principali del CSD 3000 sono nella tabella seguente.

Fattore di forma 2.5″ U.2 (15 mm)
Capacità predefinite 3.2 TB, 3.84 TB, 6.4 TB, 7.68 TB
Interfaccia host PCIe Gen4x4
Virtualization SR-IOV con 15 funzioni virtuali
Sicurezza

 

TCG Opal 2.0 con accelerazione della sicurezza HW

 

Management NVMe-MI 1.1 su SMBus

 

Potenza <20 W tipico, <5 W inattivo

 

L’affidabilità Protezione del percorso dati end-to-end, perdita di potenza

Protezione, correzione errori LDPC, NAND Die RAID

Lettura sequenziale 7.2 GB / s
Scrittura sequenziale 4.8 GB/s*
Lettura casuale (4kB) 1450 kIOPS
Scrittura casuale (4kB) 380 kIOPS*
Sostenuta 70/30 Casuale 4kB Leggi/Scrivi con 2:1 comprimibile Dati 1020 kIOPS

Background dei test su ScaleFlux CSD 3000 e comparabili

StorageReview Enterprise Test Lab fornisce un'architettura flessibile per condurre benchmark dei dispositivi di storage aziendali in un ambiente paragonabile a quello che gli amministratori incontrano nelle distribuzioni reali. L'Enterprise Test Lab incorpora una varietà di server, reti, condizionatori di alimentazione e altre infrastrutture di rete che consentono al nostro personale di stabilire condizioni reali per valutare con precisione le prestazioni durante le nostre revisioni.

Incorporiamo questi dettagli sull'ambiente e sui protocolli del laboratorio nelle revisioni in modo che i professionisti IT e i responsabili dell'acquisizione dello spazio di archiviazione possano comprendere le condizioni in cui abbiamo ottenuto i seguenti risultati.

Banco di prova ScaleFlux CSD 3000

Abbiamo utilizzato un sistema diverso dal nostro normale banco di prova per recensire il CSD 3000. Con l'unità unica come questa e la diversa piattaforma di test utilizzata, non la confronteremo testa a testa con i tradizionali SSD Gen4 NVMe. Questa recensione sfrutta il nostro server Intel OEM Scalable Gen3, che è ben equipaggiato con doppi processori Intel 8380, offrendo una potenza della CPU ben superiore a quella necessaria per stressare lo storage locale ad alte prestazioni. Le sue specifiche di alto livello includono quanto segue:

  • 2 Intel scalabili Gen3 8380
  • 32 DDR32 da 4 GB a 3200 MHz
  • Ubuntu 20.04.2 Live Server (carichi di lavoro sintetici)
  • VMware ESXi 7.0u2 (carichi di lavoro delle applicazioni)
  • 8 alloggiamenti NVMe PCI Gen4 U.2

Per misurare le prestazioni di ScaleFlux CSD 3000, utilizziamo VDbench, che può avere il livello di compressione regolato prima di ogni carico di lavoro. Di solito, questa impostazione viene mantenuta allo 0% per impostazione predefinita, ma l'abbiamo aumentata al 50% per un fattore di compressione 2:1 durante il test di questo SSD. Queste due serie si riflettono nei grafici seguenti.

Prestazioni di ScaleFlux CSD 3000

Note:: Dopo aver esaminato ScaleFlux CSD 3000, ci sono stati forniti due modelli più recenti con firmware di produzione. Abbiamo aggiornato la recensione con gli ultimi risultati di questi due punti di capacità.

Analisi del carico di lavoro VDBench

Per quanto riguarda il benchmarking dei dispositivi di archiviazione, il test delle applicazioni è il migliore e il test sintetico è al secondo posto. Pur non essendo una rappresentazione perfetta dei carichi di lavoro effettivi, i test sintetici aiutano i dispositivi di storage di riferimento con un fattore di ripetibilità che semplifica il confronto delle soluzioni concorrenti.

Questi carichi di lavoro offrono una gamma di profili di test diversi che vanno dai test "quattro angoli" e test comuni sulle dimensioni di trasferimento del database per tracciare acquisizioni da diversi ambienti VDI. Questi test sfruttano il comune generatore di carichi di lavoro vdBench, con un motore di scripting per automatizzare e acquisire risultati su un cluster di test di elaborazione di grandi dimensioni. Ciò ci consente di ripetere gli stessi carichi di lavoro su un'ampia gamma di dispositivi di storage, inclusi array flash e singoli dispositivi di storage.

Il nostro processo di test per questi benchmark riempie l'intera superficie dell'unità con i dati, quindi partiziona una sezione dell'unità pari al 25% della capacità dell'unità per simulare il modo in cui l'unità potrebbe rispondere ai carichi di lavoro delle applicazioni. Ciò differisce dai test entropici completi, che utilizzano il 100% dell'unità e la portano in uno stato stazionario. Di conseguenza, queste cifre rifletteranno velocità di scrittura più sostenute.

Profili:

  • Lettura casuale 4K: 100% di lettura, 128 thread, 0-120% irate
  • Scrittura casuale 4K: scrittura al 100%, 64 thread, 0-120% irate
  • Lettura sequenziale 64K: lettura al 100%, 16 thread, 0-120% irate
  • Scrittura sequenziale 64K: scrittura al 100%, 8 thread, 0-120% irate
  • Database sintetici: SQL e Oracle
  • Clonazione completa VDI e tracce di clonazione collegata

 

L’unicità di questa unità significa che la confronteremo solo con se stessa. Per confronto, esamineremo ScaleFlux CSD 3000 con VDBench che invia dati incomprimibili e dati comprimibili 2:1.

Nel nostro primo benchmark, lettura casuale 4K, le prestazioni compresse del CSD 3000 sono salite costantemente fino a 909 IOPS con una latenza di 139 µs per il modello da 7.68 TB (il modello da 3.85 TB era un po' indietro rispetto agli altri). L'unità era leggermente più lenta senza compressione e con la stessa capacità, raggiungendo un massimo di 886 IOPS a 142.4 µs.

Prestazioni di lettura casuale di ScaleFlux C3000 Il CSD 3000 non compresso ha mostrato una curva da montagne russe nel nostro test successivo, scrittura casuale 4K, con il modello da 7.68 TB che ha mostrato i migliori risultati dei due: picco a 454K IOPS con latenza di 275.7μs. L'unità compressa ha mostrato risultati molto migliori, terminando intorno a 735 IOPS e 168.2 µs.

Prestazioni di scrittura casuale di ScaleFlux C3000

Passando ai test sequenziali da 64K, iniziamo con le prestazioni di lettura, che raccontano una storia simile (le unità compresse hanno nuovamente numeri impressionanti). Entrambe le capacità avevano prestazioni praticamente identiche, con il modello da 3.84 TB che superava leggermente la capacità maggiore di 113 IOPS (o 7.06 GB/s) a 282 µs. L'unità superiore non compressa (7.68 TB) ha raggiunto 98 IOPS a 326.8 µs.

Prestazioni di lettura sequenziale di ScaleFlux C3000

I risultati della scrittura sequenziale a 64K sono stati ancora più favorevoli con le versioni compresse. Entrambe le capacità hanno avuto ancora una volta prestazioni identiche (anche se, come puoi vedere, la capacità da 3.84 TB ha superato di poco la capacità maggiore con 96 IOPS a 154 µs di latenza, rimanendo ben al di sotto di 100 µs fino a quando non si è avvicinata a 90 IOPS. Al contrario, l'unità non compressa ha registrato picchi notevoli, terminando a 29 IOPS a 534 µs per la capacità da 7,68 TB e 25 IOPS a 616.6 µs per la capacità da 3.85 TB.

Prestazioni di scrittura sequenziale di ScaleFlux C3000

La prossima serie di test riguarda i carichi di lavoro SQL: SQL, SQL 90-10 e SQL 80-20. Il test del carico di lavoro SQL è il primo; il CSD 3000 mostra una curva simile quando compresso e non compresso con i modelli ad alta capacità, sebbene la versione compressa fosse leggermente migliore con 310 IOPS con una latenza di 101.9 µs.

Prestazioni del carico di lavoro SQL di ScaleFlux C3000 Con SQL 90-10, il CSD 7.68 compresso da 3000 TB è stato ancora una volta l'unità con le migliori prestazioni, completando il test a 311 IOPS e una latenza di 101.3 µs. In confronto, la migliore unità non compressa (sempre da 7.68 TB) ha terminato con 285 IOPS e 110.8 µs di latenza.

In SQL 80-20, vediamo entrambe le capacità del CSD 3000 compresso occupare le prime posizioni, con il modello da 7.68 TB che termina a 319 IOPS con una latenza di 98.3 µs. Il modello non compresso da 7.68 TB era notevolmente indietro (anche se molto vicino al modello di piccola capacità) con 277 IOPS a 113.5 µs.

Poi ci sono i nostri carichi di lavoro Oracle: Oracle, Oracle 90-10 e Oracle 80-20. In questo caso, i drive compressi CSD 3000 hanno continuato a offrire prestazioni complessivamente superiori. A partire dal test del carico di lavoro Oracle, il risultato migliore è stato l'unità compressa da 7.68 TB con 336 IOPS con una latenza di 103.9 µs. L'unità compressa da 7.68 TB era ben indietro, con un picco di 279 IOPS con una latenza di 126 µs.

Prestazioni del carico di lavoro Oracle ScaleFlux C3000 Nell'Oracolo 90-10; l'unità compressa da 7.86 TB ha terminato a 229 IOPS con una latenza di 94.7 µs. Le unità da 3.84 TB (compresse) e 7.68 TB (non compresse) hanno mostrato prestazioni identiche, con 214 IOPS a 101.4 µs di latenza.

Passare a Oracle 80-20 ha raccontato ancora una volta una storia simile. L'unità non compressa da 7.68 TB ha terminato a 237 IOPS con una latenza di 91 µs, mentre l'unità compressa da 7.68 TB è stata seguita da 213 IOPS con una latenza di soli 101.9 µs.

Successivamente, siamo passati ai nostri test di clonazione VDI, Full Clone (FC) e Linked Clone (LC). Tutte le unità hanno mostrato una lieve instabilità della coda nell'avvio VDI FC. Compresso, il CSD 7.68 da 3000 TB si è classificato nuovamente al top con 270 IOPS con una latenza di 126.9 µs; compresso, ha nuovamente raggiunto la capacità più performante dell'unità da 7.68 TB (che di fatto ha superato l'unità compressa da 3.84 TB) con 242 IOPS a una latenza di 141.9 µs.

Prestazioni di avvio VDI di ScaleFlux C3000 VDI FC Initial Login racconta una storia diversa, poiché le unità compresse erano di gran lunga migliori mentre le unità non compresse erano ovunque. L'unità compressa da 7.68 TB ha raggiunto il picco di 244 IOPS con 117.2 µs di latenza, mentre il modello da 3.84 TB ha raggiunto il picco di 210 IOPS con 137.2 µs di latenza. Le unità non compresse hanno terminato a 127 IOPS con una latenza di 231.1 µs (7.68 TB) e 94 IOPS con una latenza di 312.4 µs (3.84 TB).

Il CSD 3000 compresso ha continuato a stupire nel nostro ultimo test FC, Monday Login, dove il suo miglior numero è stato di 144K IOPS con una latenza di 106.9μs (7.68TB). L'unità non compressa da 7.68 TB ha mostrato 100 IOPS con una latenza di 154.6 µs.

Passeremo ora ai test LC, dove tutte le unità hanno mostrato linee stabili nel test di avvio. Le unità compresse hanno continuato a dominare (in particolare il 7.68 TB, che ha registrato 131 IOPS e una latenza di 120.1 µs). L'unità superiore non compressa (7.68 TB) è stata in grado di raggiungere 110 IOPS a 144.4 µs.

Notiamo un comportamento instabile delle unità non compresse nell'accesso iniziale LC quando si avvicina a 20,000 IOPS; il numero finale era di 49 IOPS/157.1 µs (3.84 TB) e 56 IOPS/138 µs (7.68 TB). Come sempre, le unità compresse hanno mostrato prestazioni e stabilità migliori, completando il test a 73 IOPS/103.1μs (3.84TB) e 80 IOPS/94.4μs (7.68TB).

Nel nostro ultimo test, le unità non compresse risultano ancora sottoperformanti rispetto alle versioni compresse. Nell'LC Monday Login, che ha mostrato ancora una volta alcuni strani picchi di latenza per le unità compresse, i modelli da 3.84 TB e 7.68 TB hanno terminato rispettivamente a 62 IOPS/250.1μs e 75 IOPS/207.5μs. Il numero finale dell'unità compressa era molto migliore a 109 IOPS/140.9μs (3.84TB) e 124 IOPS/123.5μs (7.68TB).

Conclusione

ScaleFlux continua a concentrarsi sullo storage computazionale. L'unità CSD 3000 che abbiamo esaminato in questa recensione migliora rispetto alla precedente CSD 2000 principalmente offrendo un'interfaccia PCIe Gen4, che gli conferisce un potenziale di prestazioni molto più elevato.

Abbiamo testato il CSD 3000 sotto Linux nel nostro server scalabile Intel OEM Gen3 in uno stato non compresso e di nuovo in uno stato compresso 2:1 per sfruttare i motori di compressione integrati dell'unità. L'unità ha mostrato prestazioni superiori e una latenza inferiore in tutti i test utilizzando dati comprimibili, spesso con delta prestazionali a due cifre.

I principali risultati prestazionali (migliori risultati/capacità) con dati compressi includono 909 IOPS in lettura casuale 4K per il modello da 7.68 TB (rispetto a 886 IOPS non compresso), 735 IOPS in scrittura casuale 4K per il modello da 7.68 TB (454 IOPS non compresso), 7.06 GB/s in Lettura sequenziale da 64 KB per il modello da 3.85 TB (6.12 GB/s non compresso) e 6 GB/s in scrittura sequenziale da 64 KB (1.82 GB/s non compresso).

Il CSD 3000 ha mostrato numeri compressi e non compressi simili nei nostri test SQL e Oracle, sebbene l'unità compressa fosse più coerente. In un esempio, SQL 80-20, l'unità compressa ha raggiunto 319 IOPS a 98.3 µs di latenza (modello da 7.68 TB) mentre il modello non compresso era notevolmente indietro con 277 IOPS a 113.5 µs

Infine, i nostri test di clonazione VDI Full e Linked hanno rilevato le differenze più evidenti tra il CSD 3000 che esegue dati compressi rispetto a quelli non compressi, ovvero i dati compressi hanno funzionato molto meglio e in modo più coerente. Per fare un esempio, VDI LC Initial Login ha mostrato le unità non compresse con prestazioni di picco di 49 IOPS/157.1 µs (3.84 TB) e 56 IOPS/138 µs (7.68 TB), mentre le unità compresse hanno completato il test a 73 IOPS/103.1 µs ( 3.84 TB) e 80 IOPS/94.4 µs (7.68 TB).

Come nota cautelativa, abbiamo riscontrato alcuni picchi di latenza inspiegabili e prestazioni ridotte durante l'esecuzione di dati non compressi. Ciò si è verificato durante i nostri test 4K/64K, SQL/Oracle e VDI FC/LC, quindi non è stato isolato solo in uno scenario.

I punti di forza del CSD3000 verranno mostrati al meglio quando potrà funzionare con alcuni dati comprimibili, poiché è lì che avrà i vantaggi più significativi in ​​generale rispetto agli SSD tradizionali. ScaleFlux ha anche aggiunto il supporto VMWare con questa versione, che non aveva quando abbiamo esaminato il precedente CSD 2000. Questo è un grande vantaggio, ma manca ancora il supporto per la virtualizzazione di Windows. Tuttavia, vale la pena considerare il CSD 3000 di ScaleFlux se è possibile allineare i carichi di lavoro con il supporto della piattaforma e i notevoli punti di forza di compressione dell'unità.

Pagina del prodotto ScaleFlux

Interagisci con StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed