È evidente che gli ultimi SSD Gen5, come Western Digital SN861, stanno influenzando i risultati aziendali. Se hai bisogno di prove, non guardare oltre il loro impatto sulla rivoluzione dell’intelligenza artificiale.
Sponsorizzato da Western Digital
L'SSD Western Digital Ultrastar® DC SN861 è progettato per soddisfare le esigenze di prestazioni elevate sia dei data center iperscalabili che degli ambienti aziendali. L'SN861 supporta un'interfaccia PCIe® Gen5 ed è disponibile in vari fattori di forma, tra cui U.2 ed E1.S, che gli consentono di adattarsi a più scenari di implementazione. Tuttavia, non è così semplice come realizzare l'SN861 in diversi fattori di forma; Western Digital ha saggiamente progettato il set di funzionalità SN861 per allinearsi ai suoi mercati target.
L'interfaccia Gen5 offre all'SN861 un immediato incremento delle prestazioni rispetto alla generazione precedente SN655. I vantaggi della nuova unità sono molto più profondi, con funzionalità come il posizionamento flessibile dei dati (FDP) nel fattore di forma E1.S. FDP riduce l'amplificazione della scrittura e ottimizza il posizionamento dei dati. L'SN861 include funzionalità di sicurezza avanzate come protezione dei dati end-to-end, crittografia AES-XTS e TCG OPAL 2.01. Il controller aiuta anche a ridurre il consumo energetico dell'SSD, con una media inferiore a 5 watt in modalità inattiva. Inoltre, l'unità supporta più standard come NVMe® 2.0 e OCP Cloud Spec 2.0.
Sebbene le funzionalità di sicurezza ed efficienza siano fondamentali, ogni aggiornamento generazionale comporta un significativo salto di prestazioni e l'SN861 non è diverso. L'unità offre velocità di lettura sequenziale fino a 13,700 MB/s e IOPS di lettura casuale fino a 3.3 milioni, essenziali per applicazioni come AI/ML e analisi dei big data. Entrambe le versioni dell'SN861 consumano in media 20 watt durante il funzionamento e meno di 5 watt in idle. La potenza è regolabile, quindi è facile regolare il profilo di potenza dell'unità in modo che corrisponda al carico di lavoro previsto. Gli hyperscaler, ad esempio, spesso fanno funzionare le loro unità E1.S a stati di consumo molto più bassi.
È interessante notare che, sebbene i due fattori di forma dell'SN861 siano tecnicamente molto simili nel design, Western Digital ha ottimizzato ciascuna unità per carichi di lavoro specifici. Nella versione E1.S, ad esempio, ciò significa funzionalità come FDP e ottimizzazione delle prestazioni per i carichi di lavoro cloud. L’unità U.2, d’altro canto, troverà la sua strada nei carichi di lavoro aziendali ad alte prestazioni e indubbiamente nei carichi di lavoro emergenti come l’intelligenza artificiale che possono trarre vantaggio dal massiccio salto di prestazioni dell’unità.
EDSFF e FDP
FDP offre vantaggi significativi agli hyperscaler come Meta ottimizzando le prestazioni e l'affidabilità dei loro SSD in carichi di lavoro come CacheLib. L'FDP riduce il fattore di amplificazione di scrittura (WAF), portando a velocità di scrittura migliorate e durata dell'SSD estesa, che è fondamentale per gestire attività di elaborazione dati di grandi dimensioni.
La tecnologia migliora l'organizzazione dei dati raggruppando in modo intelligente dati simili, riducendo al minimo l'overprovisioning e riducendo la necessità di una raccolta intensiva dei rifiuti. FDP supporta inoltre più spazi dei nomi, garantendo prestazioni coerenti tra diversi carichi di lavoro. Questa ottimizzazione migliora le prestazioni e la resistenza delle applicazioni e riduce significativamente il costo totale di proprietà (TCO) per le infrastrutture di storage su larga scala.
Il supporto per FDP nella versione E1.S dell'Ultrastar SN861 afferma che l'unità è pronta per le esigenze degli hyperscaler, ma FDP è solo una parte dell'equazione. La versione E1.S dell'unità deve soddisfare i requisiti di prestazioni su vasta scala, in particolare il QoS relativo alle prestazioni di lettura.
U.2 Per le imprese
Per quanto entusiasmante sia l'unità E1.S per i casi d'uso su vasta scala, l'U.2 SN861 è l'unità che la maggior parte delle aziende adotterà. Sottoponiamo l'unità a una serie di test per misurare le prestazioni complessive nella nostra suite di test standard.
Scheda tecnica SSD Western Digital Ultrastar DC SN861
1.60TB | 1.92TB | 3.20TB | 3.84TB | 6.40TB | 7.68TB | |
---|---|---|---|---|---|---|
Resistenza | 3 DWPD | 1 DWPD | 3 DWPD | 1 DWPD | 3 DWPD | 1 DWPD |
Sicurezza | ||||||
Fattore di forma | ||||||
Interfaccia | ||||||
Specifica NVMe | ||||||
Prestazioni (previste) | 1.60TB | 1.92TB | 3.20TB | 3.84TB | 6.40TB | 7.68TB |
Velocità di lettura (max MB/s, sequenza 128 KiB) | 13,700 | 13,700 | 13,700 | 13,700 | 13,700 | 13,700 |
Velocità di scrittura (max GB/s, sequenza 256 KiB) | 3,600 | 3,600 | 7,200 | 7,200 | 7,500 | 7,500 |
Lettura IOPS (max, Rnd 4 KiB) | 2,100K | 2,100K | 3,300K | 3,300K | 3,300K | 3,300K |
Scrittura IOPS (max, Rnd 4 KiB) | 350K | 165K | 665K | 330K | 800K | 430K |
Latenza di lettura (μS) | 65 | 65 | 65 | 65 | 65 | 65 |
Latenza di scrittura (μS) | 8 | 8 | 8 | 8 | 8 | 8 |
L’affidabilità | ||||||
MTTF (ore, previste) | ||||||
Tasso di errore bit non correggibile (UBER) | ||||||
Tasso di fallimento annualizzato (AFR, previsto) | ||||||
Garanzia limitata (anni) | ||||||
Gestione energetica (proiettata) | ||||||
Requisito (DC, +/- 10%) | ||||||
Modalità operative (media, massima) | ||||||
Inattivo (medio) | ||||||
Dimensione fisica | ||||||
altezza z (mm) | ||||||
Dimensioni (larghezza x lunghezza, mm) | ||||||
Ambientali | ||||||
Temperatura operativa (ambiente) | ||||||
Temperatura non operativa |
Per misurare le prestazioni degli SSD aziendali NVMe® Gen5 utilizzati in questo confronto, abbiamo sfruttato una suite di test fio per carichi di lavoro four corner e Vdbench per carichi di lavoro misti. Il pacchetto di script fio che abbiamo utilizzato è uno script automatizzato impostato per precondizionare e testare leggermente le unità in modo coerente, trovato qui su github. Lo abbiamo utilizzato per eseguire test di lettura e scrittura sequenziali da 256K per la larghezza di banda di picco e test di lettura e scrittura casuali da 4K per il throughput di picco.
Throughput di picco e larghezza di banda |
Western Digital SN861 7.68 TB | KIOXIA CM7-R 7.68 TB | Samsung PM1743 7.68 TB | Samsung PM9A3 7.68 TB |
Lettura sequenziale 256K (1T/64Q) | 13,283MB / s | 12,092MB / s | 14,495MB / s | 6,751MB / s |
Scrittura sequenziale 256K (1T/64Q) | 7,696MB / s | 5,796MB / s | 6,052MB / s | 4,055MB / s |
Lettura casuale 4K (8T/32Q) | 2,108,065 IOPS | 1,963,066 IOPS | 1,900,838 IOPS | 1,068,508 IOPS |
Scrittura casuale 4K (8T/32Q) | 473,658 IOPS | 301,061 IOPS | 319,758 IOPS | 206,660 IOPS |
Quando guardiamo le prestazioni di punta del Western Digital SN861, fa buon uso della sua interfaccia Gen5. In lettura sequenziale, ha misurato 13.3 GB/s, arrivando secondo rispetto al Samsung PM1743, che misurava 14.5 GB/s. Nella scrittura sequenziale, l'SN861 è arrivato primo, superando gli altri due modelli Gen5 comparabili, con una velocità di 7.7 GB/s, seguito dal Samsung PM6.1 con 1743 GB/s.
Le prestazioni di lettura casuale 4K sono state particolarmente elevate, misurando 2.11 milioni di IOPS, con 1.96 milioni di IOPS del KIOXIA CM7-R come il successivo più vicino. Quando abbiamo esaminato le prestazioni di scrittura 4K casuali, anche il Western Digital SN861 è arrivato primo, con una velocità di 474K IOPS, seguito dal Samsung PM1743 con 320K IOPS come modello più vicino. Nei nostri carichi di lavoro sui quattro angoli, il Western Digital SN861 ha ottenuto il punteggio massimo in tre dei quattro test.
Per testare l'SSD SN861 Gen5, abbiamo sfruttato il Dell®PowerEdge®R760 nel nostro laboratorio di prova. Si tratta di un server con montaggio su rack 2U altamente versatile che supporta due processori Intel Xeon di quarta generazione e dispone di configurazioni che supportano fino a 4 unità NVMe. Questo server è destinato a carichi di lavoro misti, database e VDI. Va notato che la versione del CM24-R che stiamo testando in questa recensione proviene da un server Dell con la build del firmware Dell. Questa unità potrebbe funzionare in modo diverso con il firmware originale di KIOXIA.
Configurazione Dell PowerEdge R760:
- Doppio Intel® Xeon® Gold 6430 (32 core/64 thread, base a 1.9 GHz)
- RAM DDR1 da 5 TB
- Ubuntu 22.04
Per la massima flessibilità, abbiamo lavorato anche con Serial Cables, che ci ha fornito un JBOF PCIe Gen8 a 5 bay per test SSD U.2/U.3, M.2 e EDSFF. Ciò ci consente di testare tutti i tipi di unità attuali ed emergenti sullo stesso hardware di prova. VDbench è stato sfruttato anche per confrontare le prestazioni scalate della nostra selezione di SSD in diversi tipi di carico di lavoro. Il nostro processo di test per questi benchmark riempie l'intera superficie dell'unità con i dati e quindi suddivide una sezione dell'unità pari al 25% della capacità dell'unità per simulare il modo in cui l'unità potrebbe rispondere ai carichi di lavoro delle applicazioni. Ciò differisce dai test entropici completi, che utilizzano il 100% della forza motrice e la portano in uno stato stazionario. Di conseguenza, queste cifre rifletteranno velocità di scrittura più sostenute.
Profili:
- Lettura sequenziale 16K: lettura al 100%, 32 thread, 0-120% irate
- Scrittura sequenziale 16K: scrittura al 100%, 16 thread, 0-120% irate
- Mix casuale 4K, 8K e 16K 70R/30W, 64 thread, 0-120% iorato
- Database sintetici: SQL e Oracle
- Clonazione completa VDI e tracce di clonazione collegata
Il nostro primo test Vdbench ha misurato le prestazioni di lettura sequenziale di 16K con un carico di 32 thread. Qui, abbiamo misurato un throughput di picco di 325 IOPS e 5.1 GB/s a 98 μs dal Western Digital SN861, che era testa a testa con KIOXIA CM7-R, misurando 329 IOPS. Il Samsung PM5 PCIe Gen1743 ha misurato 289 IOPS, mentre il Samsung PM9A3 che abbiamo portato come SSD Gen4 di riferimento ha misurato 227 IOPS.Spostando la nostra attenzione sulle prestazioni di scrittura con lo stesso carico di lavoro sequenziale di 16K, il Western Digital SN861 ha offerto un forte vantaggio rispetto agli altri SSD U.2 PCIe Gen5 con cui lo abbiamo confrontato. L'SN861 ha misurato un picco di 200 IOPS e 3.1 GB/s a 78 μs, con un buon vantaggio sia rispetto al KIOXIA CM7-R che al Samsung PM1743. Rispetto al panorama Gen4, tutti avevano un forte vantaggio rispetto al Samsung PM9A3, che misurava 131 IOPS.
I nostri prossimi tre test esaminano il ridimensionamento delle dimensioni dei blocchi in un test di trasferimento casuale con un mix R/W 70/30. Il primo test ha misurato una dimensione del blocco di 4K. In questo caso, troviamo che Western Digital SN861 e KIOXIA CM7-R hanno prestazioni molto simili, con l'SN861 che misura 903 IOPS a 70 μs contro 881 IOPS del CM7-R. Il Samsung PM1743 è rimasto indietro con una velocità di picco di 521 IOPS, mentre il Gen4 PM9A3 ha misurato 396 IOPS.
Passando alla dimensione del blocco da 8 con il nostro test casuale 70/30 R/W, il Western Digital SN861 ha superato il KIOXA CM7-R, misurando un picco di 682 IOPS a 93 μs, rispetto al CM7-R con 599 IOPS. Il Samsung PM1743 è rimasto indietro con 414 IOPS, mentre il Gen4 PM9A3 ha misurato 301 IOPS.
Il nostro test finale casuale 70/30 R/W esamina una dimensione del blocco di 16K. Il Western Digital SN861 continua il suo forte vantaggio qui, misurando un picco di 434 IOPS a 143 μs, con il CM7-R che misura 337 IOPS. Il Samsung PM1743 ha continuato a seguire, misurando 231 IOPS, mentre il Gen4 PM9A3 ha misurato 183 IOPS.
Il nostro prossimo gruppo di test si concentra su un carico di lavoro SQL sintetico. In questo primo test, troviamo il Western Digital SN861 in vantaggio rispetto al KIOXIA CM7-R, con una velocità di picco di 407 IOPS a 78 μs contro 396 IOPS del CM7-R. Il Samsung PM1743 è rimasto indietro con un picco di 340 IOPS, mentre il Gen4 PM9A3 ha misurato 310 IOPS.
Con il carico di lavoro SQL in un mix 80/20 R/W, Western Digital SN861 continua a superare il KIOXIA CM7-R, misurando un picco di 424 IOPS a 75 μs contro 407 del CM7-R. Il Samsung PM1743 ha seguito questi due con una velocità di picco di 322 IOPS, mentre il Gen4 PM9A3 ha misurato 281 IOPS.
Aumentando la diffusione in lettura fino a una suddivisione R/W di 90/10 nel nostro carico di lavoro SQL, Western Digital SN861 ha continuato a mantenere la leadership rispetto a KIOXIA CM7-R, misurando 411 IOPS a 77 μs contro 398 IOPS del CM7-R. Il Samsung è ancora dietro questi due con una velocità di picco di 328 IOPS, mentre il Gen4 PM9A3 ha misurato 297 IOPS.
Dopo i nostri test SQL, passiamo all'attenzione su un carico di lavoro Oracle sintetico. In questo caso, i nostri tre SSD Gen5 mostrano notevoli miglioramenti rispetto al Samsung PM4A9 Gen3. Il Western Digital SN861 ha mantenuto la leadership con una velocità di picco di 445 IOPS a 80 μs, davanti al KIOXIA CM7-R con 417 IOPS. Il Samsung PM1743 è arrivato dietro a questi, misurando 317 IOPS, e il PM9A3 con 267 IOPS.
Spostando lo spread R/W del nostro carico di lavoro Oracle sintetico a 80/20, lo spread tra Western Digital SN861 e KIOXIA CM7-R si è ridotto, con l'SN861 che ha misurato un picco di 309 IOPS a 71 μs e il CM7-R che ha misurato 304 IOPS. . Il Samsung PM1743 ha misurato un picco di 252 IOPS, mentre il Gen4 PM9A3 è arrivato con 228 IOPS.
Il nostro carico di lavoro Oracle sintetico finale con un mix R/W 90/10 ha rilevato un divario simile tra Western Digital SN861 e KIOXIA CM7-R. L'SN861 ha avuto una velocità di picco di 296 IOPS a 74 μs, mentre il CM7-R ha misurato 292 IOPS. Il Samsung PM1743 era più indietro con una velocità di picco di 250 IOPS, mentre il Gen4 PM9A3 ha misurato 231 IOPS.
I nostri ultimi sei carichi di lavoro si concentrano sulle tracce VDI di VM full-clone e linked-clone. Questi coprono tre scenari ciascuno: avvio, accesso iniziale e accesso del lunedì. Il nostro test copre uno scenario di avvio con clone completo, in cui Western Digital SN861 ha misurato 370 IOPS a 94 μs rispetto a KIOXIA CM7-R con 348 IOPS. Il Samsung PM1743 è rimasto indietro con 263 IOPS e il Gen4 PM9A3 con 227 IOPS.
Nel nostro scenario di accesso iniziale, il KIOXIA CM7-R si è portato avanti con un vantaggio rispetto al Western Digital SN861, misurando 196 IOPS a 163 μs rispetto al SN861 con 181 IOPS. Il Samsung PM1743 ha misurato un picco di 157 IOPS, mentre il Gen4 PM9A3 è arrivato con 117 IOPS.
Nel profilo di accesso del lunedì, Western Digital SN861 e KIOXIA CM7-R si sono affrontati testa a testa. L'SN861 ha misurato un picco di 158 IOPS a 99 μs mentre il CM7-R ha misurato 160 IOPS. Il Samsung PM1743 ha misurato 126 IOPS e il Gen4 PM9A3 è arrivato con 83 IOPS.
Nei nostri ultimi tre test, abbiamo esaminato gli stessi profili in una configurazione VDI Linked Clone, iniziando con un avvio. Il KIOXIA CM7-R è arrivato primo, misurando 161 IOPS, davanti al Western Digital SN861 con 156 IOPS a 102 μs. Il Samsung PM1743 ha quindi misurato 138 IOPS, seguito dal Gen4 PM9A3 con 110 IOPS.
Nel nostro test di misurazione di un profilo di accesso iniziale, KIOXIA CM7-R ha ottenuto la velocità massima di 89 IOPS, seguito da Western Digital SN861 con 85 IOPS a 102 μs. Il Samsung PM1743 è rimasto indietro con 70 IOPS, seguito dal fratello Gen4 con 53 IOPS.
Nel nostro ultimo carico di lavoro VDI relativo a un profilo di accesso del lunedì, Western Digital SN861 è arrivato in testa con una velocità di picco di 122 IOPS a 129 μs, seguito dal KIOXIA CM7-R che misurava 115 IOPS. Il Samsung PM1743 ha misurato 95 IOPS, seguito dal Gen4 PM9A3 con una velocità di picco di 64 IOPS.
Western Digital SN861 e AI
In un percorso in qualche modo correlato al lavoro con l'SN861 in questo rapporto, abbiamo lavorato anche con la generazione precedente Western Digital Ultrastar DC SN655 all'interno della piattaforma OpenFlex™ Data24 fornita dal gruppo di sistemi Western Digital. In una demo di FMS '24, abbiamo mostrato una demo AI con un server GPU, la piattaforma Data24 NVMe-oF™ e SSD Gen4 SN655.
I nostri test con NVIDIA® IndeX® si sono concentrati sullo sfruttamento delle sue funzionalità avanzate di visualizzazione volumetrica per gestire enormi set di dati con alta fedeltà. IndeX utilizza l'accelerazione GPU per fornire una visualizzazione interattiva in tempo reale di dati volumetrici 3D, che è fondamentale per settori come l'esplorazione di petrolio e gas, l'imaging medico e la ricerca scientifica.
Per ottenere prestazioni ottimali, soprattutto in ambienti ad uso intensivo di GPU, è necessario garantire uno scambio di dati ad alta velocità tra GPU e storage. Ad esempio, per saturare completamente la larghezza di banda di una GPU NVIDIA H100, dovevamo raggiungere circa 64 GB/s di throughput, il che implica l'utilizzo di soluzioni e tecnologie di storage NVMe ad alte prestazioni come NVIDIA GPUDirect™. Questa integrazione riduce la latenza e massimizza il throughput dei dati, garantendo un utilizzo efficiente della GPU per un'elaborazione più rapida ed efficace di set di dati su larga scala.
Quando osserviamo le differenze di larghezza di banda in ciò che l'SN4 Gen655 può fare a 6.8 GB/s di picco rispetto ai 13.7 GB/s dell'SN861, è ovvio vedere i vantaggi del passaggio a un SSD Gen5. Per raggiungere i 64 GB/s con il modello della generazione precedente, erano necessari dieci SSD, mentre l'SN861 poteva raggiungere quell'obiettivo con solo cinque. Questa differenza potrebbe consentire di aumentare il numero di unità per ulteriore larghezza di banda o capacità.
Le prestazioni e la capacità saranno fondamentali affinché lo storage possa adattarsi alle esigenze dell’intelligenza artificiale e di altre applicazioni avanzate. L'interfaccia Gen5 e l'incremento delle prestazioni complessive offerto dall'SN861 rispetto alle unità Gen4 sono molto interessanti a questo proposito, il che significa che queste unità possono supportare più GPU all'interno di un singolo sistema di storage e garantire che tali GPU vengano alimentate a una velocità sufficientemente veloce da garantire il pieno utilizzo.
Conclusione
L'SN861 segna un sostanziale passo avanti per Western Digital. L'unità è disponibile in fattori di forma per supportare sia i clienti hyperscale che quelli aziendali, con funzionalità di unità come FDP nell'unità E1.S ottimizzate per i loro potenziali casi d'uso. L'interfaccia Gen5 è tuttavia il vantaggio più evidente per le unità, offrendo un profilo prestazionale impressionante a tutto tondo.
Il Western Digital SN861 ha offerto ottime prestazioni fin dall'inizio, conquistando tre primi posti nei nostri carichi di lavoro iniziali sui quattro angoli, misurando la larghezza di banda sequenziale di picco e il throughput casuale. I punti salienti includono prestazioni di lettura casuale 4K di 2.11 milioni di IOPS e prestazioni di scrittura casuale 4K di 474 IOPS. Le prestazioni di lettura sequenziale sono state ottime, arrivando al secondo posto rispetto al Samsung PM1743 con 13.3 GB/s, anche se è riuscito a prendere il comando nella larghezza di banda di scrittura sequenziale misurando 7.7 GB/s.
Nei nostri carichi di lavoro VDbench, che si concentravano principalmente su carichi di lavoro misti o trasferimenti di dimensioni di blocchi più piccoli, l'SN861 ha continuato a funzionare eccezionalmente bene. Abbiamo misurato una forte velocità di scrittura sequenziale a 16K di 200K IOPS e forti vantaggi nei test di mix 70/30 R/W che coprono dimensioni di trasferimento 4K, 8K e 16K. Nei nostri carichi di lavoro VDI, l'SN861 si è scambiato il primo posto con il KIOXIA CM7-R, che in alcune aree era testa a testa. Nel complesso, il Western Digital SN861 ha avuto ottimi risultati nella nostra gamma di test.
È evidente che gli ultimi SSD Gen5, come Western Digital SN861, stanno influenzando i risultati aziendali. Se hai bisogno di prove, non guardare oltre il loro impatto sulla rivoluzione dell’intelligenza artificiale. Lo abbiamo visto nei nostri test; I sistemi di intelligenza artificiale necessitano di uno storage veloce per far funzionare le GPU, sia in una cache come nell'esempio NVIDIA IndeX sopra o all'interno di array di storage condivisi o server GPU. Western Digital ha fatto molto bene nel posizionare l'SN861 per questi carichi di lavoro avanzati, offrendo allo stesso tempo SKU abilitati per FDP per hyperscaler.
Archiviazione nel data center Western Digital
Interagisci con StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed