Proprio la scorsa settimana Intel ha rilasciato il proprio CPU Xeon di terza generazione, che si basa sul loro ecosistema che include l'archiviazione SSD Optane nel P5800X e ovviamente l'ultimo Moduli di memoria persistente serie 200 (PMem). Una volta terminate le nostre revisioni iniziali sullo storage Intel, abbiamo deciso di riutilizzare il server Intel e la tecnologia di storage che abbiamo in laboratorio. Abbiamo installato Windows Server 2019 per testare Optane PMem 200, Optane P5800X SSD e TLC NAND SSD P5510 testa a testa. Lo scopo di questa recensione è valutare le prestazioni di storage Intel in Windows Server in modo da poter comprendere meglio dove risiedono i punti di forza di ciascuna di queste tecnologie in uno scenario bare metal.
Proprio la scorsa settimana Intel ha rilasciato il proprio CPU Xeon di terza generazione, che si basa sul loro ecosistema che include l'archiviazione SSD Optane nel P5800X e ovviamente l'ultimo Moduli di memoria persistente serie 200 (PMem). Una volta terminate le nostre revisioni iniziali sullo storage Intel, abbiamo deciso di riutilizzare il server Intel e la tecnologia di storage che abbiamo in laboratorio. Abbiamo installato Windows Server 2019 per testare Optane PMem 200, Optane P5800X SSD e TLC NAND SSD P5510 testa a testa. Lo scopo di questa recensione è valutare le prestazioni di storage Intel in Windows Server in modo da poter comprendere meglio dove risiedono i punti di forza di ciascuna di queste tecnologie in uno scenario bare metal.
Optane PMem contro Optane SSD contro NAND SSD
Ci sono ancora una serie di domande su quale tecnologia di storage sia adatta per una particolare applicazione o caso d'uso, nonostante la piramide di storage da tempo favorita da Intel. Certo, la DRAM è la più veloce, ma sfortunatamente è anche costosa. Optane PMem può essere utilizzato come DRAM, fornendo storage persistente che non necessita di reidratazione al riavvio. PMem sfrutta anche gli slot DIMM tradizionali, quindi è facile inserirlo. PMem ha anche un profilo prestazionale impressionante rispetto ai tradizionali SSD.
Poi ovviamente ci sono gli SSD Optane, che sono stati ottimizzati per assorbire le scritture, un lavoro con cui gli SSD tradizionali possono avere difficoltà. Questo è il motivo per cui vengono generalmente utilizzati come parte di un'architettura di archiviazione multilivello come cache o pool di livelli. Gli SSD Optane, tuttavia, sono più costosi degli SSD NAND TLC e presentano un enorme svantaggio in termini di capacità, ad esempio il P5800X arriva a 1.6 TB.
Scendendo in basso abbiamo SSD TLC, come Intel P5510, che si adatta al punto giusto per la performance per dollaro. Infine, nel regno flash, abbiamo gli SSD QLC. Questi offrono la massima capacità e valore per terabyte, ma in realtà preferiscono trovarsi in un ambiente ad alta intensità di lettura, ancora meglio se si trovano dietro una cache o un livello che aggrega le scritture e le consegna agli SSD QLC in modo gentile e amorevole. Da lì la piramide dello storage si trasforma in un pantano di dischi rigidi, unità nastro e permutazioni di storage cloud.
Prestazioni di archiviazione Intel in Windows Server
Per valutare le prestazioni di queste ultime tecnologie di storage Intel, volevamo una situazione con il minor sovraccarico possibile, trovando comunque un buon supporto per PMem in particolare e la nostra metodologia di test esistente. Il primo candidato è Microsoft Windows Server 2019. Stiamo testando su un server Intel OEM progettato per mostrare le tecnologie di piattaforma più recenti come Xeon di terza generazione, PMem 3 e il supporto per lo storage PCIe Gen200.
Specifiche del server Intel OEM
- 2 Intel Xeon Platinum 8380 a 2.3 GHz a 40 core
- 16 DDR32 da 4 GB a 3200 MHz
- 16 memorie persistenti Intel serie 128 da 200 GB
- SSD di avvio: Intel SATA da 1 TB
- Sistema operativo: Windows Server 2019
Analisi sintetica del carico di lavoro aziendale
Il nostro processo di benchmark dello storage condiviso aziendale precondiziona ciascun dispositivo in uno stato stazionario con lo stesso carico di lavoro con cui il dispositivo verrà testato con un carico pesante di 16 thread con una coda in sospeso di 16 per thread, quindi testato a intervalli prestabiliti in più thread/coda profili di profondità per mostrare le prestazioni in condizioni di utilizzo leggero e intenso. Poiché stiamo testando uno spazio di archiviazione ridotto pari al 20% su ciascun dispositivo, rappresentiamo solo graficamente le sezioni principali di ciascun test.
Prove di precondizionamento e di stato stazionario primario:
- Throughput (aggregato IOPS di lettura+scrittura)
- Latenza media (latenza di lettura+scrittura mediata insieme)
- Latenza massima (latenza di picco in lettura o scrittura)
- Deviazione standard della latenza (deviazione standard di lettura e scrittura mediata insieme)
La nostra analisi sintetica del carico di lavoro aziendale include quattro profili basati su attività del mondo reale, con un carico di lavoro 1T/1Q 4K per concentrarsi sulle prestazioni a basso carico. Questi profili sono stati sviluppati per facilitare il confronto con i nostri benchmark precedenti e con valori ampiamente pubblicati come la velocità massima di lettura e scrittura di 4K e 8K 70/30, comunemente utilizzata per le unità aziendali.
- 4K 1T/1Q
- 100% di lettura o 100% di scrittura
- 100%4K
- 4K 16T/16Q
- 100% di lettura o 100% di scrittura
- 100%4K
- 8K70/30
- 70% leggi, 30% scrivi
- 100%8K
- 8K (sequenziale)
- 100% di lettura o 100% di scrittura
- 100%8K
- 128K (sequenziale)
- 100% di lettura o 100% di scrittura
- 100%128K
Per i nostri test, abbiamo esaminato tre configurazioni di storage all'interno della piattaforma server Intel di terza generazione. Questi includevano quanto segue:
- 16 Intel Persistent Memory serie 128 da 200 GB in due spazi dei nomi (ciascuno con circa 1 TB di spazio di archiviazione)
- 2 SSD Intel P800X Optane da 5800 GB
- 8 SSD Intel P7.68 da 5510 TB
Ogni gruppo di dispositivi o spazio dei nomi è stato testato direttamente con un processo FIO, utilizzando un ingombro di capacità del dispositivo pari al 20% per misurare le prestazioni sostenute. A ciascun dispositivo per gruppo è stato assegnato il proprio lavoro e i risultati sono stati aggregati. Ad esempio, per due dispositivi testati, a ciascuno è stato assegnato un carico di lavoro 1T/1Q, quindi due thread su 1 coda in totale per quel carico di lavoro. Otto dispositivi equivarrebbero a otto thread totali in una coda e così via.
Nel nostro primo test, ci siamo concentrati su un carico di lavoro di lettura e scrittura casuale 4K con profondità di coda singola e thread singolo. Le prestazioni off-line sono importanti per molte applicazioni, poiché alcuni dispositivi non necessitano di una notevole profondità di coda di I/O per funzionare.
Intel PMem ha mostrato vantaggi significativi nelle prestazioni di lettura, misurando quasi il doppio rispetto ai doppi SSD Intel P5800X o agli otto SSD Intel P5510. Osservando le prestazioni di scrittura, PMem aveva ancora un vantaggio rispetto agli SSD P5800X, ma otto unità P5510 erano in grado di fornire un throughput più elevato.
Successivamente, esaminiamo l'impatto medio della latenza del nostro test di lettura e scrittura 1K 1T/4Q.
Intel PMem ha misurato 10 microsecondi di latenza in lettura casuale 4K, seguito dal P5800X con 24 microsecondi e dagli SSD P5510 con 81 microsecondi. Osservando la latenza di scrittura abbiamo visto 11 microsecondi dal PMem, 23 dagli SSD P5800x e 27 ms dagli SSD P5510.
Passando a una forma più pesante dello stesso test di lettura e scrittura 4K, esaminiamo dove ciascun tipo di dispositivo ha raggiunto il massimo.
Il gruppo di otto SSD Intel P5510 ha offerto il throughput di lettura più elevato misurando quasi 4.8 milioni di IOPS, seguito da PMem con 3.2 milioni di IOPS e dai doppi SSD P5800X con 1.7 milioni di IOPS. Nella scrittura casuale 4K i due SSD P5800X erano in testa con 1.91 milioni di IOPS, seguiti dagli otto SSD P5510 con 1.78 milioni di IOPS e dai due spazi dei nomi PMem con 1.35 milioni di IOPS.
Sebbene il throughput sia importante, uno degli aspetti più interessanti di Optane, sia come PMem che come SSD, è la capacità di gestire la latenza di archiviazione. Lo vediamo anche nel nostro carico di lavoro di lettura e scrittura casuale 4K più pesante.
Intel PMem ha avuto la latenza di lettura più bassa misurando 159 microsecondi, seguita dai due SSD P5800X con 296 microsecondi e dagli otto SSD P5510 sul retro con 427 microsecondi. La latenza di scrittura ha visto i due SSD P5800X in testa con 265 microsecondi, con PMem in coda con 377 microsecondi e gli otto SSD tradizionali P5510 con 1.147 ms.
Passando alla dimensione del blocco fino al nostro carico di lavoro 8K 70/30, esaminiamo i tre diversi tipi di storage e il modo in cui rispondono a un numero di thread e code in costante aumento.
In termini di prestazioni di picco, il gruppo di otto SSD Intel P5510 ha davvero allungato le gambe e ha offerto numeri di picco impressionanti. Nella parte superiore, ha raggiunto il massimo con 4.34 milioni di IOPS a 16T/16Q, anche se ciò che è interessante è vedere dove PMem e i due P5800X sono riusciti a saltare leggermente in avanti in alcuni dei thread inferiori e nei punti di coda.
Passando all'attenzione sulla latenza media vediamo un quadro diverso dipinto tra i diversi tipi di archiviazione. Intel PMem, pur non avendo il throughput più elevato, è riuscito a cavarsela con una latenza media tra le più basse in questo test, seguito da vicino dagli SSD P5800X. Gli otto SSD P5510 hanno un livello di latenza molto più elevato (relativamente) rispetto alle due tecnologie Optane, anche se offrono di gran lunga il throughput più elevato.
Successivamente passiamo ai nostri carichi di lavoro sequenziali iniziando prima con la dimensione di trasferimento di 8K.
Il gruppo di otto SSD Intel P5510 ha superato facilmente questo test con 4.45 milioni di IOPS, seguito da PMem con 1.92 milioni di IOPS, seguito dai due SSD P5800X con 1.71 milioni di IOPS. In scrittura, PMem è arrivato al primo posto con 1.75 milioni di IOPS, seguito dagli otto SSD P5510 con 1.55 milioni di IOPS seguiti dai due SSD P5800X con 1.18 milioni di IOPS.
Nel nostro ultimo test, esaminiamo la larghezza di banda di picco dei tre diversi supporti di memorizzazione. Con entrambi i tipi di dispositivi U.2, parte della fascia alta limitata deriva dal numero di corsie per ciascuna distribuzione.
Partendo dal vertice della larghezza di banda in lettura, gli otto P5510 sono arrivati con un impressionante 54 GB/s, seguiti da PMem con due namespace che offrono 44 GB/s e i due SSD P5800X in coda con 14 GB/s in lettura. È interessante vedere quanto alto può arrivare il PMem quando si tratta di larghezza di banda. Passando alla scrittura a blocchi di grandi dimensioni, gli otto SSD P5510 sono arrivati in cima con 32.7 GB/s, seguiti da PMem con 14.3 GB/s, e poi dai due SSD P5800X con 11.1 GB/s. Nel complesso numeri molto impressionanti su tutta la linea.
Conclusione
Intel ha lavorato duramente con Optane negli ultimi anni sia con la variante PMem che con quella SSD. È chiaro che questa tecnologia di storage è di fondamentale importanza per loro poiché intrecciano una storia completa della piattaforma Intel nel tentativo di respingere AMD nel data center. E per i carichi di lavoro mission-critical, i risultati lo confermano. Per quanto riguarda il tiering dello storage, il P5800X si colloca perfettamente in cima alla gerarchia dei dispositivi NVMe, riscontrando un gigantesco aumento delle prestazioni rispetto al modello della generazione precedente grazie in gran parte a PCIe Gen4. Questo incremento è così grande che inizia ad avvicinarsi al throughput, ma non alla larghezza di banda, offerto da PMem.
Durante i nostri test, abbiamo visto esattamente ciò che ci aspettavamo di vedere. PMem ha mostrato un eccezionale valore prestazionale in termini di latenza e throughput a basse profondità di coda. Offre inoltre enormi guadagni di larghezza di banda nelle prestazioni di lettura. L'SSD Optane P5800X, anche in implementazioni da due, inizia ad avvicinarsi molto al PMem su tutta la linea. Ciò consente al P5800X di rappresentare un fantastico abbinamento alle unità TLC o QLC in una soluzione che può sfruttarle come cache o livello.
Non importa dove guardiamo la piattaforma Intel Gen3 Xeon, c'è molto da amare quando si tratta di storage. I nostri risultati sono evidenziati dall’immensa larghezza di banda di lettura di PMem che supera i 44 GB/s di lettura e dalla latenza di 10 microsecondi nei carichi di lavoro di lettura e scrittura casuale 4K con profondità di coda bassa. Il P5800X offre vantaggi di latenza simili, con una portata più ampia nel più comune alloggiamento U.2, misurando circa il doppio della latenza di Intel PMem con un numero basso di code e thread. Anche gli SSD P5510 hanno mostrato la loro forza quando si è trattato di carichi di lavoro con code più elevate, offrendo numeri ai vertici delle classifiche nei benchmark IO sequenziali o casuali.
Il punto è che l’ultima serie di dispositivi di storage Intel, sia PMem che SSD, hanno fatto progressi sostanziali rispetto ai prodotti della generazione precedente. Ciò è particolarmente vero ora che Intel è in grado di fornire il BUS più veloce per DRAM e gli slot PCIe Gen4. Con questi dati bare metal, possiamo vedere i punti specifici in cui ciascuna tecnologia eccelle. Comprendere questi dati consentirà ai costruttori di sistemi di progettare in modo intelligente piattaforme in grado di far eccellere qualsiasi applicazione.
Interagisci con StorageReview
Newsletter | YouTube | LinkedIn | Instagram | Twitter | Facebook | TikTok | RSS feed