Gli SSD NVMe sono diventati i migliori su tutta la linea. Hanno iniziato facendo enormi passi avanti rispetto alle unità SAS e SATA, ma negli ultimi anni hanno lentamente ottenuto prestazioni leggermente superiori ad ogni iterazione. Esiste un limite superiore con PCIe 3.0 e le unità attuali lo stanno raggiungendo. Ma ora con le CPU AMD EPYC 7002 di seconda generazione, PCIe 4.0 è qui e KIOXIA lo sta sfruttando con gli SSD CM6.
Gli SSD NVMe sono diventati i migliori su tutta la linea. Hanno iniziato facendo enormi passi avanti rispetto alle unità SAS e SATA, ma negli ultimi anni hanno lentamente ottenuto prestazioni leggermente superiori ad ogni iterazione. Esiste un limite superiore con PCIe 3.0 e le unità attuali lo stanno raggiungendo. Ma ora con la seconda generazione CPU AMD EPYC 7002, PCIe 4.0 è qui e KIOXIA lo sta sfruttando con gli SSD CM6.
KIOXIA ha annunciato le nuove unità PCIe 4.0, CM6 e CD6, come demo all'ultimo Flash Memory Summit, in tempi ormai dimenticati degli eventi fisici. All'epoca, erano i primi SSD PCIe 4.0 e al momento in cui scrivo, la serie SSD CM6 potrebbe essere ancora uno dei pochi, se non altro, SSD PCIe 4.0 per le aziende. Il grosso problema con le nuove unità saranno le prestazioni più elevate: si stima che raggiungano 6.9 GB/s e 1.4 milioni di IOPS in lettura. Questi sono alcuni numeri teorici impressionanti. Le unità sono inoltre dotate di NVMe-MI in banda, registro eventi persistente e granularità dello spazio dei nomi.
KIOXIA CM6 è un fattore di forma U.3, conforme SFF-TA-1001 che ne consente l'utilizzo in backplane abilitati tri-mode. Il CM6 è disponibile in un'ampia gamma di capacità che vanno da 800 GB fino a 30.72 TB. Le unità sono disponibili in versione ad alta intensità di lettura (CM6-R) e per uso misto (CM6-V) a seconda delle esigenze degli utenti. Oltre ai modelli specifici per casi d'uso, esistono diverse versioni sicure tra cui Sanitize Instat Erase (SIE), un'unità con crittografia automatica (SED) e un modello FIPS 140-2 (livello 2). L'unità è dotata di doppia porta per garantire anche un'elevata disponibilità.
Per questa recensione stiamo esaminando un KIOXIA CM6-V con 6.4 TB di capacità.
Specifiche KIOXIA CM6 PCIe 4.0
Modello | CM6-R (lettura intensiva) | CM6-V (uso misto) |
Fattore di forma | Altezza Z da 2.5 pollici e 15 mm | |
Capacità1 | 960 GB, 1.92 TB, 3.84 TB, 7.68 TB, 15.36 TB, 30.72 TB | 800 GB, 1.6 TB, 3.2 TB, 6.4 TB, 12.8 TB |
Interfaccia | PCIe Gen3/4, 1×4 e 2×2 | |
Conformità | PCIe 4.0 e NVMe 1.4 | |
Tipo NAND | KIOXIA BiCS FLASH TLC 96D a 3 strati | |
Lettura sequenziale | Gen3 = fino a 3,500 MB/s Gen4 = fino a 6,900 MB/s |
Gen3 = fino a 3,500 MB/s Gen4 = fino a 6,900 MB/s |
Scrittura sequenziale | Gen3 = fino a 3,100 MB/s Gen4 = fino a 4,200 MB/s |
Gen3 = fino a 3,100 MB/s Gen4 = fino a 4,200 MB/s |
Lettura casuale | Gen3 = fino a 800 IOPS Gen4 = fino a 1.4 milioni di IOPS |
Gen3 = fino a 800 IOPS Gen4 = fino a 1.4 milioni di IOPS |
Scrittura casuale | Gen3 = fino a 155 IOPS Gen4 = fino a 170 IOPS |
Gen3 = fino a 290 IOPS Gen4 = fino a 350 IOPS |
Consumo di energia | Attivo: 20 W; Inattivo: <5 W | |
Resistenza | 1 DWPD per 5 anni | 3 DWPD per 5 anni |
BER non correggibile | 1 settore per 10^17 bit letti | |
MTTF/AFR | 2.5 milioni di ore / 0.35% | |
Temperatura di esercizio | Da 0 a 70 ° C |
Performance
Banco di prova
Le nostre nuove recensioni sugli SSD PCIe Gen4 Enterprise sfruttano a Lenovo Think System SR635 per test applicativi e benchmark sintetici. ThinkSystem SR635 è una piattaforma AMD a CPU singola ben equipaggiata, che offre una potenza della CPU ben superiore a quella necessaria per stressare l'archiviazione locale ad alte prestazioni. È anche l'unica piattaforma nel nostro laboratorio (e una delle poche attualmente sul mercato) con alloggiamenti PCIe Gen4 U.2. I test sintetici non richiedono molte risorse della CPU ma sfruttano comunque la stessa piattaforma Lenovo. In entrambi i casi, l'intento è quello di mostrare lo storage locale nella migliore luce possibile in linea con le specifiche massime dell'unità di storage del fornitore.
Piattaforma sintetica e applicativa PCIe Gen4 (Lenovo ThinkSystem SR635)
- 1 AMD 7452 (2.35 GHz x 32 core)
- 8 DRAM ECC DDR64-4MHz da 3200 GB
- CentOS 7.7 1908
- ESXi6.7u3
Piattaforma applicativa PCIe Gen3 (Lenovo Think System SR850)
- 4 CPU Intel Platinum 8160 (2.1 GHz x 24 core)
- 16 DRAM ECC DDR32-4Mhz da 2666 GB
- 2 schede RAID RAID 930-8i 12Gb/s
- 8 alloggiamenti NVMe
- VMware ESXI 6.7u3
Piattaforma sintetica PCIe Gen3 (Dell PowerEdge R740xd)
- 2 CPU Intel Gold 6130 (2.1 GHz x 16 core)
- 4 DRAM ECC DDR16-4MHz da 2666 GB
- 1x scheda RAID PERC 730 da 2 GB 12 Gb/s
- Adattatore NVMe aggiuntivo
- Ubuntu-16.04.3-desktop-amd64
Essendo la prima serie di recensioni su una nuova piattaforma, abbiamo incluso i risultati delle unità passate, che sono confronti vicini ma non al 100% tra mele poiché erano testati su una piattaforma precedente. Le nostre differenze nei test sintetici non avranno grandi distorsioni nei risultati, ma i carichi di lavoro delle applicazioni che lavorano sulla piattaforma AMD con CPU singola rispetto alla piattaforma Intel con CPU quadrupla potrebbero in una certa misura. Nei nostri test MySQL uno dei nuovi prodotti Gen4 KIOXIA ha preso il comando, ma la latenza del server SQL è stata nella media. Con solo due unità Gen4 che siamo stati in grado di pubblicare in giro non disponiamo di una quantità significativa di dati comparabili, ma è qualcosa da prendere in considerazione quando si visualizzano questi risultati. Abbiamo anche intensificato i nostri test sintetici per sfruttare gli SSD più veloci, mostrando ora i risultati dei test con conteggi di thread di picco più elevati.
Test di background e comparabili
Le Laboratorio di test aziendale di StorageReview fornisce un'architettura flessibile per condurre benchmark dei dispositivi di storage aziendali in un ambiente paragonabile a quello che gli amministratori incontrano nelle distribuzioni reali. L'Enterprise Test Lab incorpora una varietà di server, reti, condizionatori di alimentazione e altre infrastrutture di rete che consentono al nostro personale di stabilire condizioni reali per valutare con precisione le prestazioni durante le nostre revisioni.
Incorporiamo questi dettagli sull'ambiente e sui protocolli del laboratorio nelle revisioni in modo che i professionisti IT e i responsabili dell'acquisizione dello spazio di archiviazione possano comprendere le condizioni in cui abbiamo ottenuto i seguenti risultati. Nessuna delle nostre revisioni è pagata o supervisionata dal produttore delle apparecchiature che stiamo testando. Ulteriori dettagli su Laboratorio di test aziendale di StorageReview e una panoramica delle sue capacità di rete sono disponibili nelle rispettive pagine.
Analisi del carico di lavoro dell'applicazione
Per comprendere le caratteristiche prestazionali dei dispositivi di storage aziendali, è essenziale modellare l'infrastruttura e i carichi di lavoro applicativi presenti negli ambienti di produzione live. I nostri parametri di riferimento per il KIOXIA CM6 sono quindi i Prestazioni MySQL OLTP tramite SysBench che a Prestazioni OLTP di Microsoft SQL Server con un carico di lavoro TCP-C simulato. Per i nostri carichi di lavoro applicativi, ciascuna unità eseguirà 4 VM configurate in modo identico.
Prestazioni dell'SQL Server
Ogni VM SQL Server è configurata con due vDisk: volume da 100 GB per l'avvio e volume da 500 GB per il database e i file di log. Dal punto di vista delle risorse di sistema, abbiamo configurato ciascuna VM con 8 vCPU, 64 GB di DRAM e abbiamo sfruttato il controller SCSI SAS LSI Logic. Sebbene i nostri carichi di lavoro Sysbench testati in precedenza saturassero la piattaforma sia in termini di I/O di storage che di capacità, il test SQL cerca prestazioni di latenza.
Questo test utilizza SQL Server 2014 in esecuzione su VM guest Windows Server 2012 R2 ed è sottoposto a stress da Benchmark Factory for Databases di Quest. StorageReview Protocollo di test OLTP di Microsoft SQL Server utilizza l'attuale bozza del Benchmark C (TPC-C) del Transaction Processing Performance Council, un benchmark di elaborazione delle transazioni online che simula le attività presenti in ambienti applicativi complessi. Il benchmark TPC-C si avvicina di più rispetto ai benchmark sintetici delle prestazioni per valutare i punti di forza e i colli di bottiglia delle prestazioni dell'infrastruttura di storage negli ambienti di database. Ogni istanza della nostra VM SQL Server per questa recensione utilizza un database SQL Server da 333 GB (scala 1,500) e misura le prestazioni transazionali e la latenza con un carico di 15,000 utenti virtuali.
Configurazione di test di SQL Server (per VM)
- Di Windows Server 2012 R2
- Impronta di archiviazione: 600 GB allocati, 500 GB utilizzati
- SQL Server 2014
-
- Dimensioni del database: scala 1,500
- Carico del client virtuale: 15,000
- Memoria RAM: 48 GB
- Durata della prova: 3 ore
-
- 2.5 ore di precondizionamento
- Periodo di campionamento di 30 minuti
Per il nostro benchmark transazionale di SQL Server, KIOXIA CM6 si è piazzato al quarto posto assoluto con 12,633.6 TPS, anche se era solo 10.6 TPS sotto il migliore.
Con la latenza media di SQL Server, il CM6 ha avuto una latenza media di 5.5 ms, la stessa del cugino CD6 SSD.
Prestazioni del Sysbench
Il prossimo benchmark dell'applicazione è costituito da a Database Percona MySQL OLTP misurato tramite SysBench. Questo test misura il TPS medio (transazioni al secondo), la latenza media e anche la latenza media del 99° percentile.
Ogni banco di sistema La VM è configurata con tre vDisk: uno per l'avvio (~92 GB), uno con il database predefinito (~447 GB) e il terzo per il database in fase di test (270 GB). Dal punto di vista delle risorse di sistema, abbiamo configurato ciascuna VM con 8 vCPU, 60 GB di DRAM e sfruttato il controller SCSI SAS LSI Logic.
Configurazione test Sysbench (per VM)
- CentOS 6.3 a 64 bit
- Percona XtraDB 5.5.30-rel30.1
-
- Tabelle del database: 100
- Dimensione del database: 10,000,000
- Discussioni del database: 32
- Memoria RAM: 24 GB
- Durata della prova: 3 ore
-
- 2 ore di precondizionamento di 32 thread
- 1 ora 32 thread
Osservando il nostro benchmark transazionale Sysbench, il KIOXIA CM6 ha registrato 8,632 TPS, classificandosi nuovamente al quarto posto nel nostro gruppo comparabile.
Con la latenza media Sysbench il CM6 è arrivato quarto ancora una volta con 14.82ms.
Per quanto riguarda la latenza del nostro scenario peggiore (99° percentile), il CM6 è rimasto dove è comodo, al quarto posto, con 29.86 ms.
Analisi del carico di lavoro VDBench
Quando si tratta di confrontare i dispositivi di archiviazione, il test delle applicazioni è la soluzione migliore e il test sintetico viene al secondo posto. Pur non essendo una rappresentazione perfetta dei carichi di lavoro effettivi, i test sintetici aiutano a definire i dispositivi di storage con un fattore di ripetibilità che semplifica il confronto tra soluzioni concorrenti. Questi carichi di lavoro offrono una gamma di profili di test diversi che vanno dai test dei "quattro angoli", ai test comuni sulle dimensioni di trasferimento del database, alle acquisizioni di traccia da diversi ambienti VDI. Tutti questi test sfruttano il comune generatore di carichi di lavoro vdBench, con un motore di scripting per automatizzare e acquisire risultati su un ampio cluster di test di calcolo. Ciò ci consente di ripetere gli stessi carichi di lavoro su un'ampia gamma di dispositivi di storage, inclusi array flash e singoli dispositivi di storage. Il nostro processo di test per questi benchmark riempie l'intera superficie dell'unità con i dati, quindi partiziona una sezione dell'unità pari al 25% della capacità dell'unità per simulare il modo in cui l'unità potrebbe rispondere ai carichi di lavoro delle applicazioni. Questo è diverso dai test entropici completi che utilizzano il 100% dell'unità e li portano in uno stato stazionario. Di conseguenza, queste cifre rifletteranno velocità di scrittura più sostenute.
Profili:
- Lettura casuale 4K: 100% di lettura, 128 thread, 0-120% irate
- Scrittura casuale 4K: scrittura al 100%, 128 thread, 0-120% irate
- Lettura casuale 4K (carico elevato): lettura al 100%, 512 thread, 0-120% irate
- Scrittura casuale 4K (carico elevato): scrittura al 100%, 512 thread, 0-120% irate
- Lettura sequenziale 64K: lettura al 100%, 32 thread, 0-120% irate
- Scrittura sequenziale 64K: scrittura al 100%, 16 thread, 0-120% irate
- Lettura sequenziale 64K (carico elevato): lettura al 100%, 64 thread, 0-120% irate
- Scrittura sequenziale 64K (carico elevato): scrittura al 100%, 64 thread, 0-120% irate
- Database sintetici: SQL e Oracle
- Clonazione completa VDI e tracce di clonazione collegata
Comparabili:
Nella nostra prima analisi del carico di lavoro VDBench, lettura casuale 4K, il KIOXIA CM6 si è rivelato con prestazioni impressionanti con un picco di 846,288 IOPS con una latenza di 150 µs. Ciò pone l'unità al primo posto.
Le nuove unità PCIe 4.0 possono sopportare un carico maggiore e saremmo negligenti se non li spingessimo un po' di più per vedere cosa possono fare. Quindi, con un carico elevato di lettura casuale 4K, il CM6 è stato in grado di raggiungere il picco di 1,507,564 IOPS con una latenza di 337.9 µs. Molto meglio della sua controparte CD6.
Per la scrittura Random 4K, si è classificato terzo assoluto. Ha funzionato con una latenza inferiore a 100 µs fino a circa 490 IOPS e ha raggiunto il picco a 548,169 IOPS con una latenza di 226.4 µs.
Un carico elevato di scrittura casuale 4K ha visto il CM6 raggiungere il picco di 549,103 IOPS con una latenza di 922μs dietro al CD6 questa volta.
Passando ai carichi di lavoro sequenziali, il CM6 ha avuto la possibilità di brillare ancora una volta conquistando il primo posto nella lettura a 64K con un punteggio di picco di 97,779 IOPS o 6.11 GB/s con una latenza di soli 325 µs.
La lettura sequenziale a 64K ad alto carico è simile al posizionamento nella lettura 4K con il CM6 che raggiunge un picco di 101,018 IOPS o 6.3 GB/s con una latenza di 629 µs.
La scrittura a 64K ha mostrato il CM6 con un forte punteggio di picco anche se le prestazioni sono diminuite dopo il picco, arrivando al terzo posto. Le prestazioni massime sono state di circa 49 IOPS o 3.1 GB/s con una latenza di circa 50 µs.
La scrittura sequenziale a 64K con carico elevato ha visto il CM6 avere un picco più elevato ma successivamente un calo delle prestazioni. Il CM6 ha raggiunto il picco di circa 49 IOP o 3.1 GB/s con una latenza così bassa che riusciamo a malapena a vederla prima di scendere.
La prossima serie di test riguarda i carichi di lavoro SQL: SQL, SQL 90-10 e SQL 80-20. Partendo da SQL, il KIOXIA CM6 si è classificato al secondo posto assoluto con un picco di 266,458 IOPS con una latenza di 119μs.
Per SQL 90-10 il CM6 è arrivato secondo ancora una volta con una prestazione di picco di 265,276 IOPS con una latenza di 119.2μs.
SQL 80-20 ha dato al CM6 la possibilità di mettersi in mostra arrivando primo con una prestazione di picco di 263,819 IOPS 119.4μs.
Successivamente ci sono i nostri carichi di lavoro Oracle: Oracle, Oracle 90-10 e Oracle 80-20. A partire da Oracle, il CM6 è arrivato primo ancora una volta con una prestazione massima di 271,230 IOPS con una latenza di 128.6μs.
Oracle 90-10 si è classificato secondo al CM6 con una prestazione massima di 202,341 IOPS con una latenza di soli 107.4 µs.
Il CM6 passa accanto alla concorrenza e conquista ancora una volta il primo posto nell'Oracle 80-20 con un picco di 206,733 IOPS con una bassa latenza di 104.7μs.
Successivamente, siamo passati al nostro test clone VDI, Completo e Collegato. Per l'avvio VDI Full Clone (FC), il CM6 ha preso il primo posto con 223,668 IOPS e una latenza di 153.5μs.
Per l'accesso iniziale VDI FC il CM6 è scivolato al terzo posto con una prestazione di picco di 154,836 IOPS con una latenza di 189μs.
Il nostro benchmark VDI FC Monday Login ha visto il CM6 rimanere al terzo posto con un picco di 98,867 IOPS con una latenza di 158.4μs.
Per l'avvio VDI Linked Clone (LC), KIOXIA CM6 è tornato al primo posto con un punteggio di picco di 115,058 IOPS con una latenza di 137.7 µs.
L'accesso iniziale VDI LC è un po' difficile da leggere nel grafico, ma il CM6 si è piazzato al centro del gruppo con un picco di 38,848 IOPS con una latenza di 202.4μs prima di scendere un po'.
Infine, VDI LC Monday Login ha fatto registrare ancora una volta le prestazioni migliori del CM6 con un punteggio di picco di 96,008 IOPS e una latenza di 162.5 µs.
Conclusione
Il KIOXIA CM6 è stato uno dei primi SSD PCIe 4.0, se non il primo, per l'azienda. Le nuove unità promettono prestazioni più elevate, in questo caso fino a 6.9 GB/s e fino a 1.4 milioni di IOPS. Il CM6 è dotato di doppia porta, che aggiunge un livello di elevata disponibilità all'unità. L'unità è disponibile in un'ampia gamma di capacità da 800 GB fino a ben 30.72 TB con 9 opzioni di capacità intermedie. Il CM6 ha sia un modello ad alta intensità di lettura che un modello ad uso misto con 1 e 3 DWPD rispettivamente. E l'SSD viene fornito con una varietà di opzioni di modelli sicuri.
Per quanto riguarda le prestazioni, abbiamo eseguito la nostra solita raffica di analisi del carico di lavoro delle applicazioni e VDBench con poche eccezioni. Abbiamo dovuto saltare il test Houdini poiché la piattaforma di test è Intel e le unità KIOXIA sarebbero ostacolate dalle porte Gen3. Su VDBench abbiamo aggiunto un test di carico più elevato per stressare un po' di più le nuove unità poiché sono progettate per gestirlo.
Nella nostra analisi del carico di lavoro delle applicazioni, abbiamo eseguito SQL Server e Sysbench. Con SQL Server il CM6 è arrivato quarto sia in termini di TPS che di latenza media con 12,633.6 TPS e 5.5 ms, un punteggio comunque molto buono. Con Sysbench il disco si è piazzato nuovamente al quarto posto su tutta la linea con 8,632 TPS, 14.82 ms di latenza media e 29.86 ms nel nostro scenario peggiore.
In VDBench il drive ha davvero brillato. Il CM6 è stato il migliore in molti dei nostri benchmark. Le caratteristiche principali includono 846 IOPS in lettura 4K, 1.5 milioni di IOPS in lettura 4K con carico elevato, 548 IOPS in scrittura 4K, 549 IOPS in scrittura 4K con carico elevato, 6.1 GB/s in lettura 64K, 6.3 GB/s in lettura 64K con carico elevato. e 3.1 GB/s sia in scrittura a 64K che in scrittura a 64K con carico elevato. SQL ha registrato picchi di 266 IOPS, 265 IOPS in SQL 90-10 e 264 IOPS in SQL 80-20. Oracle ci ha fornito picchi di 271 IOPS, 202 IOPS in Oracle 90-10 e 207 IOPS in Oracle 80-20. VDI FC ci ha fornito 224 IOPS di avvio, 155 IOPS per l'accesso iniziale e 99 IOPS nell'accesso del lunedì. VDI LC ha registrato 115 IOPS di avvio, 39 IOPS di accesso iniziale e 96 IOPS di accesso del lunedì.
Questa recensione e quella del CD6 danno uno sguardo specifico al PCIe 4.0 e al futuro dei dispositivi di archiviazione man mano che altri entrano nel mercato. Non sono molti i fornitori di server che producono supporto front-to-back per PCIe 4.0 e Lenovo è l'unico nel nostro laboratorio al momento della stesura di questo articolo. Lenovo ha colto rapidamente tutti i vantaggi offerti dai processori AMD EPYC 2 di seconda generazione, anticipando prodotti di storage come KIOXIA CM7002. Ma per KIOXIA questo li mette nella posizione interessante di essere davanti agli altri, ma il pieno potenziale della loro unità può essere raggiunto solo con server più recenti basati su AMD (fino a quando anche Intel non decide di entrare nel gioco). Per ora, il CM6 continuerà a funzionare con apparecchiature legacy e sarà pronto a fornire maggiori prestazioni man mano che le aziende si aggiornano.
Interagisci con StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS feed