Memblaze ha rilasciato una serie di SSD NAND NVMe 64D a 3 strati nella serie PBlaze5 910-916. Le unità sono state rilasciate in entrambi i fattori di forma U.2 e AIC con il 910 che arriva fino a 15.36 TB di capacità. La versione con maggiore resistenza dell'unità è la 916. Abbiamo già esaminato la SSD 916U.2 e ora si stanno concentrando sulla versione AIC HHHL con prestazioni più elevate.
Memblaze ha rilasciato una serie di SSD NAND NVMe 64D a 3 strati nella serie PBlaze5 910-916. Le unità sono state rilasciate in entrambi i fattori di forma U.2 e AIC con il 910 che arriva fino a 15.36 TB di capacità. La versione con maggiore resistenza dell'unità è la 916. Abbiamo già esaminato la SSD 916U.2 e ora si stanno concentrando sulla versione AIC HHHL con prestazioni più elevate.
L'SSD Memblaze PBlaze5 916 AIC è dotato di tutti i vantaggi della versione U.2, tra cui la crittografia dei dati AES 256, la protezione completa del percorso dei dati e la protezione avanzata in caso di interruzione dell'alimentazione. Le versioni 916 hanno anche una resistenza maggiore, supportando 3 DWPD rispetto al 910 che supporta solo 1 DWPD. Il 916 AIC sfrutta le quattro corsie aggiuntive per spingere ancora più prestazioni con velocità indicate fino a 5.9 GB/s in lettura e 2.8 GB/s in scrittura con un throughput fino a 1 milione di IOPS in lettura e 303 IOPS in scrittura.
L'SSD Memblaze PBlaze5 916 AIC è disponibile sia da 3.2 TB che da 6.4 TB, per questa recensione stiamo esaminando la versione da 6.4 TB.
Specifiche AIC Memblaze PBlaze5 serie 916
Capacità utente (TB) | 3.2, 6.4 |
Fattore di forma | HHHL AIC |
Interfaccia: | PCIe 3.0 x 8 |
Lettura sequenziale (128KB)(GB/s) | 5.5, 5.9 |
Scrittura sequenziale (128KB)(GB/s) | 3.1, 3.8 |
IOPS di lettura casuale sostenuta (4KB). | 850K, 1,000K |
Scrittura casuale sostenuta (4KB) IOPS (stato stazionario) | 210K, 303K |
Latenza di lettura/scrittura | 87/11 µs |
Resistenza a vita | 3 DWPD |
UBER | <10-17 |
MTBF | 2 milioni di ore |
Protocollo | NVMe 1.2a |
Memoria Flash NAND | NAND 3D eTLC |
Sistema Operativo | RHEL, SLES, CentOS, Ubuntu, Windows Server, VMware ESXi |
Consumo di energia | 7 ~ 25 W. |
Supporto delle funzionalità di base | Protezione in caso di interruzione dell'alimentazione, hot plug, protezione completa del percorso dati, S.M.A.R.T: TRIM, multi-spazio dei nomi, crittografia dati AES 256, riavvio rapido, cancellazione crittografia, |
Supporto di funzionalità avanzate | TRIM, spazio dei nomi multiplo, crittografia dati AES 256, riavvio rapido, cancellazione crittografia, doppia porta |
Supporto software | Strumento di gestione open source, strumento di debug CLI, driver incluso nel sistema operativo (Facile integrazione del sistema) |
Performance
Banco di prova
Le nostre recensioni sugli SSD aziendali sfruttano un Lenovo ThinkSystem SR850 per i test delle applicazioni e a Dell PowerEdge R740xd per benchmark sintetici. Il ThinkSystem SR850 è una piattaforma quad-CPU ben equipaggiata, che offre una potenza della CPU ben superiore a quella necessaria per stressare l'archiviazione locale ad alte prestazioni. I test sintetici che non richiedono molte risorse della CPU utilizzano il più tradizionale server a doppio processore. In entrambi i casi, l'intento è quello di mostrare lo storage locale nella migliore luce possibile in linea con le specifiche massime dell'unità di storage del fornitore.
Lenovo Think System SR850
- 4 CPU Intel Platinum 8160 (2.1 GHz x 24 core)
- 16 DRAM ECC DDR32-4Mhz da 2666 GB
- 2 schede RAID RAID 930-8i 12Gb/s
- 8 alloggiamenti NVMe
- VMware ESXI 6.5
Dell PowerEdge R740xd
- 2 CPU Intel Gold 6130 (2.1 GHz x 16 core)
- 4 DRAM ECC DDR16-4MHz da 2666 GB
- 1x scheda RAID PERC 730 da 2 GB 12 Gb/s
- Adattatore NVMe aggiuntivo
- Ubuntu-16.04.3-desktop-amd64
Test di background e comparabili
Le Laboratorio di test aziendale di StorageReview fornisce un'architettura flessibile per condurre benchmark dei dispositivi di storage aziendali in un ambiente paragonabile a quello che gli amministratori incontrano nelle distribuzioni reali. L'Enterprise Test Lab incorpora una varietà di server, reti, condizionatori di alimentazione e altre infrastrutture di rete che consentono al nostro personale di stabilire condizioni reali per valutare con precisione le prestazioni durante le nostre revisioni.
Incorporiamo questi dettagli sull'ambiente e sui protocolli del laboratorio nelle revisioni in modo che i professionisti IT e i responsabili dell'acquisizione dello spazio di archiviazione possano comprendere le condizioni in cui abbiamo ottenuto i seguenti risultati. Nessuna delle nostre revisioni è pagata o supervisionata dal produttore delle apparecchiature che stiamo testando. Ulteriori dettagli su Laboratorio di test aziendale di StorageReview che a una panoramica delle sue capacità di rete sono disponibili nelle rispettive pagine.
Paragonabili per questa recensione:
- Memblaze PBlaze5 3.2 TB
- Elemento liquido AIC 7.68 TB
- SSD Intel DC P4610 1.6 TB
- Huawei ES3000 V5 3.2 TB
- SSD Intel DC P4510 2 TB, 8 TB
- Memblaze PBlaze5 910 AIC 7.68 TB
Analisi del carico di lavoro dell'applicazione
Per comprendere le caratteristiche prestazionali dei dispositivi di storage aziendali, è essenziale modellare l'infrastruttura e i carichi di lavoro applicativi presenti negli ambienti di produzione live. I nostri parametri di riferimento per il Memblaze PBlaze5 916 sono quindi i Prestazioni MySQL OLTP tramite SysBench che a Prestazioni OLTP di Microsoft SQL Server con un carico di lavoro TCP-C simulato. Per i nostri carichi di lavoro applicativi, ogni unità eseguirà 2-4 VM configurate in modo identico.
Prestazioni dell'SQL Server
Ogni VM SQL Server è configurata con due dischi virtuali: un volume da 100 GB per l'avvio e un volume da 500 GB per il database e i file di log. Dal punto di vista delle risorse di sistema, abbiamo configurato ciascuna VM con 16 vCPU, 64 GB di DRAM e abbiamo sfruttato il controller SCSI SAS LSI Logic. Sebbene i nostri carichi di lavoro Sysbench testati in precedenza saturassero la piattaforma sia in termini di I/O di storage che di capacità, il test SQL cerca prestazioni di latenza.
Questo test utilizza SQL Server 2014 in esecuzione su VM guest Windows Server 2012 R2 ed è sottoposto a stress da Benchmark Factory for Databases di Quest. StorageReview Protocollo di test OLTP di Microsoft SQL Server utilizza l'attuale bozza del Benchmark C (TPC-C) del Transaction Processing Performance Council, un benchmark di elaborazione delle transazioni online che simula le attività presenti in ambienti applicativi complessi. Il benchmark TPC-C si avvicina di più rispetto ai benchmark sintetici delle prestazioni per valutare i punti di forza e i colli di bottiglia delle prestazioni dell'infrastruttura di storage negli ambienti di database. Ogni istanza della nostra VM SQL Server per questa recensione utilizza un database SQL Server da 333 GB (scala 1,500) e misura le prestazioni transazionali e la latenza con un carico di 15,000 utenti virtuali.
Configurazione di test di SQL Server (per VM)
- Di Windows Server 2012 R2
- Impronta di archiviazione: 600 GB allocati, 500 GB utilizzati
- SQL Server 2014
- Dimensioni del database: scala 1,500
- Carico del client virtuale: 15,000
- Memoria RAM: 48 GB
- Durata della prova: 3 ore
- 2.5 ore di precondizionamento
- Periodo di campionamento di 30 minuti
Per il nostro benchmark transazionale di SQL Server, il Memblaze PBlaze5 916 AIC si è trovato al terzo posto con 12,645.0 TPS anche se era a soli 1.1 TPS dal primo posto.
Per comprendere meglio le prestazioni, è necessario esaminare anche la latenza. Qui il 916 AIC è arrivato secondo con soli 1.3 ms, battendo il resto della serie 910/916.
Prestazioni del Sysbench
Il prossimo benchmark dell'applicazione è costituito da a Database Percona MySQL OLTP misurato tramite SysBench. Questo test misura il TPS medio (transazioni al secondo), la latenza media e anche la latenza media del 99° percentile.
Ogni banco di sistema La VM è configurata con tre vDisk: uno per l'avvio (~92 GB), uno con il database predefinito (~447 GB) e il terzo per il database in fase di test (270 GB). Dal punto di vista delle risorse di sistema, abbiamo configurato ciascuna VM con 16 vCPU, 60 GB di DRAM e abbiamo sfruttato il controller SCSI SAS LSI Logic.
Configurazione test Sysbench (per VM)
- CentOS 6.3 a 64 bit
- Percona XtraDB 5.5.30-rel30.1
- Tabelle del database: 100
- Dimensione del database: 10,000,000
- Discussioni del database: 32
- Memoria RAM: 24 GB
- Durata della prova: 3 ore
- 2 ore di precondizionamento di 32 thread
- 1 ora 32 thread
Con il benchmark transazionale Sysbench, il 916 AIC è arrivato secondo con 9,298 TPS.
Per la latenza media Sysbench l'AIC 916 è rimasto al secondo posto con 13.8 ms.
Per quanto riguarda la latenza del nostro scenario peggiore (99° percentile), l'AIC 916 ha preso il primo posto con solo 25.2 ms di latenza.
Houdini di SideFX
Il test Houdini è specificamente progettato per valutare le prestazioni di archiviazione in relazione al rendering CGI. Il banco di prova per questa applicazione è una variante del core Dell PowerEdge R740xd tipo di server che utilizziamo in laboratorio con doppie CPU Intel 6130 e DRAM da 64 GB. In questo caso, abbiamo installato Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) con bare metal. L'output del benchmark viene misurato in secondi per il completamento, dove meno significa meglio.
La demo di Maelstrom rappresenta una sezione della pipeline di rendering che evidenzia le capacità prestazionali dello storage dimostrando la sua capacità di utilizzare in modo efficace il file di scambio come una forma di memoria estesa. Il test non scrive i dati dei risultati né elabora i punti per isolare l'effetto wall-time dell'impatto della latenza sul componente di storage sottostante. Il test stesso è composto da cinque fasi, tre delle quali vengono eseguite come parte del benchmark, che sono le seguenti:
- Carica i punti compressi dal disco. Questo è il momento di leggere dal disco. Si tratta di un thread singolo, che può limitare la velocità effettiva complessiva.
- Decomprime i punti in un unico array piatto per consentirne l'elaborazione. Se i punti non dipendono da altri punti, il working set potrebbe essere modificato per rimanere nel nucleo. Questo passaggio è multi-thread.
- (Non eseguito) Elabora i punti.
- Li reimpacchetta in blocchi con bucket adatti per essere archiviati nuovamente su disco. Questo passaggio è multi-thread.
- (Non eseguito) Scrive nuovamente i blocchi inseriti in bucket su disco.
Con il test Houdini, il 916 AIC ha ottenuto un punteggio di 3,070.7 secondi atterrando nel punto morto delle unità non Optane e proprio contro il 910 AIC.
Analisi del carico di lavoro VDBench
Quando si tratta di confrontare i dispositivi di archiviazione, il test delle applicazioni è la soluzione migliore e il test sintetico viene al secondo posto. Pur non essendo una rappresentazione perfetta dei carichi di lavoro effettivi, i test sintetici aiutano a definire i dispositivi di storage con un fattore di ripetibilità che semplifica il confronto tra soluzioni concorrenti. Questi carichi di lavoro offrono una gamma di profili di test diversi che vanno dai test "quattro angoli", test comuni sulle dimensioni di trasferimento del database, alle acquisizioni di traccia da diversi ambienti VDI. Tutti questi test sfruttano il comune generatore di carichi di lavoro vdBench, con un motore di scripting per automatizzare e acquisire risultati su un ampio cluster di test di calcolo. Ciò ci consente di ripetere gli stessi carichi di lavoro su un'ampia gamma di dispositivi di storage, inclusi array flash e singoli dispositivi di storage. Il nostro processo di test per questi benchmark riempie l'intera superficie dell'unità con i dati, quindi partiziona una sezione dell'unità pari al 25% della capacità dell'unità per simulare il modo in cui l'unità potrebbe rispondere ai carichi di lavoro delle applicazioni. Questo è diverso dai test entropici completi che utilizzano il 100% dell'unità e li portano in uno stato stazionario. Di conseguenza, queste cifre rifletteranno velocità di scrittura più sostenute.
Profili:
- Lettura casuale 4K: 100% di lettura, 128 thread, 0-120% irate
- Scrittura casuale 4K: scrittura al 100%, 64 thread, 0-120% irate
- Lettura sequenziale 64K: lettura al 100%, 16 thread, 0-120% irate
- Scrittura sequenziale 64K: scrittura al 100%, 8 thread, 0-120% irate
- Database sintetici: SQL e Oracle
- Clonazione completa VDI e tracce di clonazione collegata
Nella nostra prima analisi del carico di lavoro VDBench, lettura casuale 4K, il Memblaze PBlaze5 916 AIC è stato confrontato con altre due unità AIC: il Memblaze PBlaze5 910 e il Liqid Element. Qui la 916 ha corso testa a testa cadendo appena dietro la 910, con il Liqid in testa. Il 916 è iniziato a 81,010 IOPS con 99μs e ha raggiunto il picco a 809,069 IOPS con una latenza di 157μs.
La scrittura casuale 4K ha mostrato lo stesso posizionamento per il 916, ultimo. Qui il 916 è partito da 64,157 IOPS con soli 17.7μs. L'unità è riuscita a rimanere sotto i 100μs, in realtà 25μs, fino a circa 578 IOPS dove ha raggiunto il picco prima di spegnersi.
Passando ai carichi di lavoro sequenziali, esaminiamo prima le letture sequenziali da 64K. Anche in questo caso il 916 è arrivato in fondo alla classifica, subito dopo il 910. Il 916 ha raggiunto il picco di 50,011 IOPS o 3.13 GB/s con una latenza di 319 μs.
La scrittura a 64K ha visto il 916 scivolare al secondo posto appena dietro al 910. Qui il 916 ha iniziato a 4,308 IOPS o 256 MB/s e ha cavalcato la linea di latenza di 50μs fino a 30K IOPS o 1.85 GB/s prima di raggiungere il picco a 42,319 IOPS o 2.65 GB/s con latenza di 370μs.
Il prossimo passo sono i nostri carichi di lavoro SQL, anche in questo caso il 916 era in fondo ma solo leggermente piegato dal 916. Il 916 è iniziato con 27,120 IOPS con una latenza di 100.9 μs e ha raggiunto il picco a 269,845 IOPS con una latenza di 118.1 μs. Solo una differenza di latenza di 18μs dall'inizio alla fine.
Per SQL 90-10 il 916 era al terzo posto con 27,381 IOPS e una latenza di 97.7μs. Il 916 ha superato i 100μs a circa 82 IOPS e ha raggiunto il picco a 273,081 IOPS con una latenza di 116.3μs.
Con SQL 80-20 il posizionamento del 916 era lo stesso a partire da 28,023 IOPS e 88.9μs di latenza e ha raggiunto il picco a 277,572 IOPS con una latenza di 114.6μs.
Per il nostro carico di lavoro Oracle, il 916 ha superato di poco il 910. Qui l'unità è iniziata a 30,716 IOPS con una latenza di 91.2μs e ha raggiunto il picco a 282,888 IOPS con una latenza di 126.2μs.
Oracle 90-10 ha visto il 916 ricadere all'ultimo, a malapena. In questo caso l'unità è iniziata a 40,494 IOPS con una latenza di 98.2μs e ha raggiunto il picco a 202,512 IOPS con una latenza di 107.9μs.
Per Oracle 80-20 vediamo ancora una volta il 916 prendere a malapena il secondo posto dal 910. L'unità è iniziata a 42,276 IOPS con una latenza di 87.6 μs ed è rimasta sotto 100 μs fino a circa 169 IOPS per raggiungere il picco a 210,628 IOPS con una latenza di 103.8 μs. .
Successivamente, passiamo al nostro test clone VDI, completo e collegato. Per VDI Full Clone Boot, il 916 è arrivato terzo partendo da 22,788 IOPS con latenza di 107.9μs e ha raggiunto il picco a 218,323 IOPS con latenza di 158.9μs.
Per l'accesso iniziale VDI FC, il 916 è arrivato secondo dietro al 910 a partire da 15,487 IOPS con una latenza di 69.7 μs ed è rimasto sotto i 100 μs fino a circa 65 IOPS. L'unità ha raggiunto il picco di 147,777 IOPS e una latenza di 199.4μs.
VDI FC Monday Login ha avuto il primo take 916 a partire da 10,213 IOPS e una latenza di 89.4μs. L'unità è rimasta sotto i 100μs fino a circa 35 IOPS e ha raggiunto il picco a 101,673 IOPS con una latenza di 155.5μs.
Per il VDI Linked Clone (LC) ricominciamo con il test di avvio. Qui il 916 si è piazzato terzo partendo da 9,598 IOPS con una latenza di 127μs e ha raggiunto il picco a 98,621 IOPS con una latenza di 161.6μs.
Nel VDI LC Initial Login il 916 ha superato il 910 per prendere il secondo posto. In questo caso l'unità è iniziata a 5,599 IOPS con una latenza di 94.2 μs ed è andata oltre i 100 μs a circa 20 IOPS. Il 916 ha raggiunto il picco di 55,416 IOPS con una latenza di 142.1μs.
Alla fine il VDI LC Monday Login ha visto il 916 primeggiare con una prestazione di picco di 78,483 IOPS e una latenza di 201.3μs.
Conclusione
Il Memblaze PBlaze5 916 è uno degli SSD 64D NAND NVMe a 3 strati dell'azienda. Per questa recensione particolare abbiamo esaminato il fattore di forma AIC. Il fattore di forma AIC offre tutti gli stessi vantaggi della linea 916, crittografia dei dati AES 256, protezione completa del percorso dei dati, protezione avanzata in caso di interruzione dell'alimentazione e maggiore resistenza, fornendo allo stesso tempo prestazioni ancora più elevate rispetto alla sua controparte U.2. L'AIC 916 ha indicato velocità fino a 5.9 GB/s in lettura e 2.8 GB/s in scrittura con un throughput fino a 1 milione di IOPS in lettura e 303 IOPS in scrittura insieme a 3DWPD.
Per la nostra analisi del carico di lavoro delle applicazioni, l'AIC Memblaze PBlaze5 916 ha mostrato ottime prestazioni sia in SQL Server che in Sysbench. L'unità è arrivata terza nell'output di SQL Server con 12,645 TPS e una latenza media di 1.3 ms posizionandola al secondo posto. Per Sysbench l'AIC 916 aveva 9,298 TPS, una latenza media di 13.8 ms, e ha preso il primo posto nel nostro scenario peggiore di latenza con 25.2 ms. Houdini ha mostrato una prestazione meno forte con 3070.7 secondi.
Per il nostro VDBench abbiamo testato il 916 AIC rispetto ad altri due modelli AIC, il Memblaze PBlaze5 910 AIC e il Liqid Element AIC. Qui le prestazioni sono state buone ma il posizionamento le ha fatte sembrare contrastanti. Spesso la 916 arrivava ultima contro le altre due unità, ma ogni volta era a portata di mano della 910. I punti salienti includono un punteggio di lettura casuale 4K di 809 IOPS, un punteggio di scrittura casuale 4K di 578 IOPS, un punteggio sequenziale di 64K di 3.13 GB/s e un punteggio di scrittura sequenziale di 2.65 GB/s. Ciò che è più interessante qui è stata la latenza. Anche al picco 370μs è stato il massimo con l'unità che ha funzionato al di sotto dei 25μs durante la maggior parte della scrittura casuale 4K. SQL ha mostrato punteggi di picco superiori a un quarto di milione di IOPS in ciascun test e la latenza variava da 88.9μs a soli 118.1μs, un valore molto basso e coerente in tutti i test. I punteggi di picco di Oracle non erano così forti come quelli di SQL (sebbene il primo fosse di 283 IOPS), ma presentava un'altra dimostrazione di una latenza bassa e costante che andava da 87.6μs a 126.2μs al picco più alto.
L'AIC Memblaze PBlaze5 916 è la scelta ideale per le applicazioni che necessitano di coerenza e bassa latenza. Anche se la natura della scheda aggiuntiva fa sì che rinunci alla sostituibilità a caldo (rendendola potenzialmente più elevata da mantenere, sebbene abbia anche un'elevata resistenza), è più che compensata in termini di prestazioni, in particolare di latenza.
Iscriviti alla newsletter di StorageReview