Durante l'evento Step Ahead a Pechino, Memblaze ha lanciato una nuova serie di unità 500 NVME nonché un'espansione della sua linea 900 a 910 e 916. In questa recensione esamineremo la serie 910. Le nuove unità 910 sono offerte in due fattori di forma e sfruttano la NAND 64D a 3 strati, che consente alle unità di avere capacità fino a 16 TB. Questa maggiore densità può portare a rack più densi o al consolidamento dei rack nel data center.
Durante l'evento Step Ahead a Pechino, Memblaze ha lanciato una nuova serie di unità 500 NVME nonché un'espansione della sua linea 900 a 910 e 916. In questa recensione esamineremo la serie 910. Le nuove unità 910 sono offerte in due fattori di forma e sfruttano la NAND 64D a 3 strati, che consente alle unità di avere capacità fino a 16 TB. Questa maggiore densità può portare a rack più densi o al consolidamento dei rack nel data center.
Oltre a sfruttare 64 strati per raggiungere capacità più elevate, Memblaze PBlaze5 910 dichiara prestazioni più elevate rispetto ai modelli precedenti. L'azienda afferma che l'unità può raggiungere letture sequenziali fino a 3.5 GB/s e throughput fino a 835 IOPS, pur avendo una latenza inferiore al millisecondo. L'unità è inoltre dotata di elevata disponibilità integrata, essendo dotata di doppia porta, in modo da eliminare un singolo percorso di guasto. Il 910 ha 1 DWPD di resistenza e due milioni di ore MTBF. I casi d'uso ideali includono: database, ricerca, indicizzazione, CDN, cloud e iperscala, SDS, deep learning e analisi dei big data, ERP, SAP HANA, BOSS, servizi bancari, fiscalità, trading ad alta frequenza e pagamenti online.
Per questa recensione esamineremo il PBlaze3.84 2 da 5 TB, U.910.
Specifiche dell'SSD Memblaze PBlaze5 910 NVMe
Fattore di forma | U.2 | ||
Ultra-Grande | 3.84TB | 7.68TB | 15.36TB |
NAND | eTLC 3D | ||
Interfaccia | PCIe 3.0 x 4 | ||
Protocollo | NVMe 1.2a | ||
Performance | |||
Lettura sequenziale (128KB) | 3.5GB / s | 3.5GB / s | 3.3GB / s |
Scrittura sequenziale (128KB) | 3.1GB / s | 3.5GB / s | 3.3GB / s |
Lettura casuale sostenuta (4KB) | 835K IOPS | 830K IOPS | 826K IOPS |
Scrittura casuale sostenuta (4KB) | 99K IOPS | 135K IOPS | 150K IOPS |
Latenza R/W | 87 / 12μs | ||
DWPD | 1 | ||
UBER | <10^-17 | ||
MTBF | 2 milioni di ore | ||
Consumo di energia | 7 ~ 25W |
Performance
Banco di prova
Le nostre recensioni sugli SSD aziendali sfruttano un Lenovo ThinkSystem SR850 per i test delle applicazioni e a Dell PowerEdge R740xd per benchmark sintetici. Il ThinkSystem SR850 è una piattaforma quad-CPU ben equipaggiata, che offre una potenza della CPU ben superiore a quella necessaria per stressare l'archiviazione locale ad alte prestazioni. I test sintetici che non richiedono molte risorse della CPU utilizzano il più tradizionale server a doppio processore. In entrambi i casi, l'intento è quello di mostrare lo storage locale nella migliore luce possibile in linea con le specifiche massime dell'unità di storage del fornitore.
Lenovo Think System SR850
- 4 CPU Intel Platinum 8160 (2.1 GHz x 24 core)
- 16 DRAM ECC DDR32-4Mhz da 2666 GB
- 2 schede RAID RAID 930-8i 12Gb/s
- 8 alloggiamenti NVMe
- VMware ESXI 6.5
Dell PowerEdge R740xd
- 2 CPU Intel Gold 6130 (2.1 GHz x 16 core)
- 16 DRAM ECC DDR16-4MHz da 2666 GB
- 1x scheda RAID PERC 730 da 2 GB 12 Gb/s
- Adattatore NVMe aggiuntivo
- Ubuntu-16.04.3-desktop-amd64
Test di background e comparabili
Le Laboratorio di test aziendale di StorageReview fornisce un'architettura flessibile per condurre benchmark dei dispositivi di storage aziendali in un ambiente paragonabile a quello che gli amministratori incontrano nelle distribuzioni reali. L'Enterprise Test Lab incorpora una varietà di server, reti, condizionatori di alimentazione e altre infrastrutture di rete che consentono al nostro personale di stabilire condizioni reali per valutare con precisione le prestazioni durante le nostre revisioni.
Incorporiamo questi dettagli sull'ambiente e sui protocolli del laboratorio nelle revisioni in modo che i professionisti IT e i responsabili dell'acquisizione dello spazio di archiviazione possano comprendere le condizioni in cui abbiamo ottenuto i seguenti risultati. Nessuna delle nostre revisioni è pagata o supervisionata dal produttore delle apparecchiature che stiamo testando. Ulteriori dettagli su Laboratorio di test aziendale di StorageReview che a una panoramica delle sue capacità di rete sono disponibili nelle rispettive pagine.
Paragonabili per questa recensione:
- Memblaze PBlaze5 3.2 TB
- Memblaze PBlaze4 3.2 TB
- Intel P3700 2 TB
- Intel P4500 2 TB
- HGST SN100 3.2 TB
- Toshiba PX04 1.6 TB
Analisi del carico di lavoro dell'applicazione
Per comprendere le caratteristiche prestazionali dei dispositivi di storage aziendali, è essenziale modellare l'infrastruttura e i carichi di lavoro applicativi presenti negli ambienti di produzione live. I nostri benchmark per il Memblaze PBlaze5 910 sono quindi i Prestazioni MySQL OLTP tramite SysBench che a Prestazioni OLTP di Microsoft SQL Server con un carico di lavoro TCP-C simulato. Per i nostri carichi di lavoro applicativi, ogni unità eseguirà 2-4 VM configurate in modo identico.
Prestazioni dell'SQL Server
Ogni VM SQL Server è configurata con due dischi virtuali: un volume da 100 GB per l'avvio e un volume da 500 GB per il database e i file di log. Dal punto di vista delle risorse di sistema, abbiamo configurato ciascuna VM con 16 vCPU, 64 GB di DRAM e abbiamo sfruttato il controller SCSI SAS LSI Logic. Sebbene i nostri carichi di lavoro Sysbench testati in precedenza saturassero la piattaforma sia in termini di I/O di storage che di capacità, il test SQL cerca prestazioni di latenza.
Questo test utilizza SQL Server 2014 in esecuzione su VM guest Windows Server 2012 R2 ed è sottoposto a stress da Benchmark Factory for Databases di Quest. StorageReview Protocollo di test OLTP di Microsoft SQL Server utilizza l'attuale bozza del Benchmark C (TPC-C) del Transaction Processing Performance Council, un benchmark di elaborazione delle transazioni online che simula le attività presenti in ambienti applicativi complessi. Il benchmark TPC-C si avvicina di più rispetto ai benchmark sintetici delle prestazioni per valutare i punti di forza e i colli di bottiglia delle prestazioni dell'infrastruttura di storage negli ambienti di database. Ogni istanza della nostra VM SQL Server per questa recensione utilizza un database SQL Server da 333 GB (scala 1,500) e misura le prestazioni transazionali e la latenza con un carico di 15,000 utenti virtuali.
Configurazione di test di SQL Server (per VM)
- Di Windows Server 2012 R2
- Impronta di archiviazione: 600 GB allocati, 500 GB utilizzati
- SQL Server 2014
- Dimensioni del database: scala 1,500
- Carico del client virtuale: 15,000
- Memoria RAM: 48 GB
- Durata della prova: 3 ore
- 2.5 ore di precondizionamento
- Periodo di campionamento di 30 minuti
Per il nostro benchmark transazionale di SQL Server, il Memblaze PBlaze5 910 U.2 è arrivato in fondo alla classifica con 12,546.5 TPS, inferiore a quello di altre tre unità PBlaze.
Sorprendentemente, il 910 ha avuto anche la latenza più alta, pari a 38.8 ms.
Prestazioni del Sysbench
Il prossimo benchmark dell'applicazione è costituito da a Database Percona MySQL OLTP misurato tramite SysBench. Questo test misura il TPS medio (transazioni al secondo), la latenza media e anche la latenza media del 99° percentile.
Ogni banco di sistema La VM è configurata con tre vDisk: uno per l'avvio (~92 GB), uno con il database predefinito (~447 GB) e il terzo per il database in fase di test (270 GB). Dal punto di vista delle risorse di sistema, abbiamo configurato ciascuna VM con 16 vCPU, 60 GB di DRAM e abbiamo sfruttato il controller SCSI SAS LSI Logic.
Configurazione test Sysbench (per VM)
- CentOS 6.3 a 64 bit
- Percona XtraDB 5.5.30-rel30.1
- Tabelle del database: 100
- Dimensione del database: 10,000,000
- Discussioni del database: 32
- Memoria RAM: 24 GB
- Durata della prova: 3 ore
- 2 ore di precondizionamento di 32 thread
- 1 ora 32 thread
Con il benchmark transazionale Sysbench, l'U.2 910 ha fatto meglio, raggiungendo 6,664.6 TPS, attestandosi a metà del gruppo testato.
Con la latenza media Sysbench l'U.2 910 si è trovato ancora una volta al centro del gruppo con una latenza di 19.2ms.
Il nostro benchmark sulla latenza dello scenario peggiore ha visto l'U.2 910 attestarsi di nuovo vicino alla metà con 37.8 ms.
Houdini di SideFX
Il test Houdini è specificamente progettato per valutare le prestazioni di archiviazione in relazione al rendering CGI. Il banco di prova per questa applicazione è una variante del core Dell PowerEdge R740xd tipo di server che utilizziamo in laboratorio con doppie CPU Intel 6130 e DRAM da 64 GB. In questo caso, abbiamo installato Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) con bare metal. L'output del benchmark viene misurato in secondi per il completamento, dove meno significa meglio.
La demo di Maelstrom rappresenta una sezione della pipeline di rendering che evidenzia le capacità prestazionali dello storage dimostrando la sua capacità di utilizzare in modo efficace il file di scambio come una forma di memoria estesa. Il test non scrive i dati dei risultati né elabora i punti per isolare l'effetto wall-time dell'impatto della latenza sul componente di storage sottostante. Il test stesso è composto da cinque fasi, tre delle quali vengono eseguite come parte del benchmark, che sono le seguenti:
- Carica i punti compressi dal disco. Questo è il momento di leggere dal disco. Si tratta di un thread singolo, che può limitare la velocità effettiva complessiva.
- Decomprime i punti in un unico array piatto per consentirne l'elaborazione. Se i punti non dipendono da altri punti, il working set potrebbe essere modificato per rimanere nel nucleo. Questo passaggio è multi-thread.
- (Non eseguire) Elabora i punti.
- Li reimpacchetta in blocchi con bucket adatti per essere archiviati nuovamente su disco. Questo passaggio è multi-thread.
- (Non eseguito) Scrivi nuovamente i blocchi inseriti in bucket su disco.
Con il test Houdini il 910 U.2 si è piazzato nella fascia medio-bassa, ma perfettamente in linea con gli altri prodotti Memblaze con un punteggio di 3,093.8 secondi.
Analisi del carico di lavoro VDBench
Quando si tratta di confrontare i dispositivi di archiviazione, il test delle applicazioni è la soluzione migliore e il test sintetico viene al secondo posto. Pur non essendo una rappresentazione perfetta dei carichi di lavoro effettivi, i test sintetici aiutano a definire i dispositivi di storage con un fattore di ripetibilità che semplifica il confronto tra soluzioni concorrenti. Questi carichi di lavoro offrono una gamma di profili di test diversi che vanno dai test "quattro angoli", test comuni sulle dimensioni di trasferimento del database, alle acquisizioni di traccia da diversi ambienti VDI. Tutti questi test sfruttano il comune generatore di carichi di lavoro vdBench, con un motore di scripting per automatizzare e acquisire risultati su un ampio cluster di test di calcolo. Ciò ci consente di ripetere gli stessi carichi di lavoro su un'ampia gamma di dispositivi di storage, inclusi array flash e singoli dispositivi di storage. Il nostro processo di test per questi benchmark riempie l'intera superficie dell'unità con i dati, quindi partiziona una sezione dell'unità pari al 25% della capacità dell'unità per simulare il modo in cui l'unità potrebbe rispondere ai carichi di lavoro delle applicazioni. Questo è diverso dai test entropici completi che utilizzano il 100% dell'unità e la portano in uno stato stazionario. Di conseguenza, queste cifre rifletteranno velocità di scrittura più sostenute.
Profili:
- Lettura casuale 4K: 100% di lettura, 128 thread, 0-120% irate
- Scrittura casuale 4K: scrittura al 100%, 64 thread, 0-120% irate
- Lettura sequenziale 64K: lettura al 100%, 16 thread, 0-120% irate
- Scrittura sequenziale 64K: scrittura al 100%, 8 thread, 0-120% irate
- Database sintetici: SQL e Oracle
- Clonazione completa VDI e tracce di clonazione collegata
Nella nostra prima analisi del carico di lavoro VDBench, lettura casuale 4K, il Memblaze PBlaze5 910 U.2 è riuscito a rimanere sotto 1 ms con un picco di 665,679 IOPS e una latenza di 191.3 μs, posizionando l'unità all'incirca a metà.
La scrittura casuale 4K ha registrato ancora una volta una latenza inferiore al millisecondo. Il 910 U.2 si è piazzato penultimo con una prestazione di picco di 296,639 IOPS e una latenza di 429.6μs.
Passando ai carichi di lavoro sequenziali, il 910 U.2 si è piazzato ancora una volta penultimo nelle letture sequenziali da 64K con un punteggio di picco di 38,472 IOPS o 2.4 GB/s con una latenza di 415.3 μs.
Restando al penultimo posto, il 910 U.2 ha raggiunto il picco con circa 18K IOPS o 1.1GB/s con una latenza di circa 870μs nella scrittura sequenziale a 64K.
Passando ai carichi di lavoro SQL, il 910 U.2 ha raggiunto il picco di 243,228 IOPS con una latenza di soli 130.4μs posizionando l'unità al quarto posto assoluto.
SQL 90-10 ha visto il 910 mantenere il quarto posto con un punteggio massimo di 232,061 IOPS e una latenza di 136.5μs.
Sempre al quarto posto, il 910 U.2 ha raggiunto il picco di 220,195 IOPS con una latenza di 144.6μs nel benchmark SQL 80-20.
Con il nostro carico di lavoro Oracle il 910 U.2 continua a rimanere al quarto posto con un punteggio di picco di 212,052 IOPS e una latenza di 168.5μs.
Per Oracle 90-10 il 910 U.2 è passato al terzo posto con un picco di 180,723 IOPS e una latenza di 121.1μs.
In Oracle 80-20 il 910 ha quasi raggiunto il terzo posto con il 900 con una prestazione di picco di 177,143 IOPS e una latenza di 123.5μs.
Successivamente, passiamo al nostro test clone VDI, completo e collegato. Per VDI Full Clone Boot, il 910 U.2 è arrivato quarto con una prestazione di picco di 176,239 IOPS e una latenza di 197.9μs.
VDI FC Initial Login ha visto il 910 U.2 al quarto posto ma più indietro rispetto ai primi tre drive con una prestazione di picco di 66,925 IOPS e una latenza di 445.1μs.
Con VDI FC Monday Login il 910 U.2 si è classificato al quarto posto con 67,309 IOPS e una latenza di 235.7μs.
Passando a Linked Clone (LC) diamo prima un'occhiata al test di avvio. Qui il 910 U.2 è arrivato quarto con 83,210 IOPS e una latenza di 191.2μs.
VDI LC Initial Login ha mantenuto il 910 U.2 stabile al quarto posto con 40,035 IOPS e una latenza di 197.4μs.
Infine il VDI LC Monday Login ha ottenuto il picco 910 U.2 a 45,349 IOPS e una latenza di 349μs per il quarto posto.
Conclusione
Memblaze PBlaze5 910 è la nuova unità per data center NVMe dell'azienda che sfrutta la NAND 64D a 3 strati. L'unità è disponibile in due fattori di forma (U.2 per questa recensione) e con capacità di 3.84 TB, 7.68 TB e 15.36 TB. Memblaze dichiara prestazioni fino a 3.5 GB/s in lettura, 3.5 GB/s in scrittura e throughput fino a 835 IOPS in lettura e 150 IOPS in scrittura. L'unità soddisfa i criteri per numerosi casi d'uso e viene fornita con opzioni di sicurezza come la crittografia dei dati AES 256 e supporta la funzione TRIM fino a 8 TB/s.
Osservando le prestazioni di analisi del carico di lavoro delle applicazioni, il 910 U.2 è arrivato all'ultimo posto nei nostri benchmark SQL Server con 12,546.5 TPS e una latenza media di 38.8 ms. In Sysbench l'unità ha ottenuto un atterraggio leggermente migliore al centro del gruppo con 6,664.6 TPS e una latenza media di 19.2 ms e una latenza dello scenario peggiore di 37.8 ms. Nel nostro benchmark Houdini by SideFX il 910 U.2 ha ottenuto un punteggio di 3,093.8 secondi posizionandolo nella fascia bassa del campo ma in linea con gli altri prodotti Memblaze.
Per VDBench il Memblaze PBlaze5 910 U.2 ha avuto una latenza inferiore al millisecondo durante tutti i test. L'unità tendeva a cadere al centro della parte inferiore del gruppo in tutti i test. I risultati principali includono 666 IOPS in lettura 4K, 297 IOPS in scrittura 4K, 2.4 GB/s in lettura 64K e 1.1 GB/s in scrittura 64K. I risultati SQL contenevano circa un quarto di milione di IOPS con i test Oracle eseguiti tra 177 IOPS e 212 IOPS.
Nel complesso ha dato buone prestazioni, ma le prestazioni hanno iniziato a peggiorare rispetto alla generazione precedente PBlaze5 900.
Iscriviti alla newsletter di StorageReview