Casa Impresa Recensione Micron RealSSD P320h Enterprise PCIe

Recensione Micron RealSSD P320h Enterprise PCIe

by Kevin O'Brien

Micron RealSSD P320h è un acceleratore di applicazioni Half-Height, Half-Length (HHHL) che sfrutta la NAND SLC e un'interfaccia PCIe Gen 2 x8 per garantire prestazioni indicate di 3.2 GB/s in lettura sequenziale e fino a 785,000 IOPS in lettura casuale. L'architettura P320h si discosta da molti degli altri recenti acceleratori di applicazioni che abbiamo esaminato che generalmente eseguono il RAID insieme a diverse unità flash. Diversa è l'offerta Micron, che utilizza invece RAIN (array ridondante di NAND indipendente) con controller personalizzato, che è simile all'approccio adottato da Fusion-io e Virident. Questa architettura consente a Micron di vantare velocità e latenza inebrianti offrendo allo stesso tempo un elevato livello di sicurezza dei dati sull'unità. In questa recensione testiamo una coppia di schede da 700 GB e vedremo non solo quanto sono veloci da sole, ma anche come si adatta la P320h in Windows Server 2012.


Micron RealSSD P320h è un acceleratore di applicazioni Half-Height, Half-Length (HHHL) che sfrutta la NAND SLC e un'interfaccia PCIe Gen 2 x8 per garantire prestazioni indicate di 3.2 GB/s in lettura sequenziale e fino a 785,000 IOPS in lettura casuale. L'architettura P320h si discosta da molti degli altri recenti acceleratori di applicazioni che abbiamo esaminato che generalmente eseguono il RAID insieme a diverse unità flash. Diversa è l'offerta Micron, che utilizza invece RAIN (array ridondante di NAND indipendente) con controller personalizzato, che è simile all'approccio adottato da Fusion-io e Virident. Questa architettura consente a Micron di vantare velocità e latenza inebrianti offrendo allo stesso tempo un elevato livello di sicurezza dei dati sull'unità. In questa recensione testiamo una coppia di schede da 700 GB e vedremo non solo quanto sono veloci da sole, ma anche come si adatta la P320h in Windows Server 2012.

Come notato, l'architettura delle unità e le politiche di gestione della NAND svolgono un ruolo fondamentale in termini di prestazioni del dispositivo viste sia dal punto di vista del throughput che della latenza. Con il P320h, Micron fonde la propria proprietà intellettuale con la progettazione e la produzione ASIC di IDT. Il risultato netto è un controller ASIC che include l'intelligenza proprietaria di Micron sulla gestione e il controllo della NAND, che include RAIN. L’approccio RAIN di Micron è molto efficiente nel modo in cui gestisce la NAND e tale efficienza è in definitiva ciò che guida le prestazioni e la protezione dei dati del P320h. Micron utilizza un'architettura RAID7 1+5P all'interno di RAIN. Con lo striping utilizzato al livello 7+1, Micron è in grado di fornire le stesse prestazioni di un'unità senza parità, pur fornendo la protezione dei dati richiesta dalle aziende.

Sebbene il P320h sia interessante grazie alle tecniche di gestione della NAND Micron, anche fisicamente è interessante. Il PCB HHHL è pieno di parti Micron, comprese ovviamente SLC NAND e DDR, e non richiede una connessione di alimentazione esterna per raggiungere le massime prestazioni. Le nostre unità da 700 GB hanno 64 pezzi NAND inseriti sulla scheda, evidenziati dal dissipatore di calore passivo sul controller singolo. Il design a controller singolo consente prestazioni e affidabilità migliori rispetto alle soluzioni concorrenti che si basano sulla combinazione di più controller tramite hardware e software. L'utilizzo di un controller specificatamente progettato per la NAND Micron offre a Micron un altro vantaggio in termini di interoperabilità, prestazioni e supporto dell'unità. Contrariamente a quanto riportato altrove, l'unità non supporta NVMe, tuttavia Micron sta decisamente andando in quella direzione con i prodotti futuri.

Micron offre il P320h in due capacità solo SLC, 350 GB e 700 GB utilizzabili. Un'unità da 350 GB inizia come RAW da 512 GB, ma dopo aver sottratto il 12.5% per RAIN e poi il 22% per l'overprovisioning, l'unità arriva a 350 GB. Il P320h offre fino a 25 PB di autonomia per il modello da 350 GB e 50 PB per quello da 700 GB e viene fornito con strumenti software per la gestione dell'unità e il reporting sullo stato.

Specifiche Micron RealSSD P320h

  • Capacità
    • 350 GB (MTFDGAR350SAH-1N1AB)
      • Lettura sequenziale: 3.2 GB/s (128 KB, stato stazionario)
      • Scrittura sequenziale: 1.9 GB/s (128 KB, stato stazionario)
      • Lettura casuale: 785,000 IOPS (4 KB, stato stazionario)
      • Scrittura casuale: 175,000 IOPS (4 KB, stato stazionario)
    • 700 GB (MTFDGAR700SAH-1N1AB)
      • Lettura sequenziale: 3.2 GB/s (128 KB, stato stazionario)
      • Scrittura sequenziale: 1.9 GB/s (128 KB, stato stazionario)
      • Lettura casuale: 785,000 IOPS (4 KB, stato stazionario)
      • Scrittura casuale: 205,000 IOPS (4 KB, stato stazionario)
  • Latenza pronta: <42μs (512 byte)
  • Latenza di scrittura: <9μs
  • Interfaccia: PCIe Gen2 x8
  • Potenza: 25 W massimo, 10 W inattivo
  • Fattore di forma: HHHL
  • Comando nativo in coda fino a 256 comandi
  • Durata: 350 GB – 25 PB, 700 GB – 50 PB
  • Dimensioni: 68.90mm x 167.65mm x 18.71mm
  • Temp. di funzionamento: da 0°C a +50°C
  • Compatibilità OS
    • Microsoft: Windows Server 2008 R2 SP1 (x86-64), Windows Server 2008 R2 SP1 Hyper-V (x86-64), Windows Server 2012 (x86-64) SP128, Windows Server 2012 Hyper-V (x64)
    • Linux: RHEL Linux 5.5, 5.6, 5.7, 5.8 (SP128), 6.1, 6.2 (x86-64), SLES Linux 11 SP1 e SP2 (x86-64)
    • GPL open source (Kernel Rev. 2.6.25+)
  • Conservazione dei dati a fine vita 1 anno

Panoramica video

Costruire e disegnare

La Micron RealSSD P320h è una scheda PCI-Express x8 Half-Height Half-Length caratterizzata dal layout PCIe AA più elementare sul mercato in termini di design. Con un singolo controller e due piccole schede figlie, è più snella di qualsiasi altra soluzione che abbiamo recensito fino ad oggi, e di gran lunga la meno complessa. Ciò funziona a favore di Micron in diversi modi. Innanzitutto la scheda si adatta automaticamente a quasi tutti i server sul mercato che supportano le schede di espansione PCIe, ma entra in gioco anche quando si confronta l'affidabilità complessiva delle soluzioni aziendali. Con un singolo controller e nemmeno uno switch PCIe come nelle offerte Fusion-io “Duo”, ci sono meno parti che possono guastarsi. Ciò contrasta nettamente con le configurazioni multi-controller presenti su alcune soluzioni concorrenti che eseguono il RAID insieme a più controller SandForce. In un mercato che odia spegnere le piattaforme una volta entrate in produzione, fatta eccezione per l'eventuale sostituzione in futuro, sapere che il dispositivo installato oggi funzionerà per anni senza causare problemi è un enorme vantaggio.

Il cuore del Micron RealSSD P320h è un controller ASIC Micron/IDT personalizzato, unico per questa soluzione. Sui nostri due campioni da 700 GB, questo controller è quindi collegato a un pool da 1 TB di NAND SLC Micron e bufferizzato con 2.25 GB di RAM DDR Micron. A seconda di come li guardi, questi articoli offrono un enorme vantaggio per Micron, poiché hanno una conoscenza molto dettagliata di come tutti questi componenti funzionano a livello centrale avendoli internamente.

Il Micron RealSSD P320h è molto agile per quanto riguarda il consumo energetico, assorbendo meno di 25 watt da un bus PCIe 2.0 x8; non richiede alcuna connessione di alimentazione esterna. Ciò conferisce al P320h maggiore flessibilità quando si tratta di trovare piattaforme adatte su cui installare, senza richiedere cavi di alimentazione aggiuntivi o testare i server per fornire alimentazione tramite specifiche PCIe.

Software di gestione

Sebbene la maggior parte degli acceleratori di applicazioni siano dotati di software, l'usabilità e l'efficacia di tali strumenti varia da eccellente a scarsa. Micron fornisce gli strumenti RealSSD Manager progettati per rendere più efficace la gestione del P320h, comprese sia una CLI che una GUI. Questi strumenti sono compatibili sia con Windows che con Linux e offrono un'ampia gamma di funzionalità. Gli utenti possono sfruttare questi strumenti software per aggiornare il firmware dell'unità, controllare lo stato dell'AA PCIe e avviare la formattazione del dispositivo. A un livello più avanzato è possibile monitorare l'utilizzo e la temperatura correnti dell'unità, con funzionalità di registrazione integrate.

Rispetto alle utility incluse nel produttore che abbiamo visto fino ad oggi, quelle di Micron si collocano proprio sotto Fusion-io in termini di set di funzionalità e design complessivo. Anche se lesina un po' sul design rispetto a ioSphere, Micron RealSSD Manager offre molte delle stesse funzionalità di gestione e monitoraggio, anche se solo a livello locale. Attualmente non supporta il monitoraggio dei dispositivi su sistemi remoti, ma nel complesso offre un enorme passo avanti in termini di funzionalità rispetto agli strumenti di gestione LSI o OCZ.

Test di background e comparabili

Quando si tratta di testare l'hardware aziendale, l'ambiente è importante tanto quanto i processi di test utilizzati per valutarlo. Noi di StorageReview offriamo lo stesso hardware e la stessa infrastruttura che si trova in molti data center a cui alla fine sarebbero destinati i dispositivi che testiamo. Ciò include solo test con server aziendali e apparecchiature infrastrutturali adeguate come rete aziendale, spazio rack, condizionamento/monitoraggio dell'alimentazione e hardware comparabile della stessa classe per valutare correttamente le prestazioni di un dispositivo. Nessuna delle nostre revisioni è pagata o controllata dal produttore dell'attrezzatura che stiamo testando; con elementi comparabili pertinenti selezionati a nostra discrezione dai prodotti di cui disponiamo nel nostro laboratorio.

Piattaforma di test aziendale StorageReview:

Lenovo Think Server RD240

  • 2 Intel Xeon X5650 (2.66 GHz, cache da 12 MB)
  • Windows Server 2008 Standard Edition R2 SP1 a 64 bit e CentOS 6.2 a 64 bit
  • Chipset Intel 5500+ ICH10R
  • Memoria: RDIMM registrati DDR8 da 2 GB (4 x 1333 GB) a 3 MHz

Quando si è trattato di scegliere prodotti comparabili per questa recensione, abbiamo scelto i favoriti di ciascun produttore, ma solo nelle aree che avevano senso rispetto al Micron RealSSD P320h dotato di SLC. Per questo motivo abbiamo abbandonato l'LSI WarpDrive di prima generazione poiché è stato sostituito dal Nytro WarpDrive di seconda generazione, così come dall'OCZ Z-Drive R4 che era troppo al di fuori della curva di latenza per le esigenze del mercato dello storage aziendale ad alte prestazioni. .

640GB Fusion-ioioDrive Duo

  • Rilasciato: 1H2009
  • Tipo NAND: MLC
  • Controller: 2 proprietari
  • Visibilità del dispositivo: JBOD, RAID software a seconda del sistema operativo
  • Fusion-io VSL Windows: 3.1.1
  • Fusion-io VSL Linux 3.1.1

200GB LSI Nytro WarpDrive WLP4-200

  • Rilasciato: 1H2012
  • Tipo NAND: SLC
  • Controller: 4 x LSI SandForce SF-2500 tramite LSI SAS2008 PCIe a SAS Bridge
  • Visibilità del dispositivo: hardware RAID0 fisso
  • Windows LSI: 2.10.51.0
  • LSI Linux: driver CentOS 6.2 nativo

RealSSD P700h da 320 GB Micron

  • Rilasciato: 2H2011
  • Tipo NAND: SLC
  • Controller: 1 proprietari
  • Visibilità del dispositivo: singolo dispositivo
  • Micron Windows: 7.03.3452.00
  • MicronLinux: 1.3.7-1

Analisi sintetica del carico di lavoro aziendale (impostazioni stock)

Il modo in cui guardiamo alle soluzioni di storage PCIe va più in profondità rispetto al semplice esame delle tradizionali prestazioni burst o steady-state. Quando si osservano le prestazioni medie su un lungo periodo di tempo, si perdono di vista i dettagli relativi alle prestazioni del dispositivo nell'intero periodo. Poiché le prestazioni della flash variano notevolmente con il passare del tempo, il nostro nuovo processo di benchmarking analizza le prestazioni in aree quali throughput totale, latenza media, latenza di picco e deviazione standard durante l'intera fase di precondizionamento di ciascun dispositivo. Con i prodotti aziendali di fascia alta, la latenza è spesso più importante della velocità effettiva. Per questo motivo facciamo di tutto per mostrare le caratteristiche prestazionali complete di ciascun dispositivo che sottoponiamo al nostro Laboratorio di test aziendale.

Abbiamo anche aggiunto confronti delle prestazioni per mostrare come funziona ciascun dispositivo con un set di driver diverso sui sistemi operativi Windows e Linux utilizzando il generatore di carichi di lavoro Fio. Per Windows, utilizziamo i driver più recenti al momento della revisione originale, quindi ciascun dispositivo viene testato in un ambiente Windows Server 64 R2008 a 2 bit. Per Linux utilizziamo l'ambiente CentOS 64 a 6.2 bit, supportato da ogni Enterprise PCIe Application Accelerator. Il nostro obiettivo principale con questo test è mostrare in che modo differiscono le prestazioni del sistema operativo, poiché avere un sistema operativo elencato come compatibile su una scheda prodotto non significa sempre che le prestazioni tra i due sistemi siano uguali.

Tutti i dispositivi testati seguono la stessa politica di test dall'inizio alla fine. Attualmente, per ogni singolo carico di lavoro, i dispositivi vengono cancellati in modo sicuro utilizzando gli strumenti forniti dal fornitore, precondizionati allo stato stazionario con lo stesso carico di lavoro con cui il dispositivo verrà testato sotto un carico pesante di 16 thread con una coda in sospeso di 16 per thread e quindi testato a intervalli prestabiliti in più profili di profondità thread/coda per mostrare le prestazioni in condizioni di utilizzo leggero e intenso. Per i test con attività di lettura al 100%, il precondizionamento avviene con lo stesso carico di lavoro, sebbene invertito al 100% di scrittura.

Prove di precondizionamento e di stato stazionario primario:

  • Throughput (aggregato IOPS di lettura+scrittura)
  • Latenza media (latenza di lettura+scrittura mediata insieme)
  • Latenza massima (latenza di picco in lettura o scrittura)
  • Deviazione standard della latenza (deviazione standard di lettura e scrittura mediata insieme)

Al momento l'analisi sintetica del carico di lavoro aziendale include quattro profili comuni, che possono tentare di riflettere l'attività del mondo reale. Questi sono stati scelti per avere qualche somiglianza con i nostri benchmark precedenti, nonché un terreno comune per il confronto con valori ampiamente pubblicati come la velocità massima di lettura e scrittura 4K, nonché 8K 70/30 comunemente utilizzati per le unità aziendali. Abbiamo incluso anche due carichi di lavoro misti legacy, tra cui il tradizionale file server e il server Web che offrono un'ampia combinazione di dimensioni di trasferimento. Questi ultimi due verranno gradualmente eliminati con i benchmark delle applicazioni in tali categorie man mano che vengono introdotti sul nostro sito e sostituiti con nuovi carichi di lavoro sintetici.

  • 4K
    • 100% di lettura o 100% di scrittura
    • 100%4K
  • 8 K 70/30
    • 70% leggi, 30% scrivi
  • File server
    • 80% leggi, 20% scrivi
    • 10% 512b, 5% 1k, 5% 2k, 60% 4k, 2% 8k, 4% 16k, 4% 32k, 10% 64k
  • webserver
    • 100% letto
    • 22% 512b, 15% 1k, 8% 2k, 23% 4k, 15% 8k, 2% 16k, 6% 32k, 7% 64k, 1% 128k, 1% 512k

Passando al nostro primo test che copre un carico di lavoro di precondizionamento in scrittura casuale 4K, il Micron RealSSD P320h inizia alla grande, con velocità di burst appena inferiori a 400k IOPS nel nostro ThinkServer Lenovo. Le prestazioni si sono stabilizzate sopra i 200 IOPS intorno al limite degli 80 minuti, con prestazioni molto simili tra i nostri ambienti di test CentOS 6.2 e Windows Server 2008.

Osservando la latenza media per tutta la durata del nostro test di precondizionamento 4K, il P320h si è rapidamente stabilizzato a poco più di 1 ms di latenza con un carico di 16T/16Q, molto al di sotto dell'LSI Nytro WarpDrive dotato di SLC.

Confrontando la latenza massima di Windows e Linux per la durata del nostro carico di lavoro di precondizionamento, abbiamo scoperto che l'ambiente Linux offriva il minor numero di picchi di latenza elevata, mentre il set di driver Windows a volte arrivava a 1,000 ms.

Sebbene i picchi di 1,000 ms possano essere sconcertanti, il confronto della deviazione standard fornisce un quadro generale migliore della latenza complessiva per tutta la durata del test. Nel caso del P320h, anche con i picchi più alti in Windows Server 2008, è riuscito ad arrivare secondo solo a se stesso in Linux.

Dopo la transizione dalla fase di precondizionamento, abbiamo prelevato un campione più lungo di ciascun acceleratore di applicazioni nel carico di lavoro 4K con un carico 16T/16Q. Il Micron RealSSD P320h ha offerto di gran lunga le prestazioni più elevate, sia in lettura casuale 4K che in scrittura casuale, con il vantaggio dato dal suo set di driver Linux. In CentOS abbiamo misurato 417 IOPS in lettura contro "solo" 378 IOPS in Windows. La velocità di scrittura casuale 4K è stata costante su entrambe le piattaforme, misurando oltre 202k IOPS.

Considerato il throughput quasi incredibile, non è stata una sorpresa vedere il P320h con la latenza media più bassa. La latenza media di lettura è stata leggermente superiore a 0.6 ms, con una latenza di scrittura di 1.26 ms.

Confrontando la latenza di picco nel nostro campionamento finale delle prestazioni di lettura e scrittura casuale 4K, il Micron RealSSD P320h ha registrato alcuni dei picchi di lettura casuale 4K più alti del gruppo sia in Windows che in Linux. Le prestazioni di scrittura casuale erano più frazionate, con una latenza di picco più elevata sul lato Windows e una latenza di picco inferiore sul segmento Linux.

Analizzando ulteriormente la latenza complessiva, il Micron realSSD P320h ha offerto di gran lunga le prestazioni 4K casuali più costanti in Linux, e leggermente meno con i suoi driver Windows.

Il nostro prossimo test sposta l'attenzione sul nostro carico di lavoro 8K 70/30, dove il Micron P320h guida nuovamente il gruppo con un ampio margine in termini di throughput. In questo segmento le velocità di burst sono passate in 30 minuti nel test, per poi stabilizzarsi allo stato stazionario intorno al limite dei 120 minuti.

Il P320h ha offerto una latenza media molto bassa nel nostro carico di lavoro 8K 70/30, misurando circa 1.5 ms per tutta la durata del processo di precondizionamento. Il set di driver Linux offriva un leggero vantaggio, ma nello schema generale delle cose sarebbe difficile notare quella differenza.

Passando dalla latenza media a quella massima, c'è una notevole differenza tra il comportamento in Windows e in Linux. I driver Windows avevano tempi di risposta massimi compresi tra 1,000 e 1,200 ms, mentre il lato Linux era inferiore a circa 200 ms.

Mentre la latenza di picco mostra i peggiori tempi di risposta singoli, la nostra prossima sezione esamina la deviazione standard per vedere come si è svolto il quadro generale della latenza durante la fase di precondizionamento. In Linux, il Micron P320h ha offerto un livello di coerenza molto maggiore rispetto al lato Windows. Sebbene le prestazioni di Windows siano state meno costanti, si è comunque classificato a metà classifica.

Rispetto al carico di lavoro massimo fisso di 16 thread e 16 code che abbiamo eseguito nel test di scrittura 100K al 4%, i nostri profili di carico di lavoro misti scalano le prestazioni su un'ampia gamma di combinazioni thread/coda. In questi test estendiamo l'intensità del nostro carico di lavoro da 2 thread e 2 code fino a 16 thread e 16 code. Il Micron P320h ha offerto un vantaggio dominante a QD più elevati rispetto ai concorrenti di questo gruppo, rinunciando solo a prestazioni minime a livello 2T/2Q. Nell'intero spettro, il set di driver Linux ha offerto un throughput più elevato nella maggior parte delle aree con un piccolo margine.

Il Micron RealSSD P320h ha offerto i migliori tempi di risposta del gruppo tranne il carico 2T/2Q, ed è rimasto sotto 1 ms per tutti tranne il segmento 16T/16Q.

I tempi di risposta più elevati hanno iniziato a manifestarsi sul P320h in Windows verso la metà del test, con più di 4 thread simultanei. I driver Linux hanno mantenuto questi segnali acustici contenuti in tutti i test, tranne nei test QD128 e QD256 più efficaci in cui si sono avvicinati ai 200 ms.

Confrontando la deviazione standard, il Micron RealSSD P320h ha offerto le sue prestazioni più costanti sotto Linux e si è classificato a metà del gruppo per il suo set di driver Windows.

Il carico di lavoro del file server rappresenta uno spettro di dimensioni di trasferimento più ampio che colpisce ciascun particolare dispositivo, quindi invece di accontentarsi di un carico di lavoro statico di 4K o 8K, l'unità deve far fronte a richieste che vanno da 512b a 64K. Il test di precondizionamento del file server è stata la prima area in cui il Micron P320h non ha superato gli altri modelli in termini di velocità di burst, anche se ha continuato a diventare più veloce dallo stato di cancellazione sicura solo al termine del test. Inizialmente inferiore a 80 IOPS, dopo 100 minuti ha superato i 120 IOPS in stato stazionario. Questo ha superato di gran lunga i modelli esistenti in questo segmento.

Osservando la latenza media, quando il Micron RealSSD P320h si è avvicinato allo stato stazionario con una profondità di coda effettiva di 256, ha sfiorato una media di 2 ms con i suoi tempi di risposta.

Spostando la nostra attenzione sui tempi di risposta di picco, il set di driver Windows ha mostrato nuovamente tempi di risposta di picco più elevati, attestandosi intorno ai 1,000 ms durante il nostro test. Questo è stato confrontato con il set di driver Linux che manteneva un livello di picco non superiore a 50 ms.

Anche se i tempi di risposta di picco non sembrano necessariamente buoni, spostiamo la nostra attenzione sulla deviazione standard per dipingere un quadro più chiaro della latenza complessiva del Micron P320h. In quest'area si possono notare alcuni inconvenienti durante la durata del test del P320h in Windows, ma mantiene comunque un livello tra i più bassi del gruppo.

Dopo aver terminato la fase di precondizionamento, siamo passati ai test primari con un carico che variava tra 16T/16Q fino a 2T/2Q. Il Micron RealSSD P320h è partito velocemente e ha guidato il gruppo con un sostanziale vantaggio man mano che la profondità effettiva della coda è aumentata. Alla fine le prestazioni sono scese sotto i 130k IOPS nel nostro server a doppio processore.

Confrontando la latenza media, il P320h ha offerto il suo throughput IOPS massimo di 130k a 16T/4Q con una latenza media di circa 0.5 ms, con un aumento fino a 1-2 ms ai livelli EQD128 ed EQD256.

L'immagine di latenza massima durante il segmento principale del nostro test sul file server ha avuto gli stessi blip da 1,000 ms durante il segmento Windows del nostro test dei test precedenti, con i driver Linux che offrono tempi di risposta di picco molto più bassi.

Confrontando la deviazione standard della latenza, il Micron RealSSD P320h ha offerto la migliore distribuzione della latenza del gruppo in Linux, e si è posizionato verso la metà del pacchetto in Windows.

Nel nostro ultimo carico di lavoro sintetico che copre un profilo di server Web, che tradizionalmente è un test di lettura al 100%, applichiamo un'attività di scrittura al 100% per precondizionare completamente ciascuna unità prima dei nostri test principali. In questo test il Micron RealSSD P320h ha ottenuto le prestazioni in stato stazionario più veloci, ma la novità di questo test è stata la chiara differenza di throughput tra i driver Windows e Linux. Le prestazioni di Linux sono state molto più elevate, oltre a offrire migliori prestazioni di burst.

Passando alla latenza media, il Micron P320h ha offerto una curva piatta a partire da poco più di 20 minuti dall'inizio del test, con le prestazioni di Linux con un vantaggio di quasi 2 ms.

Rispetto ai carichi di lavoro misti di lettura/scrittura dei test precedenti che mostravano frequenti segnali acustici da 1,000 ms dal P320h, il test di precondizionamento del Web Server è stato molto più calmo in confronto. Detto questo, il lato Linux è stato ancora più calmo, non mostrando alcun rallentamento nella latenza durante il processo di precondizionamento.

Confrontando la deviazione standard della latenza nella fase di precondizionamento del nostro server Web, il Micron RealSSD P320h ha offerto di gran lunga la latenza più coerente, anche includendo i segnali acustici rilevati dai driver Windows. Osservando la lieve rampa di latenza man mano che l'unità si avvicina allo stato stazionario, vediamo che le prestazioni si stabilizzano completamente tra i 60 e gli 80 minuti.

Passando al segmento principale del nostro test del Web Server con un profilo di lettura del 100%, il Micron P320h è ancora in testa al gruppo in tutte le categorie, ad eccezione delle prestazioni Windows nella sezione 2T/2Q del nostro test. Un aspetto interessante confrontando le sue prestazioni è che mentre il lato Linux offriva maggiori prestazioni di scrittura, il set di driver Windows offriva prestazioni di lettura più elevate. Ciò ha comportato prestazioni Windows più elevate in tutte le sezioni con una profondità della coda maggiore e una velocità massima molto maggiore (152k contro 170k IOPS)

La latenza media del Micron RealSSD P320h è rimasta inferiore a 1 ms in tutte le fasi, tranne quando la profondità effettiva della coda era 256. Confrontando il picco di throughput con la latenza media, troviamo che il punto debole di questa scheda nella traccia del nostro server Web si trova tra una profondità della coda effettiva di 64 e 128.

Anche se i driver Windows hanno finalmente preso il sopravvento in termini di throughput e latenza media, i tempi di risposta massimi si sono comunque attestati intorno ai 1,000 ms nella maggior parte delle sezioni del test; le prestazioni di Linux non hanno avuto picchi di latenza elevati

Confrontando la deviazione standard della latenza tra le unità di questo gruppo, il Micron RealSSD in Linux ha offerto la migliore diffusione della latenza, mentre i driver Windows si sono posizionati verso la metà del gruppo.

Analisi sintetica del carico di lavoro aziendale (multi-unità/rete)

Dotato di due acceleratori di applicazioni PCIe RealSSD P700h Micron da 320 GB, abbiamo configurato un ambiente di test costituito da un server Supermicro ad alte prestazioni con Windows Server 2012. Questa piattaforma di test è stata collegata tramite due adattatori Mellanox InfiniBand PCIe 3.0 separati al nostro switch IB SX6036, a due Anche i server HP Proliant DL380p Gen8 eseguono Windows Server 2012. Sul server di archiviazione Supermicro ad alte prestazioni, abbiamo creato un semplice array di archiviazione utilizzando Storage Spaces, che è stato poi condiviso su SMB. A differenza dei nostri benchmark principali che mettono alla prova l'intera superficie LBA delle unità, questi test hanno messo in evidenza due segmenti da 50 GB distribuiti sul volume con striping, confrontati localmente e sulla rete InfiniBand.

Di seguito abbiamo incluso un video panoramica dei nostri test InfiniBand:

Piattaforma di test aziendale StorageReview da 56 Gb/s:

Super microcomputer SuperServer 7047R-TXRF

  • Supermicrocomputer X9DRX+-F
  • Doppie CPU Intel E5-2670 (2.6 GHz, 20 MB di cache)
  • Centro dati Windows Server 2012
  • 128 GB di RAM (8 GB x 16 Hynix DDR3, 64 GB per CPU)

(2) HP Proliant DL380p Gen8

  • Intel Xeon E5-2640 (6 core, 2.50 GHz, 15 MB, 95 W)
  • Windows Server Standard 2012
  • Chipset Intel C600
  • RDIMM registrati DDR64 da 8 GB (8 x 16 GB) e 4 GB (4 x 1333 GB) a 3 MHz

Switch e hardware InfiniBand Mellanox SX6036 da 56 Gb/s

  • 36 porte FDR da 56 Gb/s
  • Cavi passivi in ​​rame QSFP
  • Adattatore InfiniBand Mellanox ConnectX-3 VPI PCIe 3.0 doppio da 56 Gb/s

La nostra attuale infrastruttura di test di interconnessione ad alte prestazioni InfiniBand è composta da due server HP Proliant DL380p Gen8 dotati di adattatori Mellanox ConnectX-3 VPI PCIe collegati tramite lo switch IB a 36 porte da 56 Gb/s di Mellanox. Questo ambiente consente al dispositivo di archiviazione che stiamo testando di fungere da collo di bottiglia I/O, anziché l'attrezzatura di rete stessa.

Nel nostro spazio locale semplice e nella sezione di test InfiniBand, ci siamo ristretti a una selezione limitata di test, anziché alla nostra suite completa. Per facilitare il confronto abbiamo utilizzato il nostro carico di lavoro 8K 70/30 per mostrare la differenza di prestazioni tra l'accesso locale e quando condiviso in rete.

Utilizzando un ingombro complessivo più piccolo su cui testare i nostri test primari, abbiamo riscontrato che le prestazioni si adattano molto bene in un ambiente a doppia scheda. A livello locale, con due sessioni del generatore di carico di lavoro in esecuzione simultaneamente per imitare i due server in esecuzione sulla rete, abbiamo misurato prestazioni superiori a 490 IOPS nel nostro carico di lavoro 8K 70/30. Presentando il singolo array con striping su due condivisioni e accedendovi dai nostri due server HP Proliant DL380p Gen8, le prestazioni sono scese a 402k IOPS. Siamo riusciti a più che raddoppiare il throughput in entrambi gli scenari mantenendo comunque eccellenti prestazioni per server.

Osservando la latenza media nel nostro ambiente twin-P320h, c'era una certa differenza nella latenza media confrontando l'accesso locale con l'accesso remoto tramite InfiniBand, ma la latenza era comunque inferiore a quella misurata da un P320h nel nostro banco di prova principale. Dato che la condivisione di questo dispositivo ad alto I/O tra più sistemi ha avuto un impatto minimo sulla latenza, si apre davvero la porta alla condivisione di costose risorse ad alte prestazioni su più di un sistema.

Non c'era davvero alcuna differenza misurabile nella latenza di picco rispetto all'accesso locale e remoto, il che è importante sapendo che la rete InfiniBand non aumenta in modo significativo la latenza su dispositivi come gli acceleratori di applicazioni PCIe.

Analogamente al picco di latenza, non abbiamo riscontrato differenze evidenti tra la deviazione standard della latenza osservata localmente in un ambiente con striping o sulla nostra rete InfiniBand.

Dopo aver constatato che le prestazioni 8K 70/30 con due carichi simultanei con una profondità di coda effettiva di 256 ciascuno hanno riscontrato un piccolo calo delle prestazioni sulla rete rispetto a quelle locali, abbiamo spostato la nostra attenzione su un carico di lavoro variabile che va da 2T/2Q fino a 16T/16Q . Poiché ciò si verificava su due server o due generatori di carico di lavoro locali contemporaneamente, il carico totale sarebbe compreso tra 4T/2Q e 32T/16Q. Sia l'accesso locale che quello di rete all'array con striping P320h hanno offerto la stessa reattività a un carico crescente. Entrambi i test hanno mostrato modelli quasi identici su tutto lo spettro, con l'accesso locale che ha offerto le prestazioni migliori.

La latenza media nella sezione principale del nostro carico di lavoro 8K 70/30 sulla configurazione P320h con striping ha offerto prestazioni eccellenti a livello locale e sulla nostra rete. Il più impressionante sono i risultati InfiniBand, in cui ciascun server ha registrato una latenza inferiore a 0.8 ms per oltre 400,000 IOPS sulla rete.

Confrontando la latenza massima nel carico di lavoro 8K 70/30 con la nostra configurazione dual-P320h abbiamo mostrato risultati simili localmente rispetto a quelli remoti, con entrambi con segnali acustici superiori a 1,000 ms per tutta la durata del test.

Analogamente ai nostri risultati di latenza massima di cui sopra, c'era pochissima differenza tra l'accesso locale all'array P320h o la condivisione tramite Windows Storage Space sulla nostra rete InfiniBand.

Conclusione

Il Micron RealSSD P320h è semplicemente un ottimo esempio di ingegneria ben eseguita. Tutto, dalla progettazione e layout della scheda al controller personalizzato, rende il P320h una vera unità integrata, cosa che non è sempre così nemmeno nello spazio di archiviazione aziendale. Micron trova modi per aggiungere valore a tutta l'unità, dall'IP di gestione NAND nell'ASIC personalizzato alla caratterizzazione NAND più profonda possibile che porta alle massime prestazioni e resistenza dei componenti flash SLC.

Quando valutiamo le prestazioni del P320h, l'unità urla, mantenendo quasi la parità tra i nostri ambienti di test CentOS e Windows Server. In termini di ambiente migliore, Linux ha sempre avuto un vantaggio, soprattutto per quanto riguarda la latenza ottimale. Dire che il Micron P320h è veloce è però un eufemismo. Ha superato di gran lunga qualsiasi altra soluzione che abbiamo testato fino ad oggi, con velocità di burst maggiori rispetto alla maggior parte e prestazioni a stato stazionario di gran lunga superiori rispetto alle soluzioni concorrenti. Analizzando la sua reattività, la latenza media è stata impeccabile, ma ciò che è ancora più impressionante sono state le sue nuove prestazioni Linux impeccabili, con una latenza di picco e una deviazione standard della latenza molto basse. Il lato Windows non era troppo lontano, anche se la latenza di picco e la deviazione standard della latenza si collocavano a metà del gruppo in confronto.

Per quanto riguarda la compatibilità, abbiamo riscontrato che il Micron RealSSD P320h funziona perfettamente in un ambiente aziendale. Per noi non ha senso testare questa offerta aziendale di alto livello su una piattaforma consumer, poiché non verrebbe mai portata in un ambiente di produzione in esecuzione su una di esse. A tal fine, nei server di primo livello su cui lo abbiamo testato, ha funzionato senza intoppi su più sistemi operativi. Anche il P320h non ha avuto problemi a lavorare nella configurazione a doppia unità nel nostro Supermicro SuperServer 7047R con Windows Server 2012, come si può vedere nel nostro video.

Se proprio dobbiamo lamentarci è che l'ambiente Windows lascia alcune aree minori che necessitano di miglioramenti, soprattutto se confrontiamo la latenza di picco e la deviazione standard in tutti i nostri carichi di lavoro. Anche con una latenza più elevata, ha comunque superato molti, se non tutti, degli acceleratori di applicazioni PCIe che abbiamo testato, ma riteniamo che potrebbero esserci ancora delle prestazioni da spremere con driver più raffinati. Un'altra area di lieve lamentela riguarda l'offerta di prodotti solo SLC in sole due capacità. I concorrenti offrono unità in MLC o eMLC, che consentono un punto di ingresso inferiore in termini di costi, nonché capacità molto maggiori; in alcuni casi oltre 2 TB su una singola scheda. Certo, il mercato entry-level aziendale molto letto non è l’obiettivo del P320h, ma una maggiore varietà per soddisfare più esigenze potrebbe rendere la famiglia P320h più versatile.

Vantaggi

  • L'acceleratore di applicazioni PCIe più veloce che abbiamo testato fino ad oggi
  • Latenza media e di picco molto bassa
  • Eccellente parità di prestazioni in ambienti Windows e Linux

Svantaggi

  • Limitato alla NAND SLC
  • Il massimo è di 700 GB

Conclusione

Micron RealSSD P320h è un'offerta completa e ben eseguita per le aziende che desiderano il meglio di ciò che lo storage PCIe ha da offrire. Il P320h è il migliore della sua categoria, garantendo prestazioni multi-OS eccellenti e costanti grazie ai componenti Micron e alla proprietà intellettuale di gestione NAND superiore integrata nel controller.

Product Page

Discuti questa recensione