Home Enterprise Micron RealSSD P320h Enterprise PCIe-test

Micron RealSSD P320h Enterprise PCIe-test

by Kevin OBrien

De Micron RealSSD P320h is een half-height, half-length (HHHL) applicatieversneller die gebruikmaakt van SLC NAND en een PCIe Gen 2 x8-interface om de geciteerde prestaties van 3.2 GB/s sequentieel lezen en tot 785,000 willekeurig gelezen IOPS te stimuleren. De P320h-architectuur wijkt af van veel van de andere recente applicatieversnellers die we hebben beoordeeld en die over het algemeen meerdere flashdrives samen RAIDen. Het Micron-aanbod is anders, in plaats daarvan gebruikt het RAIN (redundante array van onafhankelijke NAND) met aangepaste controller, wat vergelijkbaar is met de aanpak van Fusion-io en Virident. Dankzij deze architectuur kan Micron bogen op een aantal onstuimige snelheids- en latentieclaims, terwijl het een hoog niveau van gegevensbeveiliging op de schijf biedt. In deze recensie testen we een paar van de 700 GB-kaarten en zullen we niet alleen zien hoe snel ze op zichzelf gaan, maar ook hoe de P320h schaalt in Windows Server 2012.


De Micron RealSSD P320h is een half-height, half-length (HHHL) applicatieversneller die gebruikmaakt van SLC NAND en een PCIe Gen 2 x8-interface om de geciteerde prestaties van 3.2 GB/s sequentieel lezen en tot 785,000 willekeurig gelezen IOPS te stimuleren. De P320h-architectuur wijkt af van veel van de andere recente applicatieversnellers die we hebben beoordeeld en die over het algemeen meerdere flashdrives samen RAIDen. Het Micron-aanbod is anders, in plaats daarvan gebruikt het RAIN (redundante array van onafhankelijke NAND) met aangepaste controller, wat vergelijkbaar is met de aanpak van Fusion-io en Virident. Dankzij deze architectuur kan Micron bogen op een aantal onstuimige snelheids- en latentieclaims, terwijl het een hoog niveau van gegevensbeveiliging op de schijf biedt. In deze recensie testen we een paar van de 700 GB-kaarten en zullen we niet alleen zien hoe snel ze op zichzelf gaan, maar ook hoe de P320h schaalt in Windows Server 2012.

Zoals opgemerkt, spelen drive-architectuur en NAND-beheerbeleid een cruciale rol in termen van apparaatprestaties, zowel vanuit doorvoer- als latentieperspectief. Met de P320h combineert Micron hun eigen IP met ASIC-ontwerp en fabricage van IDT. Het nettoresultaat is een ASIC-controller met Micron-eigen intelligentie rond NAND-beheer en -besturing, waaronder RAIN. De RAIN-benadering van Micron is zeer efficiënt in de manier waarop het omgaat met NAND en die efficiëntie is uiteindelijk wat de prestaties en gegevensbescherming van de P320h aandrijft. Micron gebruikt wat neerkomt op een 7+1P RAID5-architectuur binnen RAIN. Omdat de striping op het 7+1-niveau wordt gebruikt, kan Micron dezelfde prestaties leveren als een schijf zonder pariteit, terwijl het toch de gegevensbescherming biedt die bedrijven nodig hebben.

Hoewel de P320h interessant is dankzij Micron NAND-beheertechnieken, is hij fysiek ook interessant. De HHHL-printplaat zit vol met Micron-onderdelen, waaronder natuurlijk de SLC NAND en DDR, en er is geen externe stroomaansluiting nodig om maximale prestaties te bereiken. Onze schijven van 700 GB hebben 64 NAND-stukken op het bord die worden benadrukt door het passieve koellichaam op de enkele controller. Het ontwerp met één controller zorgt voor betere prestaties en betrouwbaarheid dan concurrerende oplossingen die afhankelijk zijn van het combineren van meerdere controllers via hardware en software. Het gebruik van een controller die speciaal is ontworpen voor Micron NAND geeft Micron nog een voordeel als het gaat om interoperabiliteit, prestaties en ondersteuning van de schijf. In tegenstelling tot wat elders is gemeld, ondersteunt de schijf NVMe niet, maar Micron gaat zeker die kant op met toekomstige producten.

Micron biedt de P320h aan in twee SLC-only capaciteiten, 350GB en 700GB bruikbaar. Een schijf van 350 GB begint als 512 GB RAW, maar na aftrek van 12.5% voor RAIN en vervolgens 22% voor overprovisioning, komt de schijf uit op 350 GB. De P320h levert tot 25 PB uithoudingsvermogen voor het 350 GB-model en 50 PB voor het 700 GB-model en wordt geleverd met softwaretools voor schijfbeheer en gezondheidsrapportage.

Micron RealSSD P320h-specificaties

  • Capaciteiten
    • 350 GB (MTFDGAR350SAH-1N1AB)
      • Sequentieel lezen: 3.2 GB/s (128 KB, stabiele toestand)
      • Sequentieel schrijven: 1.9 GB/s (128 KB, stabiele toestand)
      • Willekeurig lezen: 785,000 IOPS (4KB, stabiele toestand)
      • Willekeurig schrijven: 175,000 IOPS (4KB, stabiele toestand)
    • 700 GB (MTFDGAR700SAH-1N1AB)
      • Sequentieel lezen: 3.2 GB/s (128 KB, stabiele toestand)
      • Sequentieel schrijven: 1.9 GB/s (128 KB, stabiele toestand)
      • Willekeurig lezen: 785,000 IOPS (4KB, stabiele toestand)
      • Willekeurig schrijven: 205,000 IOPS (4KB, stabiele toestand)
  • Gereed latency: <42 µs (512 bytes)
  • Schrijflatentie: <9µs
  • Interface: PCIe Gen2 x8
  • Vermogen: 25W maximaal, 10W inactief
  • Vormfactor: HHHL
  • Native commando's die tot 256 commando's in de wachtrij plaatsen
  • Uithoudingsvermogen: 350 GB – 25 PB, 700 GB – 50 PB
  • Afmetingen: 68.90mm x 167.65mm x 18.71mm
  • Bedrijfstemperatuur: 0°C tot +50°C
  • OS Compatibiliteit
    • Microsoft: Windows Server 2008 R2 SP1 (x86-64), Windows Server 2008 R2 SP1 Hyper-V (x86-64), Windows Server 2012 (x86-64) SP128, Windows Server 2012 Hyper-V (x64)
    • Linux: RHEL Linux 5.5, 5.6, 5.7, 5.8 (SP128), 6.1, 6.2 (x86-64), SLES Linux 11 SP1 en SP2 (x86-64)
    • Open source GPL (Kernel Rev. 2.6.25+)
  • Einde levensduur Gegevensbewaring 1 jaar

Video overzicht

Bouw en Ontwerp

De Micron RealSSD P320h is een Half-Height Half-Length x8 PCI-Express-kaart met de meest eenvoudige PCIe AA-indeling op de markt qua ontwerp. Met een enkele controller en twee kleine dochterkaarten is het slanker dan elke andere oplossing die we tot nu toe hebben getest, en verreweg de minst complexe. Dit werkt op meerdere manieren in het voordeel van Micron. Ten eerste past de kaart automatisch in bijna alle servers op de markt die PCIe-uitbreidingskaarten ondersteunen, maar het speelt ook een rol bij het vergelijken van de algehele betrouwbaarheid van bedrijfsoplossingen. Met een enkele controller en niet eens een PCIe-switch zoals gevonden op de Fusion-io "Duo" -aanbiedingen, zijn er minder onderdelen die defect kunnen raken. Dit staat in schril contrast met de configuraties met meerdere controllers die te vinden zijn op sommige concurrerende oplossingen die meerdere SandForce-controllers samen RAIDen. In een markt die een hekel heeft aan het uitschakelen van platforms als ze eenmaal in productie zijn, behalve de uiteindelijke vervanging onderweg, is het een enorm pluspunt om te weten dat het apparaat dat je vandaag hebt geïnstalleerd jarenlang zal werken zonder problemen te veroorzaken.

De kern van de Micron RealSSD P320h is een aangepaste Micron/IDT ASIC-controller die uniek is voor deze oplossing. Op onze twee voorbeelden van 700 GB wordt deze controller vervolgens gekoppeld aan een pool van 1 TB Micron SLC NAND en gebufferd met 2.25 GB Micron DDR RAM. Afhankelijk van hoe je het bekijkt, bieden die items een enorm voordeel van Micron, omdat ze zeer gedetailleerde kennis hebben van hoe al die componenten op kernniveau werken door ze in huis te hebben.

De Micron RealSSD P320h is erg wendbaar als het gaat om stroomverbruik en verbruikt minder dan 25 watt uit een PCIe 2.0 x8-bus; geen externe stroomaansluiting nodig. Dit geeft de P320h meer flexibiliteit als het gaat om het vinden van geschikte platforms om in te installeren, zonder dat er extra voedingskabels of testservers nodig zijn om stroom te leveren via PCIe-specificatie.

management Software

Hoewel de meeste applicatieversnellers met wat software worden geleverd, varieert de bruikbaarheid en effectiviteit van die tools van uitstekend tot slecht. Micron biedt hun RealSSD Manager-tools die zijn ontworpen om het beheer van de P320h effectiever te maken, inclusief zowel een CLI als een GUI. Deze tools zijn compatibel met zowel Windows als Linux en bieden een breed scala aan functies. Gebruikers kunnen deze softwaretools gebruiken voor het updaten van schijffirmware, het controleren van de gezondheid van de PCIe AA en het initiëren van een apparaatformattering. Op het meer geavanceerde niveau kunt u het huidige gebruik en de temperatuur van de schijf volgen, met ingebouwde logmogelijkheden.

Vergeleken met de door de fabrikant meegeleverde hulpprogramma's die we tot nu toe hebben gezien, komt Micron's direct onder Fusion-io in termen van functieset en algemeen ontwerp. Hoewel het een beetje beknibbelt op het ontwerp in vergelijking met ioSphere, biedt de Micron RealSSD Manager veel van dezelfde beheer- en monitoringmogelijkheden, zij het alleen op lokaal niveau. Momenteel ondersteunt het geen bewakingsapparaten op externe systemen, maar over het algemeen biedt het een enorme verbetering in functies in vergelijking met LSI- of OCZ-beheertools.

Achtergrond en vergelijkingen testen

Als het gaat om het testen van bedrijfshardware, is de omgeving net zo belangrijk als de testprocessen die worden gebruikt om deze te evalueren. Bij StorageReview bieden we dezelfde hardware en infrastructuur als in veel datacenters waar de apparaten die we testen uiteindelijk voor bestemd zijn. Dit omvat alleen testen met bedrijfsservers en de juiste infrastructuurapparatuur zoals bedrijfsnetwerken, rackruimte, stroomconditionering/bewaking en vergelijkbare hardware van dezelfde klasse om goed te evalueren hoe een apparaat presteert. Geen van onze beoordelingen wordt betaald of gecontroleerd door de fabrikant van de apparatuur die we testen; met relevante vergelijkingen die naar eigen goeddunken zijn gekozen uit producten die we hebben in ons lab.

StorageReview Enterprise-testplatform:

Lenovo Think Server RD240

  • 2 x Intel Xeon X5650 (2.66 GHz, 12 MB cachegeheugen)
  • Windows Server 2008 Standard Edition R2 SP1 64-bits en CentOS 6.2 64-bits
  • Intel 5500+ ICH10R-chipset
  • Geheugen – 8 GB (2 x 4 GB) 1333 MHz DDR3 geregistreerde RDIMM's

Als het ging om het kiezen van vergelijkingsmateriaal voor deze review, kozen we de koplopers van elke fabrikant, maar alleen op gebieden die logisch waren in vergelijking met de met SLC uitgeruste Micron RealSSD P320h. Om die reden hebben we de eerste generatie LSI WarpDrive laten vallen toen deze werd vervangen door de tweede generatie Nytro WarpDrive, evenals de OCZ Z-Drive R4 die te ver buiten de latentiecurve viel voor de behoeften van de markt voor krachtige bedrijfsopslag .

640GB Fusion-io ioDrive Duo

  • Vrijgegeven: 1H2009
  • NAND-type: MLC
  • Besturing: 2 x Eigendom
  • Apparaatzichtbaarheid: JBOD, software-RAID afhankelijk van het besturingssysteem
  • Fusion-io VSL Windows: 3.1.1
  • Fusion-io VSL Linux 3.1.1

200GB LSI Nytro WarpDrive WLP4-200

  • Vrijgegeven: 1H2012
  • NAND-type: SLC
  • Controller: 4 x LSI SandForce SF-2500 via LSI SAS2008 PCIe naar SAS Bridge
  • Apparaatzichtbaarheid: vaste hardware RAID0
  • LSI-vensters: 2.10.51.0
  • LSI Linux: native CentOS 6.2-stuurprogramma

700 GB Micron RealSSD P320h

  • Vrijgegeven: 2H2011
  • NAND-type: SLC
  • Besturing: 1 x Eigendom
  • Toestelzichtbaarheid: enkel toestel
  • Micron-vensters: 7.03.3452.00
  • MicronLinux: 1.3.7-1

Enterprise synthetische werklastanalyse (voorraadinstellingen)

De manier waarop we naar PCIe-opslagoplossingen kijken, gaat dieper dan alleen kijken naar traditionele burst- of steady-state-prestaties. Als je naar de gemiddelde prestaties over een lange periode kijkt, verlies je de details uit het oog van hoe het apparaat over die hele periode presteert. Aangezien de prestaties van flash sterk variëren naarmate de tijd verstrijkt, analyseert ons nieuwe benchmarkingproces de prestaties op gebieden als totale doorvoer, gemiddelde latentie, pieklatentie en standaarddeviatie over de gehele preconditioneringsfase van elk apparaat. Bij high-end enterprise-producten is latentie vaak belangrijker dan doorvoer. Om deze reden doen we er alles aan om de volledige prestatiekenmerken te laten zien van elk apparaat dat we gebruiken Enterprise testlab.

We hebben ook prestatievergelijkingen toegevoegd om te laten zien hoe elk apparaat presteert onder een andere driverset voor zowel Windows- als Linux-besturingssystemen met behulp van de Fio-workloadgenerator. Voor Windows gebruiken we de nieuwste stuurprogramma's ten tijde van de oorspronkelijke beoordeling, waarna elk apparaat wordt getest onder een 64-bits Windows Server 2008 R2-omgeving. Voor Linux gebruiken we de 64-bits CentOS 6.2-omgeving, die elke Enterprise PCIe Application Accelerator ondersteunt. Ons belangrijkste doel met deze tests is om te laten zien hoe de prestaties van het besturingssysteem verschillen, aangezien het hebben van een besturingssysteem dat op een productblad als compatibel wordt vermeld, niet altijd betekent dat de prestaties ervan gelijk zijn.

Alle geteste apparaten vallen van begin tot eind onder hetzelfde testbeleid. Momenteel worden apparaten voor elke afzonderlijke werklast veilig gewist met behulp van de tools die door de leverancier worden geleverd, gepreconditioneerd in stabiele toestand met dezelfde werklast waarmee het apparaat zal worden getest onder zware belasting van 16 threads met een uitstekende wachtrij van 16 per thread, en vervolgens getest met vaste intervallen in profielen met meerdere threads/wachtrijen om de prestaties bij licht en zwaar gebruik te tonen. Voor tests met 100% leesactiviteit is preconditionering met dezelfde werkbelasting, hoewel omgedraaid naar 100% schrijven.

Voorconditionering en primaire steady-state tests:

  • Doorvoer (lezen+schrijven IOPS aggregaat)
  • Gemiddelde latentie (lees- en schrijflatentie samen gemiddeld)
  • Maximale latentie (piek lees- of schrijflatentie)
  • Latentie Standaarddeviatie (Lezen + Schrijven Standaarddeviatie samen gemiddeld)

Op dit moment omvat Enterprise Synthetic Workload Analysis vier veelvoorkomende profielen, die kunnen proberen de werkelijke activiteit weer te geven. Deze werden uitgekozen om enige gelijkenis te vertonen met onze eerdere benchmarks, evenals een gemeenschappelijke basis voor vergelijking met algemeen gepubliceerde waarden zoals max. 4K lees- en schrijfsnelheid, evenals 8K 70/30 die vaak wordt gebruikt voor zakelijke schijven. We hebben ook twee verouderde gemengde workloads opgenomen, waaronder de traditionele bestandsserver en webserver die een brede mix van overdrachtsgroottes bieden. Deze laatste twee worden uitgefaseerd met toepassingsbenchmarks in de categorieën die op onze site worden geïntroduceerd, en vervangen door nieuwe synthetische workloads.

  • 4K
    • 100% lezen of 100% schrijven
    • 100% 4K
  • 8K 70/30
    • 70% lezen, 30% schrijven
  • file Server
    • 80% lezen, 20% schrijven
    • 10% 512b, 5% 1k, 5% 2k, 60% 4k, 2% 8k, 4% 16k, 4% 32k, 10% 64k
  • webserver
    • 100% gelezen
    • 22% 512b, 15% 1k, 8% 2k, 23% 4k, 15% 8k, 2% 16k, 6% 32k, 7% 64k, 1% 128k, 1% 512k

Op weg naar onze eerste test, die een 4K random write preconditioning-workload omvat, begint de Micron RealSSD P320h hoog, met burst-snelheden van net onder de 400 IOPS in onze Lenovo ThinkServer. De prestaties stabiliseerden zich boven 200 IOPS rond de 80 minuten, met zeer vergelijkbare prestaties tussen onze CentOS 6.2 en Windows Server 2008 testomgevingen.

Als we kijken naar de gemiddelde latentie tijdens onze 4K-preconditioneringstest, was de P320h snel tevreden met iets meer dan 1 ms latentie met een belasting van 16T/16Q, ver onder de met SLC uitgeruste LSI Nytro WarpDrive.

Bij het vergelijken van de maximale latentie van Windows en Linux over de duur van onze preconditioneringswerklast, ontdekten we dat de Linux-omgeving de minste pieken met hoge latentie bood, terwijl de Windows-stuurprogramma's af en toe fladderden tot 1,000 ms.

Hoewel pieken van 1,000 ms verontrustend kunnen zijn, geeft het vergelijken van de standaarddeviatie een beter algemeen beeld van de algehele latentie gedurende de duur van de test. In het geval van de P320h, zelfs met zijn hogere pieken in Windows Server 2008, slaagde hij er nog steeds in om op de tweede plaats te komen na alleen zichzelf in Linux.

Nadat we de preconditioneringsfase hadden verlaten, namen we een langere steekproef van elke applicatieversneller in de 4K-workload met een belasting van 16T/16Q. De Micron RealSSD P320h bood verreweg de hoogste prestaties, zowel in 4K willekeurig lezen als willekeurig schrijven, met het voordeel dat werd gegeven aan de Linux-stuurprogrammaset. In CentOS hebben we 417 IOPS gelezen versus "slechts" 378 IOPS in Windows gemeten. De willekeurige schrijfsnelheid van 4K was consistent op beide platforms en bedroeg meer dan 202 IOPS.

Met de bijna ongelooflijke doorvoer was het geen verrassing dat de P320h de laagste gemiddelde latentie had. De gemiddelde leeslatentie kwam uit op iets meer dan 0.6 ms, met een schrijflatentie van 1.26 ms.

Bij het vergelijken van pieklatentie in onze laatste steekproef van 4K willekeurige lees- en schrijfprestaties, had de Micron RealSSD P320h enkele van de hoogste 4K willekeurige leesblips uit het stel in zowel Windows als Linux. Willekeurige schrijfprestaties waren meer gesplitst, met hogere pieklatentie aan de Windows-kant en lagere pieklatentie aan het Linux-segment.

Verder borend in de algehele latentie, bood de Micron realSSD P320h veruit de meest consistente willekeurige 4K-prestaties in Linux, en iets minder met zijn Windows-stuurprogramma's.

Onze volgende test verschuift de focus naar onze 8K 70/30-workload, waar de Micron P320h opnieuw de groep leidt met een ruime marge in doorvoer. In dit segment gingen de burst-snelheden in 30 minuten over in de test en stabiliseerden ze zich rond de 120 minuten in een stabiele toestand.

De P320h bood een zeer lage gemiddelde latentie in onze 8K 70/30-workload, die ongeveer 1.5 ms bedroeg tijdens het preconditioneringsproces. De Linux-driverset bood een kleine voorsprong, maar in het algemene schema zou je dat verschil moeilijk opmerken.

Door de focus te verschuiven van gemiddelde naar pieklatentie, is er een merkbaar verschil tussen het gedrag in Windows en in Linux. De Windows-stuurprogramma's hadden een maximale responstijd tussen 1,000 en 1,200 ms, terwijl de Linux-kant lager was met ongeveer 200 ms.

Hoewel pieklatentie de slechtste enkele reactietijden laat zien, wordt in onze volgende sectie gekeken naar standaarddeviatie om te zien hoe het algemene beeld van latentie zich ontwikkelde tijdens onze preconditioneringsfase. In Linux bood de Micron P320h veel meer consistentie in vergelijking met de Windows-kant. Hoewel de Windows-prestaties minder consistent waren, stond het nog steeds in het midden van het peloton.

Vergeleken met de vaste werklast van 16 threads en max. 16 wachtrijen die we hebben uitgevoerd in de 100% 4K-schrijftest, schalen onze gemengde werklastprofielen de prestaties over een breed scala aan thread/wachtrij-combinaties. In deze tests variëren we onze werkbelasting van 2 threads en 2 wachtrijen tot 16 threads en 16 wachtrijen. De Micron P320h bood een indrukwekkende voorsprong op grotere wachtrijdiepten ten opzichte van de vergelijkbare apparaten in deze groep, terwijl hij slechts minimale prestaties op het 2T/2Q-niveau opgaf. Over het hele spectrum bood de Linux-driverset een hogere doorvoer in de meeste gebieden met een kleine marge.

De Micron RealSSD P320h bood de beste reactietijden van de groep in alle behalve de 2T/2Q-belasting, en bleef onder de 1 ms voor alle behalve het 16T/16Q-segment.

De hogere reactietijden begonnen op te duiken op de P320h in Windows tegen het midden van de test, met meer dan 4 gelijktijdige threads. De Linux-stuurprogramma's hielden die blips binnen de perken, behalve de hoogst effectieve QD128- en QD256-tests, die bijna 200 ms bedroegen.

Als we de standaarddeviatie vergelijken, bood de Micron RealSSD P320h zijn meest consistente prestaties onder Linux en stond hij in de middenmoot voor zijn Windows-driverset.

De werkbelasting van de bestandsserver vertegenwoordigt een groter spectrum van overdrachtsgrootte dat elk afzonderlijk apparaat raakt, dus in plaats van genoegen te nemen met een statische werklast van 4k of 8k, moet de schijf verzoeken van 512b tot 64K aan. De preconditioneringstest van de bestandsserver was het eerste gebied waar de Micron P320h niet beter presteerde dan de andere modellen wat betreft burst-snelheden, hoewel hij alleen maar sneller bleef worden vanuit de veilig gewiste toestand toen de test uitging. Terwijl het begon onder de 80 IOPS, overtrof het na 100 minuten de 120 IOPS in stabiele toestand. Deze overtrof de bestaande modellen in dit segment ver.

Kijkend naar de gemiddelde latentie, terwijl de Micron RealSSD P320h de steady-state naderde met een effectieve wachtrijdiepte van 256, scheerde hij met gemiddeld 2 ms mee met zijn reactietijden.

Door onze focus te verleggen naar piekresponstijden, vertoonde de Windows-driverset opnieuw hogere piekresponstijden, die tijdens onze test rond de 1,000 ms schommelden. Dit werd vergeleken met de Linux-stuurprogrammaset die een piekniveau handhaafde dat niet boven de 50 ms ging.

Hoewel de piekresponstijden er niet noodzakelijkerwijs goed uitzien, verleggen we onze focus naar standaarddeviatie om een ​​duidelijker beeld te schetsen van de algehele latentie van de Micron P320h. In dit gebied kun je enkele blips zien tijdens de testduur van de P320h in Windows, maar het behoudt nog steeds een niveau dat tot de laagste van de groep behoort.

Nadat we onze preconditioneringsfase hadden voltooid, vielen we in onze primaire tests met een belasting variërend van 16T/16Q tot 2T/2Q. De Micron RealSSD P320h begon snel en leidde het peloton met een aanzienlijke voorsprong naarmate de effectieve wachtrijdiepte toenam. Uiteindelijk bereikten de prestaties onder de 130 IOPS in onze dual-processor server.

Als we de gemiddelde latentie vergelijken, bood de P320h zijn top 130k IOPS-doorvoer bij 16T/4Q met een gemiddelde latentie van ongeveer 0.5 ms, oplopend tot 1-2 ms op de EQD128- en EQD256-niveaus.

Het maximale latency-beeld tijdens het hoofdsegment van onze File Server-test had dezelfde blips van 1,000 ms tijdens het Windows-segment van onze test als de vorige tests, waarbij de Linux-stuurprogramma's veel lagere piekresponstijden boden.

Als we de latency-standaarddeviatie vergelijken, bood de Micron RealSSD P320h de beste latency-spreiding van de groep in Linux, en kwam hij in het midden van het peloton in Windows.

In onze laatste synthetische werklast voor een webserverprofiel, wat traditioneel een 100% leestest is, passen we 100% schrijfactiviteit toe om elke schijf volledig te preconditioneren vóór onze hoofdtests. In deze test kwam de Micron RealSSD P320h uit met de snelste steady-state prestaties, maar nieuw in deze test was het duidelijke verschil in doorvoer tussen de Windows- en Linux-stuurprogramma's. De Linux-prestaties waren veel hoger en boden ook betere burst-prestaties.

Door de focus uit te schakelen naar gemiddelde latentie, bood de Micron P320h een vlakke curve vanaf iets meer dan 20 minuten in de test, waarbij de Linux-prestaties bijna 2 ms voorsprong hadden.

Vergeleken met de gemengde lees/schrijf-workloads in eerdere tests die frequente blips van 1,000 ms van de P320h vertoonden, was de preconditioneringstest van de webserver in vergelijking veel rustiger. Dat gezegd hebbende, de Linux-kant was nog rustiger en vertoonde geen haperingen in latentie tijdens het preconditioneringsproces.

Vergelijking van de standaarddeviatie van de latentie in de preconditioneringsfase van onze webserver, de Micron RealSSD P320h bood verreweg de meest consistente latentie, zelfs als we de blips van de Windows-stuurprogramma's meenemen. Als we kijken naar de zeer milde latentiehelling toen de schijf de stabiele toestand naderde, zien we dat de prestaties tussen 60 en 80 minuten volledig zijn afgevlakt.

Overschakelend naar het hoofdsegment van onze webservertest met een 100% leesprofiel, leidde de Micron P320h nog steeds het peloton in alle categorieën, behalve de Windows-prestaties in het 2T/2Q-gedeelte van onze test. Een interessant aspect dat de prestaties vergelijkt, is dat terwijl de Linux-kant betere schrijfprestaties bood, de Windows-driverset hogere leesprestaties bood. Dit resulteerde in hogere Windows-prestaties in alle secties met een zwaardere wachtrijdiepte en een veel hogere topsnelheid (152k versus 170k IOPS)

De gemiddelde latentie van de Micron RealSSD P320h bleef in alle stadia onder de 1 ms, behalve wanneer de effectieve wachtrijdiepte 256 was. Als we de piekdoorvoer vergelijken met de gemiddelde latentie, vinden we dat de sweet spot van deze kaart in onze webservertracering tussen een effectieve wachtrijdiepte van 64 ligt. en 128.

Hoewel de Windows-stuurprogramma's uiteindelijk de overhand kregen in termen van doorvoer en gemiddelde latentie, zweefden de maximale responstijden nog steeds in de buurt van 1,000 ms over de meeste delen van de test; de Linux-prestaties hadden geen hoge latentiepieken

Bij het vergelijken van de standaarddeviatie van latentie tussen de schijven in deze groep, bood de Micron RealSSD in Linux de beste latentiespreiding, terwijl de Windows-stuurprogramma's in het midden van het peloton kwamen.

Analyse van synthetische werkbelasting voor ondernemingen (meerdere schijven/netwerk)

Uitgerust met twee 700 GB Micron RealSSD P320h PCIe Application Accelerators, hebben we een testomgeving geconfigureerd die bestond uit een krachtige Supermicro-server met Windows Server 2012. Dit testplatform was via twee afzonderlijke PCIe 3.0 Mellanox InfiniBand-adapters verbonden met onze SX6036 IB-switch, met twee HP Proliant DL380p Gen8-servers draaien ook op Windows Server 2012. Op de krachtige Supermicro-opslagserver hebben we een eenvoudige opslagarray gemaakt met behulp van opslagruimten, die vervolgens werd gedeeld via SMB. In tegenstelling tot onze primaire benchmarks die het volledige LBA-oppervlak van de schijf testen, legden deze tests de nadruk op twee segmenten van 50 GB verspreid over het striped volume, zowel lokaal gebenchmarkt als via het InfiniBand-netwerk.

We hebben hieronder een overzichtsvideo van onze InfiniBand-tests opgenomen:

StorageReview 56Gb/s Enterprise-testplatform:

Super microcomputer SuperServer 7047R-TXRF

  • Supermicrocomputer X9DRX+-F
  • Dubbele Intel E5-2670 CPU's (2.6 GHz, 20 MB cache)
  • Windows Server 2012 DataCenter
  • 128 GB RAM (8 GB x 16 Hynix DDR3, 64 GB per CPU)

(2) HP Proliant DL380p Gen8

  • Intel Xeon E5-2640 (6 kernen, 2.50 GHz, 15 MB, 95 W)
  • Windows Server Standard 2012
  • Intel C600-chipset
  • 64 GB (8 x 8 GB) en 16 GB (4 x 4 GB) 1333 MHz DDR3 geregistreerde RDIMM's

Mellanox SX6036 56Gb/s InfiniBand-schakelaar en hardware

  • 36 56Gb/s FDR-poorten
  • Passieve QSFP-koperkabels
  • Mellanox ConnectX-3 VPI PCIe 3.0 dubbele 56Gb/s InfiniBand-adapter

Onze huidige InfiniBand high-performance interconnect testinfrastructuur bestaat uit twee HP Proliant DL380p Gen8-servers die zijn uitgerust met Mellanox ConnectX-3 VPI PCIe-adapters die zijn aangesloten via de 36-poorts 56Gb/s IB-switch van Mellanox. In deze omgeving kan het opslagapparaat dat we testen de I/O-bottleneck zijn, in plaats van de netwerkapparatuur zelf.

In onze lokale eenvoudige ruimte en InfiniBand-testsectie hebben we ons beperkt tot een beperkte selectie van tests, in plaats van onze volledige suite. Om de vergelijking te vergemakkelijken, hebben we onze 8K 70/30-workload gebruikt om het verschil in prestaties te laten zien tussen lokale toegang en gedeelde toegang via het netwerk.

Door een kleinere totale voetafdruk te gebruiken om op te testen vanaf onze primaire tests, ontdekten we dat de prestaties buitengewoon goed schaalden in een omgeving met twee kaarten. Lokaal, met twee werklastgeneratorsessies die tegelijkertijd worden uitgevoerd om de twee servers na te bootsen die over het netwerk draaien, hebben we prestaties gemeten van meer dan 490 IOPS in onze 8K 70/30 werklast. Door die single striped array over twee shares te presenteren en er toegang toe te krijgen vanaf onze twee HP Proliant DL380p Gen8-servers, daalden de prestaties tot 402k IOPS. We waren in staat om de doorvoer in beide scenario's meer dan te verdubbelen en toch uitstekende prestaties per server te behouden.

Als we kijken naar de gemiddelde latentie in onze twin-P320h-omgeving, was er enig verschil in gemiddelde latentie bij het vergelijken van lokale toegang versus externe toegang via InfiniBand, maar de latentie was nog steeds lager dan wat we gemeten hebben van één P320h in ons primaire testbed. Aangezien er een minimale latentie-impact was bij het delen van dit hoge I/O-apparaat tussen meerdere systemen, opent dit echt de deur voor het delen van dure, krachtige bronnen met meer dan één systeem.

Er was echt geen meetbaar verschil in pieklatentie bij het vergelijken van lokale toegang met toegang op afstand, wat belangrijk is wetende dat het InfiniBand-netwerk de latentie voor apparaten zoals PCIe Application Accelerators niet significant verhoogt.

Net als bij pieklatentie, zagen we geen waarneembaar verschil tussen de standaarddeviatie van de latentie die lokaal wordt waargenomen in een gestreepte omgeving of via ons InfiniBand-netwerk.

Nadat we hadden gezien dat de 8K 70/30-prestaties met twee gelijktijdige ladingen met een effectieve wachtrijdiepte van 256 elk een kleine prestatiedaling hebben via het netwerk versus lokaal, hebben we onze focus verlegd naar een variërende werklast variërend van 2T/2Q tot 16T/16Q . Aangezien dit op twee servers of twee lokale werklastgeneratoren tegelijkertijd gebeurde, zou de totale belasting 4T/2Q tot 32T/16Q zijn. Zowel lokale als netwerktoegang tot de gestreepte P320h-array bood dezelfde reactiesnelheid bij toenemende belasting. Beide tests toonden vrijwel identieke patronen over het volledige spectrum, waarbij de lokale toegang de beste prestaties bood.

Gemiddelde latentie in het hoofdgedeelte van onze 8K 70/30-workload op de gestreepte P320h-configuratie bood uitstekende prestaties lokaal en via ons netwerk. Het meest indrukwekkend zijn de InfiniBand-resultaten, waarbij elke server minder dan 0.8 ms latentie zag voor meer dan 400,000 IOPS over het netwerk.

Het vergelijken van de maximale latentie in de 8K 70/30-werklast met onze dual-P320h-opstelling toonde vergelijkbare resultaten lokaal versus op afstand, met beide met blips van meer dan 1,000 ms gedurende de duur van de test.

Vergelijkbaar met onze maximale latentieresultaten van hierboven, was er heel weinig verschil tussen lokale toegang tot de P320h-array of het delen ervan via Windows Storage Space via ons InfiniBand-netwerk.

Conclusie

De Micron RealSSD P320h is gewoon een geweldig voorbeeld van goed uitgevoerde techniek. Alles, van bordontwerp en lay-out tot de aangepaste controller, maakt de P320h tot een echt geïntegreerde eenheid, iets dat zelfs in de opslagruimte van een onderneming niet altijd het geval is. Micron vindt manieren om waarde toe te voegen aan de hele schijf, van NAND-beheer-IP in de aangepaste ASIC tot de diepst mogelijke NAND-karakterisering die leidt tot maximale prestaties en uithoudingsvermogen van de SLC-flashcomponenten.

Wanneer we de prestaties van de P320h evalueren, schreeuwt de schijf en behoudt hij bijna pariteit tussen onze CentOS- en Windows Server-testomgevingen. In termen van zijn betere omgeving had Linux altijd het voordeel, vooral als het ging om optimale latentie. Zeggen dat de Micron P320h snel is, is echter een beetje een understatement. Het overtrof elke andere oplossing die we tot nu toe hebben getest aanzienlijk, met hogere burst-snelheden dan de meeste en veel betere stationaire prestaties dan concurrerende oplossingen. Duikend in zijn reactievermogen, was de gemiddelde latentie onberispelijk, maar wat nog indrukwekkender is, waren de nieuwe foutloze Linux-prestaties, met een zeer lage pieklatentie en latentiestandaarddeviatie. De Windows-kant was niet al te ver weg, hoewel de pieklatentie en de standaarddeviatie van de latentie in vergelijking daarmee de middenmoot waren.

Als het op compatibiliteit aankomt, vonden we dat de Micron RealSSD P320h feilloos werkt in een bedrijfsomgeving. Voor ons heeft het geen zin om dit eersteklas enterprise-aanbod te testen op een consumentenplatform, aangezien het nooit in een productieomgeving zou worden gebracht die op één draait. Daartoe werkte het in de eerstelijnsservers waarin we het hebben getest zonder haperingen op meerdere besturingssystemen. De P320h had ook geen problemen met het werken in een configuratie met twee schijven in onze Supermicro SuperServer 7047R met Windows Server 2012, zoals te zien is in onze video.

Als we al veel gaan klagen, dan is het dat de Windows-omgeving enkele kleine verbeterpunten liet, vooral omdat we pieklatentie en standaarddeviatie in al onze workloads vergeleken. Zelfs met die hogere latentie overtrof het nog steeds veel, zo niet alle, PCIe-toepassingsversnellers die we hebben getest, maar we denken dat er nog wat prestaties over kunnen zijn die moeten worden uitgeperst met meer verfijnde stuurprogramma's. Een ander punt van kleine klacht is het productaanbod met alleen SLC in slechts twee capaciteiten. Concurrenten bieden schijven aan in MLC of eMLC, wat een lagere instapprijs mogelijk maakt, evenals veel grotere capaciteiten; in sommige gevallen meer dan 2 TB op een enkele kaart. Toegegeven, de beginnende zakelijke markt die intensief wordt gelezen, is niet het doel van de P320h, maar meer variatie om aan meer behoeften te voldoen, zou de P320h-familie veelzijdiger kunnen maken.

VOORDELEN

  • Snelste PCIe Application Accelerator die we tot nu toe hebben getest
  • Zeer lage gemiddelde en pieklatentie
  • Uitstekende prestatiepariteit in Windows- en Linux-omgevingen

NADELEN

  • Beperkt tot SLC NAND
  • Komt uit op 700 GB

Tot slot

De Micron RealSSD P320h is een goed uitgevoerd, compleet aanbod voor ondernemingen die het beste willen van wat PCIe-opslag te bieden heeft. De P320h presteert het best in zijn klasse en levert uitstekende en consistente multi-OS-prestaties dankzij Micron-componenten en superieur intellectueel eigendom voor NAND-beheer dat in de controller is geïntegreerd.

Product Page

Bespreek deze recensie