In het datacenter is er een eindeloze race tussen processors en opslag. In de afgelopen tien jaar hebben processors het aantal kernen dat ze bevatten verhoogd van één of twee naar 8, 16, 32 of zelfs 64. Opslagtechnologieën hebben in deze periode hun latentie drastisch verminderd en de gegevensdoorvoer vergroot. De realiteit is echter dat er veel te veel CPU-cycli worden verspild aan het wachten op gegevens die zich op PCIe-apparaten of op netwerkopslag bevinden. We bereiken een keerpunt met de opkomst van een nieuw type opslaghardware: Storage Class Memory (SCM). SCM bevindt zich op het geheugenkanaal, dat niet wordt gehinderd door latentie en databandbreedtebeperkingen van perifere opslag. Omdat SCM zich op het geheugenkanaal bevindt, bevindt het zich veel dichter bij de CPU, wat betekent dat het meer gelijktijdige "zwembanen" heeft om gegevens naar moderne CPU's te vervoeren. Dit verhoogt de snelheid waarmee gegevens door de processor kunnen worden benaderd aanzienlijk.
In het datacenter is er een eindeloze race tussen processors en opslag. In de afgelopen tien jaar hebben processors het aantal kernen dat ze bevatten verhoogd van één of twee naar 8, 16, 32 of zelfs 64. Opslagtechnologieën hebben in deze periode hun latentie drastisch verminderd en de gegevensdoorvoer vergroot. De realiteit is echter dat er veel te veel CPU-cycli worden verspild aan het wachten op gegevens die zich op PCIe-apparaten of op netwerkopslag bevinden. We bereiken een keerpunt met de opkomst van een nieuw type opslaghardware: Storage Class Memory (SCM). SCM bevindt zich op het geheugenkanaal, dat niet wordt gehinderd door latentie en databandbreedtebeperkingen van perifere opslag. Omdat SCM zich op het geheugenkanaal bevindt, bevindt het zich veel dichter bij de CPU, wat betekent dat het meer gelijktijdige "zwembanen" heeft om gegevens naar moderne CPU's te vervoeren. Dit verhoogt de snelheid waarmee gegevens door de processor kunnen worden benaderd aanzienlijk.
Omdat SCM veel sneller is dan de gewone datacenteropslagoplossing, kan het de manier waarop we opslag gebruiken veranderen. Hoewel SCM het potentieel heeft om opslag aan de leiding te geven in de datacentertechnologierace, zal het daar alleen in slagen als we ervan kunnen profiteren - wat heel goed mogelijk is met de ontwikkelde mogelijkheid om de kracht van SCM voor gegevensopslag effectief te benutten. In dit artikel leggen we uit wat SCM is en bespreken we wat het zo transformatief maakt: de belofte van deze technologie, ons testproces en waarom we denken dat het transformatief kan zijn in het datacenter.
Een van de problemen met veel nieuwe hardwaretechnologieën is dat ze een herschrijving of herarchitectuur van applicaties of services kunnen vereisen om te kunnen profiteren van hun mogelijkheden. Een goed voorbeeld hiervan is wanneer het nodig was om multithreaded code te schrijven om te profiteren van multi-coreprocessors toen ze voor het eerst uitkwamen. SCM bevond zich in dezelfde situatie totdat een bedrijf, Formule Zwart, bedacht een manier om bestaande, ongewijzigde applicaties te laten profiteren van SCM om de applicatieprestaties te versnellen. Formule Zwart ontwikkelde geheugenbeheersoftware die een standaard POSIX-compatibel blokapparaat presenteert voor toepassingen om SCM zonder enige wijziging te gebruiken. Vroege tests door Formulas Black laten zien dat applicaties die gebruik maken van SCM-ondersteunde opslag aanzienlijke prestatieverbeteringen laten zien. We zullen deze voordelen verifiëren en kwantificeren in de StorageReview.com-labs.
Voordat we ingaan op de bijzonderheden van Formulas Black, willen we eerst een korte opfrissing geven van SCM en de achtergrond ervan. SCM is heel anders dan elke andere serveropslag die we hebben gezien doordat processors er toegang toe hebben via de geheugenbus via DIMM-slots, in plaats van via een perifere bus (zoals het geval is met NVMe en SSD/HDD) - en deze processormethode toegang vertaalt zich in een substantiële vermindering van de latentie. In tegenstelling tot DRAM (dat niet persistent is), bewaart SCM informatie na een stroomstoring of na een herstart. Hoewel SCM andere mogelijkheden heeft dan SSD/HDD-technologieën, zijn de snelheid waarmee het toegankelijk is en de persistentie verreweg de belangrijkste.
De ontwikkeling van de technologie om SCM te realiseren heeft lang geduurd. Omdat je NAND (dat momenteel wordt gebruikt in SSD-apparaten) niet zomaar in DIMM-slots kunt pluggen en verwachten dat het goed presteert, moest er een nieuwe vorm van halfgeleiders worden ontwikkeld. Intel liep voorop op het gebied van SCM-technologie met zijn 3D XPoint-chip die het gebruikt in zijn Optane DC permanent geheugen productlijn.
Vroege tests door Intel laten zien dat 3D XPoint 100 keer sneller is dan NAND, maar slechts 10 keer langzamer dan DRAM. Ondanks dat het een stuk langzamer is dan DRAM, ondersteunt 3D XPoint apparaten met een hogere capaciteit, kost het minder en heeft het, zoals opgemerkt, gegevenspersistentie - wat DRAM niet heeft. Hoewel er verschillende SCM PMEM-producten op de markt zijn, zullen we ons ter wille van de eenvoud en aangezien Intel op dit moment de leider in het veld lijkt te zijn, concentreren op het SCM-aanbod in dit artikel.
Toen SCM-producten eenmaal beschikbaar waren, moesten bedrijven de beste manier vinden om deze technologie te benutten - en dat deed Formulus Black met galeislaaf. Forsa is een softwarestack waarmee een apparaat op blokniveau kan worden gemaakt en beheerd, een logisch uitgebreid geheugen (LEM) genaamd, waarbij SCM of DRAM als fysieke geheugenmedia wordt gebruikt. Omdat een LEM POSIX-compatibel is, kan een applicatie deze rechtstreeks gebruiken; je kunt er een standaard bestandssysteem op mounten, of het kan gebruikt worden door een virtuele machine (VM). Ter verduidelijking: Forsa kan ook worden gebruikt met DRAM, maar de tests die we in ons StorageReview.com-lab zullen uitvoeren, zijn met Optane DC Persistent Memory (DCPMM).
Er zijn andere apparaatstuurprogramma's op blokniveau voor DCPMM, maar in tegenstelling tot andere apparaten op blokniveau, heeft Formulaus Black de LEM voorzien van bedrijfsopslagfuncties zoals gegevensintegriteit, real-time gegevensreductie, klonen, snapshots, hoge beschikbaarheid, enz. Deze functies kunnen worden gebruikt (ongeacht of de LEM wordt gebruikt door een VM) als een bestandssysteem of rechtstreeks door een toepassing. Bovendien behandelt FORSA de complexiteiten die uniek zijn voor het gebruik van het geheugenkanaal, zoals stock DCPMM heeft geen NUMA-bewustzijn, terwijl FORSA LEM's NUMA-bewust zijn vanwege hun NURA-architectuur. In plaats van bijvoorbeeld vier afzonderlijke SCM-opslagregio's op de Lenovo SR950-server in ons testlab te moeten inrichten en beheren, wijst Forsa alle SCM-geheugenregio's toe aan alle NUMA-knooppunten op een multi-socketserver en stelt u in staat om SCM- gebaseerde LEM's die de totale SCM-capaciteit van alle gebruiken.
Het maken en inschakelen van LEM's met de bovengenoemde zakelijke functies is heel eenvoudig, omdat Forsa een gelikte webgebaseerde gebruikersinterface heeft. Omdat Formulalus Black echter een API-first-mentaliteit heeft, zijn alle LEM-beheerfuncties toegankelijk via hun RESTful API.
Om de gegevensintegriteit te waarborgen, heeft Forsa een Central Fault Tolerance Manager (CFTM) die geheugenfouten controleert en Bad Block Replacement (BBR) uitvoert.
Om de gegevensefficiëntie te verbeteren, biedt Formulus Black ook een functie voor gegevensreductie, een real-time inline algoritme dat hun eigen Formule Bit Marker (FbM)-technologie gebruikt om dubbele gegevens te verminderen. Vroege tests door Formulas Black geven aan dat FbM de hoeveelheid onbewerkte gegevens die op dezelfde fysieke geheugenmedia kan worden opgeslagen, kan vergroten en de effectieve kosten per GB voor het gebruik van geheugen als snel opslagniveau kan verlagen. In een niche-casetest waarin ze veel RHEL VM-instanties hebben geïmplementeerd, beweren ze echter dat FbM de effectieve opslagcapaciteit van het geheugen met meer dan 20x heeft vergroot. Dit is te danken aan het vermogen van FbM om gegevenspatronen te detecteren, zoals golden image-instanties van RHEL en andere toepassingsgegevens die over meerdere instanties van virtuele machines lopen.
Voor gegevensbescherming kan Forsa worden gebruikt in High Availability (HA)-modus, waarin het een spiegelbeeld creëert van de LEM die u wilt beschermen op een tweede knooppunt. We zien dat de HA-modus buitengewoon handig is met hoogwaardige LEM's, of bij gebruik van DRAM als opslagback-up, omdat deze niet-persistent is.
U kunt LEM's ook beschermen door er een back-up van te maken op een SSD-opslagapparaat. De back-upfunctie van Forsa, BLINK, is er een die u kunt gebruiken op alle of slechts enkele LEM's op een systeem. Net als de HA-modus zien we dat BLINK buitengewoon nuttig is met hoogwaardige LEM's of bij gebruik van DRAM als opslagback-up, aangezien het niet-persistent is.
Er kunnen gevallen zijn waarin de LEM die u wilt maken de capaciteit van de DRAM of SCM op een enkele server overschrijdt. Om aan deze situaties tegemoet te komen, kunt u Forsa gebruiken om een LEM te maken die zich uitstrekt over twee servers waarop Forsa draait.
De vereisten om Forsa te gebruiken zijn vrij losjes en je kunt ze vinden op de Formulas Black-website. De vereisten voor Intel Optane DC Persistent Memory zijn strenger, aangezien het alleen wordt ondersteund op bepaalde moederborden en bepaalde modellen van hun nieuwste processors. Voor onze tests gebruiken we een goed uitgeruste Lenovo SR950-server. De SR950 die we gaan gebruiken heeft 768 GB RAM, 4 x 8280M CPU's, een ingebouwde SATA m.2 SSD die zal worden gebruikt om op te starten, en 12x 1.6 TB Intel P4610 NVMe SSD's. In onze vorige tests zagen we indrukwekkende prestatieresultaten. In VDBench-workloads kon het meer dan 5 miljoen IOPS leveren in 4K lezen en 3.2 miljoen IOPS in 4K schrijven. Dit is het perfecte systeem om Forsa te testen, omdat het niet wordt gehinderd door CPU-prestatieproblemen. A volledige recensie van de SR950 is hier te vinden.
Enkele applicaties, zoals SAP HANA, zijn herschreven of aangepast om te profiteren van DCPMM-technologie, maar de overgrote meerderheid niet. Naast het potentieel om deze extreem snelle opslag te gebruiken, breidt Forsa de mogelijkheden van DCPMM uit omdat het functies ondersteunt waar zakelijke klanten om vragen, zoals HA, back-up en datareductie via FbM. Formulas Black Forsa belooft veel en we kijken ernaar uit om ermee te werken in ons lab. De mogelijkheid om te profiteren van SCM-technologie zonder applicaties te herschrijven of opnieuw te ontwerpen, zou van Forsa de killer-applicatie voor DCPMM kunnen maken.
Formulus Black heeft enkele gedurfde beweringen gedaan dat Forsa de snelste blokopslaginterface voor persistent geheugen op de markt is en beweert dat Forsa LEM's zelfs beter hebben gepresteerd dan native bestandssystemen met persistent geheugen. Bij StorageReview kijken we ernaar uit om ermee in ons lab te werken en deze claims te testen.
Formule Black gratis proefversie
Formulas Black productoverzicht (PDF)
Dit rapport is gesponsord door Formulas Black. Alle standpunten en meningen in dit rapport zijn gebaseerd op onze onbevooroordeelde kijk op het (de) product(en) in kwestie.