Home Enterprise ScaleFlux CSD 2000 recensie

ScaleFlux CSD 2000 recensie

by Adam Amstrong

ScaleFlux is een bedrijf dat zich uitsluitend richt op computationele opslag, meer specifiek computationele opslag op schaal. Dat doet het bedrijf voornamelijk met zijn ScaleFlux Computational Storage Drives (CSD). Zoals je misschien al geraden hebt aan de hand van hun naam, is de CSD een NVMe SSD die is geïntegreerd met computerengines die de schijf- en systeemprestaties kunnen verbeteren. Maar computationele opslag betekent veel verschillende dingen, afhankelijk van met wie u praat. In deze review krijgen we een voorproefje van het perspectief van ScaleFlux, met de ScaleFlux CSD 2000.

ScaleFlux is een bedrijf dat zich uitsluitend richt op computationele opslag, meer specifiek computationele opslag op schaal. Dat doet het bedrijf voornamelijk met zijn ScaleFlux Computational Storage Drives (CSD). Zoals je misschien al geraden hebt aan de hand van hun naam, is de CSD een NVMe SSD die is geïntegreerd met computerengines die de schijf- en systeemprestaties kunnen verbeteren. Maar computationele opslag betekent veel verschillende dingen, afhankelijk van met wie u praat. In deze review krijgen we een voorproefje van het perspectief van ScaleFlux, met de ScaleFlux CSD 2000.

ScaleFlux CSD 2000

Wat is computationele opslag?

We schrijven al een aantal jaren over computationele opslag hier bij StorageReview. In een notendop, computationele opslag is het nemen van rekenbronnen (die niet de reken- en/of geheugenarchitectuur van het systeem zijn) en deze in de opslag zelf plaatsen.

Soms worden deze rekenbronnen ook tussen de host en de opslag geplaatst. Dit kan het verplaatsen van gegevens verminderen, de computerresources van het systeem ontlasten en mogelijk de prestaties of op zijn minst prestatieconsistentie verbeteren. Er zijn echter veel leveranciers die deelnemen aan computeropslag, dus het is belangrijk om te begrijpen dat de term 'computeropslag' heel verschillende dingen kan betekenen, afhankelijk van het product.

ScaleFlux CSD 2000 en computeropslag

ScaleFlux CSD onderscheidt zich door de introductie van compressie/decompressie-engines voor datapaden. Volgens het bedrijf kan dit de capaciteit effectief verviervoudigen en de prestaties verdubbelen. Hierbij wordt er natuurlijk van uitgegaan dat de gegevens comprimeerbaar zijn, iets fundamenteels voor een goede werking van dit platform. Ervan uitgaande dat de voorwaarden goed zijn, wordt de effectieve capaciteit een sterk verkoopargument.

ScaleFlux CSD 2000 terug

Er moet ook een kosten- en dichtheidsargument worden aangevoerd. Door gegevens te comprimeren en effectievere capaciteit te genereren, kunnen organisaties volgens ScaleFlux tot 50% besparen op de kosten van flash. Ze kunnen dankzij compressie ook "meer" flitser in hetzelfde slot bieden.

Kosten en efficiëntie betekenen weinig zonder prestaties, waarvan ScaleFlux beweert dat ze kunnen worden verdubbeld ten opzichte van traditionele SSD's? De schijf wordt geleverd in zowel een Data Center- als een Data Scale-versie, maar laten we hier naar de topcijfers kijken. Het hoogste aantal met een 1:1 datacompressie is 750K IOPS in 4K lezen en 490K IOPS in 4K schrijven voor een 2:1 datacompressie. Voor sequentiële snelheden haalt de drive naar verluidt 3 GB/s in compressie en tot 2.3 GB/s in 1:1 compressie.

Een paar andere verschillen met de CSD zijn dat het afstembare FTL/FM heeft waarmee gebruikers de prestaties en prijs per GB kunnen optimaliseren. Hoge prestaties leveren kan leiden tot stroom- en temperatuurproblemen, hoewel deze kunnen worden beperkt om oververhitting te voorkomen. Gegevensbescherming lijkt altijd meer in het nieuws te zijn, en daarom claimt de CSD end-to-end gegevensbescherming en ECC op alle interne geheugens in het gegevenspad, evenals bescherming tegen stroomuitval.

Om deel te nemen aan deze CSD-actie met ScaleFlux, zijn er een aantal nadelen. Een daarvan is dat de schijf die we beoordelen Gen 3 is, in een tijd waarin traditionele SSD's zijn gemigreerd naar PCIe Gen 4. Dit is een oplosbaar probleem. Een andere hit is de driverondersteuning die momenteel beperkt is tot Linux. Windows en VMware zijn uit. Gelokaliseerde virtualisatie zou een interessante use-case zijn en rijp voor voordelen op het gebied van datareductie. Hopelijk komt er meer brede steun.

ScaleFlux CSD 2000 belangrijkste specificaties

Vormfactoren PCIe AIC en 2.5-inch U.2
Interface PCIe Gen3 x4 blokopslagapparaat met lage latentie
NAND-media 3D TLC en 3D QLC
Vermogensverliesbeveiliging Ja
Data Protection
  • End-to-end bescherming
  • ECC op alle herinneringen
  • CRC met volledig gegevenspad
  • LDPC en die-level RAID-bescherming
Power
  • 18Watt typisch actief
  • 25W maximaal
  • 12W bij inactiviteit (nul uitgangslatentie)
Bedrijfstemperatuur 50°C @ 200LFM (AIC) 35°C @ 200LFM (U.2)
temperatuur Bescherming Thermische beperking ingeschakeld
MTTF 2 miljoen uur
Rekencapaciteit
  • Transparante gegevenspadcompressie
  • Versnelde prestaties
  • Uitgebreide capaciteit
Software Compatibiliteit Alleen Linux OS 2.6 Kernel of later

  • Repository-ondersteuning: Ubuntu 16/18/20, RedHat/CentOS 6/7/8

Compressie met ScaleFlux

Uit de poort wilden we grip krijgen op hoe compressie wordt geïmplementeerd. Om aan de slag te gaan in Linux, moet je hun aangepaste stuurprogramma laden om de schijf te bekijken en ermee te werken, wat een vertakking is van de algemene nvme-cli-toolset. Hierdoor kunt u de schijf bekijken zoals deze is, deze formatteren, communiceren en/of de bruikbare capaciteit wijzigen op basis van de huidige dataset. Hieronder ziet u een snel voorbeeld van de uitvoer voor en na onze werklasttesten. Het eerste commando van "sfx-nvme list" toont de geïnstalleerde schijf.

root@storagereview:~# sfx-nvme-lijst
Node SN Model Naamruimte Gebruik Formaat FW Rev BUS:slot:func
/dev/sfdv0n1 UC1945A7112M CSDU3RF040B1 1 3.20 TB / 3.20 TB 512 B + 0 B 4870 0000:d8:00.0

Na onze eerste benchmarkronde met volledig niet-comprimeerbare data (onze normaal werkende dataset) zien we dat de drive een compressieverhouding van 1.00 laat zien.

root@storagereview:~# cat /sys/block/sfdv*/sfx_smart_features/sfx_capacity_stat
free_space fysieke_grootte logische_grootte comp_ratio provisioned_cap space_flag
2736 6251231232 6251231312 1.00 6251233968 0

Vervolgens hebben we het vdbench-compressieniveau overgeschakeld naar 4x, waardoor de drive een deel van zijn magie achter de schermen kan laten werken. Nadat dat is voltooid en we de SSD opnieuw hebben bevraagd, zien we de grotere omvang en de compressieverhouding van 4.10. Het goede nieuws is dus dat de schijven met deze basisshake-out doen wat ze beweren te doen, in termen van compressiefunctionaliteit.

root@storagereview:~# cat /sys/block/sfdv*/sfx_smart_features/sfx_capacity_stat
free_space fysieke_grootte logische_grootte comp_ratio provisioned_cap space_flag
4728607824 1522626144 6251231312 4.10 6251233968 0

ScaleFlux CSD 2000 Prestaties

VDBench-werkbelastinganalyse

Als het gaat om het benchmarken van opslagapparaten, is het testen van applicaties het beste en komt het synthetische testen op de tweede plaats. Hoewel ze geen perfecte weergave zijn van de werkelijke werklast, helpen synthetische tests wel om opslagapparaten te baseren met een herhaalbaarheidsfactor die het gemakkelijk maakt om appels met appels te vergelijken tussen concurrerende oplossingen.

Deze workloads bieden een scala aan verschillende testprofielen, variërend van "four corners"-tests, algemene tests voor de grootte van databaseoverdrachten tot het vastleggen van sporen uit verschillende VDI-omgevingen. Al deze tests maken gebruik van de gemeenschappelijke vdBench-workloadgenerator, met een scripting-engine om resultaten te automatiseren en vast te leggen over een groot rekentestcluster. Hierdoor kunnen we dezelfde workloads herhalen op een breed scala aan opslagapparaten, waaronder flash-arrays en individuele opslagapparaten.

Ons testproces voor deze benchmarks vult het volledige schijfoppervlak met gegevens en verdeelt vervolgens een schijfgedeelte dat gelijk is aan 25% van de schijfcapaciteit om te simuleren hoe de schijf zou kunnen reageren op applicatieworkloads. Dit is anders dan volledige entropietests, die 100% van de schijf gebruiken en deze in een stabiele toestand brengen. Als gevolg hiervan weerspiegelen deze cijfers hogere aanhoudende schrijfsnelheden.

profielen:

  • 4K willekeurig lezen: 100% lezen, 128 threads, 0-120% joate
  • 4K willekeurig schrijven: 100% schrijven, 64 threads, 0-120% snelheid
  • 64K sequentieel lezen: 100% lezen, 16 threads, 0-120% jorate
  • 64K sequentieel schrijven: 100% schrijven, 8 threads, 0-120% snelheid
  • Synthetische database: SQL en Oracle
  • VDI volledige kloon en gekoppelde kloonsporen

Ter vergelijking kijken we naar de ScaleFlux SSD met VDBench die niet-comprimeerbare gegevens en 4x comprimeerbare gegevens verzendt. In willekeurige 4K begon de onsamendrukbare CSD onder de 100 µs en piekte op 588,893 IOPS met een latentie van 216 µs. Met compressie was de schijf alleen iets langzamer met een piek van 573,460 IOPS bij een latentie van 222 µs.

ScaleFlux CSD 2000 4k lezen

4K willekeurig schrijven zag de incompressibele schijf een piek bereiken van ongeveer 355K IOPS bij ongeveer 325µs voordat er wat afviel. Met compressie bleef de schijf grotendeels onder de 100 µs met een piek van ongeveer 572K IOPS met 168 µs voor latentie.

Bij het overschakelen naar 64K sequentiële workloads bereikte de incompressibele schijf voor het lezen een piek van 33,785 IOPS of 2.11 GB/s bij een latentie van 473 µs. Met compressie zagen we dat de schijf 47,489 IOPS of 2.97 GB/s bereikte bij een lagere latentie van 336 µs.

ScaleFlux CSD 2000 64k lezen

In 64K schrijven liepen beide configuraties een groot deel van de test onder de 100 µs. De niet-comprimeerbare configuratie piekte op 24,074 IOPS of 1.5 GB/s bij een latentie van 643 µs. Met 4x compressie zagen we een piek van 36,364 IOPS of 2.27 GB/s bij een latentie van 397 µs.

ScaleFlux CSD 2000 sql

Onze volgende reeks tests zijn onze SQL-workloads: SQL, SQL 90-10 en SQL 80-20. Beginnend met SQL, leken beide gegevensconfiguraties erg op elkaar. De incompressible piekte op 188,269 IOPS en 167 µs voor latentie, terwijl de gecomprimeerde gegevens die naar de schijf gingen piekten op 190,370 IOPS met een latentie van eveneens 167 µs.

In SQL 90-10 bereikte de incompressibele ScaleFlux CSD 2000 een piek van 185,310 IOPS met een latentie van 172µs. Met 4x compressie naar de schijf bereikte het een piek van 220,615 IOPS en een latentie van 144µs.

SQL 80-20 had de incompressible drive-piek bij 179,482 IOPS met een latentie van 177µs. Kijkend naar de compressie die naar de CSD gaat, zagen we een piek van 221,851 IOPS bij een latentie van 143µs.

De volgende stap zijn onze Oracle-workloads: Oracle, Oracle 90-10 en Oracle 80-20. Beginnend met Oracle piekte de incompressible op 184,048 IOPS en een latentie van 194 µs. Als we naar de schijf keken met compressie erop, zagen we een piek van 245,385 IOPS en een latentie van 135 µs.

ScaleFlux CSD 2000 orakel

Oracle 90-10 begon allebei bijna hetzelfde qua prestaties en latentie. De niet-comprimeerbare versie piekte op 155,641 IOPS bij een latentie van 141 µs. De compressieversie bereikte een piek van 175,681 IOPS met een latentie van 125 µs.

Oracle 80-20 booth-driveconfiguraties begonnen onder de 100 µs. Met onsamendrukbare gegevens was de piek 151,983 IOPS bij 144 µs voor latentie. Met gecomprimeerde gegevens zagen we een piekprestatie van 182,640 IOP's met een latentie van 120 µs.

Vervolgens zijn we overgestapt op onze VDI-kloontest, Full en Linked. Voor VDI Full Clone (FC) Boot, de ScaleFlux CSD 2000 zonder niet-comprimeerbare gegevens, bereikte de schijf een piek van 127,616 IOPS bij een latentie van 263 µs. Het verzenden van de 4x compressie verbeterde prestaties tot 161,543 IOPS met 216 µs voor latentie.

ScaleFlux CSD 2000 vdi fc-opstart

VDI FC Initial Login gaf ons pieken van 78,125 IOPS bij 379 µs met niet-comprimeerbare gegevens en 154,077 IOPS bij 189 µs met gecomprimeerde gegevens.

Voor VDI FC Monday piekte de incompressible drive op 62,922 IOPS met een latentie van 251µs. Met 4x compressie was er een veel hogere piek bij 100,680 IOPS met een latentie van slechts 156µs.

Voor VDI Linked Clone (LC) Boot bereikten de niet-comprimeerbare gegevens om te rijden een piek van 58,705 IOPS met een latentie van 271 µs. Toen we 4x compressie naar de schijf stuurden, bereikte deze een piek van 81,137 IOPPS en een latentie van 196 µs.

ScaleFlux CSD 2000 vdi lc-boot

VDI LC Initial Login zorgde ervoor dat de schijf met niet-comprimeerbare gegevens piekprestaties bereikte van 36,537 IOPS bij een latentie van 215 µs. Toen de 4x gecomprimeerde gegevens de schijf bereikten, bereikte deze een piek van 56,739 IOPS en een latentie van 137 µs.

Eindelijk, met VDI LC Monday Login bereikte de incompressibele schijf een piek van 48,814 IOPS bij een latentie van 323 µs. Met compressie bereikte de SSD een piek van 81,799 IOPS met een latentie van 192µs.

Conclusie

ScaleFlux richt zich uitsluitend op computationele opslag. Dit gebeurt voornamelijk via zijn SSD's, bekend als ScaleFlux Computational Storage Drives (CSD). Dit zijn PCIe Gen3 SSD's met rekenmotoren om de prestaties en gegevensefficiëntie te verbeteren. Het bedrijf heeft een handvol verschillende schijven, maar voor deze review hebben we gekeken naar de ScaleFlux CSD 2000.

Het belangrijkste verschil tussen de ScaleFlux-schijf en andere computeropslag is de compressie/decompressie-engine voor het gegevenspad. ScaleFlux claimt een verviervoudiging van de capaciteit en een verdubbeling van de prestaties, dankzij hun computationele technologie. Dit heeft niet alleen invloed op de prestaties, maar kan ook de kosten per TB SSD-opslag verlagen, gezien de opslagefficiëntie wanneer gegevens zeer comprimeerbaar zijn.

De eerste zorg is dan: werkt de compressiemotor? Dat was een gemakkelijke ja, omdat we de compressie tijdens onze tests direct uit de poort hebben gemanipuleerd. We begonnen met volledig onsamendrukbare gegevens en zoals verwacht zagen we een verhouding van 1:1. Door over te schakelen naar een compressieverhouding van 4x, kregen we een compressieverhouding van 4.1: 1 op de schijf. De kritieke eerste stap kreeg een vinkje voordat er naar de prestaties werd gekeken.

Laten we eerst eens kijken naar de schijf zonder dat er onsamendrukbare gegevens naar worden verzonden. Hoogtepunten zijn onder meer 589K IOPS in 4K lezen, 355K IOPS in 4K schrijven, 2.11 GB/s in 64K lezen en 1.5 GB/s in 64K schrijven. In SQL zagen we pieken van 188K IOPS, 185K IOPS in SQL 90-10 en 179K IOPS in SQL 80-20. Voor onze Oracle-workloads zagen we pieken van 184 IOPS, 156 IOPS in Oracle 90-10 en 152 IOPS in Oracle 80-20. Met onze VDI Clone-tests gaf de CSD 2000 zonder compressie ons 128 IOPS bij het opstarten, 78 IOPS bij de eerste keer inloggen en 63 IOPS bij het inloggen op maandag voor volledige kloon. Voor Linked Clone gaf de schijf ons 59 IOPS bij het opstarten, 37 IOPS bij de eerste keer inloggen en 49 IOPS bij het inloggen op maandag.

Nadat we 4x gecomprimeerde gegevens hadden verzonden, waren we aangenaam verrast toen we zagen dat de prestaties in elke test omhoog gingen, behalve bij lezen in 4K, waar het niet zo ver uit elkaar lag. Hoogtepunten zijn onder meer 573K IOPS in 4K lezen, 572K IOPS in 4K schrijven, 2.97 GB/s in 64K lezen en 2.27 GB/s in 64K schrijven. In SQL zagen we pieken van 190 IOPS, 221 IOPS in SQL 90-10 en 222 IOPS in SQL 80-20. Voor Oracle zagen we pieken van 245 IOPS, 176 IOPS in Oracle 90-10 en 183 IOPS in Oracle 80-20. Met onze VDI Clone-tests gaf de ScaleFlux met compressie ons 162K IOPS bij het opstarten, 154K IOPS bij de eerste login en 101K IOPS bij de maandag-login voor volledige kloon. Voor Linked Clone gaf de schijf ons 81 IOPS bij het opstarten, 57 IOPS bij de eerste keer inloggen en 82 IOPS bij het inloggen op maandag.

De ScaleFlux CSD 2000 is echt een interessant product en wijst op een mogelijke opschudding in de traditionele SSD-ruimte naarmate computationele opslag zijn intrede doet. CSD bestaat al vele jaren, dus het concept is niet nieuw. Wat waarschijnlijk ontbreekt, is uitvoering. Van hun kant is ScaleFlux de eerste van alle CSD-jongens die iets in ons lab krijgt. Vertrouwen alleen is echter niet voldoende om de dag te dragen, de drive moet presteren.

In dit geval zijn de prestaties niet alleen de cijfers die u in onze grafieken ziet, hoewel het daar prima deed. Het bewijs in deze SSD-pudding is het vermogen om goed te werken tegen comprimeerbare gegevens. Het doet dit precies zoals verwacht in onze tests, en levert zelfs een kleine prestatieverbetering in alle testprofielen op één na. Om deze SSD zinvol te maken, hoeft de use case alleen maar te worden uitgelijnd. Ongetwijfeld zullen comprimeerbare gegevens enorm profiteren van de ScaleFlux-technologie. Zolang u op dit moment geen ondersteuning voor VMware of Windows-virtualisatie nodig hebt, is de CSD 2000 zeker de moeite waard om in een PoC te verkennen om te zien hoeveel uw werklast hiervan kan profiteren.

SchaalFlux

Plan een PoC met ScaleFlux

Neem contact op met StorageReview

Nieuwsbrief | YouTube | LinkedIn | Instagram | Twitter | Facebook | TikTokRSS Feed