Qumulo File System is Qumulo's unieke softwaregedefinieerde gedistribueerde bestandssysteem dat het datacenter, de private en publieke cloud omvat. De software is gebouwd voor de hybride cloud, waardoor deze kan worden uitgevoerd op vooraf geconfigureerde en vooraf gekwalificeerde hardwareplatforms volgens de industriestandaard, maar ook native op meerdere openbare clouds. In ons lab hadden we de mogelijkheid om de software van Qumulo en enkele van de belangrijkste mogelijkheden ervan te bestuderen. In deze specifieke recensie bekijken we het bestandssysteem van Qumulo en de grafische gebruikersinterface (GUI).
Qumulo File System is Qumulo's unieke softwaregedefinieerde gedistribueerde bestandssysteem dat het datacenter, de private en publieke cloud omvat. De software is gebouwd voor de hybride cloud, waardoor deze kan worden uitgevoerd op vooraf geconfigureerde en vooraf gekwalificeerde hardwareplatforms volgens de industriestandaard, maar ook native op meerdere openbare clouds. In ons lab hadden we de mogelijkheid om de software van Qumulo en enkele van de belangrijkste mogelijkheden ervan te bestuderen. In deze specifieke recensie bekijken we het bestandssysteem van Qumulo en de grafische gebruikersinterface (GUI).
Om te innoveren zijn organisaties afhankelijk van moderne storage, data-infrastructuur, legacy en cloudgebaseerde applicaties en services, en cloudopslag, evenals ongestructureerd databeheer en platforms. Ongestructureerde gegevens worden echter een pijn in de nek voor bedrijven die naar de cloud willen migreren of een hybride cloudmodel willen gebruiken, aangezien dit soort gegevens een nieuwe gegevenssilo creëert; in de meeste beschikbare cloudplatforms. De IT-afdeling wordt geconfronteerd met de consequentie dat het vaker wel dan niet overweldigd is om de werklast in twee verschillende bestandssystemen te beheren: het ene op hun locatie en het andere in de cloud.
Het echte probleem zijn echter niet cloudplatforms of ongestructureerde dataplatforms. We gebruiken nog steeds verouderde bestandsopslag die niet geschikt is om de overstap naar de cloud te maken. Zoals Qumulo benadrukt, is IT veranderd, maar bestandsopslag niet. De laatste succesvolle architecturen voor bestandsopslag werden meer dan 15 jaar geleden gemaakt voordat de cloud een hoge vlucht nam. Moderne bestandsopslag daarentegen moet klaar zijn voor de cloud: verenig alle ongestructureerde gegevenstypen, schaal naar miljarden bestanden, bestrijk meerdere datacenters en de cloud zelf. Zorg ook voor zichtbaarheid en automatisering met realtime analyses en API-gestuurde controle.
Qumulo: een cloud-ready bestandssysteem
Qumulo identificeert zichzelf als een ander type opslagbedrijf en claimt het eerste bestandssysteem te hebben dat hybride cloud-workloads aanpakt en cloud-native bestandsgegevensservices biedt. Met deze software richt het bedrijf zich op ongestructureerde dataplatforms en ondersteunt het applicaties en microservices voor bouwers en ontwikkelaars. De Qumulo-bestandssysteemsoftware is beschikbaar in de publieke, private en hybride cloud.
Lagen van de software van Qumulo omvatten:
- Platformen. Huidige hardwareplatforms omvatten HPE en Fujitsu, en openbare clouds AWS en GCP. Qumulo heeft onlangs ook de mogelijkheid aangekondigd om gegevens van bestand naar object te verplaatsen om gebruik te maken van cloud-native applicaties en services die gebruikmaken van objectgegevens.
- Het besturingssysteem. Gebaseerd op standaard Ubuntu Linux.
- Schaalbare Block Store (SBS). De basis van Qumulo. Maakt schaalbaarheid, draagbaarheid, bescherming en prestaties mogelijk.
- Het bestandssysteem. Het maakt schaalbare bestandstellingen en krachtige bestandsbewerkingen mogelijk. Daarnaast geeft het real-time inzicht in performance en capaciteit.
- Gegevensdiensten. Bescherm, beveilig en beheer gegevens in het Qumulo-platform met behulp van tools op ondernemingsniveau. Deze laag bestaat uit vijf mogelijkheden: snapshots, replicatie, quota, audit en op rollen gebaseerd toegangsbeheer (RBAC).
- Beheer en programmeerbaarheid. Stel in staat om geïntegreerde oplossingen te bouwen met het Qumulo-platform en beheerders om hun dataservices te automatiseren en te beheren.
- Gegevenstoegang en authenticatie. Maak toegang tot gegevens mogelijk met behulp van standaardapplicaties en besturingssystemen en zorg tegelijkertijd voor beveiliging op ondernemingsniveau. Deze laag ondersteunt enterprise-toegangsprotocollen, waaronder NFS, SMB en FTP.
Onze focus ligt hier op het bestandssysteem, dat is gebaseerd op het concept van het organiseren van gegevens in logische structuren en het mogelijk maken van werklasten met een enorm aantal bestanden. Het bestandssysteem gebruikt een gedistribueerde architectuur die een enkele naamruimte presenteert. Gebruikte platforms zijn gedeelde niets-clusters van onafhankelijke knooppunten, waarbij elk knooppunt capaciteit en prestaties levert. En afzonderlijke knooppunten coördineren consistent met elkaar, waardoor elke client verbinding kan maken met elk knooppunt en kan lezen en schrijven in de naamruimte. Deze structuur is erg interessant; het is bedoeld voor makers om samen te werken aan datasets terwijl ze door de gegevenslevenscyclus gaan. Het biedt ook real-time inzicht in prestaties en capaciteitsgebruik, zelfs wanneer systemen worden opgeschaald tot petabytes en miljarden bestanden.
Het Qumulo-bestandssysteem organiseert gegevens in mappen en presenteert gegevens aan SMB- en NFS-clients met de mogelijkheid om gegevens over protocollen te delen, waardoor meerdere verschillende gebruikers en applicatietypen toegang krijgen tot dezelfde gegevens. Het bestandssysteem heeft unieke eigenschappen waar het opvalt: het gebruik van B-trees en een ingebouwde real-time data-analyse-engine.
Met het gebruik van de B-trees-structuur kan Qumulo opschalen naar miljarden bestanden zonder problemen te ondervinden die veel voorkomen in andere systemen. B-trees zijn met name geschikt voor systemen die grote aantallen datablokken lezen en schrijven, omdat het "ondiepe" datastructuren zijn die de hoeveelheid I/O die nodig is voor elke bewerking minimaliseren naarmate het aantal data toeneemt. Deze structuren zijn ideaal voor bestandssystemen en uitgebreide database-indexen.
Een ander cruciaal onderdeel van het Qumulo-bestandssysteem is de gegevensbewuste mogelijkheid met een real-time analyse-engine. Gegevensbewustzijn betekent multidimensionaal inzicht in het opslagsysteem, waardoor krachtige inzichten worden verkregen over systeeminhoud, activiteit, gebruikers en meer. Met de real-time analyse van Qumulo kunnen opslagbeheerders snel het opslaggebruik en de prestaties monitoren, inclusief doorvoer en latentie. Deze zichtbaarheid stelt organisaties in staat controle te krijgen over hun ongestructureerde gegevens en de algehele operationele en kapitaalkosten te verlagen door proactief de huidige behoeften te beheren en toekomstige opslagvereisten beter te voorspellen. De Qumulo web-UI, zoals besproken in het onderstaande gedeelte, brengt deze zichtbaarheid naar het volgende systeembeheerniveau.
Met zijn softwarearchitectuur en zijn specifieke bestandssysteem stelt Qumulo organisaties in staat zakelijke doelen te bereiken die voorheen onmogelijk waren in het on-prem datacenter alleen. Een van de voordelen van Qumulo is dat het het bestandssysteem on-premises uitvoert en vervolgens exact dezelfde software in de cloud uitvoert. Het bedrijf staat bekend als een scale-out provider voor bestandsopslag. Door gebruik te maken van de elasticiteit van de cloud en de schaal van zowel cloudcomputing- als cloudopslaginfrastructuur, in combinatie met de software van Qumulo, is het zeer krachtig om gegevens heen en weer te verplaatsen en het datacenter eenvoudig uit te schalen of op te schalen. Bedrijven kunnen bijvoorbeeld hun on-prem-apps nemen zoals ze zijn, ze naar de cloud verplaatsen en het werkt gewoon. En als een gebruiker bestandsgegevens heeft die hij wil gebruiken met cloudservices zoals machine learning of AI, kopieert de Shift-functionaliteit van Qumulo de gegevens naar een objectopslag in de cloud om toegang te krijgen tot cloud-native applicatie-innovatie.
Nu organisaties deze workloads naar de cloud verplaatsen, willen ze ook weten hoe hun data presteert. Dezelfde ervaring die de analyses van Qumulo bieden voor hardwareplatforms, is te vinden in de cloud en biedt een volledige hybride cloudervaring. Of bedrijven de software nu in een fysiek apparaat of in de cloud draaien, de software is hetzelfde, inclusief dezelfde GUI en mogelijkheden.
Voor meer informatie over functies en mogelijkheden raden we u aan de technische documentatie op de website van Qumulo te bezoeken.
Qumulo-prestaties
Prestatieconfiguratie
De configuratie van de Qumulo-knooppunten in ons cluster met 5 knooppunten omvatte dubbele 25GbE-poorten in LACP met elk vier 480GB SATA SSD's en twaalf 6TB SATA HDD's. Voor onze opslagtests hebben we een enkele NFS-naamruimte ingericht voor onze acht Dell EMC PowerEdge R740xd-servers, elk met een enkele 25G-poort die is toegewezen aan de vSwitch die verbinding maakt met de NFS-share. Vervolgens gebruikten we onze 16 CentOS LoadGens in VMware, elk met twee toegewezen vDisks van 125 GB, waardoor we in totaal een voetafdruk van 4 TB op het cluster hadden.
Als het gaat om het benchmarken van opslagarrays, is het testen van toepassingen het beste en komt het synthetische testen op de tweede plaats. Hoewel ze geen perfecte weergave zijn van de werkelijke werkbelasting, helpen synthetische tests wel om opslagapparaten te baseren met een herhaalbaarheidsfactor die het gemakkelijk maakt om appels met appels te vergelijken tussen concurrerende oplossingen. Deze workloads bieden een scala aan verschillende testprofielen, variërend van "four corners"-tests, algemene tests voor de grootte van database-overdrachten, evenals het vastleggen van sporen uit verschillende VDI-omgevingen. Al deze tests maken gebruik van de gemeenschappelijke vdBench-workloadgenerator, met een scripting-engine om resultaten te automatiseren en vast te leggen over een groot rekentestcluster. Hierdoor kunnen we dezelfde workloads herhalen op een breed scala aan opslagapparaten, waaronder flash-arrays en individuele opslagapparaten.
Omdat de Qumulo-opslagarray is geoptimaliseerd voor overdrachten van grote blokken, waren onze tests gericht op sequentiële overdrachten van 64K, 1024K en 2048K.
profielen:
- 64K sequentieel lezen: 100% lezen, 32 threads, 0-120% jorate
- 64K sequentieel schrijven: 100% schrijven, 32 threads, 0-120% snelheid
- 1024K sequentieel lezen: 100% lezen, 32 threads, 0-120% jorate
- 1024K sequentieel schrijven: 100% schrijven, 32 threads, 0-120% snelheid
- 2048K sequentieel lezen: 100% lezen, 32 threads, 0-120% jorate
- 2048K sequentieel schrijven: 100% schrijven, 32 threads, 0-120% snelheid
Als eerste is er onze 64K sequentiële benchmark 74,619 IOPS of 4.66 GB/s bij een latentie van 11.3 ms.
64K schrijven zag een piekprestatie van ongeveer 9K IOPS of 555MB/s bij een latentie van 110ms.
Vervolgens gaan we verder met onze 1024K-tests. Voor lezen zagen we een piekprestatie van 7,128 IOPS of 7.13 GB/s bij een latentie van 108 ms.
1024K schrijven zag een piek van ongeveer 1,670 IOPS of 1.6 GB/s bij een latentie van 557 ms voordat er wat afviel.
Onze laatste sequentiële benchmarks zijn onze 2048K. In leesprestaties zagen we een piek van 3,858 IOPS of 7.7 GB/s bij een latentie van 184 ms.
Ten slotte zagen we in onze 2048K schrijfbewerking een piek van 1,055 IOPS of 2.1 GB/s bij een latentie van 433 ms.
Qumulo Web UI Overzicht
In het volgende gedeelte geven we een overzicht van de webgebruikersinterface van Qumulo en enkele van de belangrijkste configuraties. Het bedrijf biedt deze webgebaseerde gebruikersinterface waarmee beheerders datacenter- en cloudomgevingen kunnen implementeren, beheren en bewaken.
Nadat we als admin zijn ingelogd op het cluster, worden we direct naar de Dashboard-pagina gebracht. Op dit punt realiseren we ons onmiddellijk de unieke en modern ogende web-UI voorgesteld door Qumulo. Deze web-UI bestaat uit een intuïtief menu dat goed is georganiseerd in tabbladen; we zien het in de linkerbovenhoek van het scherm, dat snel alle categorieën bevat die nodig zijn om onze infrastructuur te implementeren, beheren en bewaken. Het hoofdmenu bestaat uit de tabbladen Dashboard, Analyse, Delen, Cluster, API's & Tools en Ondersteuning. Door naar deze tabbladen te wijzen, geeft de gebruikersinterface een vervolgkeuzelijst weer voor toegang tot alle verschillende pagina's die de gebruikersinterface biedt. In de rechterbovenhoek kunnen gebruikers de huidige softwareversie, de tijd (gebaseerd op de lokale tijd van de webbrowserclient) en de huidige ingelogde gebruiker zien.
Toch zien we op de Dashboard-pagina een aantrekkelijke UI-lay-out die het monitoren van infrastructuren vergemakkelijkt en waar we verschillende kritieke gebieden kunnen observeren, zoals clusteroverzicht, capaciteitstrends, klantactiviteit en in realtime clusteractiviteit.
Een concept dat we vooral leuk vonden aan de gebruikersinterface, in het dashboardgebied, is de dynamische interactie met al zijn elementen. Onder Clusteractiviteit kan men bijvoorbeeld eenvoudig slepen om de gewenste informatieactiviteit die we willen monitoren binnen 24 uur te verplaatsen, uit te breiden of te verkleinen. Hier hebben we ook enkele presets met perioden van 1 min, 5 min, 1 uur en de standaardwaarde 3 uur. De metrische gegevens (IOPS en doorvoer) worden dienovereenkomstig aangepast aan de piekgegevens.
Als we naar beneden scrollen op de Dashboard-pagina, vinden we het gedeelte Klantactiviteit.
Nu gaan we rechtstreeks naar het gebied waar Qumulo opvalt, de analyse. Zoals eerder vermeld, stelt Qumulo beheerders in staat om de gegevens en gebruikers in realtime te beheren. Onder Analyse > Geïntegreerde analyse zien we het informatievenster aan de linkerkant gevuld met de clients die de meeste bronnen van het systeem gebruiken, en met de mappen en bestanden die actief worden gelezen en geschreven. Deze informatie wordt getoond na het klikken op een specifieke directory of subdirectory.
Als we naar de pagina Capaciteitsverkenner gaan, nog steeds onder het tabblad Analyse, kunnen we zien hoe de capaciteit over het systeem is verdeeld. Ten eerste hebben we een algemeen overzicht van de capaciteit van de directory, gerangschikt van groot naar klein.
Door op een directory te klikken, kunnen we ze allemaal in een meer gedetailleerd perspectief bekijken en verkennen. Als voorbeeld toont de onderstaande afbeelding de submappen in de map met de naam "vmw".
En als we op de submappen blijven klikken, kunnen we uiteindelijk details op bestandsniveau bereiken. Deze keer hebben we op de submap met de naam "netapp-centos01" geklikt.
De volgende pagina onder analyse is Capaciteitstrends. Vanaf hier kunnen we alle details krijgen die nodig zijn om het capaciteitsgebruik overuren van het cluster te bewaken en te beheren. De twee belangrijkste gebieden hier zijn capaciteitsgeschiedenis en capaciteitsverandering. Deze capaciteiten omvatten metagegevens, gegevens en momentopnamen (alleen uitgesloten in Capaciteitswijziging). Historie en capaciteitsveranderingen kunnen snel worden gefilterd op tijdframes van de laatste 72 uur, laatste 30 dagen of laatste 52 weken. Dit zijn geweldige opties die opslagbeheerders helpen om het cluster te visualiseren en te beheren voor schaalbaarheid en om significante capaciteitsveranderende gebeurtenissen te onderzoeken.
Het volgende gedeelte dat we hebben verkend op het tabblad Analytics is Activiteit, waar we Throughput Hot Spots, IOPS Hot Spots, Clients en Paths kunnen vinden. Op de IOPS Hot Spots-pagina kunnen we de invoer/uitvoer per seconde-hotspots in ons opslagsysteem identificeren. De grafiek toont de meest actieve mappen in termen van lees-/schrijfbewerkingen voor bestanden en metadata. Het detailniveau van deze gegevens kan worden aangepast met behulp van de schuifregelaar rechtsboven in de grafiek. Een geweldige optie om de weergave te pauzeren is ook beschikbaar via het keuzerondje Automatisch vernieuwen.
We kunnen ook de activiteit per klant volgen. De analyses laten ons zien welke klanten het meest actief zijn in termen van doorvoer en IOPS.
En ook monitoren we activiteit per pad in de cloud.
Het volgende tabblad in het hoofdmenu is Delen, en hier is de eerste pagina die we analyseren Quota's. Qumulo maakt real-time capaciteitsquota mogelijk, waardoor beheerders kunnen specificeren hoeveel capaciteit een bepaalde map mag gebruiken voor bestanden. Vanaf deze pagina kunnen we quota's maken, bewerken of verwijderen.
De volgende twee pagina's zijn NFS-exports en SMB-shares waarmee clients gegevens kunnen delen die zijn opgeslagen in een bepaalde map. Onder NFS-exports kunnen we bijvoorbeeld nieuwe exports maken, bewerken en verwijderen.
Het volgende in het hoofdmenu is Cluster. Onder het menu Cluster vinden we verschillende configuraties en opties met betrekking tot het cluster en het systeem in het algemeen. Op de eerste pagina, Overzicht, hebben we vitale capaciteitsinformatie over ons cluster en zijn knooppunten.
Door op een van de knooppunten te klikken, kunnen we inzoomen op meer specifieke hardwaredetails. We klikken bijvoorbeeld op het knooppunt "sr-qumulo-1" om relevante netwerkinformatie te ontdekken en de gezondheidsstatus te verbeteren.
Onder het Cluster-menu vinden we ook kritieke opslagfuncties zoals Snapshots en Replicatie. En meer opties, waaronder netwerkconfiguratie, de naam van het cluster wijzigen, een nieuwe host aan het cluster toevoegen en meer. Ook het instellen van de FTP- en SMB-protocollen. Ten slotte kunnen we in dit menu authenticatie en autorisatie beheren. De onderstaande afbeelding toont de pagina Lokale gebruikers en groepen als voorbeeld.
Vanaf het tabblad API's en tools hebben we rechtstreeks toegang tot de Qumulo Core-pagina in de gebruikersinterface. Hier kunnen we python-clientbibliotheekwrappers en CLI downloaden voor de Qumulo Core REST API.
Het laatste tabblad in het menu is Ondersteuning, en de eerste pagina die we hier vonden is Qumulo Care, een cloudgebaseerde monitoringservice die we kunnen inschakelen om gegevens naar Qumulo te sturen. Op deze manier kon het Qumulo-team elk clustergerelateerd probleem beter oplossen en versnellen.
Ten slotte hebben we in het menu de pagina Software-upgrade.
Conclusie
Om te innoveren zijn organisaties afhankelijk van ongestructureerde dataplatforms en databewuste opslag, die slecht bediend worden door beschikbare oplossingen. In deze review hebben we het Qumulo-bestandssysteem bestudeerd, ontwikkeld om ongestructureerde gegevens in alle omgevingen aan te bieden. Qumulo is een van de pioniers op het gebied van gegevensbewuste opslag en cloudbestandsgegevensservices, met zijn unieke softwaregedefinieerde oplossing voor de hybride cloud.
In het laatste deel van dit artikel hebben we de web-UI van Qumulo bekeken. In het verleden hebben we een overzicht gegeven van de grafische gebruikersinterfaces (GUI) van enkele van de meest populaire server- en opslagapparaten, en deze keer waren we verheugd om een overzicht te krijgen van de nieuwe GUI van Qumulo. Op het eerste gezicht worden we ons bewust van het elegante ontwerp van deze GUI, de uitstekende gebruikerservaring en hoe eenvoudig het is met de dagelijkse beheeractiviteiten van de beheerder.
Over het algemeen biedt de software van Qumulo zijn klanten een uitzonderlijke reeks mogelijkheden, monitoring- en planningstools. De software vereenvoudigt de reis naar de cloud. Het ondersteunt gegevensverplaatsing met lift-and-shift cloudmigratie en biedt tegelijkertijd krachtige realtime analyses om te detecteren en direct inzicht te krijgen in wat er met onze waardevolle gegevens gebeurt.
Neem contact op met StorageReview
Nieuwsbrief | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS Feed