VAST Data introducerade en databeräkningsplattform designad för att vara grunden för AI-assisterad upptäckt. VAST Data Platform är den senaste som erbjuder förenande lagrings-, databas- och virtualiserade beräkningsmotortjänster i ett skalbart system byggt från grunden för framtidens AI.
VAST Data introducerade en databeräkningsplattform designad för att vara grunden för AI-assisterad upptäckt. VAST Data Platform är den senaste som erbjuder förenande lagrings-, databas- och virtualiserade beräkningsmotortjänster i ett skalbart system byggt från grunden för framtidens AI.
VAST-dataplattformen byggdes för att inkludera volymerna global data som genereras och bearbetas i realtid, inklusive ostrukturerad och strukturerad data som video, bilder, fritext, dataströmmar och instrumentdata. Detta tillvägagångssätt syftar till att överbrygga gapet mellan händelsedrivna och datadrivna arkitekturer med möjligheten att komma åt och bearbeta data i alla privata eller större offentliga molndatacenter, bädda in frågebara semantiska lager i data för att bättre förstå naturliga data och beräkna data i realtid kontinuerligt och rekursivt med varje interaktion.
Bortom stora språkmodeller till AI-assisterad upptäckt
Generativa AI och stora språkmodeller (LLM) introducerade världen till artificiell intelligenss tidiga möjligheter; LLM är dock begränsade till att utföra rutinuppgifter som affärsrapportering eller recitera redan känd information. Först när maskiner kan återskapa upptäcktsprocessen genom att fånga, syntetisera och lära av data kommer det sanna löftet om AI att förverkligas. Denna nivå av specialisering kan nu uppnås på några dagar snarare än på decennier.
AI-driven upptäckt kommer att påskynda sökandet efter att lösa våra största utmaningar, hitta behandlingar för sjukdomar och cancer, ta itu med klimatförändringar, innovativa metoder för jordbruk och upptäcka nya områden inom naturvetenskap och matematik. Befintliga dataplattformar är populära för globala företag, vilket dramatiskt minskar komplexiteten i implementeringen av infrastruktur för business intelligence och rapporteringstillämpningar. Men de behöver fortfarande möta behoven av nya djupinlärningsapplikationer.
Nästa generation av AI-infrastruktur måste leverera parallell filåtkomst, GPU-optimerad prestanda för utbildning i neurala nätverk och slutledning av ostrukturerad data, och ett globalt namnområde som spänner över hybridmiljöer med flera moln och kant; allt förenat i ett lätthanterligt erbjudande som möjliggör federerad djupinlärning.
DASE: The Heart of VAST Data Platform
Från början har VAST satt naturliga data, rik metadata, funktioner och triggers i centrum för VAST Disaggregated Shared-Everything (DASE) distribuerade systemarkitektur. Genom att eliminera avvägningar mellan prestanda, kapacitet, skala, enkelhet och motståndskraft har DASE lagt grunden för djupinlärning, vilket gör det möjligt att träna modeller på hela företagets data. Genom att låta kunderna lägga till logik i systemet kan maskiner kontinuerligt och rekursivt berika och förstå data från den naturliga världen.
De nya tillkännagivandena från VAST visar ett sätt att påskynda träningsarbetsflöden. För stora företag är det avgörande att ha en snabb implementeringsväg för generativ AI. VAST lade fram sina planer för att hjälpa till att uppnå detta genom att kunna köra funktioner av transformatortyp på objekt lagrade på deras plattform. Ta till exempel slumpmässiga förvrängningar som appliceras på en uppsättning träningsbilder, de funktioner som kommer till VAST-plattformen skulle möjliggöra transformationer av träningsdata när det behövs, snarare än att behöva förbearbeta dem till priset av att konsumera mer lagring.
Utvecklingen från VAST som lovar att påskynda träningsarbetsflöden öppnar en ny horisont för generativ AI inom företag som kräver hög trohet, snabb omskolningsrespons och komplex modellering. En starkt reglerad industri kommer att gynnas enormt. Analytiker kan utnyttja VASTs kapacitet för att köra transformatorfunktioner på objekt och generera detaljerade modeller som skulle vara tid- och utrymmeskrävande att skapa manuellt. Realtidsgenerering och ändring av grafiska element kan också förbättra det kreativa arbetsflödet, vilket möjliggör en mer dynamisk och interaktiv designprocess.
Unified Global DataStore, DataBase och AI Computing Engine
VAST DataStore är en skalbar lagringsarkitektur för ostrukturerad data som eliminerar lagringsnivåer. Designad för att fånga och betjäna data från den naturliga världen, utvecklade VAST först grunden för sin plattform. VAST DataStore är en nätverksansluten företagslagringsplattform byggd för att möta behoven hos robusta AI-beräkningsarkitekturer, såsom NVIDIA DGX SuperPOD AI-superdatorer och big-data- och HPC-plattformar.
Effektiviteten i den exabyte-skaliga DataStore tar arkivekonomi till flash-infrastruktur, vilket gör den lämplig för arkivapplikationer. Att lösa kostnaden för flashlagring är avgörande för att lägga grunden för djupinlärning för företagskunder när de vill träna modeller på sina egna datatillgångar.
VAST Databas
VAST DataBase har introducerats för att tillämpa struktur på ostrukturerad naturdata. Genom att kombinera egenskaperna hos en databas, ett datalager och en datasjö i ett enkelt, distribuerat och enhetligt databashanteringssystem har VAST löst kompromisserna mellan transaktioner (för att fånga och katalogisera naturliga data i realtid) och analyser (att analysera och korrelera data i realtid). VAST DataBase VAST DataBase är designad för snabb datafångst och snabba förfrågningar i vilken skala som helst och bryter barriärerna för realtidsanalys från händelseströmmen till arkivet.
Med en grund för syntetiserad strukturerad och ostrukturerad data gör VAST Data Platform det möjligt att förfina och berika rå ostrukturerad data till strukturerad, frågebar information med stöd för funktioner och triggers. VAST DataEngine är en global funktionsexekveringsmotor som konsoliderar datacenter och molnregioner till ett globalt beräkningsramverk. Motorn stöder populära programmeringsspråk, som SQL och Python. Den introducerar ett händelsemeddelandesystem och materialiserad och reproducerbar modellträning som gör det lättare att hantera AI-pipelines.
VAST DataSpace
Det sista elementet i VAST Data Platform-strategin är VAST DataSpace. Detta globala namnutrymme tillåter varje plats att lagra, hämta och bearbeta data från vilken plats som helst med hög prestanda samtidigt som strikt konsekvens över alla åtkomstpunkter upprätthålls. Med DataSpace kan VAST Data Platform distribueras i lokala datacenter och edge-miljöer. Det utökar nu också DataSpace-åtkomst till ledande offentliga molnplattformar, inklusive AWS, Microsoft Azure och Google Cloud.
Denna globala, datadefinierade datorplattform tar ett nytt tillvägagångssätt för att kombinera ostrukturerad data med strukturerad data genom att lagra, bearbeta och distribuera dessa data från ett enda, enhetligt system.
VAST DataStore, DataBase och DataSpace är allmänt tillgängliga inom VAST Data Platform idag. VAST DataEngine kommer att göras tillgänglig 2024.
Läs mer genom att besöka Vast's BuildBeyond.ai.
Engagera dig med StorageReview
Nyhetsbrev | Youtube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Rssflöde