VAST Data stellte eine Datenverarbeitungsplattform vor, die als Grundlage für KI-gestützte Entdeckungen dienen soll. Die VAST Data Platform ist das neueste Angebot, das Speicher-, Datenbank- und virtualisierte Compute-Engine-Dienste in einem skalierbaren System vereint, das von Grund auf für die Zukunft der KI entwickelt wurde.
VAST Data stellte eine Datenverarbeitungsplattform vor, die als Grundlage für KI-gestützte Entdeckungen dienen soll. Die VAST Data Platform ist das neueste Angebot, das Speicher-, Datenbank- und virtualisierte Compute-Engine-Dienste in einem skalierbaren System vereint, das von Grund auf für die Zukunft der KI entwickelt wurde.
Die VAST-Datenplattform wurde entwickelt, um die in Echtzeit generierten und verarbeiteten globalen Datenmengen zu erfassen, einschließlich unstrukturierter und strukturierter Daten wie Videos, Bilder, Freitext, Datenströme und Instrumentendaten. Dieser Ansatz zielt darauf ab, die Lücke zwischen ereignisgesteuerten und datengesteuerten Architekturen zu schließen, indem er die Möglichkeit bietet, auf Daten in jedem privaten oder großen öffentlichen Cloud-Rechenzentrum zuzugreifen und diese zu verarbeiten, abfragbare semantische Schichten in die Daten einzubetten, um natürliche Daten besser zu verstehen, und Daten zu berechnen in Echtzeit kontinuierlich und rekursiv bei jeder Interaktion.
Über große Sprachmodelle hinaus zur KI-gestützten Entdeckung
Generative KI und Large Language Models (LLMs) führten die Welt in die frühen Fähigkeiten der künstlichen Intelligenz ein; LLMs beschränken sich jedoch auf die Durchführung von Routineaufgaben wie Geschäftsberichte oder das Rezitieren bereits bekannter Informationen. Nur wenn Maschinen den Entdeckungsprozess durch die Erfassung, Synthese und das Lernen von Daten nachbilden können, wird das wahre Versprechen der KI verwirklicht. Dieser Grad der Spezialisierung kann nun innerhalb weniger Tage statt Jahrzehnte erreicht werden.
KI-gesteuerte Entdeckungen werden die Suche nach der Lösung unserer größten Herausforderungen beschleunigen, indem wir Behandlungen für Krankheiten und Krebs finden, den Klimawandel bekämpfen, innovative Ansätze für die Landwirtschaft entwickeln und neue Bereiche der Wissenschaft und Mathematik entdecken. Bestehende Datenplattformen erfreuen sich bei globalen Unternehmen großer Beliebtheit und reduzieren die Komplexität der Infrastrukturbereitstellung für Business-Intelligence- und Reporting-Anwendungen erheblich. Allerdings müssen sie noch den Anforderungen neuer Deep-Learning-Anwendungen gerecht werden.
Die nächste Generation der KI-Infrastruktur muss parallelen Dateizugriff, GPU-optimierte Leistung für das Training neuronaler Netzwerke und Rückschlüsse auf unstrukturierte Daten sowie einen globalen Namensraum bieten, der hybride Multi-Cloud- und Edge-Umgebungen umfasst. Alles vereint in einem einfach zu verwaltenden Angebot, das föderiertes Deep Learning ermöglicht.
DASE: Das Herzstück der VAST-Datenplattform
Von Anfang an hat VAST natürliche Daten, umfangreiche Metadaten, Funktionen und Trigger in den Mittelpunkt der verteilten Systemarchitektur VAST Disaggregated Shared-Everything (DASE) gestellt. Durch die Eliminierung von Kompromissen bei Leistung, Kapazität, Skalierbarkeit, Einfachheit und Belastbarkeit hat DASE die Datengrundlage für Deep Learning gelegt und es ermöglicht, Modelle auf der Grundlage der gesamten Daten eines Unternehmens zu trainieren. Indem Kunden dem System Logik hinzufügen können, können Maschinen kontinuierlich und rekursiv Daten aus der natürlichen Welt anreichern und verstehen.
Die neuen Ankündigungen von VAST zeigen eine Möglichkeit auf, Schulungsabläufe zu beschleunigen. Für große Unternehmen ist ein schneller Implementierungspfad für generative KI von größter Bedeutung. VAST legte seine Pläne vor, um dies zu erreichen, indem es transformatorartige Funktionen auf auf seiner Plattform gespeicherten Objekten ausführen kann. Nehmen wir zum Beispiel zufällige Verzerrungen, die auf eine Reihe von Trainingsbildern angewendet werden. Die Funktionen der VAST-Plattform würden Transformationen der Trainingsdaten nach Bedarf ermöglichen, anstatt sie auf Kosten eines höheren Speicherbedarfs vorverarbeiten zu müssen.
Die Entwicklungen von VAST, die eine Beschleunigung der Trainingsabläufe versprechen, eröffnen einen neuen Horizont für generative KI in Unternehmen, die hohe Wiedergabetreue, schnelle Reaktion auf Umschulungen und komplexe Modellierung erfordern. Die stark regulierte Industrie wird enorm profitieren. Analysten können die Fähigkeiten von VAST nutzen, um Transformatorfunktionen auf Objekte auszuführen und so detaillierte Modelle zu generieren, deren manuelle Erstellung zeit- und platzaufwändig wäre. Die Generierung und Änderung grafischer Elemente in Echtzeit kann auch den kreativen Arbeitsablauf verbessern und einen dynamischeren und interaktiveren Designprozess ermöglichen.
Einheitlicher globaler Datenspeicher, Datenbank und KI-Computing-Engine
Der VAST DataStore ist eine skalierbare Speicherarchitektur für unstrukturierte Daten, die das Speicher-Tiering überflüssig macht. VAST wurde für die Erfassung und Bereitstellung von Daten aus der Natur entwickelt und entwickelte zunächst die Grundlagen seiner Plattform. Der VAST DataStore ist eine Enterprise-Network-Attached-Storage-Plattform, die speziell auf die Anforderungen robuster KI-Computing-Architekturen wie NVIDIA DGX SuperPOD KI-Supercomputer sowie Big-Data- und HPC-Plattformen zugeschnitten ist.
Die Effizienz des DataStore im Exabyte-Maßstab bringt Archivökonomie in die Flash-Infrastruktur und macht sie für Archivanwendungen geeignet. Die Lösung der Kosten für Flash-Speicher ist von entscheidender Bedeutung, um den Grundstein für Deep Learning für Unternehmenskunden zu legen, die Modelle auf ihren proprietären Datenbeständen trainieren möchten.
VAST-Datenbank
VAST DataBase wurde eingeführt, um Struktur auf unstrukturierte natürliche Daten anzuwenden. Durch die Kombination der Eigenschaften einer Datenbank, eines Data Warehouse und eines Data Lake in einem einfachen, verteilten und einheitlichen Datenbankverwaltungssystem hat VAST die Kompromisse zwischen Transaktionen (zur Erfassung und Katalogisierung natürlicher Daten in Echtzeit) und Analysen gelöst (um Daten in Echtzeit zu analysieren und zu korrelieren). VAST DataBase Die VAST DataBase wurde für die schnelle Datenerfassung und schnelle Abfragen in jedem Maßstab entwickelt und überwindet die Grenzen der Echtzeitanalyse vom Ereignisstrom bis zum Archiv.
Mit einer Grundlage für synthetisierte strukturierte und unstrukturierte Daten ermöglicht die VAST Data Platform die Verfeinerung und Anreicherung unstrukturierter Rohdaten zu strukturierten, abfragbaren Informationen mit Unterstützung für Funktionen und Trigger. Die VAST DataEngine ist eine globale Funktionsausführungs-Engine, die Rechenzentren und Cloud-Regionen in einem globalen Rechenrahmen konsolidiert. Die Engine unterstützt gängige Programmiersprachen wie SQL und Python. Es führt ein Ereignisbenachrichtigungssystem und ein materialisiertes und reproduzierbares Modelltraining ein, wodurch die Verwaltung von KI-Pipelines einfacher wird.
VAST DataSpace
Das letzte Element der VAST Data Platform-Strategie ist der VAST DataSpace. Dieser globale Namespace ermöglicht es jedem Standort, Daten von jedem Standort aus mit hoher Leistung zu speichern, abzurufen und zu verarbeiten und gleichzeitig eine strikte Konsistenz über jeden Zugriffspunkt hinweg durchzusetzen. Mit dem DataSpace ist die VAST Data Platform in lokalen Rechenzentren und Edge-Umgebungen einsetzbar. Es erweitert nun auch den DataSpace-Zugriff auf führende öffentliche Cloud-Plattformen, darunter AWS, Microsoft Azure und Google Cloud.
Diese globale, datendefinierte Computerplattform verfolgt einen neuen Ansatz zur Verbindung unstrukturierter Daten mit strukturierten Daten, indem diese Daten in einem einzigen, einheitlichen System gespeichert, verarbeitet und verteilt werden.
Der VAST DataStore, die DataBase und der DataSpace sind heute allgemein innerhalb der VAST Data Platform verfügbar. Die VAST DataEngine wird im Jahr 2024 verfügbar sein.
Erfahren Sie mehr, indem Sie Vast's besuchen BuildBeyond.ai.
Beteiligen Sie sich an StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed