Casa Impresa Dell Validated Designs for Analytics: lancio di Data Lakehouse

Dell Validated Designs for Analytics: lancio di Data Lakehouse

by Harold Fritt
Etichetta Dell EMC PowerEdge R750

Dell Technologies ha introdotto Dell Validated Designs for Analytics – Data Lakehouse che consente alle aziende di combinare sia data Lake che data warehouse, ottenendo qualità dei dati, prestazioni, sicurezza e governance per tutti i tipi di dati con il self-service on-demand.

Dell Technologies ha introdotto Dell Validated Designs for Analytics – Data Lakehouse che consente alle aziende di combinare sia data Lake che data warehouse, ottenendo qualità dei dati, prestazioni, sicurezza e governance per tutti i tipi di dati con il self-service on-demand.

dati di revisione dell'archiviazione Lakehouse

Data Lakehouse

Dell Data Lakehouse consente l'evoluzione della gestione dei dati da sistemi isolati, rigidi, costosi e lenti a sistemi unificati che abilitano business intelligence (BI), analisi, applicazioni di dati in tempo reale, scienza dei dati e machine learning (ML). La soluzione convalidata Data Lakehouse comprende dispositivi dell'intero portafoglio Dell, tra cui PowerEdge, PowerScale, ECS Object Storage e PowerSwitch.

Tuttavia, non è tutto hardware: l'infrastruttura è alimentata da Apache Spark e Kafka con tecnologie Delta Lake e Robin Cloud-Native Platform (CNP). Se raggruppata insieme, questa soluzione è progettata per sfruttare più dati per trasformare le informazioni tra le organizzazioni.

Sostituzione a caldo Dell EMC PowerEdge R750 BOSS-2

Secondo un blog di Chhandomay Mandal, Direttore di Dell, ISG Solution Marketing, "I sistemi tradizionali di gestione dei dati, come i data warehouse, sono stati utilizzati per decenni per archiviare dati strutturati e renderli disponibili per l'analisi. Tuttavia, i data warehouse non sono configurati per gestire la crescente varietà di dati. Dell ha ideato un progetto di tipo architettura di riferimento per un data lake/data warehouse combinato utilizzando software di partner di terze parti e il proprio server, storage e hardware di rete e software – testo, immagini, video, Internet delle cose (IoT) – né possono supportare algoritmi di intelligenza artificiale (AI) e machine learning (ML) che richiedono l’accesso diretto ai dati”.

I data Lake promettevano di contribuire a risolvere questi problemi consentendo alle aziende di acquisire dati strutturati, non strutturati e semistrutturati in modo più flessibile ed economico rispetto ai data warehouse tradizionali. Le organizzazioni utilizzano un data Lake insieme a un data warehouse archiviando i dati nel Lake e quindi copiandoli nel warehouse, rendendolo più accessibile e aggiungendo complessità e costi al panorama di analisi.

Una volta che le organizzazioni riusciranno a gestire meglio questa enorme impronta di dati, Data Lakehouse supporterà tutti i tipi di casi d'uso. Business intelligence (BI), analisi, applicazioni di dati in tempo reale, data science e ML sono i principali candidati. Il punto che Dell sta sottolineando più o meno è che una volta che si riesce a gestire l’espansione dei dati, è molto più semplice trarre vantaggi aziendali.

Specifiche tecniche di Dell Data Lakehouse

Dell Data Lakehouse riunisce molti software, ma alla fine si tratta di un'infrastruttura convergente basata su hardware. Dell ha messo insieme alcune delle sue migliori offerte hardware in tutto il portafoglio per mettere insieme questo design.

La tabella seguente evidenzia i componenti chiave del sistema, inclusi i nodi di lavoro che possono supportare le GPU. Molte organizzazioni vorranno seguire questa strada poiché gran parte delle analisi da eseguire su questi dati possono trarre vantaggio dalla maggiore potenza di calcolo che le GPU possono offrire.

Dell Validated Designs for Analytics – Data Lakehouse è ora disponibile.

Dell Analisi

Volantino Data Lakehouse di Dell (PDF)

Interagisci con StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | TikTok | RSS feed