A Dell Technologies apresentou o Dell Validated Designs for Analytics – Data Lakehouse, permitindo que as empresas combinem data lakes e data warehouses, resultando em qualidade de dados, desempenho, segurança e governança para todos os tipos de dados com autoatendimento sob demanda.
A Dell Technologies apresentou o Dell Validated Designs for Analytics – Data Lakehouse, permitindo que as empresas combinem data lakes e data warehouses, resultando em qualidade de dados, desempenho, segurança e governança para todos os tipos de dados com autoatendimento sob demanda.
Casa do Lago de Dados
O Dell Data Lakehouse permite a evolução do gerenciamento de dados de sistemas isolados, rígidos, caros e lentos para sistemas unificados que permitem inteligência de negócios (BI), análise, aplicativos de dados em tempo real, ciência de dados e aprendizado de máquina (ML). A solução validada pela Data Lakehouse compreende equipamentos em todo o portfólio da Dell, incluindo PowerEdge, PowerScale, ECS Object Storage e PowerSwitch.
Porém, nem tudo é hardware, a infraestrutura é alimentada por Apache Spark e Kafka com tecnologias Delta Lake e Robin Cloud-Native Platform (CNP). Quando tudo junto, esta solução é projetada para aproveitar mais dados para transformar insights nas organizações.
De acordo com um blog de Chhandomay Mandal, diretor da ISG Solution Marketing da Dell, “sistemas de gerenciamento de dados tradicionais, como data warehouses, têm sido usados há décadas para armazenar dados estruturados e disponibilizá-los para análises. No entanto, os data warehouses não são configurados para lidar com a crescente variedade de dados que a Dell desenvolveu um projeto de tipo de arquitetura de referência para um data lake/data warehouse combinados usando software de terceiros e seu próprio servidor, armazenamento e hardware de rede e software – texto, imagens, vídeo, Internet das coisas (IoT) – nem podem suportar algoritmos de inteligência artificial (IA) e aprendizado de máquina (ML) que exigem acesso direto aos dados.”
Os data lakes prometem ajudar a resolver esses problemas, permitindo que as empresas capturem dados estruturados, não estruturados e semiestruturados de maneira mais flexível e econômica do que os data warehouses tradicionais. As organizações usam um data lake em conjunto com um data warehouse armazenando dados no lake e copiando-os para o warehouse, tornando-o mais acessível e adicionando complexidade e custo ao cenário analítico.
Uma vez que as organizações tenham um melhor controle sobre essa enorme pegada de dados, o Data Lakehouse oferece suporte a todos os tipos de casos de uso. Inteligência de negócios (BI), análise, aplicativos de dados em tempo real, ciência de dados e ML são os principais candidatos. O ponto que a Dell está enfatizando mais ou menos é que, uma vez que você consegue lidar com dados dispersos, é muito mais fácil obter benefícios comerciais.
Especificações técnicas do Dell Data Lakehouse
O Dell Data Lakehouse reúne muitos softwares, mas, em última análise, é uma infraestrutura convergente baseada em hardware subjacente. A Dell reuniu algumas de suas melhores ofertas de hardware em todo o portfólio para montar esse design.
A tabela abaixo destaca os principais componentes do sistema, incluindo os nós de trabalho que podem suportar GPUs. Muitas organizações vão querer seguir esse caminho, pois grande parte da análise a ser feita nesses dados pode se beneficiar do aumento de poder computacional que as GPUs podem trazer.
O Dell Validated Designs for Analytics – Data Lakehouse já está disponível.
Folheto Data Lakehouse da Dell (PDF)
Envolva-se com a StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | TikTok | RSS feed