首页 企业版 戴尔经验证的分析设计——Data Lakehouse 推出

戴尔经验证的分析设计——Data Lakehouse 推出

by 哈罗德弗里茨
Dell EMC PowerEdge R750 标签

Dell Technologies 推出了 Dell Validated Designs for Analytics – Data Lakehouse,使公司能够结合数据湖和数据仓库,从而通过按需自助服务实现所有数据类型的数据质量、性能、安全性和治理。

Dell Technologies 推出了 Dell Validated Designs for Analytics – Data Lakehouse,使公司能够结合数据湖和数据仓库,从而通过按需自助服务实现所有数据类型的数据质量、性能、安全性和治理。

存储审查数据湖屋

数据湖屋

Dell Data Lakehouse 支持将数据管理从孤岛、僵化、昂贵和缓慢发展为支持商业智能 (BI)、分析、实时数据应用程序、数据科学和机器学习 (ML) 的统一系统。 Data Lakehouse 验证的解决方案包括戴尔产品组合中的设备,包括 PowerEdge、PowerScale、ECS 对象存储和 PowerSwitch。

不过,这并非全是硬件,基础设施由 Apache Spark 和 Kafka 以及 Delta Lake 技术和 Robin Cloud-Native Platform (CNP) 提供支持。 当所有这些捆绑在一起时,该解决方案旨在利用更多数据来转变整个组织的洞察力。

Dell EMC PowerEdge R750 BOSS-2 热插拔

根据戴尔 ISG 解决方案营销总监 Chhandomay Mandal 的博客,“传统的数据管理系统,如数据仓库,已经使用了几十年来存储结构化数据并使其可用于分析。 然而,数据仓库的设置并不能处理日益多样化的数据,戴尔已经使用第三方合作伙伴软件和自己的服务器、存储和网络硬件为组合数据湖/数据仓库设计了一个参考架构类型的设计,并且软件——文本、图像、视频、物联网 (IoT)——它们也不支持需要直接访问数据的人工智能 (AI) 和机器学习 (ML) 算法。”

数据湖承诺通过使企业能够比传统数据仓库更灵活、更具成本效益地捕获结构化、非结构化和半结构化数据来帮助解决这些问题。 组织将数据湖与数据仓库结合使用,将数据存储在湖中,然后将其复制到仓库,使其更易于访问并增加分析环境的复杂性和成本。

一旦组织能够更好地处理这种海量数据足迹,Data Lakehouse 就会支持各种用例。 商业智能 (BI)、分析、实时数据应用程序、数据科学和 ML 是主要候选者。 戴尔或多或少提出的观点是,一旦你掌握了庞大的数据,就更容易获得商业利益。

Dell Data Lakehouse 技术规格

Dell Data Lakehouse 汇集了大量软件,但归根结底,它是一个基于硬件的融合基础设施。 戴尔将其产品组合中的一些最佳硬件产品汇集在一起​​,将这种设计结合在一起。

下表突出显示了系统的关键组件,包括可以支持 GPU 的工作节点。 许多组织都希望走这条路,因为要对这些数据进行的大量分析都可以从 GPU 带来的增强计算能力中受益。

Dell Validated Designs for Analytics – Data Lakehouse 现已上市。

戴尔分析

戴尔的 Data Lakehouse 传单 (PDF)

参与 StorageReview

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | TikTok | RSS订阅