Dell Technologies 推出了 Dell Validated Designs for Analytics – Data Lakehouse,使公司能够结合数据湖和数据仓库,从而通过按需自助服务实现所有数据类型的数据质量、性能、安全性和治理。
Dell Technologies 推出了 Dell Validated Designs for Analytics – Data Lakehouse,使公司能够结合数据湖和数据仓库,从而通过按需自助服务实现所有数据类型的数据质量、性能、安全性和治理。
数据湖屋
Dell Data Lakehouse 支持将数据管理从孤岛、僵化、昂贵和缓慢发展为支持商业智能 (BI)、分析、实时数据应用程序、数据科学和机器学习 (ML) 的统一系统。 Data Lakehouse 验证的解决方案包括戴尔产品组合中的设备,包括 PowerEdge、PowerScale、ECS 对象存储和 PowerSwitch。
不过,这并非全是硬件,基础设施由 Apache Spark 和 Kafka 以及 Delta Lake 技术和 Robin Cloud-Native Platform (CNP) 提供支持。 当所有这些捆绑在一起时,该解决方案旨在利用更多数据来转变整个组织的洞察力。
根据戴尔 ISG 解决方案营销总监 Chhandomay Mandal 的博客,“传统的数据管理系统,如数据仓库,已经使用了几十年来存储结构化数据并使其可用于分析。 然而,数据仓库的设置并不能处理日益多样化的数据,戴尔已经使用第三方合作伙伴软件和自己的服务器、存储和网络硬件为组合数据湖/数据仓库设计了一个参考架构类型的设计,并且软件——文本、图像、视频、物联网 (IoT)——它们也不支持需要直接访问数据的人工智能 (AI) 和机器学习 (ML) 算法。”
数据湖承诺通过使企业能够比传统数据仓库更灵活、更具成本效益地捕获结构化、非结构化和半结构化数据来帮助解决这些问题。 组织将数据湖与数据仓库结合使用,将数据存储在湖中,然后将其复制到仓库,使其更易于访问并增加分析环境的复杂性和成本。
一旦组织能够更好地处理这种海量数据足迹,Data Lakehouse 就会支持各种用例。 商业智能 (BI)、分析、实时数据应用程序、数据科学和 ML 是主要候选者。 戴尔或多或少提出的观点是,一旦你掌握了庞大的数据,就更容易获得商业利益。
Dell Data Lakehouse 技术规格
Dell Data Lakehouse 汇集了大量软件,但归根结底,它是一个基于硬件的融合基础设施。 戴尔将其产品组合中的一些最佳硬件产品汇集在一起,将这种设计结合在一起。
下表突出显示了系统的关键组件,包括可以支持 GPU 的工作节点。 许多组织都希望走这条路,因为要对这些数据进行的大量分析都可以从 GPU 带来的增强计算能力中受益。
Dell Validated Designs for Analytics – Data Lakehouse 现已上市。
戴尔的 Data Lakehouse 传单 (PDF)
参与 StorageReview
电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | TikTok | RSS订阅