Dell Technologies 推出了 Dell Validated Designs for Analytics – Data Lakehouse,使公司能夠結合數據湖和數據倉庫,從而通過按需自助服務實現所有數據類型的數據質量、性能、安全性和治理。
Dell Technologies 推出了 Dell Validated Designs for Analytics – Data Lakehouse,使公司能夠結合數據湖和數據倉庫,從而通過按需自助服務實現所有數據類型的數據質量、性能、安全性和治理。
數據湖屋
Dell Data Lakehouse 支持將數據管理從孤島、僵化、昂貴和緩慢發展為支持商業智能 (BI)、分析、實時數據應用程序、數據科學和機器學習 (ML) 的統一系統。 Data Lakehouse 驗證的解決方案包括戴爾產品組合中的設備,包括 PowerEdge、PowerScale、ECS 對象存儲和 PowerSwitch。
不過,這並非全是硬件,基礎設施由 Apache Spark 和 Kafka 以及 Delta Lake 技術和 Robin Cloud-Native Platform (CNP) 提供支持。 當所有這些捆綁在一起時,該解決方案旨在利用更多數據來轉變整個組織的洞察力。
根據戴爾 ISG 解決方案營銷總監 Chhandomay Mandal 的博客,“傳統的數據管理系統,如數據倉庫,已經使用了幾十年來存儲結構化數據並使其可用於分析。 然而,數據倉庫的設置並不能處理日益多樣化的數據,戴爾已經使用第三方合作夥伴軟件和自己的服務器、存儲和網絡硬件為組合數據湖/數據倉庫設計了一個參考架構類型的設計,並且軟件——文本、圖像、視頻、物聯網 (IoT)——它們也不支持需要直接訪問數據的人工智能 (AI) 和機器學習 (ML) 算法。”
數據湖承諾通過使企業能夠比傳統數據倉庫更靈活、更具成本效益地捕獲結構化、非結構化和半結構化數據來幫助解決這些問題。 組織將數據湖與數據倉庫結合使用,將數據存儲在湖中,然後將其複製到倉庫,使其更易於訪問並增加分析環境的複雜性和成本。
一旦組織能夠更好地處理這種海量數據足跡,Data Lakehouse 就會支持各種用例。 商業智能 (BI)、分析、實時數據應用程序、數據科學和 ML 是主要候選者。 戴爾或多或少提出的觀點是,一旦你掌握了龐大的數據,就更容易獲得商業利益。
Dell Data Lakehouse 技術規格
Dell Data Lakehouse 匯集了大量軟件,但歸根結底,它是一個基於硬件的融合基礎設施。 戴爾將其產品組合中的一些最佳硬件產品匯集在一起,將這種設計結合在一起。
下表突出顯示了系統的關鍵組件,包括可以支持 GPU 的工作節點。 許多組織都希望走這條路,因為要對這些數據進行的大量分析都可以從 GPU 帶來的增強計算能力中受益。
Dell Validated Designs for Analytics – Data Lakehouse 現已上市。
戴爾的 Data Lakehouse 傳單 (PDF)
參與 StorageReview
電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | 的TikTok | RSS訂閱