首頁 企業 甲骨文宣布改進 MySQL HeatWave Lakehouse

甲骨文宣布改進 MySQL HeatWave Lakehouse

by 哈羅德弗里茨

在甲骨文云世界開幕當天,甲骨文宣布改進 MySQL HeatWave Lakehouse 基於 17 TB 的工作負載,查詢性能據稱比 Snowflake 快 6 倍,比 Redshift 快 400 倍。 據 Oracle 稱,MySQL HeatWave Lakehouse 可以從對象存儲加載 400 TB 數據,速度比 Redshift 快 8 倍,比 Snowflake 快 2.7 倍。

在甲骨文云世界開幕當天,甲骨文宣布改進 MySQL HeatWave Lakehouse 基於 17 TB 的工作負載,查詢性能據稱比 Snowflake 快 6 倍,比 Redshift 快 400 倍。 據 Oracle 稱,MySQL HeatWave Lakehouse 可以從對象存儲加載 400 TB 數據,速度比 Redshift 快 8 倍,比 Snowflake 快 2.7 倍。

MySQL HeatWave Lakehouse 是 MySQL HeatWave 產品組合的最新成員,它在單個 MySQL 數據庫中結合了事務處理、分析、機器學習和基於機器學習的自動化。 MySQL HeatWave Lakehouse 可擴展到 512 個節點,使客戶能夠以各種文件格式(例如 CSV 和 Parquet,以及 Aurora 和 Redshift 備份)處理和查詢對象存儲中數百 TB 的數據。

MySQL HeatWave Lakehouse 在大規模並行橫向擴展 MySQL HeatWave 架構的支持下,據說在運行查詢和加載數據方面比競爭性雲數據庫服務提供更好的性能,正如行業標準基準測試所證明的那樣。

在單個查詢中,客戶可以查詢 MySQL 數據庫中的事務數據,並使用標準 MySQL 語法將其與對象存儲中的數據結合起來。 Oracle 還宣布了新的 MySQL Autopilot 功能,可提高性能並使其更易於使用。 MySQL HeatWave Lakehouse 現已推出 Beta 版供客戶試用,併計劃於 1HCY23 全面上市。

從 AWS、谷歌和本地遷移的客戶一直在使用 MySQL HeatWave 進行廣泛的用例,包括營銷分析,特別是廣告活動績效的實時分析和客戶數據分析以構建有效的活動。 遷移的 AWS 客戶包括汽車、電信、零售、高科技和醫療保健行業的領導者。

甲骨文還發布了新的 Lakehouse 基準測試,並為 MySQL HeatWave Lakehouse 和 MySQL Autopilot 引入了多項功能。 甲骨文客戶可以試試 MySQL Heatwave 免費 30 天.

基準

正如公開可用的 400 TB TPC-H 基準所證明的那樣,腳本可在 GitHub上,MySQL HeatWave Lakehouse的查詢性能為:

  • 比雪花快 17 倍
  • 比 Amazon Redshift 快 6 倍

將數據從對象存儲加載到 MySQL HeatWave Lakehouse 中也明顯更快。 對於 400 TB TPC-H 工作負載,MySQL HeatWave Lakehouse 的負載性能為:

  • 比 Amazon Redshift 快 8 倍
  • 比雪花快 2.7 倍

MySQL HeatWave Lakehouse 的創新新功能

MySQL HeatWave Lakehouse 的新功能包括:

  • 更大的數據量,標準的 MySQL 語法: 客戶可以使用 MySQL HeatWave Lakehouse 查詢多達 400 TB 的數據,HeatWave 集群可擴展到 512 個節點。 客戶使用標準的 MySQL 語法查詢數據。
  • 相同的性能和壓縮: MySQL HeatWave 為存儲在 MySQL 數據庫或對象存儲中的數據提供相同的查詢性能——如 10TB 和 30TB TPC-H 基準測試所證明的那樣。 在這兩種情況下,實現的壓縮量和每個節點可以處理的數據量是相同的。
  • 支持多種文件格式: 借助 MySQL HeatWave Lakehouse,客戶可以加載和處理以各種文件格式存儲的數據,例如 CSV 和 Parquet,以及來自 AWS 的 Aurora 和 Redshift 備份。 這使客戶能夠利用 MySQL HeatWave 的優勢,即使他們的數據未存儲在 MySQL 數據庫中也是如此。 無論存儲數據的文件格式如何,查詢性能都是相同的。
  • 能夠在 MySQL 中查詢數據並將其與對象存儲中的數據結合: 借助 MySQL HeatWave Lakehouse,客戶可以查詢存儲在 MySQL 數據庫中的 OLTP 數據,並將其與存儲在對象存儲中的數據相結合。 對 OLTP 數據所做的任何更改都會實時更新並反映在查詢結果中。

新的 MySQL Autopilot 功能

MySQL Autopilot 為 MySQL HeatWave 提供基於機器學習的自動化。 MySQL HeatWave Lakehouse 增強了現有的 MySQL Autopilot 功能,例如自動配置和自動查詢計劃改進,從而減少了數據庫管理開銷並提高了性能。

新的 MySQL Autopilot 功能包括:

  • 自動模式推斷: Autopilot 自動推斷文件數據到數據庫中數據類型的映射。 因此,客戶無需為每個要由 MySQL HeatWave Lakehouse 查詢的新文件手動指定映射。
  • 自適應數據採樣: Autopilot 智能地對對象存儲中的文件部分進行採樣,以最少的數據訪問收集準確的統計數據。 MySQL HeatWave 使用這些統計數據來生成和改進查詢計劃、確定最佳模式映射等。
  • 自動加載: Autopilot 分析數據以預測加載到 MySQL HeatWave 的時間,確定數據類型的映射,並自動生成加載腳本。
  • 自適應數據流: MySQL HeatWave Lakehouse 動態適應底層對象存儲的性能。 因此,MySQL HeatWave 可以從底層雲基礎架構中獲得最大的可用性能,從而提高整體性能、性價比和可用性。

MySQL HeatWave 的其他增強功能

Oracle 宣布了 MySQL HeatWave 的許多其他增強功能,從機器學習到 VS 代碼插件。 MySQL HeatWave 的數據庫內 ML 功能得到進一步豐富,包括對預測模型的支持。 添加了新的 ML 解釋技術,這些技術已針對 MySQL HeatWave 進行了優化。 數據科學家現在可以影響自動化 HeatWave ML 訓練管道的各個階段,包括算法的選擇、特徵選擇、評分指標和解釋技術。 HeatWave ML 也得到了增強,允許客戶將 ML 模型導入 HeatWave。

新的多引擎 Hypergraph 查詢優化器進一步提高了複雜查詢的性能,並且無需指定連接順序。 添加了 Zone map,它加速了 MySQL HeatWave 的更廣泛的查詢集。 並且增強了 MySQL 的 VS 代碼插件以支持 MySQL HeatWave 功能。

為分佈式雲做好準備

MySQL HeatWave 在多個雲中可用,包括 OCI、AWS 和現在的 Microsoft Azure。 它作為 OCI 專用區域的一部分在本地提供,適用於不希望將其數據庫工作負載移動到公共雲的組織。 客戶還可以將數據從本地 MySQL OLTP 應用程序複製到 MySQL HeatWave,以獲得近乎實時的分析。 MySQL HeatWave 始終使用最新版本的 MySQL 數據庫。

參與 StorageReview

電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱