首頁 Enterprise雲端 OVHcloud美國GPU服務器評測

OVHcloud美國GPU服務器評測

by 喬丹拉努斯
OVH雲數據中心

在不斷發展的人工智能 (AI) 開發領域,雲訓練徹底改變了 AI 模型的創建、完善和部署方式。 雲訓練是一種使用遠程雲基礎設施訓練人工智能模型的方法,它具有許多優勢,可推動人工智能開發進入可擴展性、效率和可訪問性的新領域。

在不斷發展的人工智能 (AI) 開發領域,雲訓練徹底改變了 AI 模型的創建、完善和部署方式。 雲訓練是一種使用遠程雲基礎設施訓練人工智能模型的方法,它具有許多優勢,可推動人工智能開發進入可擴展性、效率和可訪問性的新領域。

通過利用雲計算的力量,組織和開發人員可以釋放一系列優勢,簡化人工智能培訓流程,並以以前無法實現的方式加速創新。 從輕鬆的可擴展性到專門的硬件利用,雲訓練使人工智能從業者能夠敏捷地應對複雜的挑戰,並充分利用其模型的潛力。

OVHcloud 美國 GPU 服務器徽標

OVHcloud US 是誰?

儘管不是家喻戶曉的名字,OVHcloud US(OVH Group 的美國子公司)提供裸機服務器、託管私有云和混合雲解決方案。 他們的解決方案涵蓋了從視頻遊戲專用服務器、為大型企業定制託管私有云服務以及介於兩者之間的一切。 在本次評測中,我們將探討他們的公共雲計算服務,特別是由 NVIDIA Tesla V100S GPU 提供支持的 GPU 雲。 這些 GPU 實例專為任何可從並行處理中受益的事物而設計,無論是基本的機器學習、生成式 AI 還是特定的 AI 模型訓練。

我們今天要關注的關鍵問題之一是基於雲的 GPU 處理相對於本地解決方案的優勢。 兩者當然都有爭議,但 OVHcloud US 提供了一些轉向雲的令人信服的理由,即使這只是為了開始您的個人或企業人工智能之旅。

主要賣點無疑是價格。 具有 0.88 GB VRAM、100 個 vCore 和 32GB 內存的單個 Tesla V14S 的起價為 45 美元/小時,可以使用數千小時的周期,甚至接近本地解決方案的成本。 然後,通過基於雲的實例來補充現有的內部 GPU 機器,以實現偶爾重新訓練 AI 模型等任務,從而帶來成本效益。

OVHcloud US GPU 產品分為以下幾類:

名稱 記憶體應用 核心 GPU 儲存應用 公共網絡 專用網 價格/小時
t2-45 GB 45 14 特斯拉 V100S 32 GB 400 GB的SSD 2 Gbps 4 Gbps $2.191
t2-90 GB 90 28 2x Tesla V100S 32 GB 800 GB的SSD 4 Gbps 4 Gbps $4.38
t2-180 GB 180 56 4x Tesla V100S 32 GB 50 GB 固態硬盤 + 2 TB NVMe 10 Gbps 4 Gbps $8.763
t2-le-45 GB 45 14 特斯拉 V100S 32 GB 300 GB的SSD 2 Gbps 4 Gbps $0.88
t2-le-90* GB 90 30 特斯拉 V100S 32 GB 500 GB的SSD 4 Gbps 4 Gbps $1.76
t2-le-180* GB 180 60 特斯拉 V100S 32 GB 500 GB的SSD 10 Gbps 4 Gbps $3.53

*新發布

OVHcloud 美國 GPU 服務器硬件

讓我們更深入地了解 OVHcloud US 提供的硬件選項。 GPU 實例的核心是 NVIDIA Tesla V100S,這是一款針對計算進行優化的 GPU,具有 32GB HBM2 內存。 雖然較新的 Tesla A100 主要取代了這些 GPU,但 V100S 仍然提供出色的性能和價值。

這些實例最重要的方面是它們基於雲,因此它們不會佔用您現場可能擁有的任何系統,這使它們成為“設置後就忘記它”工作流程的理想解決方案。 這些 GPU 通過 PCI 直通直接傳送到實例,無需虛擬化層,從而為您的工作提供每張卡的專用使用。
OVHcloud US GPU 服務器 GPU 詳細信息在 CPU 方面,他們沒有指定您將獲得哪些特定 SKU,但他們保證所有內核至少為 2.2GHz,這對於大多數應用程序來說足夠快。 我們的特定實例報告有一個 Intel Xeon Gold 6226R,其 14 個線程中的 32 個可供我們使用。 vCore 數量範圍為 14 至 56。

如果您的用例需要,OVHcloud US 確實提供具有更快 CPU 的不同選項。 內存選項範圍從 45GB 到 180GB,對於大多數以 GPU 為中心的工作流程來說應該足夠了。 同樣的理念也適用於存儲,容量從 300GB 到專用的 2TB NVMe 驅動器。

OVHcloud 美國 GPU 服務器 – 流行的 AI 使用案例

技術開發

啟動和運行一個實例的速度足夠快且足夠便宜,以至於 OVHcloud 為即使是休閒開發人員也可以使用像樣的 GPU 提供了令人信服的理由。 理論上,您可以在本地創建所有訓練數據,將其加載到您選擇的雲數據提供商,啟動實例,然後開始訓練/微調在線提供的各種模型。

通過對該場景的嚴格測試,我們開發了多種成熟的 駱駝 利用 Alpaca 代碼和 Huggingface 轉換權重來調整口味。 這些口味可以在您的設備上無縫準備,方便地上傳到 Google Drive,輕鬆下載到實例上,並進行專業微調。 現在,我們正在使用較低參數的模型來適應我們擁有的 32GB VRAM,與嘗試購買 RTX8000 這樣的類似卡並在家庭實驗室中折騰相比,它仍然是一個更易於管理的選擇。

小型企業可以使用此策略為開發人員或團隊提供 GPU 計算訪問權限,而不必等待硬件或重大預算批准。

推理

V100S 是一款出色的 GPU,適用於可裝入其內存的 LLM 推理。 雖然推理時間與您使用 ChatGPT 等服務獲得的時間不同,但權衡是運行您自己的私有模型的好處。 與往常一樣,運行具有 24/7 正常運行時間的雲服務會產生成本,但以當前每小時 0.88 美元的速度運行實例需要幾個月的時間才能接近本地運行所需的基礎設施。

圖像識別

從圖像中提取數據以對其進行分類、識別元素或構建更豐富的文檔是許多行業的要求。 通過將 Caffe2 等框架與 Tesla V100S GPU 相結合,醫療成像、社交網絡、公共保護和安全變得更加容易。

情況分析

在某些情況下,需要實時分析,以應對各種和不可預測的情況做出適當的反應。 例如,該技術用於自動駕駛汽車和互聯網網絡流量分析。 這就是深度學習出現的地方,形成通過訓練獨立學習的神經網絡。

人際交往

過去,人們學會了與機器交流。 我們現在正處於一個機器正在學習與人交流的時代。 無論是通過語音還是通過聲音和視頻進行情感識別,TensorFlow 等工具都突破了這些交互的界限,開闢了許多新用途。

實踐印象

OVHcloud Linux 發行版選擇

一開始,OVHcloud US 門戶非常直觀,設置也很簡單。 創建帳戶,添加付款方式,創建一些 SSH 密鑰,選擇實例,獲取紅牛,然後通過 SSH 連接到新的 GPU 盒。 我們使用 Ubuntu Server,但其他選項也適用於 Linux 版本和風格,包括 Fedora、Arch、Debian CenOS、AlmaLinux 和 Rocky。

還可以選擇安裝各種操作系統映像,其中包括 Docker 等應用程序。

OVHcloud Unix 選擇列表

親身體驗 OVHcloud US GPU 服務器後,我們發現這種體驗非常用戶友好且響應迅速。 實例設置非常簡單,並且訪問 GPU 資源幾乎是無縫的。 無論是測試複雜的機器學習模型,還是處理大規模數據處理任務,OVHcloud US的GPU實例都表現出了卓越的性能。

此外,擴展資源的靈活性使我們能夠根據我們的特定需求定制環境。 從用戶界面到底層硬件,一切的設計都是為了促進平穩高效的工作流程。 對各種流行人工智能框架的支持,再加上 NVIDIA Tesla V100S GPU 的強大功能,使我們的實驗、模型訓練和推理不僅成為可能,而且非常有效。

通過這些基於雲的解決方案增強我們的內部資源的能力證實了OVHcloud US 對於在人工智能領域邁出第一步的初學者和尋求可靠且經濟高效的解決方案的經驗豐富的專業人士來說都是一個有吸引力的選擇。

我們運行了幾個基準測試來測試 CPU 分配性能和 V100 實施。 首先是 Blender-CLI 基準測試,然後是我們最喜歡的 CPU 基準測試 y-cruncher。

GPU怪物 1112.95022
GPU 垃圾場 754.813874
GPU課堂 603.196188
CPU怪獸 113.467036
CPU垃圾場 62.223543
CPU課堂 50.618349
y 型破碎機 1b
40.867秒
y 型破碎機 2.5b
113.142秒

t2-45le 實例經過測試,提供了與其規格一致的結果,其性能指標沒有出現任何意外。 搭載 V100 後,很明顯它可以處理密集的推理任務,甚至在性能和費用方面都可以有效支持基於雲的訓練操作。

關閉的思考

與企業 IT 中的一切一樣,有利有弊。 雲訓練人工智能也是如此。 使用 OVHcloud US GPU 服務器進行雲訓練可提供可擴展性、成本效益和加速開發,並打開創新和實驗之門。 專業的硬件、全球可訪問性和無縫協作使基於雲的人工智能為突破性發現做好了準備。

OVH雲數據中心

OVH雲數據中心

這些優勢與數據安全問題和網絡穩定性的現實並存。 為了解決潛在的陡峭學習曲線,人工智能的雲培訓應謹慎對待,提醒組織製定符合其獨特需求和優先事項的戰略課程。

雖然我們只觸及了特定的 GPU Server,但 OVHcloud US 擁有一套全面的服務。 總的來說,支持很友好,他們在我們初次註冊後跟進,看看我們是否需要幫助。 該門戶直觀、易於使用和理解,並且系統的運行完全符合預期。 唯一的缺點可能是缺乏區域,但由於成本和簡單性,這一點很容易被忽視。 OVHcloud US 得到了可靠的推薦,並將作為未來項目的潛在雲提供商,為需要在實驗室之外或只需租用一點額外的能力來完成工作的項目提供支持。

當我們應對這一動態格局時,必須以平衡的視角對待人工智能雲培訓,擁抱機遇,同時務實應對挑戰。 以獨創性和實用性為標誌的人工智能卓越之旅是通過理解這些利弊之間錯綜複雜的相互作用以及製定利用前者同時減輕後者的策略而形成的。

OVHcloud美國

參與 StorageReview

電子通訊 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱