Meta は 14 年以上にわたり、いくつかの最大規模のデータセンターでハードウェアの設計、構築、導入を行ってきました。急速な成長を経た 2009 年、Facebook のエンジニアがソフトウェア、サーバー、ハードウェア、冷却を備えたエネルギー効率の高いデータセンターの設計に取り組み始めたとき、データ、人材、リソースの大幅な内部増加をサポートするためにインフラストラクチャを再考するためにエンジニアが招集されました。 、そしてパワー。彼らは現在、大容量ストレージの次の標準として Grand Canyon Storage System を OCP に提供しています。
Meta は 14 年以上にわたり、いくつかの最大規模のデータセンターでハードウェアの設計、構築、導入を行ってきました。急速な成長を経た 2009 年、Facebook のエンジニアがソフトウェア、サーバー、ハードウェア、冷却を備えたエネルギー効率の高いデータセンターの設計に取り組み始めたとき、データ、人材、リソースの大幅な内部増加をサポートするためにインフラストラクチャを再考するためにエンジニアが招集されました。 、そしてパワー。彼らは現在、大容量ストレージの次の標準として Grand Canyon Storage System を OCP に提供しています。
新しい施設は、同社の以前の施設に比べて建設時のエネルギー効率が 38% 高く、運営コストが 24% 低かった。 Facebook は、その成功を世界のエンジニアリング コミュニティと共有することを決定しました。そこで 2011 年に、ネットワーク機器のイノベーションのペースを高めるために、Open Compute Project Foundation (OCP) が開始されました。汎用サーバー、GPU サーバー、ストレージ アプライアンス、ラック設計に至るすべてが OCP コラボレーション モデルから生まれ、データセンターを超えて適用され、通信業界とエッジ インフラストラクチャの進歩に貢献しています。
したがって、Meta が OCP Global Summit を利用して、参加者を Grand Canyon と呼ばれる最新のストレージ サーバーと JBOD、および Barton Springs と呼ばれる新しいシングル ソケット サーバーに案内したことは、まさに適切でした。グランド キャニオンの設計は、より優れた高速ストレージ サーバーを構築するという要求から生まれました。
新しいサーバーの背後にある動機は次のことに基づいていました。
- スロットあたりの CPU パフォーマンスが向上
- 高密度ドライブをサポートするためにシャーシが改良されました (2025 ~ 2026 年あたりの期間まで)
- 電力効率
- 柔軟性の維持 (ORv3、モジュラー CPU カード)
- 長寿命コンポーネントを使用した設計
グランド キャニオンの設計ではモジュール性が向上し、新しいシャーシのアップグレード可能性と寿命が延長されました。
成分 | 説明 |
CPU | Intel Xeon「Cooper Lake」SOC |
ブートドライブ | M.2 ソリッドステート (2280 フォームファクター) ハイパースケール NVMe ブート SSD 仕様) |
DIMM | 1 チャネルで最大 4MT/s のチャネルあたり 4 DDR3200 DIMM |
PCH | インテル PCH チップセット |
新しいストレージ サーバーは、36 つのドロワー内で 3.5 台の 1 インチ HDD をサポートする XNUMX つのストレージ ノードで構成されます。グランド キャニオンでは、優れた仕様を備えた Barton Springs XNUMX ソケット サーバーを使用しています。新しいシャーシにはさらなる柔軟性が組み込まれており、システムを XNUMX つの構成で構築できるようになりました。
最初の構成オプションは、72 つの計算ノードと XNUMX 台の HDD を含むスタンドアロンのデュアル ストレージ サーバーで、データ アクセスを高速化するためにすべてのドライブの電源が常にオンになっています。
216 番目の構成は、ヘッド ノードとしても使用できる単一のコンピューティング ノードを備えた単一のストレージ サーバーです。この構成は XNUMX つの JBOD シャーシに接続します。これは XNUMX 番目の構成であり、コンピューティング ノードを備えず、最大 XNUMX 台の HDD をサポートします。
上の分解図に示すように、各構成にはシステム内のモジュールの実装が異なります。この設計の重要な要素は、シャーシの前面または上部からすべてのコンポーネントに簡単にアクセスできることです。
グランド キャニオン vs. ブライス キャニオン (前世代)
ブライスキャニオン | グランドキャニオン | |
Rescale 計算する | 16コア | 26コア |
SpecIntRate | 1 | 1.87 (ターボ有効) |
DRAM 容量、CPU あたりの BW | 2x 32GB DDR4、33GB/秒 | 4x 16GB DDR4、93GB/秒 |
コンピューティングあたりのブート SSD | 256 GB | 256 GB |
コンピューティングあたりのデータ SSD | 2x2TB m.2 | 2x2TB E1.S 9.5mm(アップグレード可能な容量) |
シャーシあたりのドライブ数、コンピューティングあたりのドライブ数 | 72、36 | 72、36 |
NIC | 50Gbps、シングルホスト、OCP2.0 | 50Gbps、単一ホスト、OCP 3.0 (100Gbps にアップグレード可能) |
グランドキャニオンストレージシステムの構造設計の改善
このシャーシ内の HDD の数とファンからの振動の可能性を考慮して、Meta は、高密度の HDD 容量の採用を可能にし、ファンの振動がエンクロージャに伝わるのを防ぐために、構造的および音響的な振動減衰機能の使用を改善しました。
メタ エンジニアは、サロゲートを使用して振動を測定し、ハードドライブ ベンダーに連絡して、グランド キャニオンのシャーシの設計に使用された振動軽減の利点を比較しました。
ファン システムは、ファンが停止すると閉じるブラインドを組み込むように変更され、システム全体の空気の流れの損失を防ぎます。これにより、ファンが故障した場合でも、シャーシ全体が適切に冷却されます。
Grand Canyon システムは、SAS Gen4 機能を含む Broadcom の最新の IOC およびエクスパンダを使用しており、SAS および SATA HDD と相互運用可能であり、SAS/SATA HDD 上のコマンド継続時間制限に対するハードウェアおよびファームウェアの互換性を提供します。 デュアルアクチュエーターHDD.
サポート文書
グランドキャニオンの特性評価用に構築されたサロゲート HDD については、 このトークを参照してください.
サロゲート HDD、改善、標準化に関する情報については、 OCP HDD ダイナミクス 作業の流れ。
Meta にとって興味深い機能の詳細については、「HDDの機能 今後のセッションについてはこちらをご覧ください。
スペックは、 GitHub リポジトリ (OpenBMC).
Grand Canyon システムは Wiwynn から入手でき、製品ガイドでは SV/ST7000G4 と呼ばれています。
StorageReview と連携する
ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード