Lenovo は、ハイ パフォーマンス コンピューティング (HPC) 市場向けソリューションの提供における長年のリーダーです。 Lenovo の主流製品はエンドユーザーにもデータセンター管理者にもよく知られていますが、Lenovo の HPC 能力はおそらく彼らの最大の秘密です。その秘密は、スーパーコンピューターの世界最大のプロバイダーであるという点にあります (管理されているデータによれば、スーパーコンピューターの 32% がスーパーコンピューターを提供) トップ500).
Lenovo は、ハイ パフォーマンス コンピューティング (HPC) 市場向けソリューションの提供における長年のリーダーです。 Lenovo の主流製品はエンドユーザーにもデータセンター管理者にもよく知られていますが、Lenovo の HPC 能力はおそらく彼らの最大の秘密です。その秘密は、スーパーコンピューターの世界最大のプロバイダーであるという点にあります (管理されているデータによれば、スーパーコンピューターの 32% がスーパーコンピューターを提供) トップ500).
これらの大規模な HPC の勝利は、基本的に、Lenovo の HPC 分野に対する深い理解と、顧客のニーズを満たすために積極的にチャンスをつかむ姿勢によってもたらされました。このリスクを取るということは、具体的にはどのような意味を持つのでしょうか?さて、約10年前、レノボ 水冷スーパーコンピュータを納入 ドイツのミュンヘンにあるライプニッツ スーパーコンピューティング センターへ。このイベントは、特にラック スペース、冷却、電力が重視されるヨーロッパなどの地域で、スーパーコンピューティングの経済学を変えるのに役立ちました。
レノボ ThinkSystem SR670 V2
それ以来、スーパーコンピューティングは大きく変化しましたが、Lenovo は革新を続けています。 2018 年の夏、Lenovo は正式にサービスを開始しました。 ネプチューン、液体冷却によるより効率的なデータセンターのビジョンを示しています。 Lenovo は、ThinkSystem SD650 を市場に投入することで、トレイごとに 1 つの DWX (Neptune Direct Water Cooling) ノードをサポートする 2U トレイ内のコンポーネントに液体冷却を実現することがいかに簡単であるかを HPC 顧客に実証しました。 NeXtScale n1200 エンクロージャ (6U) では、最大 650 つのトレイがサポートされます。 2 年後、Lenovo は SD2-N V670、液体冷却、Ice Lake CPU、ソケット付き GPU、DRAM、ストレージ、および I/O モジュールを発売しました。 ThinkSystem SR2 VXNUMX への液体対空気 (LXNUMXA) 熱交換器の実装は、Lenovo のフォワード エンジニアリングの一例です。
Lenovo ThinkSystem SD650 V2 搭載 Neptune™ 液体冷却テクノロジー
とにかく HPC システムを必要とするのは誰ですか?
処理能力、ストレージの革新、メモリの大幅なパフォーマンス向上により、このようなパワーを必要とする人がいるでしょうか?
あらゆる規模の企業は、ネットワーク内のいくつかの異なるリソースからインテリジェンスを抽出するために、データを収集および分析するより効率的な方法を探しています。特に企業は、分子生物学、金融、地球規模の気候変動追跡、迅速な遺伝子分析、地震画像処理などの計算集約型プログラムに焦点を当てていました。 HPC は、市場での優位性を求め、生産性と成長に影響を与えるテクノロジーへの投資に積極的な企業など、より幅広い分野の組織からも注目を集めています。前述のアプリケーションの基盤である HPC と AI はより緊密に連携しており、組織がそのデータを活用するための新しい道を提供しています。
集約されたデータに即時にアクセスする必要性が、これらの HPC システムの需要を高め続けています。競争相手の一歩先を行くことは、組織の成功と長寿にとって不可欠です。 HPC は、ビジネス、科学、エンジニアリングの複雑な問題を解決する上で重要であり、科学、研究、小売、AV などのイノベーションの基礎となり、社会に影響を与えるテクノロジーの進歩を推進しています。
AI と M/L、IoT、リサーチ、ライブ ストリーミング サービスなどのテクノロジーから収集されるデータは爆発的に増加しており、通常のサーバーでは処理できないリアルタイム処理が必要です。
HPC の需要増加のもう 1 つの原動力は、システムがエッジ、クラウド、またはオンプレミスに導入できることです。重要なのは、データが作成された場所でデータを処理し、処理のためにデータを別の遠隔地に転送する必要がないことです。
Lenovo ThinkSystem SR670 v2 (L2A 熱交換器付き)
HPC プラットフォームを選択する際の重要な考慮事項は、スケールアウト機能です。大規模な計算リソースに関しては、多いほど良いです。これらのシステムのスケールアウト機能は非常に重要であり、大規模な HPC クラスターを作成できるかどうかは、スケールする能力に応じて成功または失敗を意味します。高速、低遅延の相互接続と NVMe などの新しいストレージ テクノロジを利用すると、計算結果が高速化されます。クラスターはデータセンター、クラウド、またはハイブリッド モデルで構築でき、柔軟でスケーラブルな展開を実現します。 Lenovo ThinkSystem SR670 V2 はそのようなシステムです。
HPC 要件を満たす GPU が豊富なサーバー
Lenovo ThinkSystem SR670 V2 は、NVIDIA A3 および A100 Tensor コア GPU を含む 40 つのダブルワイド GPU と、NVLink および Lenovo Neptune ハイブリッド リキッドで提供される NVIDIA HGX A100 4-GPU を搭載したモデルをサポートする、GPU が豊富な 200U ラック サーバーです。空冷。このサーバーは、新しい第 XNUMX 世代インテル Xeon スケーラブル プロセッサー ファミリ (旧名「Ice Lake」) と最新のインテル Optane パーシステント メモリー XNUMX シリーズをベースにしています。
SR670 V2 は、さまざまな業界にわたる人工知能 (AI)、ハイパフォーマンス コンピューティング (HPC)、およびグラフィック ワークロードに最適なパフォーマンスを提供します。小売、製造、金融サービス、ヘルスケア業界は、SR670 V2 の GPU の処理能力を活用して、より重要な洞察を抽出し、機械学習 (ML) と深層学習 (DL) を利用してイノベーションを推進できます。
従来の空冷方式は限界に達しつつあります。コンポーネントの能力、特に CPU と GPU の向上により、エネルギーとインフラストラクチャのコストが増加し、システムの騒音が増加し、二酸化炭素排出量が増加しています。 SR670 V2 モデルは、Lenovo Neptune 液対空気 (L2A) ハイブリッド冷却テクノロジーを採用しており、これらの課題に対処し、熱を素早く放散します。 NVIDIA HGX A100 GPU の熱は、独自の閉ループの液体から空気への熱交換器を通じて除去され、配管を追加することなく、高密度、低消費電力、静かな動作、高性能などの液体冷却の利点を実現します。
業界は GPU テクノロジーを活用しています
SR670 V2 は、NVIDIA Ampere データセンター ポートフォリオの最新の GPU をサポートするように設計された 3 つの第 670 世代 Intel Xeon スケーラブル プロセッサ上に構築されています。 SR2 VXNUMX は、視覚化、レンダリング、または計算集約型の HPC や AI を利用する場合でも、ワークロードに最適化されたパフォーマンスを提供します。
小売、製造、金融サービス、ヘルスケア業界は、GPU を活用してより重要な洞察を抽出し、機械学習 (ML) とディープ ラーニング (DL) を活用したイノベーションを推進しています。さまざまな組織でアクセラレーション コンピューティングが GPU を活用する方法をいくつか紹介します。
- 在宅勤務チーム向けのリモート視覚化
- レイトレーシングによるレンダリングによるフォトリアルなグラフィックス
- 強力なビデオのエンコードとデコード
- ライフサイエンスにおけるインシリコ試験と免疫学
- コールセンター向けの自然言語処理 (NLP)
- 品質管理のための自動光学検査(AOI)
- 小売顧客体験のためのコンピュータビジョン
アクセラレータの機能を利用するワークロードが増えるにつれて、GPU の需要が増加します。 ThinkSystem SR670 V2 は、高速化された HPC および AI ワークロードを実稼働環境に導入し、システム パフォーマンスを最大化するための最適化されたエンタープライズ グレードのソリューションを提供します。
柔軟な構成オプション
SR670 V2 はモジュラー設計により究極の柔軟性を実現します。構成オプションには次のものがあります。
- NVLink ブリッジを備えた最大 XNUMX つの倍幅 GPU
- NVLink および Lenovo Neptune™ ハイブリッド水冷を備えた NVIDIA HGX™ A100 4 GPU
- フロントまたはリアの高速ネットワーキングの選択
- ローカル高速 2.5 インチ、3.5 インチ、NVMe ストレージの選択
ThinkSystem SR670 V2 のパフォーマンスは、ワークロード、視覚化、レンダリング、または計算負荷の高い HPC および AI 向けに最適化されています。
NVIDIA A100 Tensor コア GPU は、あらゆる規模で前例のない高速化を実現し、AI、データ分析、HPC アプリケーション向けに世界最高パフォーマンスのエラスティック データ センターを強化します。 A100 は、効率的にスケールアップしたり、13 つの独立した GPU インスタンスに分割したりできます。マルチインスタンス GPU (MIG) は、柔軟なデータセンターがワークロードの需要の変化に動的に調整できるようにする統合プラットフォームを提供します。 670 台の ThinkSystem SR2 VXNUMX をラックに搭載すると、最大 XNUMX PFLOPS の計算能力を発揮できます。
最新の Intel® Xeon® スケーラブル ファミリー CPU 上に構築され、NVIDIA Tesla V100 や T4 などのハイエンド GPU をサポートするように設計された ThinkSystem SR670 V2 は、AI および HPC ワークロードに最適化された高速パフォーマンスを提供します。
拡張性のあるソリューション
AI から始める場合でも、本番環境に移行する場合でも、ソリューションは組織のニーズに合わせて拡張する必要があります。 ThinkSystem SR670 V2 は、高速ファブリックを使用するクラスター環境で使用し、ワークロードの需要の増加に応じてスケールアウトできます。
Lenovo Intelligent Computing Orchestration (LiCO) を使用すると、複数のユーザーのサポートが追加され、単一クラスター環境内で拡張できます。 LiCO は、HPC および AI アプリケーションのクラスター リソースを管理する強力なプラットフォームです。
LiCO は、AI と HPC の両方のワークフローを提供し、TensorFlow、Caffe、Neon、MXNet などの複数の AI フレームワークをサポートし、単一のクラスターを活用して多様なワークロード要件に対応します。
HPC ポートフォリオ全体のイノベーションの進歩も同様に急速に進んでいます。本格的な液体冷却を本格的に導入する準備がまだ整っていない組織にとって、ThinkSystem SR670 V2 は優れた柔軟性を提供します。
Lenovo ThinkSystem SR670 V2 の構成と仕様
構成可能性は、ThinkSystem SR670 V2 の魅力の核心です。その柔軟性は GPU 密度の高いコンピューティングに重点を置いており、その物理ボリュームのほとんどは、シングル幅、ダブル幅、または NVIDIA SXM のいずれであっても、モジュラー GPU 専用です。 XNUMX つの基本構成は次のとおりです。
構成1 | 構成2 | 構成3 | |
GPU の数 | 4x SXM | ダブルワイド 4 倍またはシングルワイド 8 倍 | 8倍倍幅 |
ドライブサポート | 8x 2.5 インチ | 8x 2.5 インチまたは 4x 3.5 インチ | 6x E1.S |
図示されている構成は次のとおりです。
以下の表は、SR670 V2 の完全な仕様を示しています。
コンポーネント | 製品仕様 |
機械の種類 | 7Z22 – 1 年間の保証 7Z23 – 3 年間の保証 |
フォームファクター | 3Uラック |
プロセッサ | 40 つの第 3.6 世代インテル Xeon スケーラブル プロセッサー (以前のコード名は「Ice Lake」)。最大 270 コアのプロセッサ、最大 XNUMX GHz のコア速度、最大 XNUMX W の TDP 定格をサポートします。 |
チップセット | Intel C621A「Lewisburg」チップセット、コードネーム「Whitley」プラットフォームの一部。 |
メモリ | 32 つのプロセッサーを備えた 16 個の DIMM スロット (プロセッサーあたり 8 個の DIMM スロット)。各プロセッサには 2 つのメモリ チャネルがあり、チャネルごとに 4 つの DIMM (DPC) が付いています。 Lenovo TruDDR3 RDIMM および 3200DS RDIMM がサポートされています。 DIMM スロットは、標準システム メモリと永続メモリの間で共有されます。 DIMM は 2 DPC で最大 XNUMX MHz で動作します。 |
永続メモリ | DIMM スロットに取り付けられた最大 16 個の Intel Optane パーシステント メモリ 200 シリーズ モジュール (プロセッサあたり 8 個) をサポートします。永続メモリ (Pmem) は、システム メモリ DIMM と組み合わせて取り付けられます。 |
メモリ最大 | RDIMM を使用する場合: 4 個の 32GB 128DS RDIMM を使用して最大 3TB 永続メモリあり: 4x 16GB 128DS RDIMM および 3x 16GB Pmem モジュールを使用して最大 128TB (プロセッサあたり 1.5TB) |
メモリ保護 | ECC、SDDC (x4 ベースのメモリ DIMM の場合)、ADDDC (x4 ベースのメモリ DIMM の場合、Platinum または Gold プロセッサが必要)、およびメモリ ミラーリング。 |
ディスクドライブベイ | 構成に応じて、2.5 インチ、3.5 インチ、または EDSFF ドライブのいずれか。
このサーバーは、最大 2 台の M.2 ドライブをサポートする内部 M.XNUMX アダプターもサポートしています。 |
最大内部ストレージ |
|
ストレージコントローラー |
|
オプティカルドライブベイ | 光学ドライブは内蔵していません。 |
テープドライブベイ | 内蔵バックアップドライブはありません。 |
ネットワークインターフェース | サーバー構成に応じて利用可能な、柔軟な PCIe 3.0 x4.0 または x8 ホスト インターフェイスを備えた OCP 16 SFF スロット:
OCP スロットは、2GbE、4GbE、および 1GbE ネットワーク接続を備えたさまざまな 10 ポートおよび 25 ポート アダプタをサポートします。オプションで XNUMX つのポートを XClarity Controller (XCC) 管理プロセッサと共有して、Wake-on-LAN および NC-SI をサポートできます。 |
PCI拡張スロット | 選択した GPU とドライブ ベイの構成に応じて、最大 4x PCIe 4.0 スロット。スロットの選択は次のとおりです。
|
GPUサポート | 構成に応じて、最大 8 個のダブルワイド PCIe GPU または 4 個の SXM GPU をサポートします。
注: NVIDIA A10 などのシングルワイド GPU を使用した構成は、特別入札リクエストによって可能になる場合があります。 |
ポート | フロント:
リア:
内部:
|
冷却 | 5 つのデュアルローター シンプルスワップ 80 mm ファン (構成に応じて)。ファンは N+1 ローター冗長構成であり、単一ローターの障害に耐えます。各電源には XNUMX つのファンが組み込まれています。 |
電源 | 80 PLUS Platinum 認定を取得した最大 1800 つのホットスワップ冗長 AC 電源。 2400 W または 220 W AC オプション、240 V AC をサポート。中国のみ、電源は XNUMX V DC もサポートします。
|
動画 | 200D ハードウェア アクセラレータを備えた 16 MB メモリを備えた G2 グラフィックスは、XClarity コントローラーに統合されています。最大解像度は 1920×1200 32bpp(60Hz)です。 |
ホットスワップ部品 | ドライブと電源。 |
システム管理 | ステータス LED を備えたオペレーター パネル。 SXM および 4-DW GPU モデルでは、LCD ディスプレイ付きの外部診断ハンドセット (8-DW GPU モデルでは利用できません)。 XClarity Controller (XCC) 組み込み管理、XClarity Administrator 集中インフラストラクチャ配信、XClarity Integrator プラグイン、および XClarity Energy Manager 集中サーバー電源管理。オプションの XClarity Controller Advanced および Enterprise により、リモート コントロール機能が有効になります。 |
セキュリティ機能 | シャーシ イントルージョン スイッチ、パワーオン パスワード、管理者パスワード、トラステッド プラットフォーム モジュール (TPM)、TPM 2.0 をサポート。中国のみ、オプションの Nationz TPM 2.0。 |
サポートされているオペレーティングシステム | Microsoft Windows Server、Red Hat Enterprise Linux、SUSE Linux Enterprise Server、VMware ESXi。 |
限定的保証 | 9 年または 5 年 (モデルに応じて) の顧客交換可能ユニットと、翌営業日 XNUMX×XNUMX のオンサイト限定保証 (NBD)。 |
サービスとサポート | オプションのサービスアップグレードは、Lenovo サービスを通じてご利用いただけます: 4 時間または 2 時間の応答時間、6 時間の修正時間、1 年または 2 年の保証延長、Lenovo ハードウェアのソフトウェアサポート、および一部のサードパーティアプリケーション。 |
寸法 | 幅: 448 mm (17.6 インチ)、高さ: 131 mm (5.2 インチ)、奥行き: 892 mm (35.1 インチ)。 |
重量 | おおよその重量(選択した構成によって異なります):
|
GPU は重要な構成パフォーマンス オプションを提供します
GPU サポートは、構成間で最も重要な変数です。シングル幅 GPU は PCIe x8 レーンを使用し、NVIDIA A10 まで拡張しますが、ダブル幅 GPU は PCIe x16 を使用し、NVIDIA A100 まで拡張します。主力の SXM 構成では、NVIDIA HGX A100 が使用されており、NVIDIA NVLink ブリッジ (GPU 間の直接通信) を使用して 670 つのオンボード GPU を接続します。ダブル幅の GPU 構成は NVLink をサポートし、SR2 V210 はダブル幅の AMD Instinct MIXNUMX もサポートします。
HGX A100 プラットフォームは、NVSwitch のない「Redstone」バリアントで、100 つのボード上に 40 つの SXM A400 GPU を搭載しています。 80GB、500ワット、および670GB、2ワットの両方のバージョンが利用可能です。特に、SR2 VXNUMX は、このプラットフォームで Lenovo の Neptune 液対空気 (LXNUMXA) ハイブリッド冷却を採用しており、より静かで効率的な冷却と消費電力の削減を実現しています。各 GPU にはコールド プレートが取り付けられており、そこを通じて XNUMX つの冗長低圧ポンプが液体を循環させます。大型の単一ラジエーターが熱を放散します。他の GPU 構成は空冷のみです。
各 GPU 上の個別の冷却ポンプは、Neptune ブランドのセクションの一部としてコールド プレート上に表示されます。これらはすべて単一のラジエーターを通って逆流し、ピーク負荷下でも温度を保ちます。
液体冷却には温度を低く保つという明らかな利点がありますが、GPU クロック速度がパフォーマンスにどれほどの影響を与えるかについては多くの人が認識していません。 GPU が空冷で高負荷にさらされている場合、熱設計のピーク点に達する可能性があり、そこでパフォーマンスを抑制し、温度を抑えるためにクロック速度を下げる必要があります。液体冷却にはこの問題がなく、ワークロード全体にわたって一貫した熱プロファイルを維持しながら、GPU をより強力かつ高速に実行できます。
以下のグラフは、全負荷時の空冷 GPU と水冷 GPU の違いを示しています。空冷モデルがピーク温度に達し始めると、GPU 周波数が低下しますが、水冷 CPU はその間ピーク クロック速度を維持します。
スロットについては、SR670 V2 の基本構成には前面 PCIe 2 x4.0 I/O スロットが 16 つありますが、前面の残りの部分は上記のドライブ オプション用に構成可能です。すべてホットスワップをサポートしています。
- SXM モデル – 以下から選択:
- 4x 2.5 インチ ホットスワップ NVMe ドライブ ベイ
- 8x 2.5 インチ ホットスワップ NVMe ドライブ ベイ
- 4-DW GPU モデル – 以下から選択:
- SAS、SATA、または NVMe ドライブをサポートする 8x 2.5 インチ ホットスワップ AnyBay ドライブ ベイ
- SATA HDD または SSD ドライブをサポートする 4x 3.5 インチ ホットスワップ ドライブ ベイ (特別入札による NVMe のみのサポート)
- 8-DW GPU モデル:
- 6x EDSFF E1.S ホットスワップ NVMe ドライブ ベイ
SR670 V2 は、2 つまたは XNUMX つの M.XNUMX フォーマット SATA または NVMe ブート ドライブまたはストレージ ドライブもサポートします。 RAID サポートは、オンボード ハードウェア コントローラー経由で提供されます。
一方、バックプレーンは固定されており、PCIe 4.0 x16 スロットが 3.0 つと OCP 670 が 2 つあります。 SR1800 V2400 の 80 つの冗長ホットスワップ電源装置も背面から見えます。 XNUMXW または XNUMXW のオプションがあり、XNUMX Plus Platinum 評価を受けています。
SXM 構成を搭載した SR670 V2 モデルには別の電源リンクが含まれており、フロント GPU セクションに専用の電源リンクを供給します。これらのモデルは、シャーシ背面からの実質的な電源リンクを備えていないスロットロード GPU モデルとはまったく対照的です。
SR670 V2 の残りのハードウェアも同様に印象的であり、その柔軟性のテーマを継承しています。最大 40 ワットの TDP を備えた、最大 80 つの 270 コア/16 スレッド Intel 「Ice Lake」第 4 世代 Xeon スケーラブル プロセッサをサポートします。各 CPU には 3200 個の DDR128-4 RDIMM スロットがあります。 670GB RDIMM を搭載した場合、メモリの上限は 2TB です。 CPU に応じて、SR16 VXNUMX も最大 XNUMX をサポートします。 インテル パーシステント メモリ 200 シリーズ、通常のシステムメモリとともにインストールされます。 ThinkSystem SR670 V2 が提供するすべてのハードウェアを備えた Lenovo は、システムのパフォーマンスを最大限に引き出すために、冷却レイアウトに最大限の努力を払っています。すべてのシステムですべてのコンポーネントがスロットリングなしで 100% の使用率で動作できるわけではありませんが、SR670 V2 はまさにそれを可能にするように設計されています。
最終的な考え
Lenovo は液体冷却に力を入れており、そのノウハウを活用して L2A 熱交換器などを開発してきました。サーバー内部の電力密度が増加し続ける中、ベンダーはコンポーネントから熱負荷を除去し、システムの外に熱負荷を逃がす創造的な方法を考え出す必要があります。すべての顧客が完全な水冷ソリューションを必要としているわけではありません。ただし、Lenovo は、そのポートフォリオにある空冷、部分水冷、および完全水冷サーバーを使用して、顧客の冷却需要を満たすソリューションを提供できます。
第一世代の Neptune™ は、CPU とメモリのみに液体冷却を提供しました。 CPU とメモリに加えて、Lenovos の Neptune 液体冷却システムは、電圧調整、ストレージ、PCIe、そして現在では GPU を含むように拡張されています。 Lenovo は、ファンを排除した水冷電源装置もリリースしました。 Lenovo は将来を見据えて、液体冷却が次世代の CPU や GPU によって生成される熱を処理し、企業顧客が慣れ親しんでいる密度と設置面積を維持するための鍵となると考えています。
このレポートは Lenovo によって後援されています。 このレポートで表明されているすべての見解と意見は、検討中の製品に対する当社の公平な見解に基づいています。
StorageReview と連携する
ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | Facebook | TikTok | RSSフィード