NVIDIA 認定 Cisco Nexus HyperFabric AI エンタープライズリファレンスアーキテクチャ

NVIDIA エンタープライズリファレンスアーキテクチャに準拠した Cisco Nexus ハイパーファブリック AI エンタープライズリファレンスアーキテクチャは、NVIDIA HGX^™ H200 および NVIDIA Spectrum-X^™ を搭載した Cisco UCS^® C885A M8 ラックサーバの Cisco^® クラウド管理 AI/ML ネットワーキングを特徴としています

はじめに

Cisco Nexus^® Hyperfabric AI は、クラウドでホストされているコントローラによって管理されるオンプレミスの AI クラスタです。これは、AI イニシアチブを強化およびシンプル化します。そして、包括的な統合クラウド管理型ソリューションにより、人工知能デプロイメントを促進します。Cisco Nexus Hyperfabric AI リファレンスアーキテクチャは、Cisco Silicon One^®スイッチに基づいており、NVIDIA HGX H200 および Spectrum-X の NVIDIA エンタープライズリファレンスアーキテクチャ（エンタープライズ RA）に準拠しています。

ソリューションの重要コンポーネントを図 1 に示します。クラスタで使用される主要なハードウェアコンポーネントについては、次のセクションで説明します。

Key components of Cisco Nexus Hyperfabric AI

図 1.

Cisco Nexus Hyperfabric AI の主要なコンポーネント

ハードウェア

Cisco UCS C885A M8 ラックサーバ

Cisco UCS C885A M8 ラックサーバは、大規模言語モデル（LLM）トレーニング、ファインチューニング、大規模モデル推論、取得拡張生成（RAG）などの　AI ワークロード向けに、大規模でスケーラブルなパフォーマンスを提供する 8RU であり、高密度 GPU サーバです。C-G-N-B 命名規則は、2-8-10-40（C-G-N-B）内の NVIDIA HGX リファレンスアーキテクチャに基づいてが次のように定義されています：

● C：ノード内の CPU の数

● G：ノード内の GPU の数

● N：以下のように分類されているネットワークアダプタ（NIC）の数

◦ North-south：ノードと外部システムの間の通信。

◦ East-west：クラスタ内の通信。

● B：GPU あたりの平均ネットワーク帯域幅（ギガビット/秒（GbE）単位）

サーバ内の 8x NVIDIA H200 SXM GPU は、高速 NVLink インターコネクトを使用してインターコネクトされています。east-west トラフィックは、8x NVIDIA BlueField-3 B3140H SuperNIC、そして、north/south トラフィックは、VIDIA BlueField-3 B3240 DPU NIC（1x400G モード内）を使用して、他の物理サーバに GPU 接続します。コンピューティング用に、各サーバには 2 つの AMD EPYC CPU、最大 3 TB の DDR DRAM、
30 TB の NVMe ローカルストレージ、およびホットスワップ可能なファントレイと電源が含まれます。
サーバの詳細な仕様については、付録 A を参照してください。

Cisco UCS C885A M8 Rack Server with NVIDIA HGX

図 2.

NVIDIA HGX を搭載した Cisco UCS C885A M8 ラックサーバ

Cisco HF6100-60L4D

Cisco HF6100-60L4D は、1RU シリコンワン NPU ベースの高密度スイッチで、1/10/25/50GE の速度に対応する 60 個の SFP56 ポートと、ブレークアウトをサポートする 400 QSFPDD の 4 個のポートをサポートしています。このスイッチは、管理ネットワーク、アプリケーションやサポートサーバーへの接続などのさまざまな役割を果たします。

Cisco HF6100-60L4D switch

図 3.

Cisco HF6100-60L4D スイッチ

Cisco HF6100-32D

Cisco HF6100-32D は、32 ポートの QSFPDD をサポートする、1RU シリコンワン NPU ベースの高密度 400G-port–capable スイッチです。このスイッチは、クラスタの要件に応じて、リーフまたはスパインロールで使用できます。

Cisco HF6100-32D switch

図 4.

Cisco HF6100-32D スイッチ

Cisco HF6100-64E

Cisco HF6100-64E は、2RU シリコン 1 NPU ベースの高密度 800G-port-capable スイッチで、64 個の OSFP 800G ポートをサポートおよび 64 個の 800GE または 128 個の 400G GE ポートに対応できます。これは、リーフとスパインの両方のロールで使用できます。

Cisco HF6100-64E Switch

図 5.

Cisco HF6100-64E スイッチ

Cisco UCS C225 M8 ラックサーバ

Cisco UCS C225 M8 ラックサーバは 1RU の汎用サーバーで、アプリケーションサーバー、サポートサー
バー、Kubernetes（K8s）や Slurm などの制御ノードなど、さまざまなロールで使用できます。Cisco Nexus Hyperfabric AI 内では、これらのサーバーは、以下の「ストレージアーキテクチャ」セクションで説明されている VAST ストレージソリューションを実行するためにも使用されます。

Cisco UCS C225 M8 Rack Server

図 6.

Cisco UCS C225 M8 ラックサーバ

Cisco オプティクスおよびケーブル

表 1 に示されている次のシスコのオプティクスとケーブルが、リストされているデバイスで使用されています。

表 1. さまざまなデバイスでサポートされるオプティクスおよびケーブルのリスト

デバイス	オプティクスおよびケーブル
B3140H、B3240	CB-M12-M12-SMF ケーブル付き QSFP-400G-DR4
B3220	CB-M12-M12-MMF ケーブル付き QSFP-200G-SR4
HF6100-64E	デュアル CB-M12-M12-SMF ケーブル付き OSFP-800G-DR8
HF6100-32D	CB-M12-M12-SMF ケーブル付き QDD-400G-DR4 CB-M12-M12-MMF ケーブル付き QSFP-200G-SR4
HF6100-60L4D	CB-M12-M12-SMF ケーブル付き QDD-400G-DR4 CAT5E ケーブルを使用した 1G 用の SFP-1G-T-X CAT6A ケーブルを使用した 10G 用 SFP-10G-TX

ネットワーキングトポロジ

Hyperfabric は、任意のタイプのファブリック設計に使用できる柔軟な多目的ファブリック設計ツールです。AI クラスタの展開を容易にするために、Hyperfabric for AI には、さまざまな「T レイヤー」サイズの AI クラスタ用の事前構成済みテンプレートが付属しています。お客様は「現状のまま」のテンプレートを使用するか（デバイスの接続に必要な光ファイバおよび関連する光ファイバの長さ以外の選択肢やカスタマイズはありません）、または独自のカスタムネットワークを設計することを選択できます。テンプレート化された設計のみが、NVIDIA エンタープライズリファレンスアーキテクチャ（ARA）と密接に連携するリファレンスアーキテクチャの一部と見なされます。以下に示すように、Cisco^® のデザインの特定の側面に対応するために、マイナーな変更が加えられています：

● NVIDIA HGX を搭載した Cisco UCS C885A M8 ラックサーバには、NVIDIA の 2x200G ポートではなく、2x400G のフロントエンドポートが含まれています。また、x86 管理ポートでは 1G ではなく 10G の速度が使用されます。

● VAST ストレージソリューションには、ストレージネットワークに最低 8x400G が必要です

● NVIDIA BlueField-3 SuperNIC の BMC ポートは接続されず、x86 ホストから管理されます。ただし、NVIDIA BlueField-3 DPU の BMC ポートは接続されます。

NVIDIA HGX を搭載した Cisco UCS C885A M8 ラックサーバのトポロジ

図 7 の図に、NVIDIA HGX を使用した最大 12 の Cisco UCS C885A M8 ラックサーバのクラスタトポロジを示します。

Enterprise RA for 12 Cisco UCS C885A M8 Rack Servers with NVIDIA HGX (96 GPUs)

図 7.

NVIDIA HGX を搭載した 12 台の Cisco UCS C885A M8 ラックサーバ用エンタープライズ RA（96 GPU）

表 2 に NVIDIA HGX サーバを搭載した 12 ノード Cisco UCS C885A M8 ラックサーバクラスタの BOM を示します。

表 2. NVIDIA HGX （96 GPU）を搭載した 12 ノード Cisco UCS C885A M8 ラックサーバクラスタの BOM

PID	説明	数量
UCSC-885A-M8-HC1	NVIDIA HGX を搭載した Cisco UCS C885A M8 ラックサーバ	12
HF6100-64ED	Cisco ハイパーファブリックスイッチ、64x800Gbps OSFP	2
HF6100-60L4D	Cisco Hyperfabric スイッチ 60x50G SFP28 4x400G QSFP-DD	1
HF6100-32D	Cisco Hyperfabric スイッチ、32x400Gbps QSFP-DD	2
OSFP-800G-DR8	OSFP、800GBASE-DR8、SMF デュアル MPO-12 APC、500m	114
QDD-400G-DR4-S	400G QSFP-DD トランシーバ、400GBASE-DR4、MPO-12、500m パラレル	10
QSFP-400G-DR4	400G QSFP112 トランシーバ、400GBASE-DR4、MPO-12、500 m パラレル	120
SFP-1G-TX	1G SFP	36
SFP-10G-T-X	10G SFP	24
CB-M12-M12-SMF	MPO-12 ケーブル	204
CAT6A	10G 用銅ケーブル	24
CAT5E	1G 用銅ケーブル	36

800G から 400G への接続では、以下に示すように、スイッチ側にデュアル 2x400G MPO-12 コネクタを備えたオプティクスを使用します。

Cisco OSFP-800G-DR8 transceiver module

図 8.

Cisco OSFP-800G-DR8 トランシーバモジュール

各接続は、ブレークアウトケーブルを必要とせずに独立して 400G をサポートします。

Cisco OSFP-800G-DR8 plughole view

図 9.

Cisco OSFP-800G-DR8 プラグホールビュー

図 10 の図に、NVIDIA HGX を使用した最大 16 の Cisco UCS C885A M8 ラックサーバのクラスタトポロジを示します。East-West（EW）ネットワークは、左側の東西スパイン上に 4 本のレール、右側の東西スパイン上に 4 本のレールが配置されています。

Enterprise RA for 16 Cisco UCS C885A M8 Rack Servers with NVIDIA HGX (128 GPUs)

図 10.

NVIDIA HGX を搭載した 16 台の Cisco UCS C885A M8 ラックサーバ用エンタープライズ RA（128 GPU）

表 3 に NVIDIA HGX サーバを搭載した 16 ノード Cisco UCS C885A M8 ラックサーバクラスタの BOM を示します。

表 3. NVIDIA HGX （128 GPU）を搭載した 16 ノード Cisco UCS C885A M8 ラックサーバクラスタの BOM

PID	説明	数量
UCSC-885A-M8-HC1	NVIDIA HGX を搭載した Cisco UCS C885A M8 ラックサーバ	16
HF6100-64ED	Cisco ハイパーファブリックスイッチ、64x800Gbps OSFP	4
HF6100-60L4D	Cisco Hyperfabric スイッチ 60x50G SFP28 4x400G QSFP-DD	2
HF6100-32D	Cisco Hyperfabric スイッチ、32x400Gbps QSFP-DD	2
OSFP-800G-DR8	OSFP、800GBASE-DR8、SMF デュアル MPO-12 APC、500m	144
QDD-400G-DR4	400G QSFP-DD トランシーバ、400GBASE-DR4、MPO-12、500m パラレル	12
QSFP-400G-DR4	400G QSFP112 トランシーバ、400GBASE-DR4、MPO-12、500 m パラレル	160
SFP-1G-TX	1G SFP	48
SFP-10G-T-X	10G SFP	32
CB-M12-M12-SMF	MPO-12 ケーブル	198
CAT6A	10G 用銅ケーブル	32
CAT5E	1G 用銅ケーブル	48

クラスタサイズが 16 を超える場合、East-West（E-W）コンピューティングネットワークはスパインリーフファブリックに拡張されます。クラスタサイズが最大の場合、128 Cisco UCS C885A M8 ラックサーバクラスタの図 11 に示すように、north/south（N-S）ネットワークもスパインリーフになります。E-W ネットワークは、各 EW リーフ 1〜8 にある各レール 1〜8 とレールに沿っています。

Enterprise RA for 128 Cisco UCS C885A M8 Rack Servers with NVIDIA HGX (1024 GPUs)

図 11.

NVIDIA HGX を搭載した 128 台の Cisco UCS C885A M8 ラックサーバ用エンタープライズ RA（1024 GPU）

クラスタファブリックのサイジングテーブル

Cisco UCS C885A M8 ラックサーバでサイジング

表 4 と表 5 は、NVIDIA HGX を搭載した Cisco UCS C885A M8 ラックサーバシステム、8 EW B3140H NVIDIA BlueField-3 基の SuperNIC と 2 NS B3240 NVIDIA BlueField-3 DPU NIC を使用したさまざまなクラスタサイズに必要なさまざまなユニットの数量を示しています。

表 4. NVIDIA HGX を搭載した Cisco UCS C885A M8 ラックサーバの East-west コンピューティングファブリックテーブル：コンピューティング、スイッチ、トランシーバ、ケーブル数

コンピューティング数		スイッチ数			トランシーバ数			ケーブル数
ノード	GPU	リーフ	スパイン	SuperSpine	ノードからリーフ		スイッチ間（800G）	ノードからリーフ	スイッチとスイッチ
ノード	GPU	リーフ	スパイン	SuperSpine	ノード（400G）	リーフ（800G）	スイッチ間（800G）	ノードからリーフ	スイッチとスイッチ
12	96`	2	なし	なし	96	48	48	96	48
16	128	2	なし	なし	128	64	64	128	64
32	256	4	2	該当なし	256	128	256	256	256
64	512	8	8	該当なし	512	256	1024	512	1024
128	1024	16	16	8	1024	512	2048	1024	2048

表 5. NVIDIA HGX を搭載した Cisco UCS C885A M8 ラックサーバの North-south コンピューティングファブリック
テーブル：コンピューティング、スイッチ、トランシーバ、ケーブル数

コンピューティング数		スイッチ数					トランシーバ数												ケーブル数
ノード	GPU	リーフ	スパイン		管理リーフ	ストレージリーフ	ノードからコンピューティングリーフ		ISL ポート	ノードから管理リーフ（1/10G）			リーフからスパインへの管理		ストレージリーフからスパイン		スパインからお客様およびサポートへのスパイン
ノード	GPU	リーフ	スパイン		管理リーフ	ストレージリーフ	ノード（400G）	リーフ（800G）	800G	ノード	リーフ		リーフ（400G）	スパイン（800G）	リーフ（400G）	スパイン（800G）	お客様（800G）	サポート（800G）	SMF MPO-12	CAT6A + CAT5E
12	96	East-west でコンバージド			1	2	24	12	なし	なし		60	2	2	8	4	8	4	60	60
16	128	2		該当なし	2	2	32	16	10	N/A		80	4	2	8	4	8	4	78	80
32	256	2		該当なし	3	4	64	32	16	N/A		160	6	4	16	8	16	4	144	160
64	512	2		該当なし	6	8	128	64	30	N/A		320	12	6	32	16	32	4	274	320
128	1024	4		4	11	16	256	128	256	N/A		640	44	22	64	32	64	4	756	640

ストレージアーキテクチャ

シスコは VAST Data と協力して、EBox アーキテクチャの Cisco UCS C225 M8 ラックサーバ上にストレージソフトウェアをオンボードし、Cisco Nexus Hyperfabric AI クラスタのストレージサブシステムを提供しています。VAST データは、サーバを段階的に追加することでストレージ容量と読み取り/書き込みパフォーマンスを水平方向にスケーリングできる「分散および共有（DASE）アーキテクチャ」をサポートします。AI データパイプラインのすべてのステージをサポートするために、NFS、S3、および SMB などのすべてのプロトコルサーバが有効になっています。

図 12 は、2 つのストレージリーフを備えた単一の EBox のストレージサーバと BOM の全体的なネットワーク接続を示しています。データパスの場合、各サーバは 2 つの NVIDIA BlueField-3 B3220L 2x200G NICを使用します：NIC0 はサーバ内の内部ネットワークに使用され、他のサーバからストレージドライブにアクセスできるようにします。そして NIC1 は、NFS、S3、および SMB などのクライアントトラフィックをサポートする外部ネットワークに使用されます。注：すべてのサーバがすべてのリーフに接続するため、内部ネットワークトラフィックはリーフでローカルに切り替えられます（スパインには到達しません）。クライアントが外部トラフィックに面する場合、EBox ごと、スパイン上の最小要件は 11 x 200G または 6 x 400G です。1G BMC および 10G x86 管理ポートは管理リーフスイッチに接続されます。

Block diagram and BOM of storage sub-system

図 12.

ストレージサブシステムのブロック図と BOM

クラスタサイズが大きくなると、ストレージリーフスイッチと Ebox の数は、クラスタのサイジングテーブルにあるとおりに線形的に増加します。

ソフトウェア

Hyperfabric コントローラ

Hyperfabric は、クラウドホスト型のマルチテナントコントローラであり、主な機能はネットワークファブリックを制御することです。Hyperfabric スイッチの構成ターゲット状態、ソフトウェアバージョンなどを完全に管理します。

ネットワークコントローラは、接続されているデバイスによって観察されるネットワークの動作をより詳細に可視化できるというメリットを利用できます。Cisco UCS ベースのコンピューティングおよびストレージサーバーの場合、ハイパーファブリックは IPM テレメトリを提供し、パケットの順序変更、バッファの調整、IPG の調整などのいくつかのポートレベルのオプションを最小限に管理します。それ以外の場合は、サーバーと NIC は可視性のみのデバイスです。

そのため、Hyperfabric は次のことを行いません。

● 何らかの方法でコンピューティングまたはストレージを構成する

● サーバのBMC またはホスト CPU ソフトウェアライフサイクルを管理する

● NVIDIA BlueField-3 NIC でカーネルおよびディストリビューションを管理する

サーバの構成および管理機能は、他の方法で管理する必要があります（Cisco Intersight^® は、オプションです）。これらのツールの展開および使用は、お客様側で全責任を負います。ネットワークコントローラの適切な範囲であることに加えて、この懸念事項の分離は、ネットワーク運用をコンピューティングとストレージからセグメント化するという主要な運用パラダイムに合致しています。

NVIDIA AI Enterprise

このリファレンスアーキテクチャには、NVIDIA 認定の Cisco UCS C885A M8 ラックサーバーで展開およびサポートされている NVIDIA AI Enterprise が含まれています。NVIDIA AI Enterprise は、実稼働対応の AI エージェント、生成 AI、コンピュータビジョン、音声 AI などの開発と展開を合理化するクラウドネイティブなソフトウェアプラットフォームです。エンタープライズレベルのセキュリティ、サポート、および API の安定性により、プロトタイプから実稼働へのスムーズな移行が保証されます。

NVIDIA NIM^™ マイクロサービスは、オープンソースコミュニティモデル、カスタムモデル、および NVIDIA AI Foundation モデルの実稼働展開のための完全な推論スタックを提供します。スケーラブルで最適化された推論エンジンと使いやすさにより、モデルが加速し、TCO が改善され、実稼働展開が迅速化されます。

コンピューティングサーバスタック

クラスタソリューション全体が、Ubuntu Linux 22.04 LTS および NVIDIA Cloud Native Stack（CNS）バージョン 12.3 を実行しているコンピューティングノードで検証されています。これには、Kubernetes（K8）環境内の互換性のあるドライバ、GPU、およびネットワークオペレータが含まれます。Slurm バージョン 24.11.1 は、ワークロードオーケストレーションエンジンとして検証されています。NVIDIA NGC^™ カタログの下にあるコンテナは、Kubernetes と Slurm の両方で起動できます。

Compute-server software stack

図 13.

コンピューティングサーバーソフトウェアスタック

お客様は、NVIDIA が公開している NVIDIA AI Enterprise、ドライバ、および CNS 互換性マトリックスに従って、OS ディストリビューションとソフトウェアバージョンを選択して実行できます。

セキュリティ

ソリューションのフェーズ 1 以降、追加のシスコのネットワークセキュリティおよび可観測性サービスが、クラスタのさまざまなハードウェア（スイッチ、ホスト、NIC）およびソフトウェアコンポーネントに統合されます。

テスト/認定

管理プレーン、コントロールプレーン、およびコンピューティング、ストレージとネットワーキングを組み合わせたデータプレーンのあらゆる側面で全体的なソリューションを徹底的にテストしています。また、HPC Benchmark、IB PerfTest、NCCL Test、MLCommons Training、Inference ベンチマークなど、多数のベンチマークテストスイートも実行され、パフォーマンスを評価し、調整を支援しています。NVIDIA AI エンタープライズエコシステムのさまざまな要素とエンティティが投入およびテストされ、微調整、推論、および RAG に関する多数の企業中心のお客様のユースケースを評価します。ネットワークを使用したシングルノードおよびマルチノードの両方で NVIDIA 認定システム^™ のテストスイートバージョン 3.5 を実行した結果、Cisco UCS C885A M8 ラックサーバは合格しました。

要約

つまり、Cisco Nexus Hyperfabric AI は、完全に統合された、エンドツーエンドのテスト済み AI クラスタソリューションであり、AI インフラストラクチャの展開ニーズに対応するワンストップショップをお客様に提供します。

付録 A：コンピューティングサーバの仕様

Cisco UCS C885A M8 ラックサーバ

表 6. Cisco UCS C885A M8 8RU ラックサーバ

エリア	詳細
フォームファクタ	8RU ラックサーバ（空冷）
コンピューティング + メモリ	第 5 世代 AMD EPYC 9575F X 2（400W、64 コア、最大 5GHz） 24x 96GB DDR5 RDIMM、最大 6,000 MT/S（推奨メモリ構成） 24x 128GB DDR5 RDIMM、最大 6,000 MT/S（サポートされる最大メモリ構成）
ストレージ	RAID サポート付きデュアル 1 TB M.2 NVMe（ブートデバイス）最大 16 台の PCIe5 x4 2.5 インチ U.2 1.92 TB NVMe SSD（データキャッシュ）
GPU	8x NVIDIA H200 GPU（各 700W）
ネットワークカード	8 PCIe x16 HHHL NVIDIA BlueField-3 B3140H East-West NIC 2 PCIe x16 FHHL NVIDIA BlueField-3 B3240 North-South NIC 1 つのホスト管理用の OCP 3.0 X710-T2L
冷却	システム冷却用の 16 ホットスワップ可能（N+1）ファン
前面 IO	2xUSB 2.0、1xID ボタン、1x電源ボタン
背面 IO	1x USB 3.0 A、1x USB 3.0 C、mDP、1x ID ボタン、1x 電源ボタン、1x USB 2.0 C、1x RJ45
電源装置	6 X 54V 3kW MCRPS（4+2 冗長性）および 2 X 12V 2.7kW CRPS（1+1 冗長性）

付録 B：制御ノードサーバの仕様

汎用性の高い Cisco UCS C225 M8 1RU ラックサーバは、Slurm および Kubernetes（K8）、等のサポート
サーバと制御ノードサーバとして使用されます。表 7 は、サーバの最小仕様を表示します。

表 7. Cisco UCS C225 M8 1RU ラックサーバ

エリア	詳細
フォームファクタ	1RU ラックサーバ（空冷）
コンピューティング + メモリ	1x第 4 世代 AMD EPYC 9454P（48 コア） 32GB DDR5 RDIMM X 12（4800MT/s）
ストレージ	RAID 搭載デュアル 1 TB M.2 SATA SSD（ブートデバイス）最大 10 台の 2.5 インチ PCIe Gen4 NVMe PCIe SSD（それぞれ容量 1.9 〜 15.3 TB）：オプション
ネットワークカード	1 PCIe x16 FHHL NVIDIA BlueField-3 B3220L（DPU モードで構成）または 1 PCIe x16 FHHL NVIDIA BlueField^®-3 B3140H（DPU モードで構成） x86 ホスト管理用の 1 OCP 3.0 X710-T2L（2 x 10G RJ45）
冷却	システム冷却用の 8 ホットスワップ可能（N+1）ファン
電源装置	2x 1.2KW MCRP PSU N+1 冗長構成
BMC	ホスト管理用の 1G RJ45

2 ソケット CPU を使用する展開では、B3220 DPU NIC とともに Cisco UCS C245 M8 2RU ラックサーババリアントを使用できます。

NVIDIA 認定 Cisco Nexus HyperFabric AI エンタープライズリファレンスアーキテクチャ

ダウンロードオプション

偏向のない言語

翻訳について

ダウンロードオプション

目次

専門家からのおすすめ

Learn more

NVIDIA 認定 Cisco Nexus HyperFabric AI エンタープライ ズ リファレンス アーキテクチャ

ダウンロード オプション

偏向のない言語

翻訳について

ダウンロード オプション

目次

専門家からのおすすめ

Learn more

NVIDIA 認定 Cisco Nexus HyperFabric AI エンタープライズリファレンスアーキテクチャ

ダウンロードオプション

ダウンロードオプション