Cisco Nexus 9000 スイッチを使用した AI インフラストラクチャ

NVIDIA HGX^™ H200 および NVIDIA Spectrum^™-X を搭載した Cisco UCS^® C885A M8 ラックサーバを特徴としています

Cisco^® エンタープライズリファレンスアーキテクチャ（ERA）は、オンプレミスの Cisco Nexus Dashboard プラットフォームによって管理されるネットワーキング AI クラスタ用の Cisco Nexus^® 9000 シリーズスイッチに基づいています。これは、NVIDIA Spectrum-X ネットワーキングを備えた NVIDIA HGXH200 向け NVIDIA エンタープライズリファレンスアーキテクチャに準拠しています。

Cisco Nexus 9000 シリーズスイッチは、Cisco Silicon One ^® および Cisco Cloud Scale アーキテクチャを利用して、AI およびハイパフォーマンスコンピューティング（HPC）ワークロードに高速で確定的、低遅延、および電力効率の高い接続を提供します。Cisco NX-OS オペレーティングシステムの複数のフォームファクタ、オプティクス、および豊富なソフトウェア機能を使用できるため、Nexus 9000 スイッチは、フロントエンド、ストレージ、バックエンド、およびアウトオブバンド（OOB）管理ネットワークに一貫性のあるエクスペリエンスを提供します（図 1 を参照）。

Cisco Nexus Dashboard は、Nexus 9000 スイッチベースのファブリックを管理するための運用および自動化プラットフォームです。組み込みのテンプレートを使用して構成を簡素化することで、Nexus 9000 スイッチのデータプレーン機能を補完します。輻輳、ビットエラー、トラフィックバーストなどのネットワークの正常性の問題をリアルタイムで検出し、自動的に異常としてフラグを立てます。これらの問題は、一般的に使用されるツール（ServiceNow や Ansible など）との統合を使用してより迅速に解決でき、AI クラスタのネットワークを組織の既存のワークフローと整合させることができます。

Cisco Nexus 9000 Series Switches for networking the AI clusters, managed by Nexus Dashboard Platform

図 1.

Nexus Dashboard シリーズプラットフォームによって管理される AI クラスタのネットワーク用の Cisco Nexus 9000 スイッチ

ハードウェア

Cisco UCS C885A M8 ラックサーバ

Cisco UCS C885A M8 ラックサーバは、大規模言語モデル（LLM）トレーニング、ファインチューニング、推論、取得拡張生成（RAG）などの　AI ワークロード向けに、大規模でスケーラブルなパフォーマンスを提供する 8RU であり、高密度 GPU サーバ（ノード）です。C-G-N-B 命名規則は、2-8-10-40（C-G-N-B）内の NVIDIA HGX リファレンスアーキテクチャに基づいてが次のように定義されています：

● C：ノード内の CPU の数

● G：ノード内の GPU の数

● N：以下のように分類されているネットワークアダプタ（NIC）の数

◦ North-south：フロントエンドネットワークを通してノードと外部システムの間の通信。

◦ East-west：バックエンドネットワークを通してクラスタ内の通信。

● B：GPU あたりの平均ネットワーク帯域幅（ギガビット/秒（Gb/s）単位）

サーバ内の 8x NVIDIA H200 SXM GPU は、高速 NVLink インターコネクトを使用してインターコネクトされています。他の物理サーバーへの GPU 接続は、East-West（EW）トラフィックに 8 個の NVIDIA BlueField-3 B3140H SuperNIC を使用して実行されます。North-South（NS）トラフィックでは、1x NVIDIA BlueField-3 B3220 DPU NIC（2x200G モード）を使用できます。各サーバには 2 つの AMD EPYC CPU、最大 3 TB の DDR DRAM、30 TB の NVMe ローカルストレージ、およびホットスワップ可能なファントレイと電源が含まれます。サーバの詳細な仕様については、付録 A を参照してください。

Cisco C885A M8 server with NVIDIA HGX™

図 2.

NVIDIA HGX を搭載した Cisco UCS C885A M8 ラックサーバ

Cisco UCS C885A M8 ラックサーバが図に使用されますが、この ERA は、2-8-10-400（CGNB）構成の NVIDIA HGX に基づく他のサーバに適用されます。

Cisco Nexus 93108TC-FX3 スイッチ

Cisco Nexus 93108TC-FX3 スイッチ（図 3 を参照）は、48 個の 100 Mbps または 1/10 Gbps 10GBASE-T ポートと、1RU フォームファクタで 6 個の 1/10/25/40/100 Gbps QSFP28 ポートを提供します。このスイッチは、管理ネットワークで使用できます。

Cisco Nexus 93108TC-FX3 Switch

図 3.

Cisco Nexus 93108TC-FX3 スイッチ

Cisco Nexus 9332D-GX2B スイッチ

Cisco Nexus 9332D-GX2B スイッチ（図 4 を参照）は、1RU フォームファクタで 32 個の 400G QSFP-DD ポートに 10/25/50/100/200 Gbps ブレークアウトサポートを提供します。このスイッチは、リーフまたはスパインロールで使用できます。

Cisco Nexus 9332D-GX2B Switch

図 4.

Cisco Nexus 9332D-GX2B スイッチ

Cisco Nexus 9364E-SG2 スイッチ

Cisco Nexus 9364E-SG2 スイッチ（図 5 を参照）は、QSFP-DD と OSFP の両方のポートタイプで使用可能な 2RU フォームファクタで、64 個の 800G ポートまたは 128 個の 400G ポートを提供します。このスイッチは、リーフまたはスパインロールで使用できます。

Cisco Nexus 9364E-SG2 Switch

図 5.

Cisco Nexus 9364E-SG2 スイッチ

Cisco UCS C225 M8 ラックサーバ

Cisco C225 M8 ラックサーバは 1RU の汎用サーバで、アプリケーションサーバ、サポートサーバ、Kubernetes（K8s）や Slurm の制御ノード、さらにはストレージプラットフォームなど、さまざまなロールで使用できます。たとえば、これらのサーバは、ストレージアーキテクチャの項で説明されているように、VAST ストレージソリューションを実行するためにも使用されます。

Cisco C225 M8 Rack Server

図 6.

Cisco UCS C225 M8 ラックサーバ

ネットワーキングトポロジ

Cisco Nexus 9000 シリーズスイッチは、さまざまなタイプのデータセンターファブリック設計に使用できます。ただし、NVIDIA ERA と密接に連携する設計のみが、このリファレンスアーキテクチャの一部と見なされます。

NVIDIA ARA と同様に、この Cisco ARA では、最大 128 の NVIDIA 8 GPU HGX ノードまで拡張して、合計 1024 H200 GPU をサポートできます。4 ノードスケーラブルユニット（SU）のモジュラ設計を使用し、最大 32 の SU で 128 ノードに対応します。各 SU は、ネットワークデバイスのポートアベイラビリティサイズに接続された個別の計算エンティティです。SU を複製することで、環境の規模をより簡単に調整できます。

以下に示すように、Cisco のデザインの特定の側面に対応するために、マイナーな変更が加えられています：

● Cisco UCS C885A M8 ラックサーバー x86 管理ポートは、1G ではなく 10G の速度を使用します。

● VAST ストレージソリューションには、ストレージネットワークへの少なくとも8x400G リンクが必要です。ただし、この要件は、別の NVIDIA 認定ストレージパートナーからのソリューションが使用された場合に変わる可能性があります。

● NVIDIA BlueField-3 SuperNIC の BMC ポートは接続されず、x86 ホストから管理されます。ただし、NVIDIA BlueField-3 DPU の BMC ポートは接続されます。

NVIDIA HGX を搭載した Cisco UCS C885A M8 ラックサーバのトポロジ

図 7 は、NVIDIA HGX を使用した最大 12 台の Cisco UCS C885A M8 ラックサーバーのクラスタトポロジを、3 つの SU にグループ化して示しています。この小規模では、Cisco Nexus 9364E-SG2 スイッチのペアが、フロントエンド、バックエンド、ストレージ、管理ネットワークを統合するのに十分なポート密度を提供します。このコンバージェンスにより、VLAN を使用した論理的な分離を維持しながら、許容範囲とシンプルさが向上します。

A diagram of a networkAI-generated content may be incorrect.

図 7.

NVIDIA HGX を搭載した 12 台の Cisco UCS C885A M8 ラックサーバ用エンタープライズ RA（96 GPU）

表 1 に、NVIDIA HGX を使用した 12 ノード Cisco UCS C885A M8 ラックサーバクラスタの部品表（BOM）を示します。

表 1. NVIDIA HGX （96 GPU）を搭載した 12 ノード Cisco UCS C885A ラックサーバクラスタの BOM

PID	説明	数量
UCSC-885A-M8-H12	NVIDIA HGX を搭載した Cisco UCS C885A M8 サーバ	12
N9364E-SG2-O	Cisco Nexus スイッチ、64x800Gbps OSFP	2
N9K-93108TC-FX3	Cisco Nexus スイッチ、48 1/10G BASE-T 6 QSFP28	2
N9K-C9332D-GX2B	Cisco Nexus スイッチ、32x400Gbps QSFP-DD	2
OSFP-800G-DR8	OSFP、800GBASE-DR8、SMF デュアル MPO-12 APC、500m	114
QDD-400G-DR4-S	400G QSFP-DD トランシーバ、400GBASE-DR4、MPO-12、500m パラレル	10
QSFP-400G-DR4	400G QSFP112 トランシーバ、400GBASE-DR4、MPO-12、500 m パラレル	118
QSFP-100G-DR-S	100GBASE DR QSFP トランシーバ、500 m（SMF 使用）	8
CB-M12-4LC-SMF	ケーブル、MPO12-4X デュプレックス LC、ブレークアウトケーブル、SMF、各種長さ	2
CB-M12-M12-SMF	MPO-12 ケーブル	204
CAT6A	10G 用銅ケーブル	24
CAT5E	1G 用銅ケーブル	36

Nexus 9364E-SG2-O スイッチは、800G から 400G 接続用に 2x400G MPO-12 コネクタを備えた OSFP-800G-DR8 ツイストポートトランシーバ（図 8 を参照）を使用します。

Cisco OSFP-800G-DR8

図 8.

Cisco OSFP-800G-DR8 トランシーバモジュール

各接続は、ブレークアウトケーブルを必要とせずに独立して 400G をサポートします（図 9 を参照）。

Cisco OSFP-800G-DR8 Plughole view

図 9.

Cisco OSFP-800G-DR8 プラグホールビュー

図 7 に、NVIDIA HGX を使用した最大 16 の Cisco UCS C885A M8 ラックサーバのクラスタトポロジを示します。EW ネットワークは、レール 1 から 4 が左側の EW スパインに、レール 5 から 8 が右側の EW スパインに配置されています。

A screenshot of a computerAI-generated content may be incorrect.

図 10.

NVIDIA HGX を搭載した 16 台の Cisco UCS C885A M8 ラックサーバ用エンタープライズ RA（128 GPU）

表 2 に、NVIDIA HGX を使用した 16 ノード Cisco UCS C885A M8 ラックサーバクラスタの BOM を示します。

表 2. NVIDIA HGX （128 GPU）を搭載した 16 ノード Cisco UCS C885A M8 ラックサーバクラスタの BOM

PID	説明	数量
UCSC-885A-M8-HC1	NVIDIA HGX を搭載した Cisco UCS C885A M8 ラックサーバ	16
N9364E-SG2-O	Cisco Nexus スイッチ、64x800Gbps OSFP	4
N9K-93108TC-FX3	Cisco Nexus スイッチ、48 1/10G BASE-T 6 QSFP28	2
N9K-C9332D-GX2B	Cisco Nexus スイッチ、32x400Gbps QSFP-DD	2
OSFP-800G-DR8	OSFP、800GBASE-DR8、SMF デュアル MPO-12 APC、500m	144
QDD-400G-DR4	400G QSFP-DD トランシーバ、400GBASE-DR4、MPO-12、500m パラレル	12
QSFP-400G-DR4	400G QSFP112 トランシーバ、400GBASE-DR4、MPO-12、500 m パラレル	158
QSFP-100G-DR-S	100GBASE DR QSFP トランシーバ、500 m（SMF 使用）	8
CB-M12-4LC-SMF	ケーブル、MPO12-4X デュプレックス LC、ブレークアウトケーブル、SMF、各種長さ	2
CB-M12-M12-SMF	MPO-12 ケーブル	198
CAT6A	10G 用銅ケーブル	32
CAT5E	1G 用銅ケーブル	48

クラスタサイズが 16 を超える場合、East-West コンピューティングネットワークはスパインリーフファブリックに拡張されます。クラスタサイズが最大の場合、128 Cisco UCS C885A M8 ラックサーバクラスタの図 11 に示すように、north-south ネットワークもスパインリーフになります。E-W ネットワークは、各 EW リーフ 1〜8 にある各レール 1〜8 とレールに沿っています。

A screenshot of a computerAI-generated content may be incorrect.

図 11.

NVIDIA HGX を搭載した 128 台の Cisco UCS C885A M8 ラックサーバ用エンタープライズ RA（1024 GPU）

クラスタファブリックのサイジングテーブル

Cisco UCS C885A M8 ラックサーバでサイジング

表 3 と表 4 は、NVIDIA HGX を搭載した Cisco UCS C885A M8 ラックサーバ、8 EW B3140H NVIDIA BlueField-3 基の SuperNIC と 2 NS B3240 NVIDIA BlueField-3 DPU NIC を使用したさまざまなクラスタサイズに必要なさまざまなユニットの数量を示しています。

表 3. NVIDIA HGX を搭載した Cisco UCS C885A M8 ラックサーバの East-west コンピューティングファブリックテーブル：スイッチ、トランシーバ、およびケーブル数

コンピューティング数		スイッチ数			トランシーバ数			ケーブル数
ノード	GPU	リーフ	スパイン	SuperSpine	ノードからリーフ		スイッチ間（800G）	ノードからリーフ	スイッチとスイッチ
ノード	GPU	リーフ	スパイン	SuperSpine	ノード（400G）	リーフ（800G）	スイッチ間（800G）	ノードからリーフ	スイッチとスイッチ
12	96	2	N/A	なし	96	48	48	96	48
16	128	2	N/A	なし	128	64	64	128	64
32	256	4	2	該当なし	256	128	256	256	256
64	512	8	8	該当なし	512	256	1024	512	1024
128	1024	16	16	8	1024	512	2048	1024	2048

表 4. NVIDIA HGX を搭載した Cisco UCS C885A M8 ラックサーバの North-south コンピューティングファブリックテーブル：スイッチ、トランシーバ、およびケーブル数

コンピューティング数		スイッチ数					トランシーバ数												ケーブル数
ノード	GPU	リーフ	スパイン		管理リーフ	ストレージリーフ	ノードからコンピューティングリーフ		ISL ポート	ノードから管理リーフ（1/10G）			リーフからスパインへの管理		ストレージリーフからスパイン		スパインからお客様およびサポートへのスパイン
ノード	GPU	リーフ	スパイン		管理リーフ	ストレージリーフ	ノード（400G）	リーフ（800G）	800G	ノード	リーフ		リーフ（100G）	スパイン（800G）	リーフ（400G）	スパイン（800G）	お客様（800G）	サポート（800G）	SMF MPO-12	CAT6A + CAT5E
12	96	East-West でコンバージド			2	2	24	12	N/A	なし		なし	8	2	8	4	8	4	60	60
16	128	2		該当なし	2	2	32	16	10	N/A		なし	8	2	8	4	8	4	78	80
32	256	2		該当なし	4	4	64	32	16	N/A		なし	16	4	16	8	16	4	144	160
64	512	2		該当なし	7	8	128	64	30	N/A		なし	36	7	32	16	32	4	274	320
128	1024	4		4	14	16	256	128	256	N/A		なし	56	14	64	32	64	4	756	640

オプティクスおよびケーブル

第 1 段階では、表 5 に示すオプティクスおよびケーブルをシステム内のさまざまなデバイスで使用します。

表 5. さまざまなデバイスでサポートされるオプティクスおよびケーブルのリスト

デバイス	オプティクスおよびケーブル
B3140H、B3240	QSFP-400G-DR4 と SMF MPO-12 ケーブル
B3220	QSFP-200G-SR4 と MMF MPO-12 ケーブル
N9364E-SG2-O	OSFP-800G-DR8（デュアル SMF MPO-12 ケーブル付属）
N9K-C9332D-GX2B	SMF MPO-12 ケーブルを使用した QDD-400G-DR4 QSFP-200G-SR4 と MMF MPO-12 ケーブル
N9K-93108TC-FX3	SMF デュプレックス LC ケーブルを使用した QSFP-100G-DR-S CAT5E ケーブル CAT6A ケーブル

ストレージアーキテクチャ

Cisco は VAST Data と協力して、EBox アーキテクチャの Cisco UCS C225 M8 ラックサーバ上にストレージソフトウェアをオンボードします。VAST データは、サーバを段階的に追加することでストレージ容量と読み取り/書き込みパフォーマンスを水平方向にスケーリングできる「分散および共有（DASE）アーキテクチャ」をサポートします。AI データパイプラインのすべてのステージをサポートするために、NFS、S3、および SMB などのすべてのプロトコルサーバが有効になっています。

図 12 は、2 つのストレージリーフを備えた単一の EBox のストレージサーバと BOM の全体的なネットワーク接続を示しています。データパスの場合、各サーバは 2 つの NVIDIA BlueField-3 B3220L 2x200G NICを使用します。NIC0 はサーバ内の内部ネットワークに使用され、他のサーバからストレージドライブにアクセスできるようにします。そして NIC1 は、NFS、S3、および SMB などのクライアントトラフィックをサポートする外部ネットワークに使用されます。注：すべてのサーバがすべてのリーフに接続するため、内部ネットワークトラフィックはリーフでローカルに切り替えられます（スパインには到達しません）。クライアントが外部トラフィックに面する場合、EBox ごと、スパイン上の最小要件は 11x 200G または 6x 400G です。1G BMC および 10G x86 管理ポートは管理リーフスイッチに接続されます。

Related image, diagram or screenshot

図 12.

ストレージサブシステムのブロック図と BOM

クラスタサイズが大きくなると、ストレージリーフスイッチと Ebox の数は、クラスタのサイジングテーブルにあるとおりに直線的に増加します。

VAST データに加えて、他の NVIDIA 認定ストレージパートナーもこのリファレンスアーキテクチャ内で使用できます。

ソフトウェア

Cisco NX-OS と Nexus Dashboard

前述のように、Cisco NX-OS は Nexus 9000 シリーズスイッチで実行されるオペレーティングシステムですが、Nexus Dashboard はファブリックを管理するための運用および自動化プラットフォームです。

Cisco NX-OS および Nexus Dashboard では、次のことは行いません：

● 何らかの方法でコンピューティングまたはストレージを構成する

● サーバの BMC またはホスト CPU ソフトウェアライフサイクルを管理する

● NVIDIA BlueField-3 NIC でカーネルおよびディストリビューションを管理する

サーバの構成および管理機能は、他の方法で管理する必要があります（Cisco Intersight^® は、オプションです）。これらのツールの展開および使用は、お客様側で全責任を負います。ネットワークコントローラの適切な範囲であることに加えて、この懸念事項の分離は、ネットワーク運用をコンピューティングとストレージからセグメント化するという主要な運用パラダイムと合致しています。

NVIDIA AI Enterprise

このリファレンスアーキテクチャは、NVIDIA AI Enterprise を含みます。そして、NVIDIA-certified Cisco UCS C885A M8 ラックサーバは、実稼働対応の AI エージェント、生成 AI、コンピュータビジョン、音声 AI などの開発と展開を合理化するクラウドネイティブなソフトウェアプラットフォームの NVIDIA HGX NVIDIA AI Enterprise でサポートされています。エンタープライズレベルのセキュリティ、サポート、および API の安定性により、プロトタイプから実稼働へのスムーズな移行が保証されます。

NVIDIA NIM^™ マイクロサービスは、オープンソースコミュニティモデル、カスタムモデル、および NVIDIA AI Foundation モデルの実稼働展開のための完全な推論スタックを提供します。スケーラブルで最適化された推論エンジンと使いやすさにより、モデルが加速し、TCO が改善され、実稼働展開が迅速化されます。

コンピューティングサーバスタック

クラスタソリューション全体が、Ubuntu Linux 22.04 LTS および NVIDIA Cloud Native Stack（CNS）バージョン 12.3 を実行しているコンピューティングノードで検証されています。これには、Kubernetes（K8）環境内の互換性のあるドライバ、GPU、およびネットワークオペレータが含まれます。Slurm バージョン 24.11.1 は、ワークロードオーケストレーションエンジンとして検証されています。NVIDIA® NGC^™ カタログの下にあるコンテナは、Kubernetes と Slurm の両方で起動できます。

Compute server software stack

図 13.

コンピューティングサーバソフトウェアスタック

お客様は、NVIDIA が公開している NVIDIA AI Enterprise、ドライバ、および CNS 互換性マトリックスに従って、OS ディストリビューションとソフトウェアバージョンを選択して実行できます。

セキュリティ

Cisco のネットワークセキュリティおよびオブザーバビリティサービスは、必要に応じて、クラスタのさまざまなハードウェア（スイッチ、ホスト、NIC）およびソフトウェアコンポーネントに統合できます。

テスト/認定

管理プレーン、コントロールプレーン、およびコンピューティング、ストレージとネットワーキングを組み合わせたデータプレーンのあらゆる側面を考慮し、全体的なソリューションを徹底的にテストしています。また、HPC Benchmark、IB PerfTest、NCCL Test、MLCommons Training、Inference ベンチマークなど、多数のベンチマークテストスイートも実行され、パフォーマンスを評価し、調整を支援しています。NVIDIA AI エンタープライズエコシステムのさまざまな要素とエンティティが投入およびテストされ、微調整、推論、および RAG に関する多数の企業中心のお客様のユースケースを評価します。ネットワークを使用したシングルノードおよびマルチノードの両方で NVIDIA 認定システムのテストスイートバージョン 3.5 を実行した結果、Cisco UCS C885A M8 ラックサーバは合格しました。

要約

Cisco Nexus 9000 シリーズスイッチと Nexus Dashboard プラットフォームは、NVIDIA アクセラレーションコンピューティングを利用した AI インフラストラクチャに、スケーラブルで管理が容易な高パフォーマンスのネットワーキングを提供します。

付録 A：コンピューティングサーバの仕様

表 6 に、この era で GPU ノードとして使用する Cisco UCS C885A M8 ラックサーバーの部品番号 UCSC-885A-M8-H12 の仕様を示します。

表 6. Cisco UCS C885A M8 8RU ラックサーバ

エリア	詳細
フォームファクタ	8RU ラックサーバ（空冷）
コンピューティング + メモリ	第 5 世代 AMD EPYC 9575F X 2（400W、64 コア、最大 5GHz） 24x 96GB DDR5 RDIMM、最大 6,000 MT/S（推奨メモリ構成） 24x 128GB DDR5 RDIMM、最大 6,000 MT/S（サポートされる最大メモリ構成）
ストレージ	RAID サポート付きデュアル 1 TB M.2 NVMe（ブートデバイス）最大 16 台の PCIe5 x4 2.5 インチ U.2 1.92 TB NVMe SSD（データキャッシュ）
GPU	8 X NVIDIA HGX^™ H200（各 700W）
ネットワークカード	8 PCIe x16 HHHL NVIDIA BlueField-3 B3140H east-west NIC 1 PCIe x16 FHHL NVIDIA BlueField-3 B3220 north-south NIC 1 つのホスト管理用の OCP 3.0 X710-T2L
冷却	システム冷却用の 16 ホットスワップ可能（N+1）ファン
前面 IO	2xUSB 2.0、1xID ボタン、1x電源ボタン
背面 IO	1x USB 3.0 A、1x USB 3.0 C、mDP、1x ID ボタン、1x 電源ボタン、1x USB 2.0 C、1x RJ45
電源装置	6 X 54V 3kW MCRPS（4+2 冗長性）および 2 X 12V 2.7kW CRPS（1+1 冗長性）

付録 B：制御ノードサーバの仕様

汎用性の高い Cisco UCS C225 M8 1RU ラックサーバは、Slurm および Kubernetes（K8）、等のサポートサーバ（制御ノードサーバとも呼ばれます）として使用できます。表 7 は、サーバの最小仕様を表示します。

表 7. Cisco UCS C225 M8 1RU ラックサーバ

エリア	詳細
フォームファクタ	1RU ラックサーバ（空冷）
コンピューティング + メモリ	1x第 4 世代 AMD EPYC 9454P（48 コア） 32GB DDR5 RDIMM X 12（4800MT/s）
ストレージ	RAID 搭載デュアル 1 TB M.2 SATA SSD（ブートデバイス）最大 10 台の 2.5 インチ PCIe Gen4 NVMe PCIe SSD（それぞれ容量 1.9 〜 15.3 TB）- オプション
ネットワークカード	1 PCIe x16 FHHL NVIDIA BlueField-3 B3220L（DPU モードで構成）または 1 PCIe x16 FHHL NVIDIA BlueField^®-3 B3140H（DPU モードで構成） x86 ホスト管理用の 1 OCP 3.0 X710-T2L（2 x 10G RJ45）
冷却	システム冷却用の 8 ホットスワップ可能（N+1）ファン
電源装置	2x 1.2KW MCRP PSU N+1 冗長構成
BMC	ホスト管理用の 1G RJ45

2 ソケット CPU を使用する展開では、B3220 DPU NIC とともに Cisco UCS C245 M8 2RU ラックサーババリアントを使用できます。

参考資料

● NVIDIA AI エンタープライズソフトウェアリファレンスアーキテクチャ：
https://docs.nvidia.com/ai-enterprise/reference-architecture/latest/index.html

● NVIDIA HGX：https://www.nvidia.com/en-us/data-center/hgx

● NVIDIA Spectrum-X ネットワーキング: https://www.nvidia.com/en-us/networking/spectrumx/

● Cisco Nexus 9000 シリーズスイッチ：
https://www.cisco.com/site/us/en/products/networking/cloud-networking-switches/nexus-9000-switches/index.html

● Cisco Nexus Dashboard：
https://www.cisco.com/site/jp/ja/products/networking/cloud-networking/nexus-platform/index.html

マニュアルの変更履歴

新規トピックまたは改訂されたトピック	説明箇所	日付
NVIDIA HGX を搭載した Cisco UCS C885A M8 ラックサーバのトポロジ	ネットワーキングトポロジ	2025 年 6 月

Cisco Nexus 9000 スイッチを使用した AI インフラストラクチャ

Available Languages

Download Options

Bias-Free Language

Available Languages

Download Options

Table of Contents

Our experts recommend

Learn more