更新履歴

表 1.

改定

日付

説明

A1

未定

次のサーバーの 1.0.0.240003 のリリース ノートを作成しました。

  • Cisco UCS C885A M8 ラック サーバ

A0

2024 年 12 月 9 日

次のサーバーの 1.0.0.240001 のリリース ノートを作成しました。

  • Cisco UCS C885A M8 ラック サーバ

Cisco UCS C885A M8 ラック サーバ の概要

Cisco UCS C885A M8 ラック サーバ は、大規模なディープ ラーニング/Large Language Model(LLM)トレーニング、モデル調整、大規模モデル推論、および取得拡張生成(RAG)を含む、最も要求の厳しい AI ワークロードに対処する大規模でスケーラブルな高速コンピューティング機能を提供するように設計された高密度 GPU サーバーです。

シングル サーバー内に高速コンピューティング パフォーマンスを届けるためにサーバーは、次のタイプの 8 つの GPU から選択できます:

  • NVIDIA® H100 SXM または NVIDIA® H200 サーバー PCI Express モジュール(SXM)GPU。SXM は、NVIDIA GPU に使用されているソケットベースの GPU インターコネクト メソッドです。

  • AMD MI300X OCP アクセラレータ モデル(OAM)GPU。OAM は、GPU ベンダーの縛りを防ぐオープン コンピュート GPU インターコネクト標準規格です。

ノースサウストラフィックではサーバーは、AI モデル トレーニングを高密度 GPU サーバーのクラスタ全体に拡張するために NVIDIA Bluefield-3 B3220 DPU を 1 つサポートします。GPU の間のイーストウェストトラフィックのために NVIDIA ConnectX-7 または、Bluefield-3 B3140H SuperNIC を 8 つまでサポートします。

はじめに

Cisco ベースボード管理コントローラCisco BMC)ウェブ GUI は、HTML5 ベースで SSL(HTTPS)によってセキュリティが追加されています。これは、Cisco UCS C885A M8 ラック サーバ の管理を次のオプションで助けます:

ハードウェアとコンポーネント管理

インベントリ機能は、管理者がハードウェア デバイスと各サーバーの CPU、メモリ モジュール、ハード ドライブ、ネットワーク カード、などのコンポーネントを有効します。

ステータスと確認

インベントリ機能は、ハードウェアとソフトウェア デバイスのステータスとチェックを提供します。この情報はデバイス正常性のステータス、温度、電圧、接続ステータスなど含むことがあります。

サポートされるプラットフォーム

1.0.0.240001リリースでは、次のサーバーがサポートされています:

  • Cisco UCS C885A M8 ラック サーバ

オペレーティング システムとブラウザの要件

Cisco は、次のブラウザを推奨します:

表 2. オペレーティング システムとブラウザの要件

推奨されるブラウザ

テスト済みバージョン

推奨される最小オペレーティング システム

Mozilla Firefox

132.0.2(AArch64)

macOS 15.1(24B83)

132.0(64 ビット)

Ubuntu 20.04.3 LTS

132.0.2(64 ビット)

Microsoft Windows 11 Enterprise

Apple Safari

バージョン 18.1(20619.2.8.11.10)

macOS 15.1(24B83)

Google Chrome

131.0.6778.71(64 ビット)

Microsoft Windows 11 Enterprise

Microsoft Edge

131.0.2903.51(64 ビット)

Microsoft Windows 11 Enterprise

デフォルトポート

次に示すのは、サーバ ポートとそのデフォルトのポート番号のリストです。

ポート名

ポート番号

HTTP

80

HTTPS

443

SSH

22

SSH(SSH ベースの SOL)

2200

IPMI

623

ファームウェア ファイル

1.0.0.240003ソフトウェア リリースには、次のソフトウェア ファイルが含まれます:

CCO ソフトウェア タイプ

ファイル名

OOB(BMC、BIOS、GPU、および FPGA)およびインバンド(ConnectX7、Bluefield、および OCP)コンポーネントのファームウェア。

未定

アップグレード スクリプトと Readme ファイル

未定

1.0.0.240001ソフトウェア リリースには、次のソフトウェア ファイルが含まれます:

CCO ソフトウェア タイプ

ファイル名

OOB(BMC、BIOS、GPU、および FPGA)およびインバンド(ConnectX7、Bluefield、および OCP)コンポーネントのファームウェア。

ucs-c885a-m8-1.0.0.240001.tar.gz

アップグレード スクリプトと Readme ファイル

ucs-c885a-m8-upgrade-script-v1.0.tar.gz

解決済みの問題

リリースで解決済みの問題 1.0.0.240003

リリース 1.0.0.240003 では、次の問題が解決されました:

不具合 ID

症状

最初に影響を受けるリリース

リリースで解決済み

CSCwn01691

NTP、LDAP、電力制限などの特定の BMC 構成は、BMC の更新後にデフォルトの無効状態に戻ります。

この問題は解決されました。

1.0.0.240001

1.0.0.240003

CSCwn34288

Cisco IMC Web UI または Redfish API を使用して試行すると、AMD モデルと Nvidia モデルの両方の GPU ファームウェアの更新がすべてのサーバーで失敗することがあります。この問題は、ファームウェアの更新中に発生します。

この問題は解決されました。

1.0.0.240001

1.0.0.240003

未解決の不具合

リリースで未解決の問題 1.0.0.240001

リリース 1.0.0.240001 では、次の問題が未解決です。

不具合 ID

症状

回避策

最初に影響を受けるリリース

CSCwn01691

NTP、LDAP、電力制限などの特定の BMC 構成は、BMC の更新後にデフォルトの無効状態に戻ります。

既知の回避策はありません。

1.0.0.240001

CSCwn34288

Cisco IMC Web UI または Redfish API を使用して試行すると、AMD モデルと Nvidia モデルの両方の GPU ファームウェアの更新がすべてのサーバーで失敗することがあります。この問題は、ファームウェアの更新中に発生します。

GPU の製造元が提供するホストベースのユーティリティを使用して GPU ファームウェアを更新します。

1.0.0.240001

既知の動作と制限事項

リリース での既知の動作と制限事項 1.0.0.240001

リリース 1.0.0.240001 では、既知の制限事項として次の問題があります。

不具合 ID

症状

回避策

最初に影響を受けるリリース

CSCwn16450

Cisco UCS C885A M8 ラック サーバH100 バリアントでは、HIB FPGA ファームウェアを更新すると、電源ユニットの障害が原因でホストの電源がオンにならないことがあります。この問題は、特定のファームウェア更新で確認されています。

AC 電源の再投入を実行して、FPGA および GPU ファームウェアの更新を確実にアクティブにします。

1.0.0.240001