更新履歴
改定 |
日付 |
説明 |
---|---|---|
A1 |
未定 |
次のサーバーの 1.0.0.240003 のリリース ノートを作成しました。
|
A0 |
2024 年 12 月 9 日 |
次のサーバーの 1.0.0.240001 のリリース ノートを作成しました。
|
Cisco UCS C885A M8 ラック サーバ の概要
Cisco UCS C885A M8 ラック サーバ は、大規模なディープ ラーニング/Large Language Model(LLM)トレーニング、モデル調整、大規模モデル推論、および取得拡張生成(RAG)を含む、最も要求の厳しい AI ワークロードに対処する大規模でスケーラブルな高速コンピューティング機能を提供するように設計された高密度 GPU サーバーです。
シングル サーバー内に高速コンピューティング パフォーマンスを届けるためにサーバーは、次のタイプの 8 つの GPU から選択できます:
-
NVIDIA® H100 SXM または NVIDIA® H200 サーバー PCI Express モジュール(SXM)GPU。SXM は、NVIDIA GPU に使用されているソケットベースの GPU インターコネクト メソッドです。
-
AMD MI300X OCP アクセラレータ モデル(OAM)GPU。OAM は、GPU ベンダーの縛りを防ぐオープン コンピュート GPU インターコネクト標準規格です。
ノースサウストラフィックではサーバーは、AI モデル トレーニングを高密度 GPU サーバーのクラスタ全体に拡張するために NVIDIA Bluefield-3 B3220 DPU を 1 つサポートします。GPU の間のイーストウェストトラフィックのために NVIDIA ConnectX-7 または、Bluefield-3 B3140H SuperNIC を 8 つまでサポートします。
はじめに
Cisco ベースボード管理コントローラ(Cisco BMC)ウェブ GUI は、HTML5 ベースで SSL(HTTPS)によってセキュリティが追加されています。これは、Cisco UCS C885A M8 ラック サーバ の管理を次のオプションで助けます:
ハードウェアとコンポーネント管理
インベントリ機能は、管理者がハードウェア デバイスと各サーバーの CPU、メモリ モジュール、ハード ドライブ、ネットワーク カード、などのコンポーネントを有効します。
ステータスと確認
インベントリ機能は、ハードウェアとソフトウェア デバイスのステータスとチェックを提供します。この情報はデバイス正常性のステータス、温度、電圧、接続ステータスなど含むことがあります。
サポートされるプラットフォーム
1.0.0.240001リリースでは、次のサーバーがサポートされています:
-
Cisco UCS C885A M8 ラック サーバ
オペレーティング システムとブラウザの要件
Cisco は、次のブラウザを推奨します:
推奨されるブラウザ |
テスト済みバージョン |
推奨される最小オペレーティング システム |
---|---|---|
Mozilla Firefox |
132.0.2(AArch64) |
macOS 15.1(24B83) |
132.0(64 ビット) |
Ubuntu 20.04.3 LTS |
|
132.0.2(64 ビット) |
Microsoft Windows 11 Enterprise |
|
Apple Safari |
バージョン 18.1(20619.2.8.11.10) |
macOS 15.1(24B83) |
Google Chrome |
131.0.6778.71(64 ビット) |
Microsoft Windows 11 Enterprise |
Microsoft Edge |
131.0.2903.51(64 ビット) |
Microsoft Windows 11 Enterprise |
デフォルトポート
次に示すのは、サーバ ポートとそのデフォルトのポート番号のリストです。
ポート名 |
ポート番号 |
---|---|
HTTP |
80 |
HTTPS |
443 |
SSH |
22 |
SSH(SSH ベースの SOL) |
2200 |
IPMI |
623 |
ファームウェア ファイル
1.0.0.240003ソフトウェア リリースには、次のソフトウェア ファイルが含まれます:
CCO ソフトウェア タイプ |
ファイル名 |
---|---|
OOB(BMC、BIOS、GPU、および FPGA)およびインバンド(ConnectX7、Bluefield、および OCP)コンポーネントのファームウェア。 |
未定 |
アップグレード スクリプトと Readme ファイル |
未定 |
1.0.0.240001ソフトウェア リリースには、次のソフトウェア ファイルが含まれます:
CCO ソフトウェア タイプ |
ファイル名 |
---|---|
OOB(BMC、BIOS、GPU、および FPGA)およびインバンド(ConnectX7、Bluefield、および OCP)コンポーネントのファームウェア。 |
ucs-c885a-m8-1.0.0.240001.tar.gz |
アップグレード スクリプトと Readme ファイル |
ucs-c885a-m8-upgrade-script-v1.0.tar.gz |
解決済みの問題
リリースで解決済みの問題 1.0.0.240003
リリース 1.0.0.240003 では、次の問題が解決されました:
不具合 ID |
症状 |
最初に影響を受けるリリース |
リリースで解決済み |
---|---|---|---|
CSCwn01691 |
NTP、LDAP、電力制限などの特定の BMC 構成は、BMC の更新後にデフォルトの無効状態に戻ります。 この問題は解決されました。 |
1.0.0.240001 |
1.0.0.240003 |
CSCwn34288 |
Cisco IMC Web UI または Redfish API を使用して試行すると、AMD モデルと Nvidia モデルの両方の GPU ファームウェアの更新がすべてのサーバーで失敗することがあります。この問題は、ファームウェアの更新中に発生します。 この問題は解決されました。 |
1.0.0.240001 |
1.0.0.240003 |
未解決の不具合
リリースで未解決の問題 1.0.0.240001
リリース 1.0.0.240001 では、次の問題が未解決です。
不具合 ID |
症状 |
回避策 |
最初に影響を受けるリリース |
---|---|---|---|
CSCwn01691 |
NTP、LDAP、電力制限などの特定の BMC 構成は、BMC の更新後にデフォルトの無効状態に戻ります。 |
既知の回避策はありません。 |
1.0.0.240001 |
CSCwn34288 |
Cisco IMC Web UI または Redfish API を使用して試行すると、AMD モデルと Nvidia モデルの両方の GPU ファームウェアの更新がすべてのサーバーで失敗することがあります。この問題は、ファームウェアの更新中に発生します。 |
GPU の製造元が提供するホストベースのユーティリティを使用して GPU ファームウェアを更新します。 |
1.0.0.240001 |
既知の動作と制限事項
リリース での既知の動作と制限事項 1.0.0.240001
リリース 1.0.0.240001 では、既知の制限事項として次の問題があります。
不具合 ID |
症状 |
回避策 |
最初に影響を受けるリリース |
---|---|---|---|
CSCwn16450 |
Cisco UCS C885A M8 ラック サーバH100 バリアントでは、HIB FPGA ファームウェアを更新すると、電源ユニットの障害が原因でホストの電源がオンにならないことがあります。この問題は、特定のファームウェア更新で確認されています。 |
AC 電源の再投入を実行して、FPGA および GPU ファームウェアの更新を確実にアクティブにします。 |
1.0.0.240001 |