マニュアルの変更履歴
|
改定 |
日付 |
説明 |
|---|---|---|
|
B1 |
2025 年 6 月 19 日 |
Updated: |
|
B0 |
2025 年 6 月 11 日 |
次のサーバーの 1.1.0.250022 のリリース ノートを作成しました。
|
|
A0 |
2025 年 5 月 2 日 |
次のサーバーの 1.1.0.250016 のリリース ノートを作成しました。
|
Cisco UCS C885A M8 ラック サーバ の概要
Cisco UCS C885A M8 ラック サーバ は、大規模なディープ ラーニング/Large Language Model(LLM)トレーニング、モデル調整、大規模モデル推論、および取得拡張生成(RAG)を含む、最も要求の厳しい AI ワークロードに対処する大規模でスケーラブルな高速コンピューティング機能を提供するように設計された高密度 GPU サーバーです。
シングル サーバー内に高速コンピューティング パフォーマンスを届けるためにサーバーは、次のタイプの 8 つの GPU から選択できます:
-
NVIDIA® HGX H200 サーバー PCI エクスプレス モジュール(SXM)または、Nvidia HGX H100 SXM GPU。SXM は、NVIDIA GPU に使用されているソケットベースの GPU インターコネクト メソッドです。
-
AMD MI300X OCP アクセラレータ モデル(OAM)GPU。
ノースサウストラフィックではサーバーは、AI モデル トレーニングを高密度 GPU サーバーのクラスタ全体に拡張するために NVIDIA ® BlueField B3220 DPUs または、2x200G ConnectX-7 NIC を 2 つまでサポートします。GPU の間のイーストウェストトラフィックのために NVIDIA® 1x400G ConnectX-7 または、Bluefield-3 B3140H SuperNIC を 8 つまでサポートします。
はじめに
Cisco ベースボード管理コントローラ(Cisco BMC)ウェブ GUI は、HTML5 ベースで SSL(HTTPS)によってセキュリティが追加されています。これは、Cisco UCS C885A M8 ラック サーバ の管理を次のオプションで助けます:
ハードウェアとコンポーネント管理
インベントリ機能は、管理者がハードウェア デバイスと各サーバーの CPU、メモリ モジュール、ハード ドライブ、ネットワーク カード、などのコンポーネントを有効します。
ステータスと確認
インベントリ機能は、ハードウェアとソフトウェア デバイスのステータスとチェックを提供します。この情報はデバイス正常性のステータス、温度、電圧、接続ステータスなど含むことがあります。
新機能
リリース 1.1.0.250016
-
デバイス コネクタ:デバイス コネクタを有効にすると、Cisco Intersight (クラウド ホスト型サーバー管理システム) と Cisco ベースボード管理コントローラ の間で双方向通信が確立されます。デフォルトでは有効。有効にすると、Cisco Intersight から Cisco UCS C885A M8 ラック サーバ を管理できます。
-
IPv6 のサポート。
-
仮想メディア機能の外部サーバーから構成を追加するサポート。
-
テクニカル サポート ログ ファイルが .tgz 形式で保存されるようになりました。
-
からの BIOS トークンの設定をサポート
サポートされるプラットフォーム
1.1.0.250016 以降のリリースでは、次のサーバーがサポートされています:
-
Cisco UCS C885A M8 ラック サーバ
オペレーティング システムとブラウザの要件
次のブラウザを推奨します:
|
推奨されるブラウザ |
テスト済みバージョン |
推奨される最小オペレーティング システム |
|---|---|---|
|
Mozilla Firefox |
132.0.2(AArch64) |
macOS 15.1(24B83) |
|
132.0(64 ビット) |
Ubuntu 20.04.3 LTS |
|
|
132.0.2(64 ビット) |
Microsoft Windows 11 Enterprise |
|
|
Apple Safari |
バージョン 18.1(20619.2.8.11.10) |
macOS 15.1(24B83) |
|
Google Chrome |
131.0.6778.71(64 ビット) |
Microsoft Windows 11 Enterprise |
|
Microsoft Edge |
131.0.2903.51(64 ビット) |
Microsoft Windows 11 Enterprise |
デフォルトポート
次に示すのは、サーバ ポートとそのデフォルトのポート番号のリストです。
|
ポート名 |
ポート番号 |
|---|---|
|
HTTP |
80 |
|
HTTPS |
443 |
|
SSH |
22 |
|
IPMI |
623 |
アップグレードとダウングレードのガイドライン
リリース 1.1.0.250016 以降のリリースのアップグレードとダウングレードのガイドライン
-
リリース 1.1.0.250016 以降のリリースにアップグレードすると、 1.0.1.250002より前のリリースにダウングレードすることはできません。
-
ファームウェアの更新が完了したら、AC 電源の再投入を実行してアップグレードをアクティブ化して完了します。AC 電源の再投入方法については 、『Cisco Baseboard Management Controller Configuration Guide for Cisco UCS C885A M8 Rack Server, Release 1.1』を 参照してください。
|
リリースからアップグレード |
推奨されるアップグレード パス |
|---|---|
|
リリース 1.0.1.250002 からアップグレード |
リリース 1.1.0.250016 以降のリリースに直接アップグレードします。 |
|
リリース 1.0.0.250003 からアップグレード |
|
|
リリース 1.0.0.240001 からアップグレード |
|
ファームウェア ファイル
![]() (注) |
常にすべてのコンポーネント BIOS、BMC、および FPGA をアップグレードします。予期しない動作の原因となる場合があるため、コンポーネント(BIOS のみ、または Cisco IMC のみ)を個別にアップグレードしないでください。BIOS と BMC のバージョンが異なるコンテナリ リースからのものである場合、予期しない動作が発生する可能性があります。 |
リリースのファームウェア ファイル1.1.0.250022
1.1.0.250022ソフトウェア リリースには、次のソフトウェア ファイルが含まれます:
|
CCO ソフトウェア タイプ |
ファイル名 |
|---|---|
|
OOB(BMC、BIOS、および FPGA)およびインバンド(ConnectX7、Bluefield、および OCP)コンポーネントのファームウェア。 |
ucs-c885a-m8-1.1.0.250022.tar |
|
アップグレード スクリプト |
ucs-c885a-m8-upgrade-v1.2.py |
|
GPU |
ファームウェアの最小バージョン |
|---|---|
|
H100/H200 Nvidia GPU |
HGX-22.10-1-rc80 |
|
AMD MI 300 GPU |
01.25.00.03 |
![]() (注) |
ここで提供されるバージョンは、現在の リリースとのサーバーと互換性のある、サポートされている最小バージョンです。 |
リリースのファームウェア ファイル1.1.0.250016
1.1.0.250016ソフトウェア リリースには、次のソフトウェア ファイルが含まれます:
|
CCO ソフトウェア タイプ |
ファイル名 |
|---|---|
|
OOB(BMC、BIOS、および FPGA)およびインバンド(ConnectX7、Bluefield、および OCP)コンポーネントのファームウェア。 |
ucs-c885a-m8-1.1.0.250016.tar |
|
アップグレード スクリプト |
ucs-c885a-m8-upgrade-v1.2.py |
|
GPU |
ファームウェアの最小バージョン |
|---|---|
|
H100/H200 Nvidia GPU |
HGX-22.10-1-rc80 |
|
AMD MI 300 GPU |
01.25.00.03 |
![]() (注) |
ここで提供されるバージョンは、現在の リリースとのサーバーと互換性のある、サポートされている最小バージョンです。 |
リリースのバンドル情報 1.1.0.250022
ucs-c885a-m8-1.1.0.250022.tar バンドルには、次のものが含まれています。
|
Category |
サブカテゴリ |
ファイル名 |
|---|---|---|
|
ホスト |
bluefield-3 |
|
|
connectx7 |
|
|
|
x710-ocp |
|
|
|
m2-nvme-raid-ctrl |
|
|
|
OOB |
bios |
AMD_EPYC_5th_Gen
AMD_EPYC_4th_Gen
|
|
bmc |
AMD
NVIDIA
|
|
|
fpga |
dcscm
hib
hpm
|
|
|
gpu |
AMD
NVIDIA
|
リリースのバンドル情報 1.1.0.250016
ucs-c885a-m8-1.1.0.250016.tar バンドルには、次のものが含まれています。
|
Category |
サブカテゴリ |
ファイル名 |
|---|---|---|
|
ホスト |
bluefield-3 |
|
|
connectx7 |
|
|
|
x710-ocp |
|
|
|
m2-nvme-raid-ctrl |
|
|
|
OOB |
bios |
AMD_EPYC_5th_Gen
AMD_EPYC_4th_Gen
|
|
bmc |
AMD
NVIDIA
|
|
|
fpga |
dcscm
hib
hpm
|
|
|
gpu |
AMD
NVIDIA
|
解決済みの不具合
リリースで解決済みの問題 1.1.0.250022
リリース 1.1.0.250022 では、次の問題が解決されました:
|
不具合 ID |
症状 |
最初に影響を受けるリリース |
リリースで解決済み |
|---|---|---|---|
|
CSCwn85582 |
FHHL アダプタが無効状態になります。この問題は、アダプタが InfiniBand に設定されている場合に発生します。 この問題は解決されました。 |
1.1.0.250016 |
1.1.0.250022 |
|
CSCwo68356 |
NVIDIA ConnectX CX7(4x25)アダプタの詳細がインベントリに正しく表示されません。さらに、システムが ConnectX CX7(4x25)アダプタに接続されている場合、サーバーの全体的なステータスと温度が誤って「重大」と表示されます。 この問題は解決されました。 |
1.1.0.250016 |
1.1.0.250022 |
|
CSCwo70872 |
リリース 1.1.0.250016 にアップグレードしてホストの電源をオンにした後、TEMP_FH13_Chip および TEMP_FH13_TRX センサーが空のライザースロットに対して重大なアラートを表示する場合があります。機能への影響はありません。 この問題は解決されました。 |
1.1.0.250016 |
1.1.0.250022 |
|
CSCwo89930 |
MI300 GPU を搭載したセットアップでは、再起動または電源サイクル中に OS がハングすることがあります。 この問題は解決されました。 |
1.1.0.250022 | 1.1.0.250022 |
|
CSCwo68052 |
読み取り専用ユーザー アカウントを使用して Cisco Intersight からクロス起動した場合、ネットワーク アダプタとプロセッサの詳細が Cisco BMC GUI に完全に表示されません。このシナリオでは、データの可視性が不完全になる可能性があります。 この問題は解決されました。 |
1.1.0.250016 |
1.1.0.250022 |
|
CSCwo68698 |
Cisco Intersight を介して相互起動された KVM からログアウト アクションを開始すると、ブラウザ ウィンドウに Leave というラベルの付いた終了の確認アイコンが繰り返し表示されます。この動作により、ブラウザを閉じることができず、エクスペリエンスが中断されます。 この問題は解決されました。 |
1.1.0.250016 |
1.1.0.250022 |
|
CSCwo71111 |
警告 SEL ログは、ネットワーク設定の変更中に、phosport-ipmi-host.service および bmcweb.service を含む複数のサービスが正常に終了したことを示しています。これは、静的ネットワーク設定を eth0 から eth1 に切り替えるときに発生します。 この問題は解決されました。 |
1.1.0.250016 |
1.1.0.250022 |
|
CSCwo81255 |
マップされた vMedia は Web GUI セッションのタイムアウト時にイジェクトされ、x86 CPU への OS のインストールが失敗します。 この問題は解決されました。 |
1.1.0.250016 |
1.1.0.250022 |
|
CSCwo81247 |
GUI セッションは、アクティブな使用中であっても 30 分ごとにタイムアウトし、進行中のタスクの中断が発生します。セッション タイムアウトによってマウントされた vMedia の切断につながるため、この動作は OS インストールなどの長時間実行アクティビティに影響を及ぼします。 この問題は解決されました。 |
1.0.0.240001 |
1.1.0.250022 |
リリースで解決済みの問題 1.1.0.250016
リリース 1.1.0.250016 では、次の問題が解決されました:
|
不具合 ID |
症状 |
最初に影響を受けるリリース |
リリースで解決済み |
|---|---|---|---|
|
CSCwn86588 |
ホストがオフ状態の場合、特定のセンサー(CPU、GPU、HIB、DIMM、OCP)は重大な状態を示します。これにより、UI ダッシュボードに赤色のインジケータで温度がクリティカルとして表示されます。 この問題は解決されました。 |
1.1.0.250016 |
1.1.0.250016 |
|
CSCwn86753 |
スタンバイ電源の問題は、eth1 インターフェイスの OCP アダプタに影響し、ホストの電源がオフになると BMC ネットワーク接続がダウンします。これは、eth1 インターフェイスで共有 NIC の概念を使用するシステムに影響します。 この問題は解決されました。 |
1.0.0.250003 |
1.1.0.250016 |
|
CSCwn89077 |
構成の問題により、一部のサーバーでは同じサブネットに制限されるネットワークアクセスが制限される場合があります。これを解決するには、MAC アドレス設定の更新が必要です。これは、静的な設定を使用する環境に影響します。 この問題は解決されました。 |
1.0.0.250003 |
1.1.0.250016 |
|
CSCwo02028 |
ネットワーク設定でドメイン名、DNS サーバー、または NTP サーバーを無効にすると、BMC IP が 0.0.0.0 にリセットされ、ネットワーク経由でシステム CIMC にアクセスできなくなります。リカバリでは、[BIOS F2] ページから静的 IP を手動で設定する必要があります。 この問題は解決されました。 |
1.0.0.240001 |
1.1.0.250016 |
|
CSCwo71754 |
ユーザーが構成した BIOS 設定は、BIOS または AMD Generic Encapsulated Software Architecture(AGESA)ファームウェアの更新後は保持されません。 この問題は解決されました。 |
1.0.0.240001 |
1.1.0.250016 |
未解決の不具合
リリースで未解決の問題 1.1.0.250022
リリース 1.1.0.250022 では、次の問題が未解決です。
|
不具合 ID |
症状 |
回避策 |
最初に影響を受けるリリース |
|---|---|---|---|
|
CSCwp07855 |
ホストの再起動後、AC サイクルまたは BMC の再起動後に、重大な SEL アラート (SensorError Assert、EventData=21FF46)が発生します。この問題により、システムの正常性ステータスが重大に変わります。 |
既知の回避策はありません。 機能への影響はありません。 |
1.1.0.250022 |
|
CSCwp07720 |
警告/重大な SEL ログ、 FAN の前面/背面警告低しきい値アサートが、AC サイクル、BMC の再起動、またはホストの電源サイクル中に確認され、FAN 速度エラーアサートが、PWM(49)、現在のタッチ(6874)、および EventData = 11FF0B で、ファンに影響します。 |
既知の回避策はありません。 機能への影響はありません。 |
1.1.0.250022 |
|
CSCwp23143 |
AC サイクル中、またはシステムの突然の停止で、重大な SEL アラート( AC_lost assert, AC lost, EventData=04FFFF)が発生する。状態が解決され、アラートがアサート解除された後でも、ログの正常性ステータスは重大なままです。 |
既知の回避策はありません。 |
1.1.0.250022 |
リリースで未解決の問題 1.1.0.250016
リリース 1.1.0.250016 では、次の問題が未解決です。
|
不具合 ID |
症状 |
回避策 |
最初に影響を受けるリリース |
|---|---|---|---|
|
CSCwn84681 |
M.2 NVMe RAID コントローラ(UCS-M2-NVRAID)インベントリに、BMC アウトオブバンド通信からアクセスできません。 |
既知の回避策はありません。 |
1.1.0.250016 |
|
CSCwn85582 |
FHHL アダプタが無効状態になります。この問題は、アダプタが InfiniBand に設定されている場合に発生します。 |
既知の回避策はありません。 |
1.1.0.250016 |
|
CSCwn85620 |
OCP カードのシリアル番号は、Rest API インターフェイスの BMC アウトオブバンド通信では NA としてリストされます。 |
既知の回避策はありません。 これは、機能上の影響はありません。 |
1.1.0.250016 |
|
CSCwo14370 |
REST API 応答には、GPU スレッドの正確かつ完全な製品識別子(PID)の詳細は含まれません。 |
TAC に問い合わせてサポートを受けてください。 |
1.1.0.250016 |
|
CSCwo53435 |
センサーの読み取り値は、ホスト ON - Post 完了状態で 0 °C を予期せず報告します。この問題は、システム温度の正確なモニタリングに影響します。 |
出荷時のデフォルト設定へのリセット |
1.1.0.250016 |
|
CSCwo59380 |
一部のサーバーでは、PSU 出力 LED がオレンジに表示されることがあります。 |
PSU を取り外し、再度取り付けてください。 |
1.1.0.250016 |
|
CSCwo73008 |
IPMI を介したシャーシの電源再投入中に電源投入時に障害が発生しました。システムは次のエラーで起動に失敗します。 電源の電源良好を 8000 ミリ秒以内でアサートできませんでした。 これは、BMC の再起動または AC 電源の再投入直後に電源を入れると発生します。 |
続行する前に、BMC が完全に動作可能になった後、少なくとも 10 分間待機します。 |
1.1.0.250016 |
|
CSCwo81255 |
マップされた vMedia は Web GUI セッションのタイムアウト時にイジェクトされ、x86 CPU への OS のインストールが失敗します。 |
リモート vMedia マッピングを使用します。 から |
1.1.0.250016 |
|
CSCwo71111 |
警告 SEL ログは、ネットワーク設定の変更中に、phosport-ipmi-host.service および bmcweb.service を含む複数のサービスが正常に終了したことを示しています。これは、静的ネットワーク設定を eth0 から eth1 に切り替えるときに発生します。 |
既知の回避策はありません。 これは、機能上の影響はありません。 |
1.1.0.250016 |
|
CSCwo78861 |
ユーザーの作成には通常よりも時間がかかりますこれは、LDAP が誤った設定で有効になっている場合に発生し、ユーザーの作成とセッションの処理が遅くなります。 |
LDAP設定を更新するか、アクションが完了するまで待ちます。 |
1.1.0.250016 |
|
CSCwo68052 |
読み取り専用ユーザーアカウントを使用して Cisco Intersight から相互起動した場合、ネットワークアダプタとプロセッサの詳細は Cisco BMC GUI に完全に表示されません。このシナリオでは、データの可視性が不完全になる可能性があります。 |
Intersight 読み取り専用ユーザーに対する既知の回避策はありません。 Cisco BMC GUI で作成されたオペレータユーザーと、Cisco Intersight からのアカウント管理者およびサーバー管理者ユーザーに必要なすべてのデータが表示されます。 |
1.1.0.250016 |
|
CSCwo68698 |
Cisco Intersight を介して相互起動された KVM からログアウト アクションを開始すると、ブラウザ ウィンドウに Leave というラベルの付いた終了の確認アイコンが繰り返し表示されます。この動作により、ブラウザを閉じることができず、エクスペリエンスが中断されます。 |
画面の右上隅にある [保存(Save)] ボタンをクリックします。 |
1.1.0.250016 |
|
CSCwo68356 |
NVIDIA ConnectX CX7(4x25)アダプタの詳細がインベントリに正しく表示されません。さらに、システムが ConnectX CX7(4x25)アダプタに接続されている場合、サーバーの全体的なステータスと温度が誤って「重大」と表示されます。 |
機能への影響はありません。 |
1.1.0.250016 |
|
CSCwo85473 |
ホスト OS がオフになると、PCIe が切断され、異常なメトリック値が発生することが予想されます。ただし、GPU プロパティでは、 LanesInUse 値が正しくなく、他の理由でホスト OS がオフになっている場合、特定の条件下で PCIeType が不明と表示されます。 |
ホスト OS がオフになると、PCIe が切断され、異常なメトリック値が発生する可能性があります。Intersight はこれらの無効な値を除外し、正確なデータを Metrics Explorer に表示します。 |
1.1.0.250016 |
|
CSCwo82679 |
電源の再投入中に、重大な SEL エラー、 温度センサー読み取りエラー アサート、SensorName: TEMP_HIB_PEX1 が 観察されます。同様のイベントは、同等のアサート解除イベントとともに、センサー PEX1 ~ PEX4 についても示されています。 |
アサートとアサート解除が非常に短時間で行われるため、これは無視できる一時的なイベントです。 |
1.1.0.250016 |
|
CSCwo76759 |
デフォルトゲートウェイ MAC が設定されていないか、または変更された場合、Cisco BMC はネットワークゲートウェイ MAC アドレスを動的に再学習できません。その結果、同じサブネット内で通信できますが、デフォルト ゲートウェイ MAC を手動で設定しない限り、異なるサブネットからのトラフィックに応答することはできません。これにより、異なるサブネットを持つ静的環境間で切り替えるときに、サブネットの外部で Cisco BMC に到達できなくなることがあります。 |
同じサブネット内の任意のホストを使用して、デフォルトのゲートウェイ MAC アドレスを設定します: $ipmitool -H<BMC IP> -U ルート -P<password> -I lanplus lan set 1 defgw macaddr<MAC address of the getway> |
1.0.0.240001 |
|
CSCwo81247 |
GUI セッションは、アクティブな使用中であっても 30 分ごとにタイムアウトし、進行中のタスクの中断が発生します。セッション タイムアウトによってマウントされた vMedia の切断につながるため、この動作は OS インストールなどの長時間実行アクティビティに影響を及ぼします。 |
ログアウトしてから Web UI にログインし直すことにより、セッションを更新します。 |
1.0.0.240001 |
既知の動作と制限事項
リリース での既知の動作と制限事項 1.1.0.250022
リリース 1.1.0.250022 では、既知の制限事項として次の問題があります。
-
不具合 ID:CSCwp91659
Cisco UCS C885A M8 ラック サーバ の場合、トランシーバケーブルが接続されていない場合、LPx/FHHLx アダプタ(CX7/BF3)はセンサーページおよび GUI ダッシュボードにクリティカル状態で表示されます。これにより、GUI の温度ステータスがクリティカルとして表示されます。
リリース での既知の動作と制限事項 1.1.0.250016
リリース 1.1.0.250016 では、既知の制限事項として次の問題があります。
-
障害 ID:CSCwo70892
ホットプラグされた NVMe ドライブは、ホストベースのインベントリは正しく機能しますが、再挿入後、[ストレージ(Storage)] ページの BMC インベントリに表示されません。
回避策:ホストを再起動して、完全なハードウェア インベントリを取得します。
-
障害 ID:CSCwo70872
リリース 1.1.0.250016 にアップグレードしてホストの電源をオンにした後、TEMP_FH13_Chip および TEMP_FH13_TRX センサーが、空のライザースロットに対して重大なアラートを表示する場合があります。機能への影響はありません。
回避策:この問題は解決されていますが、発生した場合は、ホストの起動後に BMC のワンタイム再起動を実行するとアラートがクリアされます。

フィードバック