この製品のマニュアルセットは、偏向のない言語を使用するように配慮されています。このマニュアルセットでの偏向のない言語とは、年齢、障害、性別、人種的アイデンティティ、民族的アイデンティティ、性的指向、社会経済的地位、およびインターセクショナリティに基づく差別を意味しない言語として定義されています。製品ソフトウェアのユーザーインターフェイスにハードコードされている言語、RFP のドキュメントに基づいて使用されている言語、または参照されているサードパーティ製品で使用されている言語によりドキュメントに例外が存在する場合があります。シスコのインクルーシブランゲージに対する取り組みの詳細は、こちらをご覧ください。
このドキュメントは、米国シスコ発行ドキュメントの参考和訳です。リンク情報につきましては、日本語版掲載時点で、英語版にアップデートがあり、リンク先のページが移動/変更されている場合がありますことをご了承ください。あくまでも参考和訳となりますので、正式な内容については米国サイトのドキュメントを参照ください。
Cisco UCS Manager 診断ツールでは、サーバのハードウェア コンポーネントの状態を検証できます。診断ツールには各種テストが用意されており、サーバのさまざまなハードウェア サブシステム(メモリや CPU など)に対して、負荷を与えたりすることができます。ハードウェア コンポーネントを修復するか、交換した後のサーバの状態の健全性チェックを実行するためのツールを使用できます。このツールは、実稼働環境に新しいサーバを導入する前に、包括的なバーンイン テストを実行するときにも使用できます。
新しいシステムの場合、org スコープでデフォルトの診断ポリシーが作成されます。このデフォルトのポリシーは default という名前であり、削除できません。ユーザがこのポリシーを削除しようとするとエラー メッセージが表示されます。デフォルトの診断ポリシーは、すべてのサーバで同じテスト セットを実行する際に推奨される方法です。デフォルト ポリシーを含むすべての診断ポリシーはカスタマイズ可能です。
デフォルト ポリシーには 1 つのメモリ テストだけが含まれています。メモリ テストのデフォルトのパラメータは変更できます。また、デフォルト診断ポリシー内のメモリ テストは削除できます。メモリ テストがない場合、診断ポリシーは実行されません。
このタスクを実行するには、admin 権限が必要です。
ブレード サーバでの診断テスト
このタスクを実行するには、admin 権限が必要です。
(注) | すべてのサーバの診断テストを開始すると、個々のサーバがリブートされます。 |
このタスクを実行するには、admin 権限が必要です。
ステップ 1 | を選択します。 | ||||||||||||||||
ステップ 2 | [Start] をクリックします。診断テストが開始されると、リンクはグレー表示になります。 [Diagnostic Result] テーブルで、次の情報を確認できます。
|
このタスクを実行するには、admin 権限が必要です。
CLI から個々のサーバに対して診断テストを実行し、このページでステータスを確認できます。
ステップ 1 | [Navigation] ペインで [Equipment] をクリックします。 | ||||||||||||||||||||||||||||||
ステップ 2 | [Equipment] > [Chassis] > [Servers] の順に展開します。 | ||||||||||||||||||||||||||||||
ステップ 3 | 診断ステータスを確認するサーバを選択し、[Diagnostics] タブをクリックします。
以下の情報を確認できます。
|
問題 |
デバッグ手順 |
BIOS が不良 DIMM を検出すると、その DIMM は無効になり、診断操作では認識されません。 |
診断操作の結果の他に、メモリ関連のエラーを参照してください。 |
DIMM ブラックリスト機能が有効であり、DIMM がブラックリストに追加されると、その DIMM は診断操作では認識されません。 |
診断操作の結果の他に、メモリ関連のエラーを参照してください。 |
サーバに不良 DIMM があり、これが原因でサーバが起動できない場合、診断操作が正常に実行されない可能性があります。 |
該当なし |
修正できないエラーが原因でサーバ リブートが行われる場合、診断操作が失敗する可能性があります。 |
該当なし |
メモリ エラーが原因で診断操作が停止する場合、診断操作エラーが発生する可能性があります。 |
該当なし |
診断操作は、管理型エンドポイントのフェールオーバーやクリティカルな UCSM プロセスの再起動などの外部イベントにより中断することがあります。このような状況では、診断操作が取り消され、メモリ テストが失敗としてマークされます。 |
このエラーは外部イベントによってトリガーされます。診断操作をやり直します。 |
メモリ テストが失敗してエラーが発生します。修正できないエラーが検出されます。 |
[Chassis/Server/Faults] タブで、サーバ エラーを確認します。 [Chassis/Server/SEL Logs] タブで、SEL ログを調べて DIMM エラーを確認します。 |
メモリ テスト エラーをさらに分析する必要があります。 |
プライマリ FI の /workspace パーティションにある次のログ ファイル アーカイブで、診断操作のログを確認します:diagnostics/diag_log_<system-name>_<timestamp>_<chassis-id>_<blade-id>.tgz 前述のログ ファイル アーカイブ内で分析ファイル tmp/ServerDiags/MemoryPmem2.<id>/MemoryPmem2.analysis を参照します。 次のコマンドを使用して、分析ファイルで診断ログを見つけます。 # for file in `ls /workspace/diagnostics/*diag*`; do tar -tzvf $file | grep analysis && echo "IN " $file; done |