この製品のマニュアルセットは、偏向のない言語を使用するように配慮されています。このマニュアルセットでの偏向のない言語とは、年齢、障害、性別、人種的アイデンティティ、民族的アイデンティティ、性的指向、社会経済的地位、およびインターセクショナリティに基づく差別を意味しない言語として定義されています。製品ソフトウェアのユーザーインターフェイスにハードコードされている言語、RFP のドキュメントに基づいて使用されている言語、または参照されているサードパーティ製品で使用されている言語によりドキュメントに例外が存在する場合があります。シスコのインクルーシブランゲージに対する取り組みの詳細は、こちらをご覧ください。
このドキュメントは、米国シスコ発行ドキュメントの参考和訳です。リンク情報につきましては、日本語版掲載時点で、英語版にアップデートがあり、リンク先のページが移動/変更されている場合がありますことをご了承ください。あくまでも参考和訳となりますので、正式な内容については米国サイトのドキュメントを参照ください。
Cisco UCS Manager 診断ツールでは、サーバのハードウェア コンポーネントの状態を検証できます。診断ツールには各種テストが用意されており、サーバのさまざまなハードウェア サブシステム(メモリや CPU など)に対して、負荷を与えたりすることができます。ハードウェア コンポーネントを修復するか、交換した後のサーバの状態の健全性チェックを実行するためのツールを使用できます。このツールは、実稼働環境に新しいサーバを導入する前に、包括的なバーンイン テストを実行するときにも使用できます。
新しいシステムの場合、org スコープでデフォルトの診断ポリシーが作成されます。このデフォルトのポリシーは default という名前であり、削除できません。ユーザがこのポリシーを削除しようとするとエラー メッセージが表示されます。デフォルトの診断ポリシーは、すべてのサーバで同じテスト セットを実行する際に推奨される方法です。デフォルト ポリシーを含むすべての診断ポリシーはカスタマイズ可能です。
デフォルト ポリシーには 1 つのメモリ テストだけが含まれています。メモリ テストのデフォルトのパラメータは変更できます。また、デフォルト診断ポリシー内のメモリ テストは削除できます。メモリ テストがない場合、診断ポリシーは実行されません。
このタスクを実行するには、admin 権限を持つユーザとしてログインする必要があります。
コマンドまたはアクション | 目的 |
---|
次に、診断ポリシーに説明を作成して設定する例を示します。
UCS-A# scope org UCS-A /org # create diag-policy new-policy UCS-A /org/diag-policy* # commit-buffer
このタスクを実行するには、admin 権限を持つユーザとしてログインする必要があります。
次に、診断ポリシーにメモリ テストを作成する例を示します。
UCS-A# scope org UCS-A /org # create diag-policy P2 UCS-A /org/diag-policy* # commit-buffer UCS-A /org/diag-policy # create memory-test 1 UCS-A /org/diag-policy/memory-test* # set cpu-filter all-cpus UCS-A /org/diag-policy/memory-test* # set memchunksize big-chunk UCS-A /org/diag-policy/memory-test* # set memsize all UCS-A /org/diag-policy/memory-test* # set pattern butterfly UCS-A /org/diag-policy/memory-test* # set loopcount 1000 UCS-A /org/diag-policy/memory-test* # commit-buffer UCS-A /org/diag-policy/memory-test # exit UCS-A /org/diag-policy # show configuration enter diag-policy P2 enter memory-test 1 set cpu-filter all-cpus set loopcount 1000 set memchunksize big-chunk set memsize all set pattern butterfly exit set descr "" set policy-owner local exit UCS-A /org/diag-policy #
このタスクを実行するには、admin 権限を持つユーザとしてログインする必要があります。
コマンドまたはアクション | 目的 |
---|
次に、診断ポリシーを削除する例を示します。
UCS-A # scope org UCS-A /org # delete diag-policy P2 UCS-A /org* # commit-buffer UCS-A /org #
このタスクを実行するには、admin 権限でログインする必要があります。
コマンドまたはアクション | 目的 | |
---|---|---|
ステップ 1 | UCS-A # scope server chassis-id /server-id |
指定サーバのシャーシ サーバ範囲を入力します。 |
ステップ 2 | UCS-A /chassis/server # scope diag |
診断モードを開始します。 |
ステップ 3 | UCS-A /chassis/server/diag # set diag-policy-name <diag-policy-name> |
指定された診断ポリシーをサーバに関連付けます。 |
ステップ 4 | UCS-A /chassis/server/diag* # commit-buffer |
トランザクションをシステム設定にコミットします。 |
ステップ 5 | UCS-A /chassis/server/diag # show |
サーバ診断の詳細を表示します。 |
ステップ 6 | UCS-A /chassis/server/diag # start |
サーバで診断テストを実行します。 |
ステップ 7 | UCS-A /chassis/server/diag* # commit-buffer |
トランザクションをシステム設定にコミットします。 |
次に、サーバ 1/7 で診断テストを実行する例を示します。
UCS-A # scope server 1/7 UCS-A /chassis/server # scope diag UCS-A /chassis/server/diag # set diag-policy-name P1 UCS-A /chassis/server/diag* # commit-buffer UCS-A /chassis/server/diag # show Oper State Diag Overall Progress Diag Policy Name ----------- ---------------------- ---------------- Completed 100 P1 UCS-A /chassis/server/diag # start UCS-A /chassis/server/diag* # commit-buffer UCS-A /chassis/server/diag #
このタスクを実行するには、admin 権限を持つユーザとしてログインする必要があります。
コマンドまたはアクション | 目的 |
---|
次に、診断ポリシーを停止する例を示します。
UCS-A# scope server 1/2 UCS-A /chassis/server # scope diag UCS-A /chassis/server/diag # stop UCS-A /chassis/server/diag* # commit-buffer
問題 |
デバッグ手順 |
BIOS が不良 DIMM を検出すると、その DIMM は無効になり、診断操作では認識されません。 |
診断操作の結果の他に、メモリ関連のエラーを参照してください。 |
DIMM ブラックリスト機能が有効であり、DIMM がブラックリストに追加されると、その DIMM は診断操作では認識されません。 |
診断操作の結果の他に、メモリ関連のエラーを参照してください。 |
サーバに不良 DIMM があり、これが原因でサーバが起動できない場合、診断操作が正常に実行されない可能性があります。 |
NA |
修正できないエラーが原因でサーバ リブートが行われる場合、診断操作が失敗する可能性があります。 |
NA |
メモリ エラーが原因で診断操作が停止する場合、診断操作エラーが発生する可能性があります。 |
NA |
診断操作は、管理型エンドポイントのフェールオーバーやクリティカルな UCSM プロセスの再起動などの外部イベントにより中断することがあります。このような状況では、診断操作が取り消され、メモリ テストが失敗としてマークされます。 |
このエラーは外部イベントによってトリガーされます。診断操作をやり直します。 |
メモリ テストが失敗してエラーが発生します。修正できないエラーが検出されます。 |
[シャーシ/サーバ/障害(Chassis/Server/Faults)] タブで、サーバ エラーを確認します。 [シャーシ/サーバ/SEL ログ(Chassis/Server/SEL Logs)] タブで、SEL ログを調べて DIMM エラーを確認します。 |
メモリ テスト エラーをさらに分析する必要があります。 |
プライマリ FI の /workspace パーティションにある次のログ ファイル アーカイブで、診断操作のログを確認します。diagnostics/diag_log_<system-name>_<timestamp>_<chassis-id>_<blade-id>.tgz 前述のログ ファイル アーカイブ内で分析ファイル tmp/ServerDiags/MemoryPmem2.<id>/MemoryPmem2.analysis を参照します。 次のコマンドを使用して、分析ファイルで診断ログを見つけます。 # for file in `ls /workspace/diagnostics/*diag*`; do tar -tzvf $file | grep analysis && echo "IN " $file; done |