Cisco UCS Manager B シリーズ トラブルシューティング ガイド
Cisco UCS Manager でのトラブルシューティングの概要
Cisco UCS Manager でのトラブルシューティングの概要
発行日;2012/11/22   |   ドキュメントご利用ガイド   |   ダウンロード ;   この章 pdf   ,   ドキュメント全体 pdf    |   フィードバック

目次

Cisco UCS Manager でのトラブルシューティングの概要

この章の内容は、次のとおりです。

Cisco UCS Manager GUI で表示されるトラブルシューティング情報

Cisco UCS Manager GUI には、Cisco UCS ドメインのトラブルシューティング情報の特定に使用できる複数のタブおよびその他の領域があります。 たとえば、特定のオブジェクトや、システム内のすべてのオブジェクトの障害やイベントを表示できます。

[Navigation] ペインの [Admin] タブでは、問題のトラブルシューティングに役立つ障害、イベント、core ファイル、およびその他の情報にアクセスできます。

[Admin] タブの [Filter] フィールドで [Faults, Events and Audit Log] を選択すると、Cisco UCS Manager GUI によってツリー ブラウザが制限され、次のいずれかのみにアクセスできるようになります。

  • システム内のすべてのコンポーネントの障害
  • システム内のすべてのコンポーネントのイベント
  • システムの監査ログ
  • システムのファブリック インターコネクトが作成した core ファイル
  • 障害の収集と core ファイルのエクスポート設定

(注)  


障害しきい値は、変更が必要となる場合があります。 使用しているリリースの Cisco UCS Manager に対応する『Cisco UCS Manager GUI Configuration Guide』の「Statistics Threshold Policy」の項を参照してください。


Cisco UCS Manager CLI で表示されるトラブルシューティング情報

Cisco UCS Manager CLI では、複数の show コマンドを使用できます。これらのコマンドを実行して、Cisco UCS ドメインのトラブルシューティング情報を特定することができます。 これらの show コマンドはスコープ認識型です。つまり、show fault コマンドを最上位のスコープから実行すると、システム内のすべての障害が表示されます。 一方、特定のオブジェクトにスコープを指定すると、show fault コマンドはそのオブジェクトに関連する障害のみを表示します。


(注)  


障害しきい値は、変更が必要となる場合があります。 使用しているリリースの Cisco UCS Manager に対応する 『Cisco UCS Manager CLI Configuration Guide』の「Statistics Threshold Policy」の項を参照してください。


その他のトラブルシューティング用マニュアル

その他のトラブルシューティング情報は、次のマニュアルに記載されています。

障害

Cisco UCS では、障害は Cisco UCS Manager によって管理される可変オブジェクトです。 障害は、Cisco UCS ドメインの障害や、発生したしきい値のアラームを表します。 障害のライフサイクルの間に、障害の状態または重大度が変化する場合があります。

各障害には、障害の発生時に影響を受けたオブジェクトの動作状態に関する情報が含まれます。 障害の状態が移行して解決すると、そのオブジェクトは機能状態に移行します。

障害は、障害収集ポリシーの設定に従ってクリアおよび削除されるまで Cisco UCS Manager 内に維持されます。

Cisco UCS ドメイン内のすべての障害は、Cisco UCS Manager CLI または Cisco UCS Manager GUI を使用して表示できます。 また、障害収集ポリシーを設定して、Cisco UCS ドメインが障害を収集および保持する方法を決定することもできます。


(注)  


すべての Cisco UCS 障害は MIB に含まれ、SNMP によるトラップが可能です。


障害の重大度

Cisco UCS ドメインで発生した障害は、ライフサイクルの中で複数の重大度に移行する場合があります。 次の表に、発生する可能性がある障害の重大度を示します。

重大度

説明

Critical

サービスに影響する状態であり、すぐに修正処理が必要です。 たとえばこの重大度は、管理対象オブジェクトがアウト オブ サービスであり、機能を回復させる必要があることを示している場合があります。

Major

サービスに影響する状態であり、緊急の修正処理が必要です。 たとえばこの重大度は、管理対象オブジェクトの機能が著しく低下しており、機能を完全に回復させる必要があることを示している場合があります。

Minor

サービスには影響しない障害の状態であり、より深刻な障害が発生するのを防ぐために修正処理が必要です。 たとえばこの重大度は、検出されたアラーム条件が、管理対象オブジェクトの能力を低下させていないことを示している場合があります。

Warning

潜在的に、あるいは近い将来に発生する可能性のある、サービスに影響する障害であり、システムに大きな影響を与えていません。 必要に応じて、さらに詳しく診断して問題を修正し、サービスに影響を与えるより深刻な障害が発生するのを防ぐ必要があります。

Condition

状態に関する情報メッセージで、単独では重要ではありません。

Info

基本的な通知または情報メッセージで、単独では重要ではありません。

障害の状態

Cisco UCS ドメインで発生した障害は、ライフサイクルの中で複数の状態に移行します。 次の表に、発生する可能性がある障害の状態をアルファベット順に示します。

状態

説明

Cleared

解決してクリアされた状態。

Flapping

短い間隔で障害が発生し、クリアされ、再び発生しました。これはフラッピング間隔と呼ばれます。

Soaking

短い間隔で障害が発生してクリアされました。これはフラッピング間隔と呼ばれます。 この状態は Flapping 状態の可能性があるため、障害の重大度は元のアクティブな値のままですが、この状態は障害が発生した状態がクリアされたことを示します。

障害の種類

Cisco UCS ドメインで発生する障害は、次の表で説明する種類のいずれかになります。

タイプ

説明

fsm

FSM タスクが正常に完了しなかったか、または Cisco UCS Manager が FSM のいずれかの段階を再試行しています。

機器

Cisco UCS Manager が、物理コンポーネントが動作不能であるか、または物理コンポーネントに別の機能上の問題があることを検出しました。

サーバ

Cisco UCS Manager が、サーバ タスク(例:サービス プロファイルをサーバに関連付ける)を完了できません。

コンフィギュレーション

Cisco UCS Manager がコンポーネントを正常に設定できません。

環境

Cisco UCS Manager が、電力問題、熱問題、電圧問題、CMOS 設定の喪失を検出しました。

管理

Cisco UCS Manager が、次のような重大な管理上の問題を検出しました。

  • 重要なサービスを開始できなかった
  • プライマリ ファブリック インターコネクトを識別できなかった
  • Cisco UCS ドメイン内のコンポーネントに互換性のないファームウェア バージョンが含まれている

接続性

Cisco UCS Manager が接続に関する問題(例:アダプタに到達できない)を検出しました。

ネットワーク

Cisco UCS Manager がネットワークに関する問題(例:リンクのダウン)を検出しました。

動作中

Cisco UCS Manager が動作に関する問題(例:ログ キャパシティの問題、サーバ ディスカバリの失敗)を検出しました。

障害のプロパティ

Cisco UCS Manager では、Cisco UCS ドメインで発生した各障害に関する詳細な情報が提供されます。 次の表に、Cisco UCS Manager CLI または Cisco UCS Manager GUI で表示可能な障害のプロパティに関する説明を示します。

プロパティ名

説明

Severity

障害の現在の重大度レベル。これは、に記載されている重大度のいずれかになります。

Last Transition

障害の重大度が最後に変更された日時。 障害が発生してから重大度が変更されていない場合、このプロパティは元の作成日を表します。

Affected Object

障害が発生した状態によって影響を受けるコンポーネント。

Description

障害の説明。

ID

障害に割り当てられた固有識別子。

Type

発生した障害の種類。これは、に記載されている種類のいずれかになります。

Cause

障害を発生させた状態に関連付けられている固有識別子。

Created at

障害が発生した日時。

Code

障害に割り当てられた固有識別子。

Number of Occurrences

障害が発生したイベントの発生回数。

Original Severity

障害が最初に発生したときに割り当てられた重大度。

Previous Severity

以前の重大度。 このプロパティは、障害の重大度がライフサイクル中に変更された場合にのみ使用されます。

Highest Severity

この問題で発生した一番深刻な重大度。

障害のライフサイクル

Cisco UCS の障害はステートフルです。 各オブジェクトには、特定の障害のインスタンスが 1 つだけ存在できます。 同じ障害が 2 度発生すると、Cisco UCS は発生回数を 1 つずつ増やします。

障害のライフサイクルは次のとおりです。

  1. ある状況がシステムで発生し、Cisco UCS Manager で障害が発生します。 これはアクティブな状態です。
  2. 障害が軽減されると、フラッピングまたはフラッピングを防ぐことを目的としたソーキング間隔になります。 障害が発生し、すぐに何度かクリアされると、フラッピングが発生します。 フラッピング間隔のうち、障害収集ポリシーに指定されている期間は、障害の重要度が保持されます。
  3. フラッピング間隔中に同じ条件が再発生した場合は、障害がアクティブ状態に戻ります。 フラッピング間隔中に同じ条件が再発生しない場合は、障害がクリアされます。
  4. クリアされた障害は保持期間になります。 この期間があるため、障害が発生した状態が改善され、さらに障害が早々に削除されていない場合でも管理者が障害に気付くことができます。 保持期間のうち、障害収集ポリシーに指定された期間はクリアされた障害が保持されます。
  5. 保持期間にその状態が再発すると、障害はアクティブな状態を返します。 この状況が再発生しない場合は、障害が削除されます。

Cisco UCS Manager GUI の障害

システム内の 1 つのオブジェクトの障害を表示する場合は、Cisco UCS Manager GUI でそのオブジェクトにナビゲートして、[Work] ペインの [Faults] タブをクリックします。 システム内のすべてのオブジェクトの障害を表示するには、[Faults, Events and Audit Log] の下の [Admin] タブにある [Faults] ノードにナビゲートします。

また、Cisco UCS Manager GUI の左上の [Fault Summary] 領域には、Cisco UCS ドメインのすべての障害の要約を表示できます。 この領域には、Cisco UCS ドメインで発生したすべての障害の要約が表示されます。

障害の重大度は、それぞれ異なるアイコンで表示されます。 各アイコンの下の数字は、システム内でその重大度の障害が発生した回数を示します。 アイコンをクリックすると、Cisco UCS Manager GUI によって [Work] ペインの [Faults] タブが開き、その重大度のすべての障害の詳細が表示されます。

Cisco UCS Manager CLI の障害

システム内のすべてのオブジェクトの障害を表示する場合は、最上位レベルのスコープから show fault コマンドを入力します。 特定のオブジェクトの障害を表示する場合は、そのオブジェクトのスコープに移動して、show fault コマンドを実行します。

障害について入手可能なすべての詳細を表示するには、show fault detail コマンドを入力します。

障害収集ポリシー

障害収集ポリシーは、フラッピング間隔や保持期間に障害を保持する時間など、Cisco UCS ドメインでの障害のライフサイクルを制御します。


ヒント


障害収集ポリシーの設定方法については、Cisco UCS B-Series Servers Documentation Roadmap で、Cisco UCS Manager の設定ガイドを参照してください。


イベント

Cisco UCS では、イベントは Cisco UCS Manager によって管理される不変オブジェクトです。 各イベントは、Cisco UCS ドメイン インスタンスの非永続状態を表します。 Cisco UCS Manager がイベントを作成してログに記録した後は、イベントは変更されません。 たとえば、サーバの電源を投入すると、Cisco UCS Manager は、その要求の始まりと終わりのイベントを作成して、ログに記録します。

Cisco UCS Manager CLI または Cisco UCS Manager GUI を使用して、1 つのオブジェクトのイベントを表示したり、Cisco UCS ドメインのすべてのイベントを表示したりできます。 イベントは、イベント ログがいっぱいになるまで Cisco UCS に残ります。 ログがいっぱいになると、Cisco UCS Manager はログおよびログの中のすべてのイベントを削除します。

イベントのプロパティ

Cisco UCS Manager では、Cisco UCS ドメインで作成および記録された各イベントに関する詳細な情報が提供されます。 次の表に、Cisco UCS Manager CLI または Cisco UCS Manager GUI で表示可能な障害のプロパティに関する説明を示します。

表 1  イベントのプロパティ

プロパティ名

説明

Affected Object

イベントを作成したコンポーネント。

Description

イベントの説明

Cause

イベントに関連付けられた固有識別子。

Created at

イベントが作成された日付と時刻。

User

イベントを作成したユーザの種類。次のような種類があります。

  • admin
  • internal
  • blank

Code

イベントに割り当てられた固有識別子。

Cisco UCS Manager GUI のイベント

システム内の 1 つのオブジェクトのイベントを表示する場合は、Cisco UCS Manager GUI でそのオブジェクトにナビゲートして、[Work] ペインの [Events] タブをクリックします。 システム内のすべてのオブジェクトのイベントを表示するには、[Faults, Events and Audit Log] の下の [Admin] タブにある [Events] ノードにナビゲートします。

Cisco UCS Manager CLI のイベント

システム内のすべてのオブジェクトのイベントを表示する場合は、最上位レベルのスコープから show event コマンドを入力します。 特定のオブジェクトのイベントを表示する場合は、そのオブジェクトのスコープに移動して、show event コマンドを入力します。

イベントについて入手可能なすべての詳細を表示するには、show event detail コマンドを入力します。

core ファイル

Cisco UCS Manager、およびファブリック インターコネクトや I/O モジュールなど一部の Cisco UCS コンポーネントに重大な障害が発生すると、core ファイルが作成されます。 core ファイルには、障害発生時のシステムとコンポーネントに関する大量のデータが含まれます。

Cisco UCS Manager はすべてのコンポーネントからの core ファイルを管理します。 core ファイルが作成されたら、すぐに外部の TFTP サーバ上の場所に core ファイルのコピーをエクスポートするように、Cisco UCS Manager を設定できます。

Cisco UCS Manager GUI の core ファイル

Cisco UCS ドメインのコンポーネントが core ファイルを生成したかどうかを確認するには、[Faults, Events and Audit Log] ノードの下の [Admin] タブにある [Core Files] ノードにナビゲートします。

Cisco UCS Manager CLI の core ファイル

Cisco UCS ドメインのコンポーネントが core ファイルを生成したかどうかを確認するには、次のコマンドを入力します。

  1. scope monitoring
  2. scope sysdebug
  3. show cores

Core File Exporter

Core File Exporter をイネーブルにすると、core ファイルが発生したらすぐに TFTP を使用してネットワーク上の指定された場所にエクスポートするように Cisco UCS Manager を設定できます。 この機能を使用して、core ファイルの内容を含む tar ファイルを、指定された場所にエクスポートすることもできます。


ヒント


Exporter をイネーブルにする方法については、Cisco UCS B-Series Servers Documentation Roadmap で、Cisco UCS Manager の設定ガイドを参照してください。


監査ログ

監査ログには、ユーザが Cisco UCS Manager で実行するアクション(直接行うアクションおよび間接的なアクションを含む)が記録されます。 監査ログの各エントリは、1 つの非永続処理を表します。 たとえば、ユーザがログインまたはログアウトしたり、サービス プロファイルなどのオブジェクトを作成、変更、削除したりすると、Cisco UCS Manager はそのアクションのエントリを監査ログに追加します。

監査ログのエントリは、Cisco UCS Manager CLI、Cisco UCS Manager GUI、または Cisco UCS Manager から出力したテクニカル サポート ファイルで表示できます。

監査ログ エントリのプロパティ

Cisco UCS Manager では、監査ログの各エントリに関する詳細な情報を提供しています。 次の表では、Cisco UCS Manager GUI または Cisco UCS Manager CLI で表示できる障害のプロパティについて説明します。

表 2 監査ログ エントリのプロパティ

プロパティ名

説明

ID

監査ログ メッセージに関連付けられた固有識別子。

Affected Object

ユーザのアクションによって影響を受けるコンポーネント。

Severity

監査ログ メッセージに関連付けられたユーザ アクションの現在の重大度。 障害の重大度で説明しているように、これらの重大度は障害にも使用されます。

Trigger

メッセージを発生したユーザに関連付けられているユーザの役割。

User

イベントを作成したユーザのタイプ。次のタイプがあります。

  • admin
  • internal
  • blank

Indication

監査ログ メッセージが示す処理。次のいずれかの値をとります。

  • creation:コンポーネントがシステムに追加されました。
  • modification:既存のコンポーネントが変更されました。

Description

ユーザ アクションの説明。

Cisco UCS Manager GUI の監査ログ

Cisco UCS Manager GUI では、[Faults, Events and Audit Log] ノードの下の [Admin] タブにある [Audit Log] ノードで監査ログを確認できます。

Cisco UCS Manager GUI の監査ログ

Cisco UCS Manager CLI で、次のコマンドを使用して監査ログを表示できます。

  • scope security
  • show audit-logs

システム イベント ログ

システム イベント ログ(SEL)は、NVRAM 内の CIMC に存在します。 過不足の電圧、温度イベント、ファン イベント、BIOS からのイベントなど、ほとんどのサーバ関連イベントが記録されます。 SEL は、主にトラブルシューティングのために使用します。

SEL ファイルのサイズは約 40KB で、ファイルがいっぱいになるとそれ以上イベントを記録できません。 新たなイベントを記録できるようにするには、ファイルの中身をクリアする必要があります。

SEL ポリシーを使用して、SEL をリモート サーバにバックアップできます。また、必要に応じて、バックアップ操作後に SEL をクリアすることもできます。 バックアップ操作は、特定のアクションに基づいて起動するか、定期的に実行できます。 SEL のバックアップやクリアは、手動で行うこともできます。

バックアップ ファイルは、自動的に生成されます。 このファイル名の形式は、sel-SystemName-ChassisID-ServerID-ServerSerialNumber-Timestamp です。たとえば、sel-UCS-A-ch01-serv01-QCI12522939-20091121160736 となります。


ヒント


各サーバの SEL を表示する方法や SEL ポリシーの設定方法などの SEL の詳細については、Cisco UCS B-Series Servers Documentation Roadmap で、Cisco UCS Manager の設定ガイドを参照してください。


SEL ファイル

SEL ファイルのサイズは約 40 KB です。 SEL ファイルがいっぱいになると、それ以上イベントを記録できません。 新たなイベントを記録できるようにするには、ファイルの中身をクリアする必要があります。

SEL ポリシー

SEL ポリシーを使用して、SEL をリモート サーバにバックアップできます。また、必要に応じて、バックアップ操作後に SEL をクリアすることもできます。 バックアップ操作は、特定のアクションに基づいて起動するか、定期的に実行できます。 SEL のバックアップやクリアは、手動で行うこともできます。

Cisco UCS Manager は、SEL ポリシーの設定に従って、SEL のバックアップ ファイルを自動的に生成します。 ファイル名の形式は、sel-SystemName-ChassisID-ServerID-ServerSerialNumber-Timestamp です。

たとえば、ファイル名は sel-UCS-A-ch01-serv01-QCI12522939-20091121160736 のようになります。

Syslog

syslog は、Cisco UCS ドメインのトラブルシューティングや監査に使用できるシステム ログの収集と処理を一元的に行います。 Cisco UCS Manager では、NX-OS syslog メカニズムと API、およびプライマリ ファブリック インターコネクトの syslog 機能を使用して、syslog エントリを収集して処理します。

Cisco UCS Manager は、Cisco UCS ドメインの syslog コレクタを管理および設定し、その設定を 1 つまたは複数のファブリック インターコネクトに展開します。 この設定は、Cisco NX-OS または Cisco UCS Manager によって、Cisco UCS ドメインで生成されるすべての syslog エントリに影響します。

syslog および syslog エントリを使用して次の 1 つまたは複数の操作を実行するように Cisco UCS Manager を設定できます。

  • syslog エントリをコンソールまたはモニタに表示する
  • syslog エントリをファイルに格納する
  • syslog エントリを、Cisco UCS ドメインの syslog が格納されている外部ログ コレクタに転送する(最大 3 つまで)

syslog エントリの形式

Cisco UCS コンポーネントによって生成される各 syslog エントリの形式は、次のとおりです。

Year month date hh:mm:ss hostname %facility-severity-MNEMONIC description

例:2007 Nov 1 14:07:58 excal-113 %MODULE-5-MOD_OK: Module 1 is online

syslog エントリの重大度

syslog エントリには、Cisco UCS Manager によって Cisco UCS の重大度が割り当てられます。 次の表に、Cisco UCS の重大度が syslog の重大度にどのようにマップされるかを示します。

表 3 Cisco UCS での syslog エントリの重大度

Cisco UCS の重大度

Syslog の重大度

CRIT

CRIT

MAJOR

ERR

MINOR

WARNING

WARNING

NOTICE

INFO

INFO

syslog エントリのパラメータ

次の表に、各 syslog エントリに含まれる情報についての説明を示します。

表 4 syslog メッセージの内容

名前

説明

Facility

その syslog エントリを生成して送信したロギング ファシリティ。 このファシリティは大きく分類され、整数で表されます。 これらのソースは、次の Linux の標準的なファシリティのいずれかになります。

  • local0
  • local1
  • local2
  • local3
  • local4
  • local5
  • local6
  • local7

Severity

syslog エントリが生成される原因となった、イベント、アラート、または問題の重大度。 重大度は次のいずれかになります。

  • emergencies
  • critical
  • alerts
  • errors
  • warnings
  • information
  • notifications
  • debugging

Hostname

エントリの発生元となるコンポーネントに依存する syslog エントリに含まれるホスト名。次のようになります。

  • ファブリック インターコネクト、Cisco UCS Manager、または Cisco UCS ドメイン
  • その他すべてのコンポーネントの場合は、仮想インターフェイス(VIF)に関連付けられたホスト名

Timestamp

syslog エントリが生成された日時。

Message

syslog エントリが生成される原因となった、イベント、アラート、または問題の説明。

syslog サービス

次の Cisco UCS コンポーネントでは、Cisco NX-OS syslog サービスを使用して、システム情報とアラートに関する syslog エントリを生成します。

  • I/O モジュール:syslogd によって、すべての syslog エントリは、接続しているファブリック インターコネクトに送信されます。
  • CIMC:すべての syslog エントリは、クラスタ設定内のプライマリ ファブリック インターコネクトに送信されます。
  • アダプタ:NIC-Tools/Syslog によって、すべての syslog エントリは、両方のファブリック インターコネクトに送信されます。
  • Cisco UCS Manager:syslog の設定に従って、自己生成された syslog エントリがログに記録されます。