Cisco UCS トラブルシューティング ガイド
概要
概要
発行日;2012/01/14 | ドキュメントご利用ガイド | ダウンロード ; この章pdf , ドキュメント全体pdf (PDF - 1MB) | フィードバック

目次

概要

Cisco UCS Manager GUI のトラブルシューティング情報

Cisco UCS Manager CLI のトラブルシューティング情報

障害

障害の重大度

障害の状態

障害のプロパティ

障害のライフサイクル

Cisco UCS Manager GUI の障害

Cisco UCS Manager CLI の障害

障害収集ポリシー

イベント

イベントのプロパティ

Cisco UCS Manager GUI のイベント

Cisco UCS Manager CLI のイベント

core ファイル

Cisco UCS Manager GUI での core ファイル

Cisco UCS Manager CLI での core ファイル

Core File Exporter

監査ログ

監査ログ エントリのプロパティ

Cisco UCS Manager GUI の監査ログ

Cisco UCS Manager CLI の監査ログ

システム イベント ログ

SEL ファイル

SEL ポリシー

Syslog

Syslog の設定

syslog の場所

syslog エントリの形式

syslog エントリのパラメータ

syslog サービス

概要

この章では、Cisco Unified Computing System(Cisco UCS)に関する問題のトラブルシューティングに役立つ障害、イベント、およびその他の情報の入手先の概要について説明します。

この章の内容は、次のとおりです。

「Cisco UCS Manager GUI のトラブルシューティング情報」

「Cisco UCS Manager CLI のトラブルシューティング情報」

「障害」

「イベント」

「core ファイル」

「監査ログ」

「システム イベント ログ」

「Syslog」

Cisco UCS Manager GUI のトラブルシューティング情報

Cisco UCS Manager GUI には、Cisco UCS インスタンスのトラブルシューティング情報の検索に使用できる複数のタブと、その他の領域があります。たとえば、特定のオブジェクトや、システムのすべてのオブジェクトの障害やイベントを表示できます。

[Navigation] ペインの [Admin] タブでは、問題のトラブルシューティングに役立つ障害、イベント、core ファイル、およびその他の情報にアクセスできます。

[Admin] タブの [Filter] フィールドで [Faults, Events and Audit Log] を選択すると、Cisco UCS Manager GUI によってツリー ブラウザが制限され、次のいずれかのみにアクセスできるようになります。

システム内のすべてのコンポーネントの障害

システム内のすべてのコンポーネントのイベント

システムの監査ログ

システムのファブリック インターコネクトが作成した core ファイル

障害の収集と core ファイルのエクスポート設定

Cisco UCS Manager CLI のトラブルシューティング情報

Cisco UCS Manager CLI には、Cisco UCS インスタンスのトラブルシューティング情報の検索を実行できる複数の show コマンドがあります。これらの show コマンドは、スコープを意識したコマンドです。たとえば、最上位のスコープから show fault コマンドを実行すると、システム内のすべての障害が表示されます。一方で、特定のオブジェクトのスコープに移動すると、 show fault はそのオブジェクトに関連する障害のみを表示します。

障害

Cisco UCS では、障害は Cisco UCS Manager によって管理される可変オブジェクトです。障害は、Cisco UCS インスタンスの障害や、発生したしきい値のアラームを表します。障害のライフサイクルの間に、障害の状態または重大度が変化する場合があります。

各障害には、障害の発生時に影響を受けたオブジェクトの動作状態に関する情報が含まれます。障害の状態が移行して解決すると、そのオブジェクトは機能状態に移行します。次のいずれかの状態になるまで、障害は Cisco UCS Manager 内に残ります。

障害収集ポリシーの設定に従って、障害がクリアおよび削除される

ユーザによって障害が通知される

Cisco UCS 内のすべての障害は、Cisco UCS Manager CLI または Cisco UCS Manager GUI を使用して表示できます。また、障害収集ポリシーを設定して、Cisco UCS インスタンスが障害を収集および保持する方法を決定することもできます。

この項の内容は次のとおりです。

「障害の重大度」

「障害の状態」

「障害のプロパティ」

「障害のライフサイクル」

「Cisco UCS Manager GUI の障害」

「Cisco UCS Manager CLI の障害」

「障害収集ポリシー」

障害の重大度

Cisco UCS インスタンスで発生した障害は、ライフサイクルの中で複数の重大度に移行する場合があります。 表 1-1 では、発生する可能性のある障害の重大度についてアルファベット順に説明します。

 

表 1-1 Cisco UCS の障害の重大度

重大度
説明

Condition

状態に関する情報メッセージ。単独では重要でないと考えられます。

Critical

サービスに影響する状態であり、すぐに修正処理が必要である。たとえばこの重大度は、管理対象オブジェクトがアウト オブ サービスであり、機能を回復させる必要があることを示している場合があります。

Info

基本的な通知または情報メッセージ。単独では重要でないと考えられます。

Major

サービスに影響する状態であり、緊急の修正処理が必要である。たとえばこの重大度は、管理対象オブジェクトの機能が著しく低下しており、機能を完全に回復させる必要があることを示している場合があります。

Minor

サービスには影響しない障害の状態であり、より深刻な障害が発生するのを防ぐために修正処理が必要。たとえばこの重大度は、検出されたアラーム条件が、現在管理対象オブジェクトの能力を低下させていないことを示している場合があります。

Warning

潜在的に、あるいは近い将来に発生する可能性のある、サービスに影響する障害であり、現在はシステムに大きな影響を与えていない。必要に応じて、さらに詳しく診断して問題を修正し、サービスに影響を与えるより深刻な障害が発生するのを防ぐ必要があります。

障害の状態

Cisco UCS インスタンスで発生した障害は、ライフサイクルの中で複数の重大度に移行します。 表 1-2 では、発生する可能性のある障害の状態についてアルファベット順に説明します。

 

表 1-2 Cisco UCS の障害の状態

重大度
説明

Cleared

この状態は解決され、障害はクリアされました。

Flapping

短い間隔で障害が発生し、クリアされ、再び発生しました。これはフラッピング間隔と呼ばれます。

Soaking

短い間隔で障害が発生してクリアされました。これはフラッピング間隔と呼ばれます。これは Flapping 状態の可能性があるため、障害の重大度は元のアクティブな値のままですが、この状態は障害が発生した状態がクリアされたことを示します。

障害のプロパティ

Cisco UCS Manager では、Cisco UCS インスタンスで発生した各障害に関する詳細な情報を提供しています。 表 1-3 では、Cisco UCS Manager CLI または Cisco UCS Manager GUI で表示できる障害のプロパティについて説明します。

 

表 1-3 障害のプロパティ

プロパティ名
説明

Severity

障害の現在の重大度。これは、表 1-1 で説明した重大度のいずれかになります。

Last Transition

障害の重大度が最後に変更された日時。障害が発生してから重大度が変更されていない場合、このプロパティは元の作成日を表します。

Affected Object

障害が発生した状態によって影響を受けるコンポーネント。

Description

障害の説明。

ID

障害に割り当てられた固有識別情報。

Type

障害は次のいずれかの種類になります。

• fsm

• 環境

• 機器

Cause

障害を発生させた状態に関連付けられている固有識別情報。

Created at

障害が発生した日時。

Code

障害に割り当てられた固有識別情報。

Number of Occurrences

障害が発生したイベントの発生回数。

Original Severity

障害が最初に発生したときに割り当てられた重大度。

Previous Severity

重大度が変更された場合の、変更前の重大度。

Highest Severity

この問題で発生した一番深刻な重大度。

障害のライフサイクル

Cisco UCS の障害はステートフルです。各オブジェクトには、特定の障害のインスタンスが 1 つだけ存在できます。同じ障害が 2 度発生すると、Cisco UCS は発生回数を 1 つずつ増やします。

障害のライフサイクルは次のとおりです。

1. ある状態がシステム内で発生し、Cisco UCS が障害を発生させます。これはアクティブな状態です。

2. 障害が軽減されると、フラッピングまたはフラッピングを防ぐことを目的としたーキング間隔になります。障害が断続的に何度も発生してクリアされると、フラッピングが発生します。フラッピ間隔のうち、障害収集ポリシーに指定されている期間は、障害の重要度が保持されます。

3. フラッピング間隔の間にその状態が再発すると、障害はアクティブな状態を返します。フラッピング間隔の間にその状態が再発しなかった場合は、その障害がクリアされます。

4. クリアされた障害は保持期間になります。この期間は、障害が発生した状態が緩和された場合でも管理者が障害に気付くようにしたり、障害が早々に削除されないようにするためのものです。保持期間のうち、障害収集ポリシーに指定された期間はクリアされた障害が保持されます。

5. 保持期間にその状態が再発すると、障害はアクティブな状態を返します。その状態が再発しなかった場合は、その障害が削除されます。

Cisco UCS Manager GUI の障害

システム内の 1 つのオブジェクトの障害を表示する場合は、Cisco UCS Manager GUI でそのオブジェクトにナビゲートして、[Work] ペインの [Faults] タブをクリックします。システム内のすべてのオブジェクトの障害を表示するには、[Faults, Events and Audit Log] の下の [Admin] タブにある [Faults] ノードにナビゲートします。

また、Cisco UCS Manager GUI の左上の [Fault Summary] 領域には、Cisco UCS インスタンスのすべての障害の要約を表示できます。この領域には、Cisco UCS インスタンスで発生したすべての障害の要約が表示されます。

障害の重大度は、それぞれ異なるアイコンで表示されます。各アイコンの下の数字は、システム内でその重大度の障害が発生した回数を示します。アイコンをクリックすると、Cisco UCS Manager GUI によって [Work] 領域の [Faults] タブが開かれ、その重大度のすべての障害の詳細が表示されます。

Cisco UCS Manager CLI の障害

システム内のすべてのオブジェクトの障害を表示する場合は、最上位レベルのスコープから show fault コマンドを実行します。特定のオブジェクトの障害を表示する場合は、そのオブジェクトのスコープに移動して、 show fault コマンドを実行します。

障害について入手可能なすべての詳細を表示するには、 show fault detail コマンドを実行します。

障害収集ポリシー

障害収集ポリシーは、フラッピング間隔や保持期間に障害を保持する時間など、Cisco UCS インスタンスでの障害のライフサイクルを制御します。


ヒント 障害収集ポリシーの設定方法については、『Cisco UCS B-Series Servers Documentation Roadmap』からアクセスできる Cisco UCS の設定ガイドを参照してください。


イベント

Cisco UCS では、イベントは Cisco UCS Manager によって管理される不変オブジェクトです。各イベントは、Cisco UCS インスタンスの非永続状態を表します。Cisco UCS Manager がイベントを作成してログに記録した後は、イベントは変更されません。たとえばサーバの電源を投入すると、Cisco UCS Manager は、その要求の始まりと終わりのイベントを作成して、ログに記録します。

Cisco UCS Manager CLI または Cisco UCS Manager GUI のいずれかを使用して、1 つのオブジェクトのイベントを表示したり、Cisco UCS インスタンスのすべてのイベントを表示できます。イベントは、イベント ログがいっぱいになるまで Cisco UCS に残ります。ログがいっぱいになると、Cisco UCS Manager はログおよびログの中のすべてのイベントを削除します。

この項の内容は次のとおりです。

「イベントのプロパティ」

「Cisco UCS Manager GUI のイベント」

「Cisco UCS Manager CLI のイベント」

イベントのプロパティ

Cisco UCS Manager では、Cisco UCS インスタンスで作成およびログ記録された各イベントの詳細情報を提供しています。 表 1-4 では、Cisco UCS Manager CLI または Cisco UCS Manager GUI で表示できる障害のプロパティについて説明します。

 

表 1-4 イベントのプロパティ

プロパティ名
説明

Affected Object

イベントを作成したコンポーネント。

Description

イベントの説明。

Cause

イベントに関連付けられた固有識別情報。

Created at

イベントが作成された日時。

User

イベントを作成したユーザの種類。次のいずれかになります。

admin

internal

blank

Code

イベントに割り当てられた固有識別情報。

Cisco UCS Manager GUI のイベント

システム内の 1 つのオブジェクトのイベントを表示する場合は、Cisco UCS Manager GUI でそのオブジェクトにナビゲートして、[Work] ペインの [Events] タブをクリックします。システム内のすべてのオブジェクトのイベントを表示するには、[Faults, Events and Audit Log] の下の [Admin] タブにある [Events] ノードにナビゲートします。

Cisco UCS Manager CLI のイベント

システム内のすべてのオブジェクトのイベントを表示する場合は、最上位レベルのスコープから show event コマンドを実行します。特定のオブジェクトのイベントを表示する場合は、そのオブジェクトのスコープに移動して、 show event コマンドを実行します。

イベントについて入手可能なすべての詳細を表示するには、 show event detail コマンドを実行します。

core ファイル

Cisco UCS Manager や、ファブリック インターコネクトまたは I/O モジュールなどの Cisco UCS の一部のコンポーネントでの重大なエラーによって、システムに core ファイルが作成される場合があります。core ファイルには、障害発生時のシステムとコンポーネントに関する大量のデータが含まれます。

Cisco UCS Manager はすべてのコンポーネントの core ファイルを管理します。core ファイルが作成されたら、すぐに外部の TFTP サーバ上の場所に core ファイルのコピーをエクスポートするように、Cisco UCS Manager を設定できます。

この項の内容は次のとおりです。

「Cisco UCS Manager GUI での core ファイル」

「Cisco UCS Manager CLI での core ファイル」

「Core File Exporter」

Cisco UCS Manager GUI での core ファイル

Cisco UCS インスタンスのコンポーネントが core ファイルを生成したかどうかを確認するには、[Faults, Events and Audit Log] の下の [Admin] タブにある [Core Files] ノードにナビゲートします。

Cisco UCS Manager CLI での core ファイル

Cisco UCS インスタンスのコンポーネントが core ファイルを生成したかどうかを確認するには、次のコマンドを実行します。

scope monitoring

scope sysdebug

show cores

Core File Exporter

Core File Exporter をイネーブルにすると、core ファイルが発生したらすぐに TFTP を使用してネットワーク上の指定された場所にエクスポートするように、Cisco UCS Manager を設定できます。この機能を使用して、core ファイルの内容を含む tar ファイルを、指定された場所にエクスポートすることもできます。


ヒント Exporter をイネーブルにする方法については、『Cisco UCS B-Series Servers Documentation Roadmap』からからアクセスできる Cisco UCS の設定ガイドを参照してください。


監査ログ

監査ログには、ユーザが Cisco UCS Manager で実行する処理(直接行う処理および間接的な処理を含む)が記録されます。監査ログの各エントリは、1 つの非永続処理を表します。たとえば、ユーザがログインまたはログアウトしたり、サービス プロファイルなどのオブジェクトを作成、変更、削除すると、Cisco UCS Manager はその処理のエントリを監査ログに追加します。

監査ログのエントリは、Cisco UCS Manager CLI、Cisco UCS Manager GUI、または show tech-support コマンドの出力で表示できます。


) 監査ログには、実行されたすべての処理の詳細が含まれない場合があります。たとえば、シャーシの電源ポリシーを変更した場合、監査ログのメッセージはシャーシが変更されたことだけを示し、実行された処理や変更された値は示されません。


この項の内容は次のとおりです。

「監査ログ エントリのプロパティ」

「Cisco UCS Manager GUI の監査ログ」

「Cisco UCS Manager CLI の監査ログ」

監査ログ エントリのプロパティ

Cisco UCS Manager では、監査ログの各エントリに関する詳細な情報を提供しています。 表 1-5 では、Cisco UCS Manager CLI または Cisco UCS Manager GUI で表示できる障害のプロパティについて説明します。

 

表 1-5 監査ログ エントリのプロパティ

プロパティ名
説明

ID

監査ログ メッセージに関連付けられた固有識別情報。

Affected Object

ユーザの処理によって影響を受けるコンポーネント。

Severity

監査ログ メッセージに関連付けられたユーザ処理の現在の重大度。これは、表 1-1 で説明した障害に使用される重大度と同じです。

Trigger

メッセージを発生したユーザに関連付けられているユーザの役割。

User

イベントを作成したユーザの種類。次のいずれかになります。

admin

internal

blank

Indication

監査ログ メッセージが示す処理。次のいずれかになります。

creation:コンポーネントがシステムに追加された。

modification:既存のコンポーネントが変更された。

Description

ユーザ処理の説明。

Cisco UCS Manager GUI の監査ログ

監査ログを表示するには、[Faults, Events and Audit Log] の下の [Admin] タブにある [Audit Log] ノードにナビゲートします。

Cisco UCS Manager CLI の監査ログ

監査ログを表示するには、次のように show audit-logs コマンドを実行します。

scope security

show audit-logs

システム イベント ログ

System Event Log(SEL; システム イベント ログ)は BMC の NVRAM にあります。SEL には、電圧の上下、温度イベント、ファン イベント、BIOS からのイベントなど、サーバ関連のほとんどのイベントが記録されます。SEL は主にトラブルシューティングの目的で使用されます。


ヒント 各サーバの SEL を表示する方法や SEL ポリシーの設定方法などの SEL の詳細については、『Cisco UCS B-Series Servers Documentation Roadmap』からアクセスできる Cisco UCS の設定ガイドを参照してください。


この項の内容は次のとおりです。

「SEL ファイル」

「SEL ポリシー」

SEL ファイル

SEL ファイルのサイズは約 40KB で、ファイルがいっぱいになるとそれ以上イベントを記録できません。それ以上のイベントを記録できるように、ファイルをクリアする必要があります。

SEL ポリシー

SEL ポリシーを使用して、リモート サーバに SEL をバックアップできます。また、オプションで、バックアップ操作の実行後に SEL をクリアすることもできます。バックアップ操作は、特定の処理に基づいてトリガーすることができます。または、定期的に発生させることもできます。手動で SEL をバックアップしたり、クリアすることもできます。

Cisco UCS Manager は、SEL ポリシーの設定に従って、SEL のバックアップ ファイルを自動的に生成します。ファイル名の形式は sel-SystemName-ChassisID-ServerID-ServerSerialNumber-Timestamp です。

たとえば、ファイル名は sel-UCS-A-ch01-serv01-QCI12522939-20091121160736 のようになります。

Syslog

Syslog は、主に、Cisco UCS インスタンスのトラブルシューティングや監査に使用できるシステム ログの収集と処理を行います。Cisco UCS Manager では、DCOS syslog メカニズムと API、およびプライマリ ファブリック インターコネクトの syslog 機能を使用して、syslog エントリを収集して処理します。

この項の内容は次のとおりです。

「Syslog の設定」

「syslog の場所」

「syslog エントリの形式」

「syslog エントリのパラメータ」

「syslog サービス」

Syslog の設定

Cisco UCS Manager は Cisco UCS インスタンスの syslog コレクタを管理および設定し、その設定を 1 つまたは複数のファブリック インターコネクトに展開します。この設定は、DCOS または Cisco UCS Manager によって Cisco UCS インスタンスで生成されるすべての syslog エントリに影響します。

syslog の場所

syslog および syslog エントリを、次のうちの 1 つまたは複数の場所に配置するように、Cisco UCS Manager を設定できます。

syslog エントリをコンソールまたはモニタに表示する

syslog エントリをファイルに格納する

syslog エントリを Cisco UCS インスタンスの syslog が格納されている外部ログ コレクタに転送する(最大 3 つまで)

syslog エントリの形式

Cisco UCS コンポーネントによって生成される syslog エントリの形式は、次のとおりです。

Year month date hh:mm:ss hostname %facility-severity-MNEMONIC description

例:2007 Nov 1 14:07:58 excal-113 %MODULE-5-MOD_OK: Module 1 is online

syslog エントリのパラメータ

表 1-6 では、各 syslog エントリに含まれる情報について説明します。

 

表 1-6 syslog メッセージの内容

名前
説明

ファシリティ

syslog エントリを生成して送信するロギング ファシリティ。このファシリティは大きく分類され、整数で表されます。これらのソースは、次の Linux の標準的なファシリティのいずれかになります。

local0

local1

local2

local3

local4

local5

local6

local7

重大度

syslog エントリを生成したイベント、アラート、または問題の重大度。重大度は次のいずれかになります。

Alerts

Critical

Debugging

Emergencies

Errors

Information

Notifications

Warnings

ホスト名

エントリの発生元となるコンポーネントに依存する syslog エントリに含まれるホスト名。たとえば次のとおりです。

ファブリック インターコネクトまたは Cisco UCS Managerの場合は、Cisco UCS インスタンスのホスト名

その他すべてのコンポーネントの場合は、VIP に関連付けられたホスト名

タイムスタンプ

syslog エントリが生成された日時。

メッセージ

syslog エントリを生成したイベント、アラート、または問題の説明。

syslog サービス

次の Cisco UCS コンポーネントでは、DCOS syslog サービスを使用して、システム情報とアラートに関する syslog エントリを生成します。

I/O モジュール:syslogd を実行します。すべての syslog エントリは接続しているファブリック インターコネクトに送信されます。

BMC:すべての syslog エントリは、クラスタ構成内のプライマリ ファブリック インターコネクトに送信されます。

アダプタ:Nic-Tools/Syslog を実行します。すべての syslog エントリは、両方のファブリック インターコネクトに送信されます。

Cisco UCS Manager:syslog の設定に従って、独自の syslog エントリをログに記録します。