Cisco DCNM for SAN, Release 6.x システム管理コンフィギュレーション ガイド リリース
システム プロセスおよびログのモニタ
システム プロセスおよびログのモニタ
発行日;2012/09/19 | 英語版ドキュメント(2012/07/09 版) | ドキュメントご利用ガイド | ダウンロード ; この章pdf , ドキュメント全体pdf (PDF - 3MB) | フィードバック

目次

システム プロセスおよびログのモニタ

システム プロセスおよびログについて

コアの保存

ブートフラッシュへの最後のコアの保存

最初と最後のコア

オンラインでのシステム ヘルス管理

ループバック テストの頻度の設定

ループバック テストのフレーム長の設定

ハードウェアの障害処理

テストの実行要件

指定モジュールのテスト

古いエラー通知のクリア

現在のステータスの説明

オンボード障害ロギング

デフォルト設定

コア ディレクトリのクリア

システム ヘルスの設定

内部ループバック テストの実行

外部ループバック テストの実行

システム プロセスおよびログの設定の確認

システム プロセスの表示

システム ステータスの表示

コア ステータスの表示

その他の参考資料

MIB

システム プロセスおよびログのモニタ

この章では、スイッチのヘルスのモニタリングについて詳細に説明します。この章の内容は次のとおりです。

「システム プロセスおよびログについて」

「デフォルト設定」

「コア ディレクトリのクリア」

「システム ヘルスの設定」

「システム プロセスおよびログの設定の確認」

「その他の参考資料」

システム プロセスおよびログについて

ここで説明する内容は、次のとおりです。

「コアの保存」

「ブートフラッシュへの最後のコアの保存」

「最初と最後のコア」

「オンラインでのシステム ヘルス管理」

「ループバック テストの頻度の設定」

「ループバック テストのフレーム長の設定」

「ハードウェアの障害処理」

「テストの実行要件」

「指定モジュールのテスト」

「古いエラー通知のクリア」

「現在のステータスの説明」

「オンボード障害ロギング」

コアの保存

次の方法のいずれかで、(アクティブ スーパーバイザ モジュール、スタンバイ スーパーバイザ モジュール、または任意のスイッチング モジュールの)コアを外部 CompactFlash(スロット 0)または TFTP サーバに保存できます。

オンデマンド:与えられたプロセス ID に基づいて 1 つのファイルをコピーします。

定期的:ユーザの設定に従ってコア ファイルを定期的にコピーします。

新しい方式が実行されると、その前に実行された方式は新しい方式で上書きされます。たとえば、別のコア ログ コピー タスクを実行すると、コアは、その新しい場所またはファイルに定期的に保存されます。

ブートフラッシュへの最後のコアの保存

この最後のコア ダンプは、スイッチオーバーまたはリブートが起こる前に、/mnt/pss/ パーティションにあるブートフラッシュに自動的に保存されます。スーパーバイザ モジュールがリブートしてから 3 分間後に、保存された最後のコアがフラッシュ パーティション(/mnt/pss)から元のメモリ上に復元されます。この復元はバックグラウンド プロセスであり、ユーザからは見えません。


ヒント 復元された最後のコア ファイルのタイムスタンプは、最後のコアが実際にダンプされた時刻ではなく、スーパーバイザのブート時刻を表します。最後のコア ダンプの正確な時刻を知るには、PID が同じ、対応するログ ファイルを確認してください。

最初と最後のコア

最初と最後のコアの機能は、限られたシステム リソースで最も重要なコア ファイルを保持します。一般に、最初のコアと最後に生成されたコアにデバッグの情報が格納されています。最初と最後のコアの機能は、最初と最後のコア情報を保持しようとします。

アクティブ スーパーバイザ モジュールからコア ファイルが生成される場合、サービスのコア ファイルの数は、service.conf ファイルで定義されます。アクティブ スーパーバイザ モジュールのコア ファイルの総数に上限はありません。

オンラインでのシステム ヘルス管理

Online Health Management System(OHMS、システム ヘルス)は、ハードウェア障害検出および復旧機能です。OHMS は、Cisco MDS 9000 ファミリのすべてのスイッチのスイッチング モジュール、サービス モジュール、スーパーバイザ モジュールの全般的な状態を確認します。

OHMS は、システム ハードウェアを次のようにモニタリングします。

アクティブ スーパーバイザ稼働する OHMS コンポーネントは、スイッチ内の他のモジュール上で稼働する他のすべての OHMS コンポーネントを制御します。

スタンバイ スーパーバイザ モジュール上で稼働するシステム ヘルス アプリケーションは、そのモジュールが HA スタンバイ モードで使用できる場合でも、スタンバイ スーパーバイザ モジュールだけを監視します。

OHMS アプリケーションはすべてのモジュールでデーモン プロセスを起動して、各モジュール上で複数のテストを実行し、モジュールの個々のコンポーネントをテストします。これらのテストは、事前に設定されたインターバルで実行され、すべての主要な障害ポイントを対象として、障害が発生している MDS スイッチのコンポーネントを隔離します。アクティブ スーパーバイザ上で稼働する OHMS は、スイッチ内の他のすべてのモジュール上で稼働する他のすべての OHMS コンポーネントを制御します。

障害を検出すると、システム ヘルス アプリケーションは次のリカバリ アクションを試行します。

障害のあるコンポーネントを隔離するため、追加のテストを実行します。

永続的ストレージから設定情報を取得し、コンポーネントの再設定を試みます。

復旧できない場合、Call Home 通知、システム メッセージ、および例外ログを送信します。障害の発生しているモジュールまたはコンポーネント(インターフェイスなど)をシャットダウンし、テストを中止します。

障害を検出すると、ただちに Call Home メッセージ、システム メッセージ、および例外ログを送信します。

障害の発生しているモジュールまたはコンポーネント(インターフェイスなど)をシャットダウンします。

詳細なテストが実行されないように、障害が発生したポートを隔離します。

その障害を適切なソフトウェア コンポーネントに報告します。

スタンバイ スーパーバイザ モジュールに切り替えます(障害がアクティブ スーパーバイザ モジュールで検出され、Cisco MDS スイッチにスタンバイ スーパーバイザ モジュールが搭載されている場合)。スイッチオーバーが完了すると、新しいアクティブ スーパーバイザ モジュールはアクティブ スーパーバイザ テストを再開します。

スイッチをリロードします(スイッチにスタンバイ スーパーバイザ モジュールが搭載されていない場合)。

テストの実行統計情報を表示、テスト、および取得したり、スイッチのシステム ヘルス テスト設定を変更したりするための CLI サポートを提供します。

問題領域に焦点を当てるためのテストを実行します。

各モジュールはそれぞれに対応するテストを実行するように設定されています。必要に応じて、各モジュールのデフォルト パラメータを変更できます。

ループバック テストの頻度の設定

ループバック テストは、モジュール内のデータ パスおよびスーパーバイザ内の制御パスにおいてハードウェア エラーを特定するように設計されています。事前に設定された頻度でループバック フレームが各モジュールに 1 つずつ送信されます。このフレームは、それぞれに設定されたインターフェイスを通過した後、スーパーバイザ モジュールに戻ります。

ループバック テストは 5(デフォルト)~ 255 秒の範囲の頻度で実行できます。ループバック頻度の値を設定しなければ、デフォルトの頻度である 5 秒がスイッチ内のすべてのモジュールに対して使用されます。ループバック テストの頻度は、モジュールごとに変更できます。

ループバック テストのフレーム長の設定

ループバック テストは、モジュール内のデータ パスおよびスーパーバイザ内の制御パスにおいてハードウェア エラーを特定するように設計されています。事前に設定されたサイズでループバック フレームが各モジュールに 1 つずつ送信されます。このフレームは、それぞれに設定されたインターフェイスを通過した後、スーパーバイザ モジュールに戻ります。

ループバック テストは、0 ~ 128 バイトの範囲のフレーム サイズで実行できます。ループバック フレーム長の値を設定しなければ、スイッチ内のすべてのモジュールに対してランダムなフレーム長がスイッチによって生成されます(自動モード)。ループバック テストのフレーム長は、モジュールごとに変更できます。

ハードウェアの障害処理

failure-action コマンドは、テストの実行中にハードウェア障害が発見された場合に、Cisco NX-OS ソフトウェアによる処理の実行を抑制します。

デフォルトでは、Cisco MDS 9000 ファミリのすべてのスイッチでこの機能はイネーブルになります。障害が発見されると処理が実行され、障害が発生したコンポーネントはそれ以降のテストから隔離されます。

障害処理は、個々のテスト レベル(モジュール単位)、モジュール レベル(すべてのテスト)、またはスイッチ全体で制御されます。

テストの実行要件

テストをイネーブルにしても、テストの実行が保障されるわけではありません。

特定のインターフェイスまたはモジュールのテストが実行されるのは、次のすべての項目に対してシステム ヘルスをイネーブルにしている場合だけです。

スイッチ全体

必要なモジュール

必要なインターフェイス


ヒント 上記のいずれかによってシステム ヘルスがディセーブルになっている場合、テストは実行されません。システム ヘルスでテストの実行がディセーブルになっている場合、テスト ステータスはディセーブル(Disabled)と表示されます。


ヒント 特定のモジュールまたはインターフェイスでテストの実行がイネーブルになっているが、システム ヘルスがディセーブルであるためにテストが実行されない場合、テストはイネーブル(Enabled)と表示されます(実行中(Running)にはなりません)。

指定モジュールのテスト

NX-OS ソフトウェアのシステム ヘルス機能は、次の領域のテストを実行します。

アクティブ スーパーバイザのファブリックへのインバンド接続。

スタンバイ スーパーバイザのアービターの可用性。

すべてのモジュール上でのブートフラッシュの接続性とアクセシビリティ。

すべてのモジュール上での EOBC の接続性とアクセシビリティ。

すべてのモジュール上の各インターフェイスのデータ パスの完全性。

管理ポートの接続性。

外部接続性検証のためのユーザによるテスト。テスト中はポートがシャットダウンされます(ファイバ チャネル ポートのみ)。

内部接続性検証のためのユーザによるテスト(ファイバ チャネル ポートと iSCSI ポート)。

古いエラー通知のクリア

ファイバ チャネル インターフェイス、iSCSI インターフェイス、モジュール全体、またはモジュール全体の特定の 1 つのテストについて、エラー履歴をクリアできます。履歴をクリアすると、障害が発生してテストから除外されていたコンポーネントはすべて再度テストされます。

障害発生時に OHMS が一定期間(たとえば、1 週間)の間処理を実行しないようにオプション failure-action オプションをイネーブルにしていて、指定期間が経過した後でエラー受信を再開する準備が整った場合には、それぞれのテストのシステム ヘルス エラー ステータスをクリアする必要があります。


ヒント 管理ポート テストは、スタンバイ スーパーバイザ モジュール上で実行することはできません。

現在のステータスの説明

各モジュールまたはテストのステータスは、その特定のモジュールでの OHMS テストの現在の設定状態によって異なります( 表 6-1 を参照)。

オンボード障害ロギング

第 2 世代ファイバ チャネル スイッチング モジュールでは、障害データを永続的ストレージに記録する機能が提供されます。この記録は、分析用に取得したり、表示したりできます。このオンボード障害ロギング(OBFL)機能は、障害および環境情報をモジュールの不揮発性メモリに保管します。この情報は、障害が発生したカードの事後分析に役立ちます。

OBFL データは、モジュール上の既存の CompactFlash に保存されます。OBFL では、モジュールのファームウェアで使用できる永続的ロギング(PLOG)機能を使用して CompactFlash にデータを保存します。保存されたデータを取得するためのメカニズムも提供されます。

OBFL 機能によって保存されるデータは、次のとおりです。

最初の電源投入時刻

カードのシャーシ スロット番号

カードの初期温度

ファームウェア、BIOS、FPGA、および ASIC のバージョン

カードのシリアル番号

クラッシュのスタック トレース

CPU hog 情報

メモリ リーク情報

ソフトウェア エラー メッセージ

ハードウェア例外ログ

環境履歴

OBFL 固有の履歴情報

ASIC 割り込みおよびエラー統計の履歴

ASIC レジスタ ダンプ

デフォルト設定

表 6-1 に、システム ヘルスおよびログのデフォルト設定値を示します。

 

表 6-1 システム ヘルスおよびログのデフォルト設定値

パラメータ
デフォルト

カーネル コアの生成

1 つのモジュール

システム ヘルス

イネーブル

ループバック頻度

5 秒

障害処理

イネーブル

コア ディレクトリのクリア

前提条件

このスイッチ上で SSH2 がイネーブルになっていることを確認します。

手順の詳細

スイッチ上でコアをクリアするには、次の手順を実行します。


ステップ 1 [Clear] をクリックしてコアをクリアします。

ソフトウェアは、過去数世代のコア(サービス単位とスロット単位)を保持し、アクティブ スーパーバイザ モジュール上に存在するすべてのコア ファイルとその他のコアをクリアします。

ステップ 2 [Close] をクリックして、ダイアログボックスを閉じます。


 

システム ヘルスの設定

Online Health Management System(OHMS、システム ヘルス)は、ハードウェア障害検出および復旧機能です。OHMS は、Cisco MDS 9000 ファミリのすべてのスイッチのスイッチング モジュール、サービス モジュール、スーパーバイザ モジュールの全般的な状態を確認します。

ここで説明する内容は、次のとおりです。

「内部ループバック テストの実行」

「外部ループバック テストの実行」

内部ループバック テストの実行

手動ループバック テストを実行すると、スイッチング モジュールまたはサービス モジュールのデータ パスや、スーパーバイザ モジュールの制御パスにおけるハードウェア エラーを特定できます。内部ループバック テストは同一のポートに対して FC2 フレームを送受信し、ラウンドトリップ時間をマイクロ秒単位で示します。このテストは、ファイバ チャネル インターフェイス、IPS インターフェイス、iSCSI インターフェイスで使用できます。

Device Manager から内部ループバック テストを実行するには、[Interface] > [Diagnostics] > [Internal] の順に選択します。

外部ループバック テストの実行

手動ループバック テストを実行すると、スイッチング モジュールまたはサービス モジュールのデータ パスや、スーパーバイザ モジュールの制御パスにおけるハードウェア エラーを特定できます。外部ループバック テストは、同一のポートの間または 2 つのポート間で FC2 フレームを送受信します。

テストを実行する前に、Rx ポートから Tx ポートへループさせるためにケーブル(またはプラグ)を接続する必要があります。同じポートの間でテストする場合は、特殊なループ ケーブルが必要です。異なるポートとの間でテストする場合は、通常のケーブルを使用できます。このテストを使用できるのは、ファイバ チャネル インターフェイスだけです。

Device Manager から外部ループバック テストを実行するには、[Interface] > [Diagnostics] > [External] を選択します。

システム プロセスおよびログの設定の確認

ここで説明する内容は、次のとおりです。

「システム プロセスの表示」

「システム ステータスの表示」

「コア ステータスの表示」

システム プロセスの表示

すべてのプロセスに関する一般的な情報を表示するには、次の手順を実行します。


ステップ 1 [Admin] > [Running Processes] を選択します。

[Running Processes] ダイアログボックスが表示されます。

 

各記号の意味は次のとおりです。

ProcessId = プロセス ID

Name = プロセス名

MemAllocated = このプロセスがシステムから動的に割り当てられているすべてのメモリの合計。すでにシステムに返されたメモリが含まれている場合があります。

CPU Time (ms) = プロセスが使用した CPU 時間(ミリ秒)

ステップ 2 [Close] をクリックして、ダイアログボックスを閉じます。


 

システム ステータスの表示

Device Manager でシステム ステータスを表示するには、次の手順を実行します。


ステップ 1 [Physical] > [System] を選択します。

[System] ダイアログボックスが表示されます。

 

ステップ 2 [Close] をクリックして、ダイアログボックスを閉じます。


 

コア ステータスの表示

スイッチ上でコアを表示するには、次の手順を実行します。


) このスイッチ上で SSH2 がイネーブルになっていることを確認します。



ステップ 1 [Admin] > [Show Cores] を選択します。

[Show Cores] ダイアログボックスが表示されます。

 

Module-num は、コアが生成されたスロット番号を示します。

ステップ 2 [Close] をクリックして、ダイアログボックスを閉じます。


 

その他の参考資料

システム プロセスとログの実装に関する詳細情報については、次の項を参照してください。

「MIB」

MIB

MIB
MIB のリンク

CISCO-SYSTEM-EXT-MIB

CISCO-SYSTEM-MIB

MIB を検索およびダウンロードするには、次の URL にアクセスしてください。

http://www.cisco.com/en/US/products/ps5989/prod_technical_reference_list.html