Cisco Fabric Manager システム管理 コンフィギュ レーション ガイド
システム プロセスおよびログのモニタ
システム プロセスおよびログのモニタ
発行日;2012/01/30 | 英語版ドキュメント(2009/09/16 版) | ドキュメントご利用ガイド | ダウンロード ; この章pdf , ドキュメント全体pdf (PDF - 6MB) | フィードバック

目次

システム プロセスおよびログのモニタ

システム プロセスの表示

システム ステータスの表示

コア ファイルおよびログ ファイル

コア ステータスの表示

コア ディレクトリのクリア

最初と最後のコア

最初と最後のコア ステータスの確認

オンラインでのシステム ヘルス管理

OHMS の概要

内部ループバック テストの実行

外部ループバック テストの実行

デフォルト設定

システム プロセスおよびログのモニタ

この章では、スイッチ状態のモニタリングについて詳細に説明します。この章の内容は、次のとおりです。

「システム プロセスの表示」

「システム ステータスの表示」

「コア ファイルおよびログ ファイル」

「デフォルト設定」

システム プロセスの表示

Device Manager を使用して、すべてのプロセスに関する一般的な情報を表示するには、次の手順を実行します。


ステップ 1 [Admin] > [Running Processes] を選択します。

図 6-1のように、[Running Processes] ダイアログボックスが表示されます。

図 6-1 [Running Processes] ダイアログボックス

 

各項目の意味は次のとおりです。

ProcessId = プロセス ID

Name = プロセス名

MemAllocated = このプロセスがシステムから動的に割り当てられているすべてのメモリの合計。すでにシステムに返されたメモリが含まれている場合があります。

CPU Time (ms) = プロセスが使用した CPU 時間(ミリ秒)

ステップ 2 [Close] をクリックして、ダイアログボックスを閉じます。


 

システム ステータスの表示

Device Manager でシステム ステータスを表示するには、次の手順を実行します。


ステップ 1 [Physical] > [System] を選択します。

図 6-2 のような [System] ダイアログボックスが表示されます。

図 6-2 [System] ダイアログボックス

 

ステップ 2 [Close] をクリックして、ダイアログボックスを閉じます。


 

コア ファイルおよびログ ファイル

ここでは、次の内容について説明します。

「コア ステータスの表示」

「コア ディレクトリのクリア」

コア ステータスの表示


) このスイッチで SSH2 がイネーブルになっていることを確認してください。


Device Manager を使用してスイッチ上でコアを表示するには、次の手順を実行します。


ステップ 1 [Admin] > [Show Cores] を選択します。

図 6-3のように、[Show Cores] ダイアログボックスが表示されます。

図 6-3 [Show Cores] ダイアログボックス

 

Module-num は、コアが生成されたスロット番号を示します。この例で、 fspf core がアクティブ スーパーバイザ モジュール(スロット 5)で生成され、 fcc がスタンバイ スーパーバイザ モジュール(スロット 6)で生成され、 acltcam および fib が、スイッチング モジュール(スロット 8)で生成されています。

ステップ 2 [Close] をクリックして、ダイアログボックスを閉じます。


 

コア ディレクトリのクリア


) このスイッチで SSH2 がイネーブルになっていることを確認してください。


Device Manager を使用してスイッチ上でコアをクリアするには、次の手順を実行します。


ステップ 1 [Clear] をクリックしてコアをクリアします。

ソフトウェアはサービスごと、およびスロットごとに直前のコアをいくつか保管し、アクティブ スーパーバイザ モジュール上のその他のすべてのコアをクリアします。

ステップ 2 [Close] をクリックして、ダイアログボックスを閉じます。


 

最初と最後のコア

最初と最後のコアの機能は、限られたシステム リソースで最も重要なコア ファイルを保持します。一般に、最初のコアと最後に生成されたコアにデバッグの情報が格納されています。最初と最後のコアの機能は、最初と最後のコア情報を保持しようとします。

アクティブ スーパーバイザ モジュールからコア ファイルが生成される場合、サービスのコア ファイルの数は、service.conf ファイルで定義されます。アクティブ スーパーバイザ モジュールのコア ファイルの総数に上限はありません。

最初と最後のコア ステータスの確認

保存したコア ファイルに関する詳細な情報を表示できます。コア ファイルの保存についての詳細を例 6-1 に示します。

例 6-1 アクティブ スーパーバイザ モジュール上の vdc 2 上の通常のサービス

アクティブ スーパーバイザ モジュール上の vdc2 から出力された 5 つの radius コア ファイルがあります。2 番目と 3 番目に古いファイルが、service.conf ファイルで定義されているコア ファイルの数に従うために削除されます。

switch# show cores vdc vdc2
 
VDC No Module-num Process-name PID Core-create-time
------ ---------- ------------ --- ----------------
2 5 radius 6100 Jan 29 01:47
2 5 radius 6101 Jan 29 01:55
2 5 radius 6102 Jan 29 01:55
2 5 radius 6103 Jan 29 01:55
2 5 radius 6104 Jan 29 01:57
 
switch# show cores vdc vdc2
 
VDC No Module-num Process-name PID Core-create-time
------ ---------- ------------ --- ----------------
2 5 radius 6100 Jan 29 01:47
2 5 radius 6103 Jan 29 01:55
2 5 radius 6104 Jan 29 01:57

オンラインでのシステム ヘルス管理

Online Health Management System(OHMS、システム ヘルス)は、ハードウェア障害検出および復旧機能です。OHMS は、Cisco MDS 9000 ファミリのすべてのスイッチのスイッチング モジュール、サービス モジュール、スーパーバイザ モジュールの全般的な状態を確認します。

ここで説明する内容は、次のとおりです。

「OHMS の概要」

「内部ループバック テストの実行」

「外部ループバック テストの実行」

OHMS の概要

OHMS は、システム ハードウェアを次の方法で監視します。

アクティブ スーパーバイザ稼動する OHMS コンポーネントは、スイッチ内の他のモジュール上で稼動する他のすべての OHMS コンポーネントを制御します。

スタンバイ スーパーバイザ モジュール上で稼動するシステム ヘルス アプリケーションは、そのモジュールが HA スタンバイ モードで使用できる場合でも、スタンバイ スーパーバイザ モジュールだけを監視します。

OHMS アプリケーションはすべてのモジュールでデーモン プロセスを起動して、各モジュール上で複数のテストを実行し、モジュールの個々のコンポーネントをテストします。テストは事前に設定された間隔で実行され、すべての主要な障害ポイントを対象とし、MDS スイッチで障害の発生したコンポーネントを隔離します。アクティブ スーパーバイザ上で稼動する OHMS は、スイッチ内の他のすべてのモジュール上で稼動する他のすべての OHMS コンポーネントを制御します。

障害を検出すると、システム ヘルス アプリケーションは次の復旧処置を行います。

障害のあるコンポーネントを隔離するため、追加のテストを実行します。

永続的ストレージから設定情報を取得し、コンポーネントの再設定を試みます。

復旧できない場合、コール ホーム通知、システム メッセージ、および例外ログを送信します。障害の発生しているモジュールまたはコンポーネント(インターフェイスなど)をシャットダウンし、テストを中止します。

障害を検出するとすぐに、コール ホーム、システム メッセージ、および例外ログを送信します。

障害の発生しているモジュールまたはコンポーネント(インターフェイスなど)をシャットダウンします。

詳細なテストを行うために、障害ポートを隔離します。

適切なソフトウェア コンポーネントに障害を通知します。

スタンバイ スーパーバイザ モジュールに切り替えます(障害がアクティブ スーパーバイザ モジュールで検出され、Cisco MDS スイッチにスタンバイ スーパーバイザ モジュールが搭載されている場合)。スイッチオーバーが完了すると、新しいアクティブ スーパーバイザ モジュールはアクティブ スーパーバイザ テストを再開します。

スイッチをリロードします(スイッチにスタンバイ スーパーバイザ モジュールが搭載されていない場合)。

スイッチ上で CLI をサポートし、表示、テスト、およびテスト統計情報の取得、またはシステム ヘルス テストの設定変更を行うことができるようにします。

障害エリアに重点を置いたテストを行います。

各モジュールはそれぞれに対応するテストを実行するように設定されています。必要に応じて、各モジュールのデフォルト パラメータを変更できます。

内部ループバック テストの実行

手動ループバック テストを実行すると、スイッチング モジュールまたはサービス モジュールのデータ パスや、スーパーバイザ モジュールの制御パスにおけるハードウェア エラーを特定できます。内部ループバック テストは同一のポートに対して FC2 フレームを送受信し、ラウンドトリップ時間をマイクロ秒単位で示します。このテストは、ファイバ チャネル インターフェイス、IPS インターフェイス、iSCSI インターフェイスで使用できます。

Device Manager から内部ループバック テストを実行するには、[Interface] > [Diagnostics] > [Internal] の順に選択します。

外部ループバック テストの実行

手動ループバック テストを実行すると、スイッチング モジュールまたはサービス モジュールのデータ パスや、スーパーバイザ モジュールの制御パスにおけるハードウェア エラーを特定できます。外部ループバック テストは、同一のポートの間または 2 つのポート間で FC2 フレームを送受信します。

テストを実行する前に、Rx ポートから Tx ポートへループさせるためにケーブル(またはプラグ)を接続する必要があります。同じポートの間でテストする場合は、特殊なループ ケーブルが必要です。異なるポートとの間でテストする場合は、通常のケーブルを使用できます。このテストは、ファイバ チャネル インターフェイスだけで使用できます。

Device Manager から外部ループバック テストを実行するには、[Interface] > [Diagnostics] > [External] を選択します。

デフォルト設定

表 6-1 に、システム ヘルスおよびログのデフォルト設定値を示します。

 

表 6-1 システム ヘルスとログのデフォルト設定

パラメータ
デフォルト

カーネル コア生成

1 つのモジュール

システム ヘルス

イネーブル

ループバック頻度

5 秒

障害動作

イネーブル