Cisco MDS 9000 ファミリー コンフィギュレーション ガイド Release 2.x
システム プロセスおよびログのモニタ
システム プロセスおよびログのモニタ
発行日;2012/02/01 | ドキュメントご利用ガイド | ダウンロード ; この章pdf , ドキュメント全体pdf (PDF - 9MB) | フィードバック

目次

システム プロセスおよびログのモニタ

システム プロセスの表示

システム ステータスの表示

コア ファイルおよびログ ファイル

最後のコアのフラッシュへの保存

コア ディレクトリのクリア

コア ステータスの表示

カーネル コア ダンプ

オンラインでのシステム ヘルス管理

システム ヘルスの初期化

ループバック テストの頻度の設定

ハードウェアの障害処理

テストの実行要件

指定モジュールのテスト

古いエラー通知のクリア

内部ループバックの実行

外部ループバックの実行

現在のステータスの説明

システム ヘルスの表示

デフォルト設定値

システム プロセスおよびログのモニタ

この章では、スイッチ状態のモニタリングについて詳細に説明します。具体的な内容は、次のとおりです。

「システム プロセスの表示」

「システム ステータスの表示」

「コア ファイルおよびログ ファイル」

「カーネル コア ダンプ」

「オンラインでのシステム ヘルス管理」

「デフォルト設定値」

システム プロセスの表示

すべてのプロセスに関する一般的な情報を表示するには、 show processes コマンドを使用します(例41-1例41-6を参照)。

例41-1 システム プロセスの表示

switch# show processes
PID State PC Start_cnt TTY Process
----- ----- -------- ----------- ---- -------------
868 S 2ae4f33e 1 - snmpd
869 S 2acee33e 1 - rscn
870 S 2ac36c24 1 - qos
871 S 2ac44c24 1 - port-channel
872 S 2ac7a33e 1 - ntp
- ER - 1 - mdog
- NR - 0 - vbuilder
 

用語:

PID = プロセスID

State = プロセスの状態

D = 中断不可能なスリープ(通常はI/O)

R = (実行キューで)実行可能

S = スリープ中

T = 追跡済みまたは停止状態

Z = 消去済み(「ゾンビ」)プロセス

NR = 稼働していない

ER = 稼働しなければならないが、現在は稼働していない

PC = 現在のプログラム カウンタ(16進形式)

Start_cnt = プロセスの起動回数(または再起動回数)

TTY = プロセスを制御する端末。ハイフン「-」は通常、特定のTTYで稼働していないデーモンを表します。

Process = プロセス名

例41-2 CPU利用率情報の表示

switch# show processes cpu
PID Runtime(ms) Invoked uSecs 1Sec Process
----- ----------- -------- ----- ----- -----------
842 3807 137001 27 0.0 sysmgr
1112 1220 67974 17 0.0 syslogd
1269 220 13568 16 0.0 fcfwd
1276 2901 15419 188 0.0 zone
1277 738 21010 35 0.0 xbar_client
1278 1159 6789 170 0.0 wwn
1279 515 67617 7 0.0 vsan
 

用語:

Runtime(ms) = プロセスで使用されたCPU時間(ミリ秒単位)

Invoked = プロセスが呼び出された回数

uSecs = 各プロセス呼び出しの平均CPU時間(マイクロ秒)

1Sec = 直前の1秒間のCPU利用率(%)

例41-3 プロセス ログ情報の表示

switch# show processes log
Process PID Normal-exit Stack-trace Core Log-create-time
---------------- ------ ----------- ----------- ------- ---------------
fspf 1339 N Y N Jan 5 04:25
lcm 1559 N Y N Jan 2 04:49
rib 1741 N Y N Jan 1 06:05
 

用語:

Normal-exit = プロセスが通常どおりに終了したかどうか

Stack-trace = ログ内にスタック トレースがあるかどうか

Core = コア ファイルが存在するかどうか

Log-create-time = ログ ファイルが生成された時間

例41-4 プロセスに関する詳細ログ情報の表示

switch# show processes log pid 1339
Service: fspf
Description: FSPF Routing Protocol Application
 
Started at Sat Jan 5 03:23:44 1980 (545631 us)
Stopped at Sat Jan 5 04:25:57 1980 (819598 us)
Uptime: 1 hours 2 minutes 2 seconds
 
Start type: SRV_OPTION_RESTART_STATELESS (23)
Death reason: SYSMGR_DEATH_REASON_FAILURE_SIGNAL (2)
Exit code: signal 9 (no core)
CWD: /var/sysmgr/work
 
Virtual Memory:
 
CODE 08048000 - 0809A100
DATA 0809B100 - 0809B65C
BRK 0809D988 - 080CD000
STACK 7FFFFD20
TOTAL 23764 KB
 
Register Set:
 
EBX 00000005 ECX 7FFFF8CC EDX 00000000
ESI 00000000 EDI 7FFFF6CC EBP 7FFFF95C
EAX FFFFFDFE XDS 8010002B XES 0000002B
EAX 0000008E (orig) EIP 2ACE133E XCS 00000023
EFL 00000207 ESP 7FFFF654 XSS 0000002B
 
Stack: 1740 bytes. ESP 7FFFF654, TOP 7FFFFD20
 
0x7FFFF654: 00000000 00000008 00000003 08051E95 ................
0x7FFFF664: 00000005 7FFFF8CC 00000000 00000000 ................
0x7FFFF674: 7FFFF6CC 00000001 7FFFF95C 080522CD ........\...."..
0x7FFFF684: 7FFFF9A4 00000008 7FFFFC34 2AC1F18C ........4......*
 

例41-5 すべてのプロセス ログの詳細表示

switch# show processes log details
======================================================
Service: snmpd
Description: SNMP Agent
 
Started at Wed Jan 9 00:14:55 1980 (597263 us)
Stopped at Fri Jan 11 10:08:36 1980 (649860 us)
Uptime: 2 days 9 hours 53 minutes 53 seconds
 
Start type: SRV_OPTION_RESTART_STATEFUL (24)
Death reason: SYSMGR_DEATH_REASON_FAILURE_SIGNAL (2)
Exit code: signal 6 (core dumped)
CWD: /var/sysmgr/work
 
Virtual Memory:
 
CODE 08048000 - 0804C4A0
DATA 0804D4A0 - 0804D770
BRK 0804DFC4 - 0818F000
STACK 7FFFFCE0
TOTAL 26656 KB
...
 

例41-6 プロセスのメモリ情報の表示

switch# show processes memory
PID MemAlloc StackBase/Ptr Process
----- -------- ----------------- ----------------
1277 120632 7ffffcd0/7fffefe4 xbar_client
1278 56800 7ffffce0/7ffffb5c wwn
1279 1210220 7ffffce0/7ffffbac vsan
1293 386144 7ffffcf0/7fffebd4 span
1294 1396892 7ffffce0/7fffdff4 snmpd
1295 214528 7ffffcf0/7ffff904 rscn
1296 42064 7ffffce0/7ffffb5c qos
 

用語:

MemAlloc = プロセスによって割り当てられた合計メモリ

StackBase/Ptr = プロセス スタックのベースおよび現在のスタック ポインタ(16進形式)

システム ステータスの表示

システム関連のステータス情報を表示するには、 show system コマンドを使用します(例41-7例41-10を参照)。

例41-7 デフォルトのスイッチ ポート状態の表示

switch# show system default switchport
System default port state is down
System default trunk mode is on
 

例41-8 指定されたIDのエラー情報の表示

switch# show system error-id 0x401D0019
Error Facility: module
Error Description: Failed to stop Linecard Async Notification.
 

例41-9 システム リセット情報の表示

switch# Show system reset-reason module 5
----- reset reason for module 5 -----
1) At 224801 usecs after Fri Nov 21 16:36:40 2003
Reason: Reset Requested by CLI command reload
Service:
Version: 1.3(1)
2) At 922828 usecs after Fri Nov 21 16:02:48 2003
Reason: Reset Requested by CLI command reload
Service:
Version: 1.3(1)
3) At 318034 usecs after Fri Nov 21 14:03:36 2003
Reason: Reset Requested by CLI command reload
Service:
Version: 1.3(1)
4) At 255842 usecs after Wed Nov 19 00:07:49 2003
Reason: Reset Requested by CLI command reload
Service:
Version: 1.3(1)
 

show system reset-reason コマンドは、次の情報を表示します。

Cisco MDS 9500シリーズ スイッチでは、スロット5およびスロット6に搭載されたスーパバイザ モジュールの直前の4つのリセット理由コードが表示されます。いずれかのスーパバイザ モジュールが搭載されていない場合、そのスーパバイザ モジュールのリセット理由コードは表示されません。

Cisco MDS 9200シリーズ スイッチでは、スロット1に搭載されたスーパバイザ モジュールの直前の4つのリセット理由コードが表示されます。

show system reset-reason module number コマンドは、指定されたスロットに搭載された特定のモジュールの直前の4つの理由コードを表示します。スーパバイザ モジュールが搭載されていない場合、そのモジュールのリセット理由コードは表示されません。

NVRAM(不揮発性RAM)および揮発性の永続的ストレージに保存されたリセット理由情報をクリアするには、 clear system reset-reason コマンドを使用します。

Cisco MDS 9500シリーズ スイッチでこのコマンドを使用すると、アクティブおよびスタンバイ スーパバイザ モジュールのNVRAMおよび揮発性の永続的ストレージに保存されたリセット理由コードがクリアされます。

Cisco MDS 9200シリーズ スイッチでこのコマンドを使用すると、アクティブ スーパバイザ モジュールのNVRAMおよび揮発性の永続尾的ストレージに保存されたリセット理由コードがクリアされます。

例41-10 システム アップタイムの表示

switch# show system uptime
Start Time: Sun Oct 13 18:09:23 2030
Up Time: 0 days, 9 hours, 46 minutes, 26 seconds
 

システム関連のCPUおよびメモリ統計情報を表示するには、 show system resources コマンドを使用します(例41-11を参照)。

例41-11 システム関連のCPUおよびメモリ情報の表示

switch# show system resources
Load average: 1 minute: 0.43 5 minutes: 0.17 15 minutes: 0.11
Processes : 100 total, 2 running
CPU states : 0.0% user, 0.0% kernel, 100.0% idle
Memory usage: 1027628K total, 313424K used, 714204K free
3620K buffers, 22278K cache
 

用語:

Load average ― 稼働中のプロセス数を表します。平均は過去1、5、および15分間のシステム負荷を表します。

Processes ― システム内のプロセス数、およびコマンドを発行したときに実際に稼働していたプロセス数を表示します。

CPU states ― 直前の1秒間における、ユーザ モード、カーネル モード、およびアイドル時間のCPU利用率(%)を示します。

Memory usage ― 合計メモリ、使用済みメモリ、空きメモリ、バッファで使用されているメモリ、およびキャッシュで使用されているメモリをKB単位で表示します。バッファおよびキャッシュは 使用済み メモリ統計情報にも含まれます。

コア ファイルおよびログ ファイル

コアを(アクティブ スーパバイザ モジュール、スタンバイ スーパバイザ モジュール、または任意のスイッチング モジュールから)外部フラッシュ(スロット0)またはTrivial File Transfer Protocol(TFTP;簡易ファイル転送プロトコル)サーバに保存する場合は、次の2つの方法のいずれかを使用できます。

オンデマンド ― 指定されたプロセスIDに基づいて、ファイルを1つコピーします。

定期的 ― ユーザ設定に従って、コア ファイルを定期的にコピーします。

新しい方式を発行すると、以前に発行された方式は無効になります。たとえば、別のコア ログ コピーを行うと、コアは新しい場所またはファイルに定期的に保存されます。


ヒント この操作を実行する前に、必要なディレクトリを作成してください。この操作で指定されたディレクトリが存在しない場合は、copy coreコマンドを試行するたびに、システム メッセージが記録されます。


コアおよびログ ファイルをオンデマンドでコピーする手順は、次のとおりです。

 

コマンド
目的

ステップ 1

switch# copy core:7407 slot0:coreSample

プロセスIDが7407のコア ファイルをスロット0にcoreSampleとしてコピーします。

switch# copy core://5/1524 tftp:/1.1.1.1/abcd

スロット5で生成された、プロセスIDが1524のプロセスのコアが存在する場合は、このコアをTFTPサーバにコピーします。

指定されたプロセスIDのコア ファイルが使用できない場合は、次の応答が表示されます。

switch# copy core:133 slot0:foo
No core file found with pid 133
 

プロセスIDが同じコア ファイルが2つ存在する場合は、1つのファイルのみがコピーされます。

switch# copy core:7407 slot0:foo1
2 core files found with pid 7407
Only “/isan/tmp/logs/calc_server_log.7407.tar.gz” will be copied to the destination.
 

コアおよびログ ファイルを定期的にコピーする手順は、次のとおりです。

 

コマンド
目的

ステップ 1

switch# config t

コンフィギュレーション モードを開始します。

ステップ 2

switch(config)# system cores slot0:coreSample

コア ファイルcoreSampleをスロット0にコピーします。

switch(config)# system cores tftp:/1.1.1.1/abcd

指定されたディレクトリ内のコア ファイル(abcd)をTFTPサーバにコピーします。

switch(config)# no system cores

コア ファイル コピー機能をディセーブルにします。

最後のコアのフラッシュへの保存

Cisco SAN-OS Release 2.0(1b)より前のリリースでは、次のいずれかのイベントが発生すると最後のコア ダンプ(サービス コア)が失われます。

Cisco MDS 9500シリーズ ディレクタでのスーパバイザのスイッチオーバー

単一スーパバイザのCisco MDSスイッチまたはCisco MDS 9100シリーズの任意のスイッチでの再起動

リセットまたはスイッチオーバーをトリガーする最後のコア ダンプはRAMに保存され、スイッチオーバーまたは再起動が終了した時点で消去されます。

Cisco SAN-OS Release 2.0(1b)以降では、この最後のコア ダンプはスイッチオーバーや再起動が発生する前に、/mnt/pss/パーティションにあるフラッシュに自動的に保存されます。スーパバイザ モジュールが再起動した3分後に、保存された最後のコアがフラッシュ パーティション(/mnt/pss)から元のRAMに戻されます。この復元はバックグラウンドで処理されるため、ユーザが認識することはありません。


ヒント 復元された最後のコア ファイルのタイムスタンプには、最後のコアが実際にダンプされた時刻ではなく、スーパバイザが起動した時刻が示されます。最後のコア ダンプの正確な時刻を取得するには、同じPIDを持つ対応するログ ファイルを確認します。


最後のコアの内容を表示するには、EXECモードで show cores コマンドを入力します。

最後のコア ダンプの時刻を表示するには、EXECモードで show process log コマンドを入力します。

コア ディレクトリのクリア

コア ディレクトリをクリアするには、 clear cores コマンドを使用します。ソフトウェアはサービスごと、およびスロットごとに直前のコアをいくつか保管し、アクティブ スーパバイザ モジュール上のその他のすべてのコアをクリアします。

switch# clear cores
 

コア ステータスの表示

現在設定されているコア コピー方式を表示するには、 show system cores コマンドを使用します(例 41-12 41-14 を参照)。

例41-12 システム コア ステータスの表示

switch# show system cores
Transfer of cores is enabled
 

例41-13 アクティブ スーパバイザ モジュールからアップロードに使用可能なすべてのコアの表示

switch# show cores
Module-num Process-name PID Core-create-time
---------- ------------ --- ----------------
5 fspf 1524 Nov 9 03:11
6 fcc 919 Nov 9 03:09
8 acltcam 285 Nov 9 03:09
8 fib 283 Nov 9 03:08

用語:

Module-num ― コアが生成されたスロット番号を示します。この例では、 fspf core はアクティブ スーパバイザ モジュール(スロット5)に、 fcc はスタンバイ スーパバイザ モジュール(スロット6)に、 acltcam および fib はスイッチング モジュール(スロット8)に生成されました。

例41-14 ローカル システムのログの表示

switch# show processes log
Process PID Normal-exit Stack Core Log-create-time
---------------- ------ ----------- ----- ----- ---------------
ExceptionLog 2862 N Y N Wed Aug 6 15:08:34 2003
acl 2299 N Y N Tue Oct 28 02:50:01 2003
bios_daemon 2227 N Y N Mon Sep 29 15:30:51 2003
capability 2373 N Y N Tue Aug 19 13:30:02 2003
core-client 2262 N Y N Mon Sep 29 15:30:51 2003
fcanalyzer 5623 N Y N Fri Sep 26 20:45:09 2003
fcd 12996 N Y N Fri Oct 17 20:35:01 2003
fcdomain 2410 N Y N Thu Jun 12 09:30:58 2003
ficon 2708 N Y N Wed Nov 12 18:34:02 2003
ficonstat 9640 N Y N Tue Sep 30 22:55:03 2003
flogi 1300 N Y N Fri Jun 20 08:52:33 2003
idehsd 2176 N Y N Tue Jun 24 05:10:56 2003
lmgrd 2220 N N N Mon Sep 29 15:30:51 2003
platform 2840 N Y N Sat Oct 11 18:29:42 2003
port-security 3098 N Y N Sun Sep 14 22:10:28 2003
port 11818 N Y N Mon Nov 17 23:13:37 2003
rlir 3195 N Y N Fri Jun 27 18:01:05 2003
rscn 2319 N Y N Mon Sep 29 21:19:14 2003
securityd 2239 N N N Thu Oct 16 18:51:39 2003
snmpd 2364 N Y N Mon Nov 17 23:19:39 2003
span 2220 N Y N Mon Sep 29 21:19:13 2003
syslogd 2076 N Y N Sat Oct 11 18:29:40 2003
tcap 2864 N Y N Wed Aug 6 15:09:04 2003
tftpd 2021 N Y N Mon Sep 29 15:30:51 2003
vpm 2930 N N N Mon Nov 17 19:14:33 2003

カーネル コア ダンプ


注意 カーネル コアの変更は、管理者や、スイッチの動作に精通した担当者が実行する必要があります。

特定のモジュールのOS(オペレーティング システム)がクラッシュした場合は、メモリ イメージ(別名カーネル コア ダンプ)の完全なコピーを取得して、クラッシュの原因を特定すると便利な場合があります。モジュールにカーネル コア ダンプが発生すると、スーパバイザに設定されたプロキシ サーバがトリガーされます。スーパバイザはCisco MDS 9000システム デバッグ サーバにモジュールのOSカーネル コア ダンプを送信します。同様に、スーパバイザOSに障害が発生した場合、スーパバイザはCisco MDS 9000システム デバッグ サーバにOSカーネル コア ダンプを送信します。


) Cisco MDS 9000システム デバッグ サーバは、Linux上で稼働するシスコ製アプリケーションです。これにより、カーネル コア ダンプのリポジトリが作成されます。Cisco MDS 9000システム デバッグ サーバは、Cisco.com Webサイト(http://www.cisco.com/kobayashi/sw-center/sw-stornet.shtml)からダウンロードできます。


カーネル コア ダンプは、テクニカル サポート担当者にとってのみ有益です。カーネル コア ダンプ ファイルは巨大なバイナリ ファイルであるため、スイッチと同じ物理LAN内の外部サーバに転送する必要があります。転送されたコア ダンプは、ソース コードおよび詳細なメモリ マップにアクセス可能なテクニカル サポート担当者によって解釈されます。


ヒント コア ダンプは、Cisco MDS 9000システム デバッグ サーバ アプリケーションのディスク スペースを使用します。すべてのレベルのコア ダンプ(level allオプション)が設定されている場合は、Cisco MDS 9000システム デバッグ サーバ アプリケーションが稼働しているLinuxサーバ上に、ダンプを保存するためのディスク スペースを1 GB以上確保する必要があります。生成を完了するために必要なスペースがプロセスにない場合、モジュールは自動的にリセットされます。カーネル コアへの変更はすべて実行コンフィギュレーションに保存されます。


外部サーバを設定する手順は、次のとおりです。

 

コマンド
目的

ステップ 1

switch# config terminal

switch(config)#

コンフィギュレーション モードを開始します。

ステップ 2

switch(config)# kernel core target 10.50.5.5

succeeded

外部サーバのIPアドレスを設定します。

モジュール情報を設定する手順は、次のとおりです。

 

コマンド
目的

ステップ 1

switch# config terminal

switch(config)#

コンフィギュレーション モードを開始します。

ステップ 2

switch(config)# kernel core module 5

succeeded

モジュール5のカーネル コアを生成するように設定します。

switch(config)# kernel core module 5 level header

succeeded

モジュール5のカーネル コアを生成するように設定し、生成対象をヘッダーレベル コアに制限します。

ステップ 3

switch(config)# kernel core limit 2

succeeded

2つのモジュールのカーネル コアを生成するように設定します。デフォルトでは、1つのモジュールに対して生成されます。

show running-config コマンドを使用すると、カーネル コアへの変更をすべて表示できます。また、 show kernel cores コマンドを使用して、設定に関する特定の変更を表示することもできます(例41-15例41-17を参照)。

例41-15 コア制限の表示

switch# show kernel core limit
2
 

例41-16 外部サーバの表示

switch# show kernel core target
10.50.5.5
 

例41-17 指定されたモジュールのコア設定の表示

switch# show kernel core module 5
module 5 core is enabled
level is header
dst_ip is 10.50.5.5
src_port is 6671
dst_port is 6666
dump_dev_name is eth1
dst_mac_addr is 00:00:0C:07:AC:01
 

オンラインでのシステム ヘルス管理

オンライン ヘルス管理システム(システム ヘルス)は、ハードウェアによる障害の検出および回復機能です。Cisco MDS SAN-OS Release 1.3(4)以降では、Cisco MDS 9000ファミリーのすべてのスイッチのスイッチング モジュール、サービス モジュール、およびスーパバイザ モジュールのヘルス管理がこの機能によって実現されます。

システム ヘルス アプリケーションは、すべてのCisco MDSモジュール上で稼働し、指定されたMDSスイッチのシステム ハードウェアをモニタします。スタンバイ スーパバイザ モジュール上で稼働するシステム ヘルス アプリケーションは、そのモジュールがHAスタンバイ モードで使用できる場合でも、スタンバイ スーパバイザ モジュールだけをモニタします。

「HAスイッチオーバーの特長」を参照してください。

システム ヘルス アプリケーションはすべてのモジュールでデーモン プロセスを起動して、各モジュール上で複数のテストを実行し、モジュールの個々のコンポーネントをテストします。テストは事前に設定された間隔で実行され、すべての主要な障害ポイントを対象とし、MDSスイッチで障害の発生したコンポーネントを隔離します。アクティブ スーパバイザ上で稼働するシステム ヘルスは、スイッチ内の他のすべてのモジュール上で稼働する他のすべてのシステム ヘルス コンポーネントを制御します。

障害を検出すると、システム ヘルス アプリケーションは次の復旧処置を行います。

障害を検出するとすぐに、コール ホーム、システム メッセージ、および例外ログを送信します。

障害の発生しているモジュールまたはコンポーネント(インターフェイスなど)をシャットダウンします。

詳細なテストを行うために、障害ポートを隔離します。

適切なソフトウェア コンポーネントに障害を通知します。

スタンバイ スーパバイザ モジュールに切り替えます(障害がアクティブ スーパバイザ モジュールで検出され、Cisco MDSスイッチにスタンバイ スーパバイザ モジュールが搭載されている場合)。スイッチオーバーが完了すると、新しいアクティブ スーパバイザ モジュールはアクティブ スーパバイザ テストを再開します。

スイッチをリロードします(スイッチにスタンバイ スーパバイザ モジュールが搭載されていない場合)。

スイッチ上でCLIをサポートし、表示、テスト、およびテスト統計情報の取得、またはシステム ヘルス テストの設定変更を行うことができるようにします。

障害エリアに重点を置いたテストを行います。

永続的ストレージから設定情報を取得します。

各モジュールはそれぞれに対応するテストを実行するように設定されています。必要に応じて、各モジュールのデフォルト パラメータを変更できます。

システム ヘルスの初期化

デフォルトで、システム ヘルス機能はCisco MDS 9000ファミリーの各スイッチでイネーブルです。

Cisco MDS 9000ファミリー スイッチでこの機能をディセーブルまたはイネーブルにする手順は、次のとおりです。

 

コマンド
目的

ステップ 1

switch# config terminal

switch(config)#

コンフィギュレーション モードを開始します。

ステップ 2

switch(config)# no system health

System Health is disabled.

現在のスイッチでシステム ヘルスのテストをディセーブルにします。

switch(config)# system health

System Health is enabled.

システム ヘルスをイネーブル(デフォルト)にして、現在のスイッチでテストを稼働させます。

ステップ 3

switch(config)# no system health interface fc8/1

System health for interface fc8/13 is disabled.

指定されたインターフェイスをテストするシステム ヘルスをディセーブルにします。

switch(config)# system health interface fc8/1

System health for interface fc8/13 is enabled.

システム ヘルスをイネーブル(デフォルト)にして、指定されたインターフェイスをテストします。

ループバック テストの頻度の設定

ループバック テストは、モジュールのデータ パスおよびスーパバイザの制御パスのハードウェア障害を発見します。事前に設定された頻度で各モジュールにループバック フレームが1つ送信されます。このフレームは、設定された各インターフェイスを経由してスーパバイザ モジュールに戻ります。

ループバック テストは5秒(デフォルト)~255秒の範囲の頻度で実行できます。ループバックの頻度を設定しない場合、デフォルトの5秒の頻度がスイッチ内のすべてのモジュールに適用されます。ループバック テストの頻度をモジュールごとに変えることはできません。設定値はすべてのモジュールに対して一定です。

Cisco MDS 9000ファミリー スイッチのすべてのモジュールにループバック テストの頻度を設定する手順は、次のとおりです。

 

コマンド
目的

ステップ 1

switch# config terminal

switch(config)#

コンフィギュレーション モードを開始します。

ステップ 2

switch(config)# system health loopback frequency 50

The new frequency is set at 50 Seconds.

ループバック頻度を50秒に設定します。デフォルトのループバック頻度は5秒です。有効範囲は5~255秒です。

ハードウェアの障害処理

failure-actionコマンドは、テストの実行中にハードウェア障害が発見された場合の、Cisco SAN-OSソフトウェアによる処理の実行を抑制します。

デフォルトで、この機能はCisco MDS 9000ファミリーのすべてのスイッチでイネーブルになっており、障害が発見されると処理が実行され、詳細なテストを行うために障害コンポーネントが隔離されます。

障害処理は、個々のテスト レベル(モジュール単位)、モジュール レベル(すべてのテスト)、またはスイッチ全体で制御されます。

スイッチの障害処理を設定する手順は、次のとおりです。

 

コマンド
目的

ステップ 1

switch# config terminal

switch(config)#

コンフィギュレーション モードを開始します。

ステップ 2

switch(config)# system health failure-action

System health global failure action is now enabled.

障害処理を実行できるようにスイッチを設定します(デフォルト)。

ステップ 3

switch(config)# no system health failure-action

System health global failure action now disabled.

障害処理が実行されないようにスイッチの設定を取り消します。

ステップ 4

switch(config)# system health module 1 failure-action

System health failure action for module 1 is now enabled.

モジュール1の障害処理を実行できるようにスイッチを設定します。

ステップ 5

switch(config)# no system health module 1 loopback failure-action

System health failure action for module 1 loopback test is now disabled.

モジュール1のループバック テストによって発見された障害に対する障害処理を実行しないようにスイッチを設定します。

テストの実行要件

テストをイネーブルにしても、テストの実行が保障される訳ではありません。

特定のインターフェイスまたはモジュールのテストが実行されるのは、次のすべてに対してシステム ヘルスをイネーブルにしている場合だけです。

スイッチ全体

必要なモジュール

必要なインターフェイス


ヒント いずれかでシステム ヘルスがディセーブルになっている場合、テストは実行されません。システム ヘルスでテストの実行がディセーブルになっている場合、テスト ステータスはディセーブル(disabled)と表示されます。



ヒント 特定のモジュールまたはインターフェイスでテストの実行がイネーブルになっているが、システム ヘルスがディセーブルであるためにテストが実行されない場合、テストはイネーブル(enabled)と表示されます(実行中[running]にはなりません)。


指定モジュールのテスト

SAN-OSソフトウェアのシステム ヘルス機能は、次のエリアでテストを実行します。

アクティブ スーパバイザのファブリックに対する帯域内接続

スタンバイ スーパバイザのアービタのアベイラビリティ

すべてのモジュールのブート フラッシュの接続およびアクセス可能性

すべてのモジュールのEOBCの接続およびアクセス可能性

すべてのモジュール上の各インターフェイスのデータ パスの完全性

管理ポートの接続性

キャッシング サービス モジュールのバッテリ(温度、使用年数、フル充電容量、充放電機能、およびバックアップ機能)およびキャッシュ ディスク(接続性、アクセス可能性、およびローディスクI/O)

外部接続性を確認するためのユーザによるテスト(テスト中はポートをシャットダウンする)(FCポートのみ)

内部接続性を確認するためのユーザによるテスト(ファイバ チャネルおよびiSCSIポート)

特定のモジュールで必要なテストを実行する手順は、次のとおりです。

 

コマンド
目的

ステップ 1

switch# config terminal

switch(config)#

コンフィギュレーション モードを開始します。

 


) 以下のステップは、任意の順番で実行できます。


 

ステップ 2

switch(config)# system health module 8 battery-charger

battery-charger test is not configured to run on module 8.

スロット8にあるCSMモジュールの両方のバッテリで、バッテリ チャージャ テストをイネーブルにします。スイッチのスロット8にCSMが存在しない場合は、左のメッセージが表示されます。

ステップ 3

switch(config)# system health module 8 cache-disk

cache-disk test is not configured to run on module 8.

スロット8にあるCSMモジュールの両方のディスクで、キャッシュ ディスク テストをイネーブルにします。スイッチのスロット8にCSMが存在しない場合は、左のメッセージが表示されます。

 


) それぞれのテストの各種オプションは次のステップで説明します。各コマンドは任意の順番で設定できます。説明のために、各種オプションを同じステップに記述しています。


 

ステップ 4

switch(config)# system health module 8 bootflash

System health for module 8 Bootflash is already enabled.

モジュール8のブートフラッシュ テストをイネーブルにします。

switch(config)# system health module 8 bootflash frequency 200

The new frequency is set at 200 Seconds.

モジュール8のブートフラッシュ テストの頻度を200秒に設定します。

ステップ 5

switch(config)# system health module 8 eobc

System health for module 8 EOBC is now enabled.

モジュール8でEOBCテストをイネーブルにします。

ステップ 6

switch(config)# system health module 8 loopback

System health for module 8 EOBC is now enabled.

モジュール8でループバック テストをイネーブルにします。

ステップ 7

switch(config)# system health module 5 management

System health for module 8 EOBC is now enabled.

モジュール5で管理テストをイネーブルにします。

古いエラー通知のクリア

ファイバ チャネル インターフェイス、iSCSIインターフェイス、モジュール全体、またはモジュール全体の特定のテストについて、エラー履歴をクリアできます。履歴をクリアすると、障害が発生してテストから除外されていたコンポーネントはすべて再度テストされます。

障害発生時にOHMSが一定期間(たとえば、1週間)の間処理を実行しないように failure-action オプションをイネーブルにしていて、指定期間が経過したあとでエラー受信を再開する準備が整った場合には、それぞれのテストのシステム ヘルス エラー ステータスをクリアする必要があります。


ヒント 管理ポート テストをスタンバイ スーパバイザ モジュールで実行することはできません。


インターフェイスまたはモジュール レベルで、EXECレベルの system health clear-errors コマンドを使用すると、システム ヘルス アプリケーションで記録された古いエラーはすべて消去されます。特定のモジュールに対して、 battery-charger bootflash cache-disk eobc inband loopback 、および mgmt のテスト オプションを個別に指定できます。

次の例では、指定されたファイバ チャネル インターフェイスのエラー履歴がクリアされます。

switch# system health clear-errors interface fc 3/1
 

次の例では、指定されたモジュールのエラー履歴がクリアされます。

switch# system health clear-errors module 3
 

次の例では、指定されたモジュールの管理ポート テストのエラー履歴がクリアされます。

switch# system health clear-errors module 1 mgmt
 

内部ループバックの実行

内部ループバックは同一のポートに対してFC2フレームを送受信し、往復時間をマイクロ秒単位で示します。このテストは、ファイバ チャネル インターフェイスおよびiSCSIインターフェイスの両方で使用できます。

モジュール全体のポートでこのテストを(ユーザが要求したときに)オンデマンドで明示的に実行するには、EXECレベルで system health internal-loopback コマンドを使用します。

switch# system health internal-loopback interface iscsi 8/1
Internal loopback test on interface iscsi8/1 was successful.
Round trip time taken is 79 useconds
 

) テストが正常に終了しない場合、ソフトウェアは障害を分析して、次のエラーを出力します。
External loopback test on interface fc 7/2 failed.Failure reason:Failed to loopback, analysis complete Failed device ID 3 on module 1


外部ループバックの実行

外部ループバック テストは、同一のポートに対してFC2フレームを送受信します。テストを実行する前に、RxポートからTxポートへループさせるためにケーブル(またはプラグ)を接続する必要があります。このテストは、ファイバ チャネル インターフェイスのみで使用できます。

長距離ネットワークに属するスイッチに接続されている外部デバイスに対してこのテストをオンデマンドで実行するには、EXECレベルで system health external-loopback コマンドを使用します。

switch# system health external-loopback interface fc 3/1
This will shut the requested interfaces Do you want to continue (y/n)? [n] y
External loopback test on interface fc3/1 was successful.
 

特定のインターフェイスを確認なしで直接シャットダウンするには、 system health external- loopback interface force コマンドを使用します。

switch# system health external-loopback interface fc 3/1 force
External loopback test on interface fc3/1 was successful.
 

) テストが正常に終了しない場合、ソフトウェアは障害を分析して、次のエラーを出力します。
External loopback test on interface fc 7/2 failed.Failure reason:Failed to loopback, analysis complete Failed device ID 3 on module 1


現在のステータスの説明

各モジュールまたはテストのステータスは、特定のモジュールにおけるOHMSテストの設定状態によって異なります( 表 41-1 を参照)。

 

表 41-1 テストおよびモジュールに関するOHMSの設定ステータス

ステータス
説明

Enabled

このモジュールのテストがイネーブルに設定されており、テストは実行されていません。

Disabled

このモジュールのテストがディセーブルに設定されています。

Running

このモジュールでテストがイネーブルに設定されており、テストが現在実行されています。

Failing

この状態が表示されるのは、このモジュールで実行中のテストで障害が発生しそうな場合です。この状態では、回復の可能性があります。

Failed

このモジュールのテストで障害が発生しました。この状態が回復する可能性はありません。

Stopped

Cisco SAN-OSソフトウェアによって、このモジュールのテストが内部的に停止されました。

Internal failure

このモジュールのテストで、内部障害が発生しました。たとえば、システム ヘルス アプリケーションがテスト手順の一部でソケットをオープンできない場合です。

Diags failed

このモジュールまたはインターフェイスの起動時の診断で障害が発生しました。

On demand

現在、このモジュールで、システム ヘルス外部ループバックまたはシステム ヘルス内部ループバック テストが実行されています。オンデマンドで発行できるのは、この2つのコマンドだけです。

Suspended

あるオーバーサブスクライブ ポートがEまたはTEポート モードに移行することにより、MDS 9100シリーズでのみ発生します。1つのオーバーサブスクライブ ポートがこのモードになると、グループ内の他の3つのオーバーサブスクライブ ポートは中断されます。

各モジュールの各コマンドのステータスは、 show system health コマンドで表示できます。「システム ヘルスの表示」を参照してください。

システム ヘルスの表示

システム関連のステータス情報を表示するには、 show system health コマンドを使用します(例41-18例41-23を参照)。

例41-18 スイッチ内のすべてのモジュールの現在のヘルス情報の表示

switch# show system health
 
Current health information for module 2.
 
Test Frequency Status Action
-----------------------------------------------------------------
Bootflash 5 Sec Running Enabled
EOBC 5 Sec Running Enabled
Loopback 5 Sec Running Enabled
-----------------------------------------------------------------
 
Current health information for module 6.
 
Test Frequency Status Action
-----------------------------------------------------------------
InBand 5 Sec Running Enabled
Bootflash 5 Sec Running Enabled
EOBC 5 Sec Running Enabled
Management Port 5 Sec Running Enabled
-----------------------------------------------------------------
 

例41-19 指定されたモジュールの現在のヘルス情報の表示

switch# show system health module 8
 
Current health information for module 8.
 
Test Frequency Status Action
-----------------------------------------------------------------
Bootflash 5 Sec Running Enabled
EOBC 5 Sec Running Enabled
Loopback 5 Sec Running Enabled
-----------------------------------------------------------------
 

例41-20 すべてのモジュールのヘルス統計情報の表示

switch# show system health statistics
 
Test statistics for module # 1
------------------------------------------------------------------------------
Test Name State Freq(s) Run Pass Fail CFail Errs
------------------------------------------------------------------------------
Bootflash Running 5s 12900 12900 0 0 0
EOBC Running 5s 12900 12900 0 0 0
Loopback Running 5s 12900 12900 0 0 0
------------------------------------------------------------------------------
 
Test statistics for module # 3
------------------------------------------------------------------------------
Test Name State Freq(s) Run Pass Fail CFail Errs
------------------------------------------------------------------------------
Bootflash Running 5s 12890 12890 0 0 0
EOBC Running 5s 12890 12890 0 0 0
Loopback Running 5s 12892 12892 0 0 0
------------------------------------------------------------------------------
 
Test statistics for module # 5
------------------------------------------------------------------------------
Test Name State Freq(s) Run Pass Fail CFail Errs
------------------------------------------------------------------------------
InBand Running 5s 12911 12911 0 0 0
Bootflash Running 5s 12911 12911 0 0 0
EOBC Running 5s 12911 12911 0 0 0
Management Port Running 5s 12911 12911 0 0 0
------------------------------------------------------------------------------
 
Test statistics for module # 6
------------------------------------------------------------------------------
Test Name State Freq(s) Run Pass Fail CFail Errs
------------------------------------------------------------------------------
InBand Running 5s 12907 12907 0 0 0
Bootflash Running 5s 12907 12907 0 0 0
EOBC Running 5s 12907 12907 0 0 0
------------------------------------------------------------------------------
 
Test statistics for module # 8
------------------------------------------------------------------------------
Test Name State Freq(s) Run Pass Fail CFail Errs
------------------------------------------------------------------------------
Bootflash Running 5s 12895 12895 0 0 0
EOBC Running 5s 12895 12895 0 0 0
Loopback Running 5s 12896 12896 0 0 0
------------------------------------------------------------------------------
 

例41-21 指定されたモジュールの統計情報の表示

switch# show system health statistics module 3
 
Test statistics for module # 3
------------------------------------------------------------------------------
Test Name State Freq(s) Run Pass Fail CFail Errs
------------------------------------------------------------------------------
Bootflash Running 5s 12932 12932 0 0 0
EOBC Running 5s 12932 12932 0 0 0
Loopback Running 5s 12934 12934 0 0 0
------------------------------------------------------------------------------
 

例41-22 スイッチ全体のループバック テストの統計情報の表示

switch# show system health statistics loopback
-----------------------------------------------------------------
Mod Port Status Run Pass Fail CFail Errs
1 16 Running 12953 12953 0 0 0
3 32 Running 12945 12945 0 0 0
8 8 Running 12949 12949 0 0 0
-----------------------------------------------------------------
 

例41-23 指定されたインターフェイスのループバック テスト統計情報の表示

switch# show system health statistics loopback interface fc 3/1
-----------------------------------------------------------------
Mod Port Status Run Pass Fail CFail Errs
3 1 Running 0 0 0 0 0
-----------------------------------------------------------------
 

) モジュール固有のループバック テストがエラーまたは障害を通知しない限り、インターフェイス固有のカウンタはゼロのままです。


例41-24 すべてのモジュールのループバック テスト時間ログの表示

switch# show system health statistics loopback timelog
-----------------------------------------------------------------
Mod Samples Min(usecs) Max(usecs) Ave(usecs)
1 1872 149 364 222
3 1862 415 743 549
8 1865 134 455 349
-----------------------------------------------------------------
 

例41-25 指定されたモジュールのループバック テスト時間ログの表示

switch# show system health statistics loopback module 8 timelog
-----------------------------------------------------------------
Mod Samples Min(usecs) Max(usecs) Ave(usecs)
8 1867 134 455 349
-----------------------------------------------------------------
 

デフォルト設定値

表 41-2 に、システム ヘルスおよびログのデフォルト設定値を示します。

 

表 41-2 システム ヘルスおよびログのデフォルト設定値

パラメータ
デフォルト

カーネル コアの生成

1つのモジュール

システム ヘルス

イネーブル

ループバック頻度

5秒

障害処理

イネーブル