Cisco XR 12416 ルータ インストレーション ガイド
インストレーションのトラブル シューティング
インストレーションのトラブルシューティング
発行日;2012/02/07 | ドキュメントご利用ガイド | ダウンロード ; この章pdf , ドキュメント全体pdf (PDF - 11MB) | フィードバック

目次

インストレーションのトラブルシューティング

トラブルシューティングの概要

サブシステムによる問題の解決

起動時のルータの正常なシーケンス

起動時の問題の特定

電源サブシステムのトラブルシューティング

AC 電源のトラブルシューティング

AC 電源シェルフ取り付けのトラブルシューティング

DC 電源のトラブルシューティング

DC 電源シェルフ取り付けのトラブルシューティング

その他の電源サブシステムに関するトラブルシューティング情報

配電システムのトラブルシューティング

プロセッサ サブシステムのトラブルシューティング

RP のトラブルシューティング

RP 英数字ディスプレイを使用したトラブルシューティング

ラインカードのトラブルシューティング

アラーム カードによるトラブルシューティング

アラーム ステータス(CRITICAL、MAJOR、MINOR)の監視

スイッチ ファブリックのトラブルシューティング

データ分析

crc16 出力

認可パリティおよび要求エラー

SFC の適切な装着

冷却サブシステムのトラブルシューティング

ブロワー モジュールの動作

電源モジュールの動作

過熱状態

冷却サブシステムの問題の特定

インストレーションのトラブルシューティング

この章では、システムのインストレーションおよび初回起動中に発生する問題の原因特定に役立つ、一般的なトラブルシューティングの方法について説明します。

この章に記載の手順では、システムが出荷時の構成で稼働していることを想定しています。製品の受領後にハードウェア構成を変更した場合、またはデフォルトのコンフィギュレーションを変更した場合は、この章に記載されている推奨事項が当てはまらないことがあります。

初回起動時に過熱による障害が起こることはほとんどありませんが、この章には、内部電圧を監視する環境モニタ機能の説明も含まれています。

内容は次のとおりです。

「トラブルシューティングの概要」

「電源サブシステムのトラブルシューティング」

「プロセッサ サブシステムのトラブルシューティング」

「スイッチ ファブリックのトラブルシューティング」

「冷却サブシステムのトラブルシューティング」

トラブルシューティングの概要

ここでは、ルータのトラブルシューティングの方法について説明します。ルータの主要サブシステムごとにトラブルシューティングの方法を進めていきます。

問題を解決できない場合は、製品を購入した代理店に連絡してください。代理店に連絡する前に、次の情報をご用意ください。

ルータの受領日およびシャーシのシリアル番号(シャーシ背面のラベルに記載)

搭載されているラインカード

可能な場合は、 show hardware コマンドを使用して、搭載されているライン カードを確認します。

Cisco IOS ソフトウェアのリリース番号

可能な場合は、 show version コマンドを使用して、この情報を確認します。

問題の症状、および問題を特定して解決するために行った手順の簡単な説明

保守契約または保証内容

サブシステムによる問題の解決

システムの問題を解決するには、問題を具体的なサブシステムに限定します。現在のルータ動作を、予測されるルータ動作と比較します。起動時の問題は 1 つのコンポーネントが原因になっている場合が多いので、ルータの各コンポーネントのトラブルシューティングを行う前に、問題のあるサブシステムを特定した方が効率的に解決できます。この章では、サブシステムごとにトラブルシューティングの手順を進めていきます。

この章で扱うルータは便宜上、次のサブシステムで構成されています。

電源サブシステム ― 次のコンポーネントからなります。

AC 入力または DC 入力電源モジュール。Power Entry Modules(PEM; 電源入力モジュール)ともいいます。ルータ シャーシは、完全冗長 PEM が取り付けられた状態で出荷されます。

シャーシ バックプレーンの配電。-48 VDC電力が電源モジュールからシャーシ バックプレーンに供給されます。-48 VDC は、バックプレーン コネクタを介してすべてのカードに供給されます。ワイヤ ハーネスを経由してシャーシ バックプレーンから電力が供給された各ブロワー モジュールは、シャーシ バックプレーンに Maintenance Bus(MBus; メンテネンス バス)データを戻します。

プロセッサ サブシステム ― 冗長 RP、ラインカード、スイッチ ファブリック、および 2 つのアラーム カードが含まれます。RP およびラインカードは、オンボード プロセッサを装備しています。RP は、各ラインカードのプロセッサに Cisco XR IOS イメージのコピーをダウンロードします。英数字ディスプレイ(ラインカードおよび RP 上)に、トラブルシューティングに役立つステータスおよびエラー メッセージが表示されます。

冷却サブシステム ― 2 つのブロワー モジュールと電力モジュールのファン(電源モジュールに 1 つずつ)で構成されます。ブロワー モジュールは、カード ケージの空気を循環させてカードを冷却します。ファンは、電力モジュール内の冷気を循環させます。

起動時のルータの正常なシーケンス

電源モジュールのステータス LED および RP とラインカード上の英数字ディスプレイを確認することによって、起動シーケンスのどの時点で、どこに問題が発生したかを判断することができます。

起動時のルータの正常なシーケンスでは、次の動作が実行されます。

1. ブロワー モジュールのファンに電力が供給され、シャーシ内に空気が送り込まれます。

ブロワー モジュールの OK インジケータが点灯します。

2. 各 PEM のファンに電力が供給され、電源モジュールに空気が送り込まれます。

電源モジュールの PWR OK インジケータが点灯します。

3. RP および搭載された各ラインカードの起動およびブート プロセス中は、カードの前面パネルの英数字ディスプレイに各カードのステータスが表示されます。

ディスプレイの上部には、カードの DC/DC コンバータから電力が供給されます。

ディスプレイの下部には、バックプレーンから +5 VDC が供給されます。

起動時の問題の特定

表4-1 に、システムが正常に起動された場合に RP およびラインカード上に表示される英数字ディスプレイの内容、アラーム カード、電源モジュール(AC または DC)、およびブロワー モジュールの各 LED の正常な状態を示します。

 

表4-1 システム起動時に表示される英数字ディスプレイおよび LED

コンポーネント
インジケータのタイプ
表示内容/LED の状態および意味

RP

英数字ディスプレイ

上部:MSTR
下部:PRP

RP がイネーブルになり、システムに認識されました。有効な Cisco IOS ソフトウェア イメージが実行されています。

ラインカード

英数字ディスプレイ

上部:IOS
下部:RUN

ラインカードがイネーブルで動作可能です。

アラーム カード

検出されたアラームの重大度

アラーム カード

CSC 0 および 1

SFC 0、1、2、および 3

CRITICAL:オフ
MAJOR:オフ
MINOR:オフ


ENABLED:オン
FAIL:オフ

ENABLED :オン
FAIL:オフ

ENABLED :オン
FAIL:オフ

AC 電源

電源ステータス

PWR OK:オン
FAULT:オフ
TEMP:オフ
OC:オフ

電源モジュールの電圧は正常で、異常は検出されていません。

DC 電源

電源ステータス

PWR OK:オン
FAULT:オフ
TEMP:オフ
OC:オフ

電源モジュールの電圧は正常で、異常は検出されていません。

ブロワー モジュール

ブロワー ステータス

OK:オン
FAIL:オフ

電源サブシステムのトラブルシューティング

ここでは、電源サブシステムのトラブルシューティングの方法について説明します。

「AC 電源のトラブルシューティング」

「AC 電源シェルフ取り付けのトラブルシューティング」

「DC 電源のトラブルシューティング」

「配電システムのトラブルシューティング」

AC 電源のトラブルシューティング

AC 入力電源では、内部温度、電圧、およびアラームカードの MBus モジュールや RP のマスター MBus モジュールによる現行負荷が監視されます。ルータが何らかの値の超過を検出すると、アラーム カードにアラームが生成され、対応する警告メッセージがコンソール上に表示されます。

図 4-1 に AC 電源のコンポーネントを示します。

図 4-1 AC 電源のコンポーネント

 

 

1

イジェクタ ハンドル

2

非脱落型ネジ

AC 電源の取り付け後に AC 電源が正常に動作しない場合、次のトラブルシューティングの手順を実行します。


ステップ 1 電源モジュールが正しく装着されていることを確認します。

PEM をイジェクトして装着し直します。以下を確認します。

イジェクト レバーが所定位置にロックされ、非脱落ネジでしっかり固定されている。

ステップ 2 ルータの電源が投入されており、すべての電源コードが正しく接続されていることを確認します。

電源シェルフの背面パネルの電源コードが固定クリップでしっかりと固定されている。

電源コードの先が専用の AC コンセントにしっかり接続されている。

電源の AC 回路ブレーカーがオンになっている。

ステップ 3 電源モジュールの、次のステータス LED インジケータを確認します。

PWR OK(グリーン) ― 電源モジュールが正常に動作しており、AC 入力電圧が 200 ~ 240 VAC の公称動作範囲にあります。電源モジュールが適切に装着されている場合は、このインジケータが点灯します。

FAULT(イエロー) ― 電源モジュール内で障害が検出されたか、または供給電圧が低すぎます。正常に動作している場合、このインジケータは消灯しています。

このインジケータが点灯している場合:

電源電圧が適正な範囲内(170 ~ 262 VAC)にあるか確認します。

電源モジュールから電源コードを取り外して、電源モジュールへの電力供給を停止してから、再開します。インジケータが点灯し続ける場合には、既存の電源モジュールをスペアの電源モジュールに交換してください。

スペアの電源モジュールにも障害がある場合、電源シェルフ バックプレーン コネクタに障害がある可能性があります。ルータの電源を切断し、購入した代理店までご連絡ください。

TEMP(イエロー) ― 電源モジュールが過熱状態になって、シャットダウンが発生しました。


) このインジケータが点灯している場合は、FAULT インジケータも点灯します。


電源モジュール ファンが正常に動作していることを確認します。

ブロワー モジュールが正常に動作していることを確認します。

電源モジュール ファンおよびブロワー モジュールが正常に動作している場合は、既存の電源モジュールをスペアの電源モジュールと交換します。

TEMP(イエローに点滅) ― 電源モジュール ファンがロックされているか、誤動作しています。


) このインジケータが点滅している場合は、FAULT インジケータも点灯します。


ファンが稼働しているかどうかを確認します。ファンの障害物を取り除きます。

ファンが稼働していない場合は、電源モジュールを交換します。

OC(点灯、10 秒後にイエローに点滅) ― 電源モジュールの出力電流が制限値を超え、過負荷または回路短絡が生じました。


) このインジケータが点灯または点滅している場合は、FAULT インジケータも点灯します。


電源モジュールから電源コードを取り外して、電源モジュールへの電力供給を停止してから、再開します。

インジケータが点灯し続ける場合は、電源モジュールを装着し直してください。

それでもインジケータが点灯し続ける場合は、電源モジュールを交換してください。


 

標準およびオプションの AC 入力電源サブシステムでは、いずれも冗長電源モジュールが使用されているので、1 つの電源モジュールからバックプレーンに供給される DC 出力電圧に問題があっても、ルータの動作が妨げられることはありません。ルータには複数の AC 電源が装備されているため、1 つの電源モジュールに障害が発生しても、ルータには電力が供給され、動作が継続されます。

AC 電源シェルフ取り付けのトラブルシューティング

AC 電源シェルフの取り付け後に AC 電源シェルフが正常に動作しない場合、次のトラブルシューティングの手順を実行します。


ステップ 1 電源シェルフが正しく装着されていることを確認します。

ネジジャッキがしっかりと締まっている。

フランジの非脱落型ネジがしっかりと締まっている。

ステップ 2 電源モジュールが正しく装着されていることを確認します。

イジェクト レバーがバネ クリップでロックされている。

それでも電源シェルフが正しく動作しない場合は、「AC 電源のトラブルシューティング」に進みます。


 

DC 電源のトラブルシューティング

DC 入力電源では、内部温度、電圧、およびアラームカードの MBus モジュールや RP のマスター MBus モジュールによる現行負荷が監視されます。ルータが何らかの値の超過を検出すると、アラーム カードにアラームが生成され、対応する警告メッセージがコンソール上に表示されます。

図 4-2 に DC 電源のコンポーネントを示します。

図 4-2 DC 電源のコンポーネント

 

 

1

ハンドル

3

イジェクト レバー

2

ファン

4

電源スイッチ

DC PEM の取り付け後に DC PEM が正常に動作しない場合、次のトラブルシューティングの手順を実行します。


ステップ 1 PEM が正しく装着されていることを確認します。

PEM をイジェクトして装着し直します。次のことを確認します。

イジェクト レバーの非脱落型ネジがしっかり締まっている。

電源スイッチが ON(1)の位置になっている。

ステップ 2 ルータの電源が投入されており、すべての電源コードが正しく接続されていることを確認します。以下を確認します。

電源コードが背面パネルの端子スタッドにしっかり接続されている。

電源コードが専用の 60 A DC 電源に接続されている。

電源の DC 回路ブレーカーがオンになっている

ステップ 3 PEM の次のステータス インジケータを確認します。

PWR OK(グリーン) ― PEM が正常に動作しており、DC 電源電圧が -48 ~ -60 VDC の公称動作範囲にあります。PEM 回路ブレーカーがオンになっている場合は、このインジケータが点灯します。

FAULT(イエロー) ― PEM 内で障害が検出されたか、または供給電圧が低すぎます。正常に動作している場合、このインジケータは消灯しています。

電源電圧が適正な範囲内(-40.5 ~ -75 VDC)にあることを表します。

PEM 回路ブレーカーをオフにしてから、オンにします。電源のオン/オフを何度か繰り返してもインジケータが点灯したままの場合は、既存の PEM をスペアと交換します。

スペアの PEM にも障害がある場合、電源シェルフ バックプレーン コネクタに障害がある可能性があります。ルータの電源を切断し、購入した代理店までご連絡ください。

TEMP(イエロー) ― PEM が過熱状態になって、シャットダウンが発生しました。


) このインジケータが点灯している場合は、FAULT インジケータも点灯します。


電源モジュール ファンが正常に動作していることを確認します。

ブロワー モジュールが正常に動作していることを確認します。

電源モジュール ファンおよびブロワー モジュールが正常に動作している場合は、既存の PEM をスペアの PEM と交換します。

TEMP(イエローに点滅) ― 電源モジュール ファンがロックされているか、誤動作しています。


) このインジケータが点滅している場合は、FAULT インジケータも点灯します。


ファンが稼働しているかどうかを確認します。ファンの障害物を取り除きます。

ファンが稼働していない場合は、電源モジュールを交換します。

OC(点灯、10 秒後にイエローに点滅) ― 電源モジュールの出力電流が制限値を超え、過負荷または回路短絡が生じました。


) このインジケータが点灯または点滅している場合は、FAULT インジケータも点灯します。


電源モジュールから電源コードを取り外して、電源モジュールへの電力供給を停止してから、再開します。

インジケータが点灯し続ける場合は、電源モジュールを装着し直してください。

それでもインジケータが点灯し続ける場合は、電源モジュールを交換してください。


 

冗長電源モジュールが装備されているので、1 台の PEM からバックプレーンに供給される DC 出力電圧に問題があっても、ルータ動作には影響しません。ルータには複数の DC 電源が装備されているため、1 台の電源モジュールに障害が発生しても、ルータには電力が供給され、動作が継続されます。

DC 電源シェルフ取り付けのトラブルシューティング

DC 電源シェルフの取り付け後に DC 電源シェルフが正常に動作しない場合、次のトラブルシューティングの手順を実行します。


ステップ 1 電源シェルフが正しく装着されていることを確認します。

ネジジャッキがしっかりと締まっている。

フランジの非脱落型ネジがしっかり締まっている。

ステップ 2 電源モジュールが正しく装着されていることを確認します。

PEM をイジェクトして装着し直します。

イジェクト レバーの非脱落型ネジがしっかり締まっている。

電源スイッチが ON(1)の位置になっている。

それでも電源シェルフが正しく動作しない場合は、「DC 電源のトラブルシューティング」に進みます。


 

その他の電源サブシステムに関するトラブルシューティング情報

ここでは、電源に関する問題の原因特定に役立つ、その他のトラブルシューティング情報について説明します。

RP およびライン カードの英数字ディスプレイに電力を供給する MBus モジュールには、バックプレーンから +5 VDC の電力が供給されます。ブロワー モジュールには、バックプレーンから -48 VDC の電力が供給されます。RP とブロワー モジュールの両方が動作していれば、内部の DC 電圧はすべて正常です。

ユーザ EXEC モード プロンプトに show environment コマンドを入力すると、次の例のように、搭載されている各カード、ブロワー モジュール、および PEM の温度および電圧情報が表示されます。

router#show environment
Slot # Hot Sensor Inlet Sensor
(deg C) (deg C)
 
1 38.0 32.5
3 36.5 39.0
5 37.0 37.0
7 36.0 32.0
16 26.0 26.0
17 27.5 27.5
18 27.0 27.5
19 0.0 0.0
20 27.0 27.5
21 28.0 28.0
22 28.0 28.0
24 47.0 NA
29 NA 22.0
 
Slot # PEM Over Temperature Sensors
 
24 PEM1 OK
PEM2 OK
Slot # Hot Sensor Inlet Sensor
(deg C) (deg C)
29 NA 22.0
 
Slot # 3V 5V MBUS 5V
(mv) (mv) (mv)
 
1 3296 5016 5048
3 3284 4976 5000
5 3308 5008 5048
7 3296 5016 5000
16 3300 NA 5064
17 3308 NA 5064
18 3292 NA 5056
19 3300 NA 5072
20 3288 NA 5056
21 3296 NA 5072
22 3292 NA 5064
24 NA NA 5096
29 NA NA 4920
 
Slot # 48V AMP_48
(Volt) (Amp)
 
24 PEM1 56 2
PEM2 55 2
Slot # Fan 0 Fan 1 Fan 2
(RPM) (RPM) (RPM)
 
29 3021 3090 2997

配電システムのトラブルシューティング

配電システムの構成は、次のとおりです。

AC または DC PEM ― -48 VDC をバックプレーンに供給します。

シャーシ バックプレーン ― シャーシ コンポーネントに電圧を供給します。

DC/DC コンバータ ― バックプレーンから供給される -48 VDC を、ラインカードが必要とする適切な電圧に変換します。

配電システムのトラブルシューティング手順は、次のとおりです。


ステップ 1 各電源モジュールで、以下を確認します。

イジェクト レバーが完全に閉じられ、非脱落型ネジでしっかり固定されている。

PWR OK インジケータが点灯している。

FAULT および TEMP インジケータが両方とも消灯している。

OC インジケータが消灯している。

電源モジュールが上記の基準を満たしている場合は、許容範囲内の適切な電力が供給されています。電源モジュールは適切に機能しています。

ステップ 2 ブロワー モジュールが動作していることを確認します。

ブロワー モジュールが機能している場合は、シャーシ バックプレーンから -48 VDC が供給されています。バックプレーンとブロワー モジュールの接続ケーブルは適切に機能しています。

1 台のブロワー モジュールが機能していない場合は、ブロワー モジュール自体に問題があるか、またはブロワー モジュールに -48 VDC の電力が供給されていないと考えられます。ブロワー モジュールををイジェクトして装着し直します。

それでもブロワー モジュールが稼働しない場合は、ブロワー モジュールのコントローラ カードまたはケーブルに問題があると考えられます。ブロワー モジュールを交換します。

ブロワー モジュールを交換しても問題が解決しない場合は、製品を購入した代理店に問い合わせてください。


 

プロセッサ サブシステムのトラブルシューティング

ルータ プロセッサ サブシステムには RP、ラインカード、およびアラーム カードが含まれます。RP およびラインカードには 2 つのオンボード プロセッサがあります。1 つはメイン(またはマスター プロセッサ)として機能し、もう 1 つは MBus モジュール プロセッサとして機能します。MBus モジュール プロセッサは、環境を監視し、オンボード DC/DC コンバータを制御します。


) 最小限のルータ構成の場合、上部カード ケージのスロット 7 に RP が搭載されていなければなりません。ルータにオプションの冗長 RP を搭載する場合、冗長 RP は下部カード ケージの左端スロット(スロット 8)に搭載する必要があります。


ここでは、プロセッサ サブシステムのトラブルシューティング方法について説明します。内容は次のとおりです。

「RP のトラブルシューティング」

「ラインカードのトラブルシューティング」

「アラーム カードによるトラブルシューティング」

RP のトラブルシューティング

ルータの電源をオンにすると、RP 英数字ディスプレイに次の情報が示されます(図 4-3)。

上部 ― 実行中の RP ソフトウェア コンポーネントを示します。ブート プロセスが正常に終了すると、MSTR と表示されます。

下部 ― ブート プロセスの現在の状況を示します。ブート プロセスが正常に終了すると、PRP と表示されます。

図 4-3 RP の英数字ディスプレイ

 

RP 英数字ディスプレイを使用したトラブルシューティング

英数字ディスプレイを使用すると、RP の問題を特定できます。英数字ディスプレイの 2 つの行には、個別に電力が供給されます。

上部には、RP 上の DC/DC コンバータから電力が供給されます。

下部には、シャーシ バックプレーン経由で RP の MBus から直接電力が供給されます。

下部ディスプレイが動作しない場合は、MBus モジュールが誤動作している可能性があります。

MBus モジュールが動作している場合は、RP の電源がオンにならなくても、下部ディスプレイはオンになります。

上部と下部の両方のディスプレイが点灯しないにもかかわらず、電源モジュールおよびブロワー モジュールが稼働している場合は、RP が正しく搭載されていないか、シャーシ バックプレーンから +5 VDC が供給されていない可能性があります。

システムの電源がオンなっていることを確認します。

シャーシ バックプレーンから RP を取り外して初期状態に戻し、再び装着してください。


注意 ソフト リセット(NMI)スイッチは、RP をリセットしたり、Cisco IOS イメージをリロードするためのメカニズムではありません。このスイッチは、ソフトウェア開発のために用意されています。システム障害やデータ損失を防ぐため、ソフト リセット スイッチは、シスコの認定作業員から指示があった場合にだけ、使用してください。

上部と下部の両方のディスプレイが動作している場合は、メッセージの意味を確認します( 表4-2 を参照)。

MBus モジュールから DC/DC コンバータに電力が供給されると、RP プロセッサはブート プロセスを開始し、さまざまなステータス メッセージを表示します。一瞬だけしか表示されないメッセージもありますが、その他のメッセージは数秒間表示されます。メッセージが特定の位置で終了したままになっている場合は、ブート プロセスが停止している可能性があります。

メッセージを書き留めてください。

ルータの電源をいったん切ってから再び投入してルータをリセットし、ブート プロセスをやり直します。ルータが再び停止する場合は、RP を交換します( 上部および下部カード ケージからの RP およびラインカードの取り外しと取り付けを参照)。

 

表4-2 RP 英数字ディスプレイ メッセージを使用したトラブルシューティング

メッセージ
説明

LMEM
TEST

ロー メモリ テストを実行中です。

LCAH
TEST

下位 15 K キャッシュの初期化中です。

BSS
INIT

ROM メイン メモリの初期化中です。

NVRAM
INIT

NVRAM の初期化中です。

EXPT
INIT

割り込みハンドラの初期化中です。

TLB
INIT

TLB の初期化中です。

CACH
INIT

CPU データおよび命令キャッシュの初期化中です。

CACH
PARY

CPU キャッシュ パリティをイネーブルにします。

MEM
INIT

メイン メモリの初期化中です。

NVRAM
SIZE

NVRAM サイズ検出中です。

PCMC
INIT

PCMCIA の初期化中です。

EXIT
INIT

初期化シーケンスが終了しています。

IOS
UP

Cisco XR IOS ソフトウェアの実行中です。

RP には 8 つのデバイスまたはポート LED アクティビティ インジケータがあり、イーサネット接続のステータスが表示されます(図 4-4)。

図 4-4 RP の LED

 

 

LINK

リンク アクティビティを示します。

EN

ポートが使用可能であることを示します。

TX

データ送信を示します。

RX

データ受信を示します。

RP の RJ-45 ポート LED は、次の情報を表示します。

アクティブになっているフラッシュ メモリ カード スロット

PCMCIA スロットへのアクセスが発生している場合は、対応する LED が点灯します(SLOT 0 および SLOT 1)。

使用中のイーサネット接続

4 つの RJ-45 イーサネット ポート アクティビティ LED は、リンク アクティビティ(LINK)、ポート イネーブル(EN)、データ送信(TX)、およびデータ受信(RX)を示します。

イーサネット インターフェイス上のアクティビティ

2 つのイーサネット ポート選択 LED(PRIMARY のラベル)は、選択されているイーサネット接続を示します。PRP では両方のポートがサポートされるので、ポート ETH0 の LED は常に点灯しています。ポート ETH1 の LED は、選択された場合に点灯します。

ラインカードのトラブルシューティング

各ラインカードの電源をオンにすると、Power-on Self-Test(POST; 電源投入時セルフテスト)がラインカードのメモリに対して実行されます。システム コンソールからラインカードに対して、フルセットのフィールド診断テストを実行することもできます。その場合、ラインカードの英数字 LED ディスプレイとシステム コンソールの両方に、pass または fail のメッセージが表示されます。

次の手順で、ラインカードの問題を特定してください。

英数字 LED ディスプレイの両方のバンクが点灯していますか。

2 つのディスプレイは個別に電力が供給されます。左側のディスプレイは、ラインカード上の DC/DC コンバータから電力が供給されます。右側のディスプレイは、電源モジュールから直接電力が供給されます。したがって、ラインカードの電源がオフになっていても右側のディスプレイは点灯する場合があります。ディスプレイが両方とも点灯しない場合は、ラインカードとバックプレーン コネクタの接続が不完全であるか、ラインカードの MBus モジュールに問題があるか、またはシステムの電源モジュールがオフになっている可能性があります。

ディスプレイが両方とも点灯している場合、表示されているメッセージを確認してください。MBus モジュールによって DC/DC コンバータがオンになると、ラインカードのプロセッサがただちにブート プロセスを開始します。ラインカード上でのブート プロセスの進行に応じて、英数字ディスプレイにステータス メッセージが表示されます。

システムは、まったく同じライン カードを並行して起動させようとします。さらに、ライン カードに電源が投入され、バックアップ可能になると、システムはただちにライン カードを起動します。

RP の起動プロセスの直後に行われるライン カードの起動プロセス中に、各ライン カードの英数字 LED ディスプレイを観察することができます。英数字ディスプレイおよび定義の詳細については、『 Cisco IOS XR Troubleshooting Guide 』を参照してください( マニュアルの入手方法、テクニカル サポート、およびセキュリティ ガイドラインを参照)。

アラーム カードによるトラブルシューティング

ルータにはアラーム カードが 2 枚備わっています。

1 枚のアラーム カードは、上部カード ケージ左端の専用スロットに搭載されます。

もう 1 枚のアラーム カードは、下部カード ケージ右端の専用スロットに搭載されます。

上下カード ケージのアラーム カード スロットは、他のスロットとは異なります。アラーム カード スロットであることを示すラベルが付き、他のスロットより幅が狭く、バックプレーン コネクタも異なります。

アラーム カードの前面パネルには、次のコンポーネントおよびインジケータがあります(図 4-5 を参照)。

CRITICAL(レッド)、MAJOR(レッド)、および MINOR(イエロー)インジケータ ― MBus を介して検出されたシステム レベルのアラーム状態を示します。

これらのインジケータは、通常オフになっています。

音声アラーム カットオフ スイッチ

外部アラームとの 25 ピン ケーブル接続

アラーム カード インジケータ

ENABLED(グリーン) ― アラーム カードは動作中で、正常に機能しています。

FAIL(イエロー) ― このスロット内のアラーム カードは故障しています。

Clock Scheduler Card(CSC; クロック スケジューラ カード)および Switch Fabric Card(SFC; スイッチ ファブリック カード)ケージの各 CSC および SFC に対応したステータス LED のペア

ENABLED(グリーン)
点灯 ― このスロット内のカードは動作中で、適切に機能しています。
消灯 ― いずれかのスロットが空であるか、またはこのスロット内のカードが故障しています。

FAIL(イエロー) ― このスロット内のカードは故障しています。

図 4-5 アラーム カードのステータス LED

 

アラーム ステータス(CRITICAL、MAJOR、MINOR)の監視

アラームは、次の過熱状態について警告することがあります。

カード ケージのコンポーネントの過熱状態

ブロワー モジュールのファンの故障

電源モジュールの過電流

いずれかのカードの電圧超過

アラーム LED は、MBus ソフトウェアによって制御され、各レベルのアラームを起動するしきい値レベルが設定されています。

RP はシステムに対し、温度、電圧、電流、およびファン速度の値を定期的に調べます。しきい値を超過すると、RP は適切なアラーム重大度をアラーム カードに設定します。その結果、対応する LED が点灯し、所定のアラーム表示リレーがアクティブになり、アラーム ディスプレイに接続された外部オーディオ/ビジュアル アラームが起動します。RP はシステム コンソールに、しきい値違反のメッセージも出力します。


) オーディオ アラーム カットオフ スイッチを使用すると、アラーム カードインジケータが適切に動作しているかどうかを目で確認できます。オーディオ アラームがアクティブでない場合に、オーディオ アラーム カットオフ スイッチを押すと、アラーム カード前面パネル上のすべてのインジケータが一時的に点灯します。インジケータが点灯しない場合は、LED に障害があります。


スイッチ ファブリックのトラブルシューティング

ここでは、スイッチ ファブリックの問題に関するトラブルシューティング手順について説明します。RP およびラインカードは、クロスバー スイッチ ファブリックを介して接続されます。クロスバー スイッチ ファブリックは、ほとんどのカード間通信に対応する高速物理パスを提供します。スイッチ ファブリックを介して RP とラインカード間で送信されるメッセージは、ルーティングおよび受信されている実際のパケット数、転送情報、トラフィック統計情報、およびほとんどの管理情報や制御情報などです。この情報は、ハードウェア関連障害を診断する場合に役立ちます。


) ここに記載された内容は、熟練した Cisco IOS ソフトウェア オペレータやシステム管理者のみを対象としています。Cisco IOS の詳細については、該当する Cisco IOS ソフトウェアのマニュアルを参照してください。


RP およびラインカードから必要なデータを収集して、スイッチ ファブリックのトラブルシューティングを行う手順は、次のとおりです。


ステップ 1 プライマリおよびセカンダリ RP に対して show controllers fia コマンドを入力し、出力を保存します。

ステップ 2 attach <slot #> コマンドを入力して、ラインカードにアクセスします。


) ラインカードに接続したら、attach コマンドを使用します。execute-on コマンドは、スイッチ ファブリックを介して動作する Inter-Processor Communication(IPC; プロセッサ間通信)に応じて異なります。IPC に問題がある場合は、スイッチ ファブリックを介してリモート実行されるコマンドがタイムアウトすることがあります。attach <slot #> コマンドは、IPC でなく、MBus を介して送信されます。


ステップ 3 搭載されたすべてのラインカードに対して show controllers fia コマンドを入力し、各出力を保存します。

ステップ 4 次の「データ分析」のセクションに進みます。


 

データ分析

スイッチ ファブリックの問題は、次のコンポーネントのいずれかに障害が発生すると起こることがあります。

RP

ライン カードのハードウェア

バックプレーン

CSC/SFC

スイッチ ファブリック エラーのトラブルシューティングでは、エラー報告元のコンポーネントに関連するパターンを見つけます。たとえば、すべての RP およびラインカードの show controllers fia 出力を組み合わせると、エラー パターンあるかどうかを判別することができます。ここでは、エラー パターンの判別に役立つ出力内の値について説明します。

crc16 出力

show controllers fia コマンドの crc16 データ行は、ハードウェア問題に関する重要な情報を示します。特定のラインカードまたは CSC/SFC がオンラインになったり、取り付けられたり、取り外されたりすると、crc16 エラー データがいくつか表示されます。ただし、この値が継続的に増加することはありません。この値が増加している場合は、障害のあるハードウェア コンポーネントを交換をしなければならいことがあります。プライマリ RP とセカンダリ RP のデータ、および搭載されたすべてのラインカードのデータを相関付けることは、非常に重要なことです。次に、プライマリ RP のステータスの出力例を示します。crc16 データ行には下線が付いていて、sfc1 のエラーを示しています。

Router#show controllers fia
Fabric configuration: Full bandwidth, redundant fabric
Master Scheduler: Slot 17 Backup Scheduler: Slot 16
From Fabric FIA Errors
-----------------------
redund fifo parity 0 redund overflow 0 cell drops 0
crc32 lkup parity 0 cell parity 0 crc32 0
Switch cards present 0x001F Slots 16 17 18 19 20
Switch cards monitored 0x001F Slots 16 17 18 19 20
Slot: 16 17 18 19 20
Name: csc0 csc1 sfc0 sfc1 sfc2
-------- -------- -------- -------- --------
los 0 0 0 0 0
state Off Off Off Off Off
crc16 0 0 0 1345 0
To Fabric FIA Errors
-----------------------
sca not pres 0 req error 0 uni FIFO overflow 0
grant parity 0 multi req 0 uni FIFO undrflow 0
cntrl parity 0 uni req 0 crc32 lkup parity 0
multi FIFO 0 empty dst req 0 handshake error 0
cell parity 0
 

次の出力例には、スロット 2 搭載のラインカードのステータスが表示されています。crc16 データ行には下線が付いていて、sfc1 のエラーを示しています。

Router#attach 2
Entering Console for 4 port ATM Over SONET OC-3c/STM-1 in Slot: 2
Type "exit" to end this session
Press RETURN to get started!
LC-Slot2>
LC-Slot2>enable
LC-Slot2#show controllers fia
From Fabric FIA Errors
-----------------------
redund FIFO parity 0 redund overflow 0 cell drops 0
crc32 lkup parity 0 cell parity 0 crc32 0
Switch cards present 0x001F Slots 16 17 18 19 20
Switch cards monitored 0x001F Slots 16 17 18 19 20
Slot: 16 17 18 19 20
Name: csc0 csc1 sfc0 sfc1 sfc2
-------- -------- -------- -------- --------
Los 0 0 0 0 0
state Off Off Off Off Off
crc16 0 0 0 1345 0
To Fabric FIA Errors
-----------------------
sca not pres 0 req error 0 uni fifo overflow 0
grant parity 0 multi req 0 uni fifo undrflow 0
cntrl parity 0 uni req 0 crc32 lkup parity 0
multi fifo 0 empty DST req 0 handshake error 0
cell parity 0
LC-Slot2#exit
Disconnecting from slot 2.
Connection Duration: 00:00:21
Router#
 

show controllers fia コマンドのデータを RP およびラインカードから収集したら、 表4-3 のような表を作成できます。

 

表4-3 エラー データ収集テーブル

カード スロット
CSC 0
CSC 1
SFC 0
SFC 1
SFC 2
SFC 3
SFC 4

0

 

 

 

ERROR

 

 

 

1

 

 

 

 

 

 

 

2

 

 

 

ERROR

 

 

 

3

 

 

 

ERROR

 

 

 

4

 

 

 

 

 

 

 

5

 

 

 

ERROR

 

 

 

6

 

 

 

 

 

 

 

7

 

 

 

ERROR

 

 

 

8

 

 

 

 

 

 

 

表4-3 では、複数のラインカードが SFC 1 からのエラーを報告しています。したがって、この問題を解決するには、最初に SFC 1 を調べるか、または交換する必要があります。交換する場合は、まず、カードが適切に装着されているかどうかを確認してください(SFC の適切な装着を参照)。


) トラブルシューティングの第一段階では必ず、対応するカードをいったん取り外して、正しく装着してください。カードを再装着したあとも crc エラーが増加する場合は、カードを交換します。


crc16 エラーの一般的な障害パターンおよび推奨処置は、次のとおりです(問題が解決されるまで、手順を 1 つずつ実行します)。

1. 同じ SFC から、複数のラインカードに関するエラーが報告される場合:

a. エラーに対応するスロット内の SFC を交換します。

b. すべての SFC を交換します。

c. バックプレーンを交換します。

2. 複数の SFC から、特定のラインカードに関するエラーが報告される場合:

a. 該当するラインカードを交換します。

b. エラーが増える場合は、現在のマスター CSC を交換します。

c. エラーが増えない場合、現在のマスター CSC が CSC0 であれば、CSC1 を交換します。

認可パリティおよび要求エラー

コンソール ログまたは show log コマンドの出力(認可パリティおよび要求エラーの形式)を調べて、トラブルを解決することもできます。認可パリティ エラーを示すメッセージ タイプを検索します。

認可許可および要求 エラーの一般的な障害パターンおよび推奨処置は、次のとおりです(問題が解決されるまで、手順を 1 つずつ実行します)。

1. 認可エラーが複数のラインカードで発生する場合:

a. CSC を交換します(交換する CSC については、以下の「注」を参照)。

b. バックプレーンを交換します。

2. 認可エラーが特定のラインカードで発生する場合:

a. 該当するラインカードを交換します。

b. CSC を交換します(交換する CSC については、以下の「注」を参照)。

c. バックプレーンを交換します。


) 複数のラインカードが認可パリティまたは要求エラーを報告しているにもかかわらず、ルータが機能している場合は、CSC にスイッチオーバーが発生しています。障害のある CSC は、現在のバックアップ CSC(show controllers fia 出力で Master Scheduler として示されていない CSC)です。見出し「From Fabric FIA Errors」または「To Fabric FIA Errors」の次に「Halted」が示されている場合、またはルータがトラフィックを転送していない場合は、CSC スイッチオーバーが発生していません。障害のある CSC は、Master Scheduler として示されている CSC です。デフォルトでは、スロット 17 の CSC がプライマリ、スロット 16 の CSC がバックアップです。


SFC の適切な装着

SFC はルータに取り付けにくいことがあります。場合によっては、正しく装着するために、少し力を込める必要があります。CSC が正しく装着されていない場合は、エラー メッセージが表示されます。

SFC およびラインカードの起動時の問題を扱う場合は、すべての CSC および SFC が正しく装着されていて、電源がオンになっていることを確認することが重要です。

冷却サブシステムのトラブルシューティング

ルータの冷却サブシステムは、シャーシの上部および下部ブロワー モジュールと、各電源モジュールに付いている 1 つのファンからなります。ブロワー モジュールおよび電源モジュールのファンは、空気を循環させて、ルータ内の動作温度を許容範囲内に保持します(図 4-6)。

ここでは、冷却サブシステムのトラブルシューティングの方法について説明します。内容は次のとおりです。

「ブロワー モジュールの動作」

「電源モジュールの動作」

「過熱状態」

「冷却サブシステムの問題の特定」

図 4-6 冷気の流れ

 

ブロワー モジュールの動作

ブロワー モジュールは、交換可能なエアー フィルタからカード ケージに冷気を取り込むことによって、内部コンポーネントの動作温度を許容範囲内に維持します。ブロワーはルータ上下付近のベイに搭載されています。

各ブロワー モジュールには 3 つのファン、コントローラ カード、および 2 つの前面パネル ステータス LED が含まれています。スナップ着脱式フロント カバーが前面パネルに装着されていますが、LED はフロント カバーを通して確認できます。

グリーン ― ブロワー モジュールが正常に機能しています。

レッド ― ブロワー モジュールに障害が検出されています。

シャーシの内部温度が上昇すると、ブロワーの速度が増し、より多くの冷気が内部コンポーネントに送り込まれます。

内部温度がしきい値を超えて上昇し続けると、過熱による機器の損傷を防ぐため、システム環境モニタによってすべての内部電源がシャットダウンされます。

ブロワー モジュールの 1 つまたは複数のファンで障害が発生すると、システム コンソールに警告メッセージが表示されるとともに、RP の英数字ディスプレイにブロワー障害メッセージが表示されます。また、残りの正常なファンが、障害のあるファンの動作を補うため、フル回転で稼働します。

電源モジュールの動作

各 AC または DC 電源にはファンが内蔵され、電源モジュールの前面から冷気を取り込み、電源シェルフの背面から熱気を排出する構造になっています。

電源が許容範囲内であれば、電源モジュールのファンは常に動作しています。

ファンに障害が発生すると、次のようになります。

電源モジュールは内部の過熱状態を検出します。

FAULT および TEMP インジケータが点灯します。

電源モジュールは過熱に関する警告をシステムに送信して、システムをシャットダウンします。

電源モジュールのトラブルシューティングの詳細については、「電源サブシステムのトラブルシューティング」を参照してください。

過熱状態

次のコンソール エラー メッセージは、システムが過熱状態を検出したか、またはシステム内に許容範囲外の電力が供給されていることを示しています。

Queued messages:
%ENVM-1-SHUTDOWN: Environmental Monitor initiated shutdown
 

先行するメッセージが、コンポーネントまたは温度センサーの障害を伝えていることがあります。ユーザ EXEC プロンプトで show environment コマンドまたは show environment all コマンドを入力して、内部システム環境の情報を表示します。これらのコマンドで生成される情報は、次のとおりです。

DC/DC コンバータからの各カードの電圧測定値

MBus モジュールの +5 VDC

ブロワー モジュールの動作電圧

各カードの 2 つのセンサーによって測定された温度(吸気温度およびカードのホットスポット温度)、および各電源モジュールのセンサーによって測定された温度

過熱状態または許容範囲外の状態が原因で環境シャットダウンが発生すると、電源モジュールの FAULT インジケータが点灯し、システムがシャットダウンします。

システムの初回起動に過熱状態になることはほとんどありませんが、以下の点を確認してください。

すぐ近くにある他の機器から排出された熱気が、シャーシのカード ケージの吸気口から取り込まれていないことを確認します。

十分なエアー フローを得るために、シャーシおよび電源モジュールの吸気口と排気口に、6 インチ(15.24 cm)以上のスペースを確保してください。このようにすると、冷気が妨げなく取り込まれ、熱気がシャーシから排出されます。

冷却サブシステムの問題の特定

過熱状態が発生しているときに、シャーシの冷却システムの問題を特定するには、次の手順を実行します。


ステップ 1 システムの電源をオンにしているときに、ブロワー モジュールが適切に稼働していることを確認します。

ブロワー モジュールが稼働していることを確認するには、ブロワー モジュールの前面パネルの 2 つの LED インジケータを調べます。

OK(グリーン) ― ブロワー モジュールが適切に機能し、-48 VDC の電力が供給されていて、シャーシ バックプレーンとブロワー モジュールとの接続ケーブルは正常です。

FAIL(レッド) ― ブロワー モジュールで障害が検出されています。ブロワー モジュールを交換してください。

どのインジケータも点灯せず、ブロワー モジュールが稼働していない場合には、ブロワー モジュールまたは -48 VDC の電力供給に問題があると考えられます。ステップ 2 に進んでください。

ステップ 2 ブロワー モジュールをイジェクトし、取り付け直して、非脱落型ネジをしっかり締めます。

それでもブロワー モジュールが機能しない場合は、ステップ 3 に進みます。

ステップ 3 各電源モジュールの LED インジケータを調べて、-48 VDC の電力が供給されているかどうかを確認します。

各電源モジュールの PWR OK インジケータが点灯し、FAULT インジケータが消灯している場合は、ブロワーに -48 VDC が供給されています。

ブロワー モジュールがまだ機能しない場合は、ブロワー モジュールのコントローラ カードに問題があるか、ブロワー モジュール ケーブルに未検出の問題があると考えられます。ブロワー モジュールを交換してください。

新しいブロワー モジュールが機能しない場合は、購入した代理店までご連絡ください。

FAULT インジケータが点灯している場合は、電源モジュールが故障しています。電源モジュールを交換してください。

TEMP および FAULT インジケータが点灯している場合、過熱状態が発生しています。

電源モジュール ファンが正常に動作していることを確認します。

ファンが稼働していない場合は、電源モジュールを交換します。

電源モジュールを交換しても問題が解決しない場合は、製品を購入した代理店に問い合わせてください。