ルータ : Cisco 12000 シリーズ ルータ

Cisco 12000 シリーズ インターネット ルータのハードウェア トラブルシューティング

2015 年 11 月 25 日 - 機械翻訳について
その他のバージョン: PDFpdf | ライター翻訳版 (2003 年 5 月 24 日) | 英語版 (2015 年 4 月 22 日) | フィードバック


目次


概要

実際には正常に機能しているハードウェアを交換することで、貴重な時間とリソースが無駄になることがよくあります。 このドキュメントでは、Cisco 12000 シリーズ インターネット ルータのハードウェアに関する一般的な問題のトラブルシューティングに役立つ情報と、故障がハードウェアに関するものかどうかを識別するための手がかりとなる情報を提供します。

注: このドキュメントは、ハードウェアの問題と誤認されやすい問題を除き、ソフトウェア関連の障害は取り上げていません。

注: さらに、この資料はラインカード(LC)のためのハードウェア トラブル シューティング ステップを Cisco 12000 シリーズ取り扱っていません。 「Cisco 12000 シリーズ インターネット ルータ ラインカード障害のハードウェア トラブルシューティング」では、ラインカードに関するハードウェアの問題のトラブルシューティング手順と、ハードウェアの障害と誤解されることのある問題を識別する手順について、詳細に説明しています。

前提条件

要件

このドキュメントの読者は次の項目に関する知識が必要です。

発生した問題がハードウェア障害と関係があると思われる場合には、この資料を参考にして、障害の原因を明らかにしてください。

使用するコンポーネント

このドキュメントの情報は、次のソフトウェアとハードウェアのバージョンに基づくものです。

  • すべての Cisco 12000 シリーズ インターネット ルータ。12008、12012、12016、12404、12406、12410、および 12416。

  • すべての Cisco IOS か。 Cisco 12000 シリーズ インターネット ルータをサポートするソフトウェア バージョン。

このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されたものです。 このドキュメントで使用するすべてのデバイスは、クリアな(デフォルト)設定で作業を開始しています。 対象のネットワークが実稼働中である場合には、どのような作業についても、その潜在的な影響について確実に理解しておく必要があります。

ハードウェアとソフトウェアの互換性およびメモリ要件

新しいラインカード、モジュール、または Cisco IOS をインストールする時はいつでもか。 ハードウェア および ソフトウェアが機能と互換性があることソフトウェア イメージ、ルータに十分なメモリがある、使用したいことを確認することは重要であり。

次の推奨手順を実行して、ハードウェアとソフトウェアの互換性とメモリ要件を確認してください。

  1. 使用しているネットワーク デバイス用のソフトウェアを選択するには、 Software Advisor登録ユーザ専用)を使用します。

    ヒント:

    • ハードウェア セクションのためのソフトウェアサポートはルータでインストールされるモジュール および カードが望ましい Cisco IOS ソフトウェア バージョンによってサポートされるかどうか確かめるのを助けます。

    • Features セクションのためのソフトウェアサポートは設定したい機能の種類の選択によって必要とされる Cisco IOSソフトウェアイメージを判別するのを助けます。

  2. Cisco IOSソフトウェアによって必要となるメモリの最低要量をチェックするのにダウンロード ソフトウェア エリアを(RAM およびフラッシュする)使用して下さいおよび/または Cisco IOSソフトウェアイメージをダウンロードして下さい。 ルータに取り付けるメモリの量(RAM およびフラッシュ)を判断するには、『Cisco IOS ソフトウェア リリースの選択方法』の「メモリ要件」のセクションを参照してください。

    ヒント:

    • ルータ上で現在使用しているバージョンと同じ機能を維持したいものの、使用している機能セットが分からない場合は、使用しているシスコのデバイスから show version コマンドを入力し、これを Output Interpreter ツールにペーストしてください。 潜在的な問題 および修正を表示するのに使用できます。 使用するには、登録ユーザとしてログインし、JavaScript を有効にしている必要があります。 特に最新のソフトウェア機能を使用しようとする場合は、機能サポートについて確認することが重要です。

    • Cisco IOS ソフトウェア イメージを新しいバージョンまたは機能セットにアップグレードする必要がある場合、詳細は、『Cisco IOS ソフトウェア リリースの選択方法』を参照してください。

  3. Cisco IOS ソフトウェアのアップグレードが必要と判断された場合には、Cisco 12000 シリーズ ルータに関する「ソフトウェア インストールおよびアップグレード手順」に従ってください。

    ヒント: ROMmon (rommon # > prompt)状態になった Cisco 12000シリーズルータの回復方法に関しての情報は、「Cisco 12000 における ROMmon 回復手順」を参照してください。

表記法

ドキュメントの表記法の詳細は、『シスコ テクニカル ティップスの表記法』を参照してください。

Cisco 12000 のコンポーネント

Cisco 12000 シリーズ インターネット ルータのシャーシを構成するコンポーネントは、次のとおりです。

  • シャーシ

  • スイッチ ファブリック カード(SFC)

  • クロック スケジューラ カード(CSC)

  • メンテナンス バス(MBUS)

  • 電源装置

  • ブロワー : ファン アセンブリ

  • アラーム カード

シャーシ自体には電子部品は組み込まれていないので、バックプレーン コネクタが部分的に曲がっていたり破損していないかぎり、シャーシがハードウェア関連の問題の原因になることはほとんどありません。 電源装置、SFC、CSC、アラーム カード、およびファン アセンブリには、いずれも電子部品が組み込まれているので、これらはハードウェア問題の影響を受けることがあります。 一般に、これらのコンポーネントでハードウェア上の問題が発生すると、エラー メッセージが出力されるか、またはルータの機能に障害が起きます。 これらのすべてのコンポーネントに関する詳細な説明と、相互運用の仕組みについては、「Cisco 12000 シリーズ インターネット ルータのアーキテクチャ」を参照してください。

問題の特定

ここでは、ルータに発生した問題がハードウェアに関係しているかどうかを判断するためのトラブルシューティング手順を説明します。

情報の収集

最初に行う必要があるのは、ルータのクラッシュの原因、または表示されているコンソール エラーの原因を明らかにすることです。 故障している箇所を調べるには、次のコマンドによる出力を収集することが不可欠です。

  • show context summary

  • show logging

これらの show コマンドのほかに、次の情報も収集する必要があります。

  • コンソール ログと syslog 情報: 複数の症状が見られる場合に根本の原因を判別するには、これらが必須の情報になります。 ルータが syslog サーバにログを送信するよう設定されていれば、問題が発生したときの情報を確認できる可能性があります。 コンソール ログの場合は、ルータのコンソール ポートに直接接続して logging enabled を使用するのが最もよい方法です。

  • Show technical-support: show technical-support コマンドは、show version、show running-config、show stacks などの複数のコマンドを 1 つにまとめたものです。 通常、ルータで問題が発生したときには、シスコ Technical Assistance Center(TAC)エンジニアからこの情報の提供を求められます。 ルータのリロードまたは電源のオフ/オンを行うと、問題に関する情報がすべて失われてしまうため、show technical-support は必ずリロードまたは電源のオフ/オンを行う前に実行してください。

紛らわしい症状

実際にはハードウェア障害ではないにもかかわらず、ハードウェア障害と間違われやすい現象がいくつかあります。 代表的なものは、ルータが応答しなくなる、すなわち「ハング」するという問題です。 また、新しいハードウェアを取り付けたあとによく起こる問題もあります。 シャーシのコンポーネントが原因で、これらの症状が起きるということは、まずありません。 次の表に、誤解を招きやすい問題についての症状、説明、およびトラブルシューティング ステップを示します。

症状 説明/トラブルシューティング
Cisco 12000 が通常動作中にハングする この症状は、一般にソフトウェアの問題が原因で発生しますが、ハードウェアが原因の場合もあります。 この問題については、「トラブルシューティング:ルータがハングする場合」を参照してください。
新しいライン カードが認識されない Software Advisor ツール(登録ユーザのみ)を使用して、現在の Cisco IOS ソフトウェア バージョンで新しいカードがサポートされているかどうかを確認してください。 LC がサポートされている場合は、service upgrade all を設定し、copy run start コマンドで設定を保存して、ルータの電源をオフ/オンします。 リロードでは不十分なときもありますが、このときは電源のオフ/オンによって解決します。 現在使用中の Cisco IOS ソフトウェア バージョンで新しいカードがサポートされていない場合は、ラインカードに十分なルート メモリがあることを確認してから、Cisco IOS ソフトウェアのバージョンをアップグレードします。 リリース 12.0(21)S の場合、特に Border Gateway Protocol(BGP; ボーダーゲートウェイ プロトコル)で多数のピアと多数のルートが設定されている場合は、256 MB のルート メモリが必要です。
CPU 使用率が非常に高い この症状については、ハードウェアの問題が原因である場合もありますが、それ以上に、ルータの設定に誤りがあるか、またはネットワーク上の何かが問題を引き起こしている可能性があります。 この症状をトラブルシューティングするには、「トラブルシューティング:Cisco ルータで CPU 高使用率が発生した場合」を参照してください。
ギガビット ルート プロセッサ(GRP)でメモリ割り当てエラーが発生する ハードウェアの問題が原因でメモリ割り当てエラーが起こることはほとんどありません。 メモリ割り当てエラーに関するトラブルシューティングのヒントは、「トラブルシューティング:メモリの問題」に記載されています。
show interfaces コマンドの出力で、入力廃棄の数が増えている この問題は、ルータのハードウェアが原因で発生することはありません。 この問題のトラブルシューティングについては、「トラブルシューティング:Cisco 12000 シリーズ インターネット ルータでの入力廃棄」を参照してください。
show interfaces コマンドの出力で ignored メッセージの数が増えている いずれかのラインカードで過負荷が起きていると思われます。 「トラブルシューティング:Cisco 12000 シリーズ インターネット ルータでの ignored エラーとメモリ不足による廃棄」に詳細に記載されている手順に従ってください。
GRP 上で Forwarding Information Base(FIB; 転送情報ベース)関連のエラー メッセージが発生する エラーメッセージデコーダ(登録ユーザのみ)ツールを使用して、このエラー メッセージの意味に関する情報を参照してください。 そのうちのいくつかはラインカードまたはスイッチ ファブリック カードのハードウェア上の問題を指します(SFC か CSC); 他はルータの他の部品の Cisco IOSソフトウェアのバグかハードウェア上の問題を示します。 FIB および CEF に関連するメッセージの一部が「トラブルシューティング:CEF 関連のエラー メッセージ」で説明されています。
GRP 上で Inter Process-Communication(IPC;プロセス間通信)関連のメッセージが発生する エラーメッセージデコーダ(登録ユーザのみ)ツールを使用して、このエラー メッセージの意味に関する情報を参照してください。 そのうちのいくつかはラインカードまたはスイッチ ファブリック カードのハードウェア上の問題を指します(SFC か CSC); 他はルータの他の部品の Cisco IOSソフトウェアのバグかハードウェア上の問題を示します。 いくつかの IPC 関連のメッセージは Cisco 12000、10000、7600、および 7500 シリーズ ルータで説明されます: IPC-3-NOBUFF メッセージのトラブルシューティング
GRP上で次のエラー メッセージが発生する
%GRP-3-FABRIC_UNI: Unicast send timed out (1)
%GRP-3-COREDUMP: Core dump incident on slot 1, 
error: Fabric ping failure
ラインカードまたはセカンダリ GRP が、スイッチ ファブリックを介してプライマリ GRP からのファブリック Ping 要求に応答できなかった場合、ファブリック Ping 障害が発生します。 こうした障害の症状が出ると、調査が必要です。 この問題の詳細は、「トラブルシューティング:Cisco 12000 シリーズ インターネット ルータにおけるファブリック Ping のタイムアウトおよび障害」で説明されています。
GRP上で次のエラー メッセージが発生する
%GRP-3-UCODEFAIL: Download failed to slot 5
ライン カードにダウンロードしたイメージが、ライン カードによってリジェクトされました。 microcode reload 設定コマンドを使用して、マイクロコードをリロードしてみることができます。 引き続きエラー メッセージが表示される場合は、「Cisco 12000 シリーズ インターネット ルータのラインカード ファームウェアのアップグレード」で説明されている upgrade all slot コマンドを使用して、MBUS エージェント ROM、MBUS エージェント RAM、およびファブリック ダウンローダをアップグレードしてみてください。 また、この表にある「新しいラインカードが認識されない」という症状も参考にしてください。

トラブルシューティング手順

スイッチ ファブリック(CSC および SFC)のトラブルシューティング

GRP とラインカードは、クロスバー スイッチ ファブリックを経由して接続します。クロスバー スイッチ ファブリックは、ほとんどのカード間通信用に高速の物理パスを提供するものです。 スイッチ ファブリックを介して GRP とラインカード間で送受信されるメッセージには、ルーティングされ受信される実際のパケット、転送情報、トラフィック統計、および大半の管理情報と制御情報などが含まれます。 したがって、GRP にとって、このパスが適切に確保されていることが重要です。

スイッチ ファブリックの症状

次のようなファブリック関連のエラー メッセージがログに表示される場合、常にスイッチ ファブリックに問題があると考える必要があります。

%FABRIC-3-CRC: Switch card 18

または

%FABRIC-3-PARITYERR: To Fabric parity error was detected. Grant parity error Data = 0x2.
SLOT 1:%FABRIC-3-PARITYERR: To Fabric parity error was detected. 
Grant parity error Data = 0x1

次のメッセージが表示されるときは、スイッチ ファブリックに関するハードウェア障害である場合と、そうでない場合があります。

05:21:11: %GRP-3-FABRIC_UNI: Unicast send timed out (2)
05:21:16: %GRP-3-FABRIC_UNI: Unicast send timed out (2)

こうした障害の症状が出ると、調査が必要です。 この問題の詳細は、「トラブルシューティング:Cisco 12000 シリーズ インターネット ルータにおけるファブリック Ping のタイムアウトおよび障害」で説明されています。

トラブル シューティング:スイッチ ファブリック

スイッチ ファブリックの問題が疑われる場合は、次のステップに従ってください。

  1. データを収集します。

    LC に接続する場合には、attach コマンドを使用して、MBUS 上でデータを収集する必要があります。 execute-on コマンドは、スイッチ ファブリックで行われている Inter-Process Communication(IPC; プロセス間通信)によって動作が異なります。 IPC に関する問題(ファブリックの問題、ソフトウェアの不具合など)が起きている場合には、スイッチ ファブリックを経由してリモートで実行されているコマンドはタイムアウトになることがあります。 通常、多量の出力を行うコマンドの場合は、LC に割り当てて、コマンドを実行することを推奨します。 attach <slot #> コマンドは、常に MBUS 上で実行されます。

    • show controllers fia(GRP 上)

    • attach <slot #>、show controllers fia の順に実行し、exit と入力(各 LC とセカンダリ GRP に対して繰り返す)

    • show controllers clock(GRP上で)

    • CSCマスタ変更を説明する show log (look for Online Insertion および Removal (OIR)イベント; ファブリック関係のエラーを探して下さい)

    • show log summary(ファブリック関連のエラーを探す)

    • show log slot <slot #>

  2. データを分析します。

    ファブリックの問題は、次のコンポーネントのいずれかの障害が原因で起きることがあります。

    • コントロール プレーン - GRP

    • データ プレーン

    • Tofab LC のハードウェア

    • バックプレーン

    • CSC/SFC

    • Frfab LC のハードウェア

    ファブリック エラーをトラブルシューティングする場合、エラーを報告しているコンポーネントがどれであるかについて、パターンを見つけ出すことから始めます。 たとえば、すべての GRP と LC からの show controllers fia の出力を組み合わせて、1 つのパターンがあるかどうかを調べます。

    注: 以降、この資料でLCについて言及するときは、任意のLCまたはGRPを指しています。

CRC の数の増加

show controllers fia コマンドの出力で crc16 が表示される場合は、この数が増えているかどうかをチェックすることが重要です。 また、プライマリ GRP と他の GRP や LC から得たデータを関連付けることは非常に重要です。 1 つの LC または 1 つのスイッチファブリック カード(CSC または SFC)をホットスワップ(OIR)した場合、何らかのファブリック エラー メッセージや crc16 が表示される可能性があります。 ただし、その後に、この数が増えることはありません。 この数字が増えている場合はハードウェア障害ですので、一部の部品を交換する必要があります。

次の出力では、プライマリ GRP とスロット 2 にある LC のステータスが分かります。

Router#show controllers fia 
Fabric configuration: Full bandwidth, redundant fabric
Master Scheduler: Slot 17  Backup Scheduler: Slot 16
From Fabric FIA Errors
-----------------------
redund fifo parity 0    redund overflow 0      cell drops 0         
crc32 lkup parity  0    cell parity     0      crc32      0         
Switch cards present    0x001F    Slots  16 17 18 19 20
Switch cards monitored  0x001F    Slots  16 17 18 19 20
Slot:     16         17         18         19         20
Name:    csc0       csc1       sfc0       sfc1       sfc2
       --------   --------   --------   --------   --------
los    0          0          0          0          0          
state  Off        Off        Off        Off        Off       
crc16  0          0          0          1345       0
To Fabric FIA Errors
-----------------------
sca not pres 0          req error     0          uni FIFO overflow 0         
grant parity 0          multi req     0          uni FIFO undrflow 0         
cntrl parity 0          uni req       0          crc32 lkup parity 0         
multi FIFO   0          empty dst req 0          handshake error   0         
cell parity  0
Router#attach 2
Entering Console for 4 port ATM Over SONET OC-3c/STM-1 in Slot: 2
Type "exit" to end this session
Press RETURN to get started!
LC-Slot2>
LC-Slot2>enable
LC-Slot2#show controllers fia
From Fabric FIA Errors
-----------------------
redund FIFO parity 0          redund overflow 0          cell drops 0         
crc32 lkup parity  0          cell parity     0          crc32      0         
Switch cards present    0x001F    Slots  16 17 18 19 20 
Switch cards monitored  0x001F    Slots  16 17 18 19 20 
Slot:     16         17         18         19         20
Name:    csc0       csc1       sfc0       sfc1       sfc2
       --------   --------   --------   --------   --------
Los    0          0          0          0          0          
state  Off        Off        Off        Off        Off       
crc16  0          0          0          1345       0
To Fabric FIA Errors
-----------------------
sca not pres 0          req error     0          uni fifo overflow 0         
grant parity 0          multi req     0          uni fifo undrflow 0         
cntrl parity 0          uni req       0          crc32 lkup parity 0         
multi fifo   0          empty DST req 0          handshake error   0         
cell parity  0
LC-Slot2#exit
Disconnecting from slot 2.
Connection Duration: 00:00:21
Router#
... 

すべての show コマンドを解析すると、次のような表を作成できます。

hwts_12000_22281a.gif

この表から、複数のライン カードで SFC1 に起因するエラーが報告されていることがわかります。 したがって、最初のステップはこの SFC の交換です。 一般的な障害のパターンと、推奨する対応策は次のとおりです(問題が解消するまで、一度に 1 ステップずつ実行してください)。

ヒント: 置換が推奨される時はいつでも、カードが正しくつけられていた(下記参照)であることを最初に確認して下さい。 正しく取り付けられてことを確認するために、該当するカードを必ず取り付け直してください。 ブレードを取り付け直した後でも CRC の数が増え続ける場合は、その部品を交換します。

  • 同じファブリック カードに起因する Frfab エラーが複数の LC で起きる場合:

    1. エラーが発生しているスロットにあるファブリック カードを交換します。

    2. すべてのファブリック カードを交換します。

    3. バックプレーンを交換します。

  • 複数のファブリック カードに起因する Frfab エラーが 1 枚の LC で起きる場合:

    1. LC を交換します。

    2. エラーが増え続ける場合は、現在のマスター CSC を交換します。

    3. エラーが増加せず、現在のマスターが CSC0 の場合は、CSC1 を交換します。

スイッチ ファブリック カードの取り付け

12016 および 12416 のスイッチ ファブリック カードは装着しにくいので、少し力を入れて装着しなければならない場合があります。 正しく挿入されていない CSC があると、次のようなエラーメッセージが表示されます。

%MBUS-0-NOCSC: Must have at least 1 CSC card in slot 16 or 17 
%MBUS-0-FABINIT: Failed to initialize switch fabric infrastructure

1/4 帯域幅構成に必要なだけの CSC および SFC しか挿入されていない場合も、このようなエラーメッセージが表示されることがあります。 この場合、エンジン 1 以上のエンジンをベースとする LC はブートしません。

カードが正しく装着されているかどうかを確認するには、CSC/SFC上で4つのLEDが点灯しているかどうかを調べます。 そうでない場合、そのカードは正しく装着されていません。

ファブリックおよび LC がブートしない問題に対処する場合、必要な CSC および SFC がすべて正しく挿入され、電源がオンになっているかどうかを確認する必要があります。 たとえば、12016 でフル帯域幅の冗長システムを構成するには、3つの SFC および2つの CSC が必要です。 フル帯域幅の非冗長システムを実現するには、3 枚の SFC と 1 枚の CSC が必要です。

show version および show controllers fia コマンドの出力から、現在ボックス内で稼働しているハードウェア構成を確認することができます。

Router#show version 
Cisco Internetwork Operating System Software 
IOS (tm) GS Software (GSR-P-M), Experimental Version 12.0(20010505:112551)
Copyright (c) 1986-2001 by cisco Systems, Inc. 
Compiled Mon 14-May-01 19:25 by tmcclure 
Image text-base: 0x60010950, data-base: 0x61BE6000

ROM: System Bootstrap, Version 11.2(17)GS2, [htseng 180] 
EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) 
BOOTFLASH: GS Software (GSR-BOOT-M), Version 12.0(15.6)S, 
EARLY DEPLOYMENT MAINTENANCE INTERIM SOFTWARE

Router uptime is 17 hours, 53 minutes 
System returned to ROM by reload at 23:59:40 MET Mon Jul 2 2001 
System restarted at 00:01:30 MET Tue Jul 3 2001 
System image file is "tftp://172.17.247.195/gsr-p-mz.15S2plus-FT-14-May-2001"

cisco 12016/GRP (R5000) processor (revision 0x01) with 262144K bytes of memory. 
R5000 CPU at 200Mhz, Implementation 35, Rev 2.1, 512KB L2 Cache 
Last reset from power-on

2 Route Processor Cards 
1 Clock Scheduler Card 
3 Switch Fabric Cards 
1 8-port OC3 POS controller (8 POs). 
1 OC12 POS controller (1 POs). 
1 OC48 POS E.D. controller (1 POs). 
7 OC48 POS controllers (7 POs). 
1 Ethernet/IEEE 802.3 interface(s) 
17 Packet over SONET network interface(s) 
507K bytes of non-volatile configuration memory.

20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K). 
8192K bytes of Flash internal SIMM (Sector size 256K).
...
Router#show controller fia 
Fabric configuration: Full bandwidth nonredundant
Master Scheduler: Slot 17
...

Cisco 12000 シリーズ インターネット ルータ アーキテクチャを読むことを推奨します: 詳細な情報詳細についてはスイッチ ファブリック

grant parity エラー と request エラー

エラーの次の型を経験するかもしれません:

  • コンソール ログまたは show log コマンドの出力:

    %FABRIC-3-PARITYERR: To Fabric parity error was detected. 
    Grant parity error Data = 0x2.
    SLOT 1:%FABRIC-3-PARITYERR: To Fabric parity error was detected. 
    Grant parity error Data = 0x1
    
  • show controllers fiaコマンドの出力:

    Router#show controllers fia
    Fabric configuration: Full bandwidth, redundant fabric
    Master Scheduler: Slot 17     Backup Scheduler: Slot 16
    
    !-- Here you can see which CSC is the master CSC. 
    By default CSC1 in slot 17 is the master
     
    
    From Fabric FIA Errors
    -----------------------
    redund FIFO parity 0   redund overflow 0   cell drops 76
    
    !-- You may see some cell drops as well
    
    
    crc32 lkup parity  0    cell parity 0   crc32 0
    Switch cards present    0x001F    Slots  16 17 18 19 20
    Switch cards monitored  0x001F    Slots  16 17 18 19 20
    Slot:     16         17         18         19         20
    Name:    csc0       csc1       sfc0       sfc1       sfc2
           --------   --------   --------   --------   --------
    Los    0          0          0          0          0
    state  Off        Off        Off        Off        Off
    crc16  876        257        876        876        876
    
    !-- You will see some crc16
    
    
    To Fabric FIA Errors
    -----------------------
    sca not pres 0          req error     1          uni fifo overflow 0
    grant parity 1          multi req     0          uni fifo undrflow 0
    
    !-- Grant parity and/or Request error counter not 0
    
    
    cntrl parity 0          uni req       0          crc32 lkup parity 0
    multi fifo   0          empty DST req 0          handshake error   0
    cell parity  0
    

Fabric Interface ASIC(FIA; ファブリック インターフェイス ASIC)は、Gigabit Route Processor(GRP; ギガビット ルート プロセッサ)と Line Card(LC; ラインカード)の両方に存在します。 FIA は GRP/LC とスイッチ ファブリック カード(CSC/SFC)間のインターフェイスを提供していますが、Scheduler Control ASIC(SCA)は CSC にしか組み込まれていません。 SCA はライン カードからの送信要求を処理し、ファブリックにアクセスするための許可を発行します。

ハードウェア要求エラー

  • req error - SCA が req ライン上でパリティ エラーを検出しました

  • grant parity - FIA が grant ライン上でパリティ エラーを検出しました

show controllers fia コマンドの出力を使用して、これらのエラーが複数のラインカードから報告されているかどうか、また CSC スイッチオーバーが発生しているかどうかを調べることができます。 この出力を特定のライン カードから取得するには、attach <slot #> と入力し、LC-Slot プロンプトが表示された後で show controller fia コマンドを実行します。

注: 上記のように、Cisco IOSソフトウェアがこのエラーを処理することができない場合、execute-on slot <slot #> show controllers fiaコマンドは失敗するので使用すべきではありません。

  • 複数の LC で grant エラーが発生する場合:

    1. CSC を交換します(交換する CSC については、次の注を参照してください)。

    2. バックプレーンを交換します。

  • 1 枚の LC で grant エラーが発生する場合:

    1. LC を交換します。

    2. CSC を交換します(交換する CSC については、次の注を参照してください)。

    3. バックプレーンを交換します。

注: 複数のラインカードがアクセス許可パリティを報告するか、または要求エラーおよびボックスがまだ機能すれば、CSC スイッチオーバは行われました。 障害のある CSC は、現在のバックアップ CSC です(show controller fia の出力で「Master Scheduler」としてリストされる CSC ではありません)。 「From Fabric FIA Errors」または「To Fabric FIA Errors」の見出しの横に「Halted」が表示されている場合、またはルータがトラフィックを転送しなくなっている場合には、CSC スイッチオーバーは発生しておらず、障害のある CSC は「Master Scheduler」としてリストされている CSC になります。 デフォルトでは、スロット 17 の CSC がプライマリで、スロット 16 の CSC がバックアップです。

Software Bug CSCdw10748(登録ユーザのみ)に対する修正が行われていない Cisco IOS ソフトウェア リリースが実行されているルータでは、grant parity エラーによってシステム レベルの障害が起きる場合があります。 CSCdw10748 に対する修正が行われていれば、冗長 CSC を搭載したルータでは、このハードウェア障害が発生した場合でもシステム レベルの障害は発生しません。 バックアップ CSC(搭載されている場合)へのフェールオーバーが実行されます。

CSCdw10748 に対する修正は、Cisco IOS ソフトウェア リリース 12.0(17)ST4、12.0(21)S、12.0(21)ST、12.0(19)ST02、12.0(19)S02、12.0(17)S04、12.0(18)S04、および 12.0(16)S07 で実装されています。

その他のエラー

その他に、発生頻度は低いものの、show controllers fia コマンドの出力に表示されるエラーがあります。

From Fabric FIA エラー

  • First In First Out(FIFO)エラー: 冗長データ オーバーフロー エラー。 このエラーは、バック プレッシャが失敗した場合、つまり From Fab によってバック プレッシャが実行されても Scheduler Control ASIC(SCA)によってさらに多くのデータが与えられ続けた場合に発生します。 この問題は、Clock Scheduler Card(CSC; クロック スケジューラ カード)に関連している可能性があります。 カードを再置する試み; それがはたらかない場合、それを交換することを試みて下さい。

  • シリアル リンク エラー: この問題は、From Fab FIA と、いずれかの Switch Fabric Card(SFC; スイッチ ファブリック カード)または Clock Scheduler Card(CSC; クロック スケジューラ カード)との間の同期が失われた場合に発生します(このエラーはカードが引き抜かれた状態では発生しません)。 FIAには、一定のセル期間だけ待機してからFIAを停止させるメカニズムが組み込まれています。 カードごとに1つのlossカウンタがあります。 すべてのGRP/LCについて収集した情報に基づいて、どの部分に障害があるかを特定できるはずです。

To Fabric FIA Errors

  • FIFO エラー

    • uni FIFO overflow - Buffer Management ASIC(BMA)/Cisco Cell Segmentation and Reassembly(CSAR)と FIA 間の問題によって、ユニキャスト FIFO オーバーフローが発生しました。

    • uni FIFO underflow - SCA が実際には FIA からの要求を受け取っていないにもかかわらず許可を発行したことにより、ユニキャスト FIFO アンダーフローが発生しました。

    FIFO エラーの場合、ライン カードまたは CSC のどちらに障害があるかを判別するのは困難です。 多数のカードにエラーが表示される場合は、CSC に問題があると考えられます。

  • ファブリック エラー: sca not pre : マスター SCA(Scheduler Control ASIC)が動作していません。 このエラーへの対処としては、何もせず、上位レイヤが問題を検出するまで待ちます。 このレベルで冗長 CSC への切り替えが自動的に行われない理由は、2 つの SCA が同期されているかどうかがわからないためです。 最初の電源投入後に CSC カードが取り付けられた場合、SCA チップの同期は行われません。 Fabric Interface ASIC(FIA; ファブリック インターフェイス ASIC)は、Gigabit Route Processor(GRP; ギガビット ルート プロセッサ)と Line Card(LC; ラインカード)の両方に存在します。 FIA は GRP/LC とスイッチ ファブリック カード(CSC/SFC)間のインターフェイスを提供していますが、Scheduler Control ASIC(SCA)は CSC にしか組み込まれていません。 SCA はライン カードからの送信要求を処理し、ファブリックにアクセスするための許可を発行します。

    または

    %FIA-3-PARITYERR: To Fabric parity error was detected.
    %FIA-3-HALT: To Fabric Request parity error interrupt = 0x4

    show controllers fia コマンドの出力が使用することができます複数のラインカードがこれらのエラーを報告するかどうか、そして判別するのに CSC スイッチオーバが起こったら。 この出力が特定のラインカードから表示されるため、型付加スロット: 、LC スロット プロンプトが現われた後 show controller fia コマンドを実行すれば。

  • BMA/CSARハンドシェーク エラー: この問題の原因を示すパリティ エラーが同時に発生しているはずです。

  • ソフトウェア要求エラー: FIA に発生するその他のエラーで、FIA を停止させたり割り込みを引き起こしたりしないものがあります。 これらのエラーは 1 秒ごとにポーリングされてカウントされます。 To Fabric 側では、これらのエラーはソフトウェア要求エラーです。 次のエラーが検出されます。

    • multi req - マルチキャスト要求に単一の宛先が指定されています。 FIA はこのセルを宛先に送信します。 Bug CSCdw05067(show controller fia の出力で、マルチキャストで実行される ATM LC に対して複数の要求が表示される)に注意してください。 ATM Engine 0(1xOC12 および 4x0C3)ラインカードによって、分散型マルチキャスト トラフィックを処理するライン カードでの show controller fia コマンドの出力に「multi request」エラーが記録される場合があります。 単一の宛先ライン カードだけに分散スイッチングされるマルチキャスト パケットごとに、このエラーが発生します。 この現象は純粋に表面的なものであり、ドロップは発生していません。 回避するには、分散型マルチキャスト スイッチングをディセーブルにします。

    • uni req - ユニキャスト要求に複数の宛先が指定されています。 FIA はこのセルをドロップします。

    • empty DST req - 宛先が空白の要求。 FIA はこのセルをドロップします。

メンテナンス バス(MBUS)のトラブルシューティング

初期ブートアップの際、プライマリ GRP では、ラインカードやスイッチ カードにある MBUS モジュールに対してカードに電源を入れるように、MBUS を使用して指示します。 その後、ブートストラップのイメージが MBUS 経由でラインカードにダウンロードされます。 MBUS は、リビジョン番号、環境情報、および一般的なメンテナンス情報の収集にも使用されます。 さらに、GRP は MBUS 上で冗長メッセージを交換し、それによって GRP 調停の結果が報告されます。

次のメッセージは問題のないもので、ルータが正常に動作しているときに表示されます。 このようなメッセージが表示される場合、措置は不要です。

%MBUS-6-GRP_STATUS: GRP in Slot 0 Mode = MBUS Secondary

または

%MBUS-6-FIA_CONFIG: Switch Cards 0x1F (bit mask); Primary Clock CSC_1

メッセージが問題のないものであるかどうか、対処が必要かどうかを判断するには、Error Message Decoder(登録ユーザのみ)ツールを使用してください。

次のような「upgrade warning」メッセージが表示される場合:

%MBUS-0-DOWNREV: Fabric Downloader in slot 2; use 
"upgrade fabric-downloader" command to update the image

ライン カードのファブリック ダウンローダのバージョンが、プライマリ GRP で現在実行されている Cisco IOS ソフトウェア リリースのバージョンと合致しているかどうかを確認してください。 MBUS エージェント RAM、ファブリック ダウンローダなどを同期させるには、service upgrade all を設定し、設定を保存し、ルータをリロードします。 リロードだけでは不十分な場合もありますが、電源のオフ/オンによって解消します。 Cisco IOS ソフトウェア リリースのサポートに十分な量のルート メモリが、ライン カードに搭載されていることを確認してください。

詳細については、『Cisco 12000 シリーズ ルータのラインカード ファームウェアのアップグレード』を参照してください。

MBUS およびいくつかの MBUS 関係のエラーメッセージの目的についてのより多くの説明に関しては、Cisco 12000 シリーズ インターネット ルータ アーキテクチャを参照して下さい: メンテナンスバス、電源 および ブロアーおよびアラーム カード

電源装置およびブロワーのトラブルシューティング

Cisco 12000 シリーズ ルータは、AC 電源、DC 電源のどちらの構成でも使用できます。 電源装置はいずれもロード シェアリングおよびホットスワップ対応です。

実際には低電圧ではないにもかかわらず、低電圧が報告されるソフトウェア バグがあります。 Cisco IOS ソフトウェア リリース イメージを実行することを忘れないでいて下さい一方フィックスされたすべての既知 電圧関係のソフトウェアバグを追い払ってダウンロード ソフトウェア エリアで利用可能の。

Cisco 12000 シリーズ インターネット ルータ アーキテクチャでシャーシの各種タイプへのいくつかの興味深い リンクを見つけることができます: メンテナンスバス、電源 および ブロアーおよびアラーム カード

トラブルシューティング:アラーム カード

12000 シャーシのタイプごとに、異なるタイプのアラーム カードがあります。 Cisco 12008 および 12016/12416 では、アラーム カードによって LC に電源が供給されるため、少なくとも 1 枚のアラーム カードを装着してください。 12008 はアラーム カードを 1 枚必要とします。これはアラーム カードが card scheduler and clock(CSC; クロック スケジューラ カード)に組み込まれているためです。 12016 と 12416 には、アラーム カード用のスロットが 2 つあります(冗長構成用)。 2 つのアラーム カードには、12016 の DC 電源モジュールのようなセグメント化されたサービス ゾーンはありません。

12404 では、統合スイッチ ファブリック カードをサポートしています。このカードでは、スイッチ ファブリック、アラーム、クロックとスケジュール機能が 1 枚のボードに納められています。

Cisco 12000 シリーズ インターネット ルータでシャーシの各種タイプへのいくつかの興味深い リンクを見つけることができます: アラーム カード

トラブルシューティング:ラインカード

Cisco 12000 シリーズ インターネット ルータ ラインカード障害 資料のためのハードウェア トラブル シューティングはラインカード障害を識別し、 トラブルシューティング するためにステップを説明します。 Cisco 12000 シリーズ インターネットルータでのラインカード クラッシュのトラブルシューティングはラインカード クラッシュにトラブルシューティング情報を提供します。

トラブルシューティング:パリティ エラー メッセージ

「Cisco 12000 シリーズ インターネット ルータのパリティ エラーのフォールト ツリー」では、Cisco 12000 シリーズ インターネット ルータでさまざまなパリティ エラー メッセージが発生した際のトラブルシューティングの手順や、問題のある部分やコンポーネントを切り離すための手順について説明されています。

TAC のサービスリクエストをオープンする場合に収集すべき情報

必要とし、上記のトラブルシューティング の 手順に従った後更にアシスタンスを Cisco TAC のサービス リクエスト登録ユーザのみ)を開きたいと思う場合 Cisco 12000 シリーズ インターネット ルータのハードウェア上の問題のトラブルシューティングための次の情報を含むこと確実でであって下さい:
  • 実施したトラブルシューティング ステップと各ステップを実施した際のブート シーケンスを示す show log の出力とコンソールのキャプチャ
  • トラブルシューティングのログ
  • show technical-support コマンドによる出力
収集したデータは、圧縮しないプレーンなテキスト形式(.txt)でサービス リクエストに添付してください。 Service Request Tool登録ユーザのみ)を使用してそれのアップロードによって情報をケースに添付できます。 Service Request Tool にアクセスできない場合は、情報を電子メールの添付ファイルとし、メッセージの件名にサービスリクエスト番号を付けて attach@cisco.com 宛てに送信してください。これにより、サービスリクエストに関連する情報が添付されます。

注: 必要でない限り、上記の情報を収集する前にルータを手作業でリロードしたり、電源のオフ/オンを行わないようにしてください。問題の原因の判断に必要な、重要な情報が失われます。

関連するシスコ サポート コミュニティ ディスカッション

シスコ サポート コミュニティは、どなたでも投稿や回答ができる情報交換スペースです。


関連情報


Document ID: 22281