ルータ : Cisco 12000 シリーズ ルータ

Cisco 12000 シリーズ インターネット ルータのハードウェアのトラブルシューティング

2003 年 5 月 24 日 - ライター翻訳版
その他のバージョン: PDFpdf | 機械翻訳版 (2013 年 8 月 21 日) | 英語版 (2008 年 1 月 15 日) | フィードバック

目次

概要
はじめに
     表記法
     前提条件
     使用するコンポーネント
     ハードウェアとソフトウェアの互換性とメモリの要件
Cisco 12000 のコンポーネント
問題の特定
     情報の収集
     誤解を招きやすい症状
トラブルシューティング ステップ
     スイッチ ファブリック(CSC および SFC)のトラブルシューティング
     メンテナンス バス(MBUS)のトラブルシューティング
     電源モジュールとブロアーのトラブルシューティング
     アラーム カードのトラブルシューティング
     パリティ エラー メッセージのトラブルシューティング
TAC をオープンする場合の情報の収集
関連するシスコ サポート コミュニティ ディスカッション
関連情報

概要

実際は正常に機能するハードウェアを交換することで、貴重な時間とリソースが無駄になることがあります。 この文書では、Cisco 12000 シリーズ インターネット ルータのハードウェアに関する一般的な問題のトラブルシューティングに役立つ情報と、故障がハードウェアに関するものかどうかを識別するための手がかりとなる情報を提供します。

注: ソフトウェアに関連する問題は、ハードウェアの問題と間違えられやすいもの以外はこの文書では対象としていません。

注: また、この文書では、Cisco 12000 シリーズ line card(LC; ライン カード)に関するハードウェアのトラブルシューティングは対象としていません。 「Cisco 12000 シリーズ インターネット ルータ ラインカード障害のハードウェア トラブルシューティング」では、ラインカードに関するハードウェアの問題のトラブルシューティング手順と、ハードウェアの障害と誤解されることのある問題を識別する手順について、詳細に説明しています。

はじめに

表記法

文書表記の詳細については、「シスコ テクニカル ティップスの表記法」を参照してください。

前提条件

この文書の読者は次の項目に関する知識が必要です。

発生した問題がハードウェアの障害に関連していると思われる場合には、この障害の原因を明らかにするのに、この文書が役立ちます。

使用するコンポーネント

この文書の情報は、次のソフトウェアとハードウェアのバージョンに基づいています。

  • すべての Cisco 12000 シリーズ インターネット ルータ。12008、12012、12016、12404、12406、12410、および 12416 など。

  • Cisco 12000 シリーズ インターネット ルータをサポートするすべての Cisco IOS(R) ソフトウェア バージョン。

この文書の情報は、特定のラボ環境にある装置に基づいて作成されています。 また、この文書で使用するデバイスは、すべて初期(デフォルト)の設定で起動しています。 実稼動中のネットワークで作業をしている場合、実際にコマンドを使用する前に、その潜在的な影響について理解しておく必要があります。

ハードウェアとソフトウェアの互換性とメモリの要件

新しいラインカードやモジュールを取り付けたり、Cisco IOS ソフトウェア イメージをインストールする場合には、ルータに十分なメモリがあることや、そのハードウェアやソフトウェアと使用する機能との間に互換性があることを確認する必要があります。

ハードウェアとソフトウェアの互換性やメモリの要件についてチェックするには、次の手順を実行することをお勧めします。

  1. 使用しているネットワーク デバイス用のソフトウェアを選択するには、Software Advisor登録ユーザのみ)ツールを使用します。

    ヒント:

    • ハードウェアに対するソフトウェアのサポート登録ユーザのみ)の項は、ルータに取り付けるモジュールやカードが、Cisco IOS ソフトウェアのバージョンでサポートされているかどうかを確認するのに役立ちます。

    • 「機能に対するソフトウェアのサポート」(登録ユーザのみ)の項では、実装したい機能のタイプを選ぶことで、必要な Cisco IOS ソフトウェア イメージを判別できます。

  2. Cisco IOS ソフトウェアまたは Cisco IOS ソフトウェア イメージのダウンロードに必要な最低限のメモリ量(RAM およびフラッシュ)をチェックするには、Download Software Area登録ユーザのみ)を使用してください。 ルータに取り付けるメモリの量(RAM およびフラッシュ)を決めるには、「Cisco IOS ソフトウェア リリースの選択方法」を参照してください。

    ヒント:

    • ルータ上で現在使用しているバージョンと同じ機能を維持したいものの、使用している機能セットが分からない場合は、使用しているシスコのデバイスから show version コマンドを入力し、これを Output Interpreter ツールにペーストしてください。 を使用すると、潜在的な問題と修正方法を表示できます。 を使用するには、登録ユーザとしてログインし、JavaScript を有効にしている必要があります。 特に最新のソフトウェア機能を使用しようとする場合には、機能サポートについて確認することが重要です。

    • Cisco IOS ソフトウェア イメージを新しいバージョンまたは機能セットにアップグレードする必要がある場合、詳細については「Cisco IOS ソフトウェア リリースの選択方法」を参照してください。

  3. Cisco IOS ソフトウェアのアップグレードが必要と判断された場合には、Cisco 12000 シリーズ ルータに関する「ソフトウェア インストレーションおよびアップグレード手順」に従ってください。

    ヒント: Cisco 12000 シリーズ ルータが ROMmon(rommon # > prompt)で停止した場合の復旧方法については、「Cisco 12000 の ROMmon 回復手順」を参照してください。

Cisco 12000 のコンポーネント

Cisco 12000 シリーズのインターネット ルータのシャーシを構成するコンポーネントは次のとおりです。

  • シャーシ

  • スイッチ ファブリック カード(SFC)

  • クロック スケジューラ カード(CSC)

  • メンテナンス バス(MBUS)

  • 電源モジュール

  • ブロワー : ファン アセンブリ

  • アラーム カード

シャーシ自体には電子式のコンポーネントは装備されていないため、バックプレーン コネクタの一部が曲がったり、破損したりしない限り、シャーシがハードウェア関連の問題の原因となることはほとんどありません。 電源モジュール、SFC、CSC、アラーム カード、およびファン アセンブリにはすべて電子式コンポーネントが組み込まれているため、ハードウェア上の問題が発生する可能性があります。 一般に、これらのコンポーネントでハードウェア上の問題が発生すると、エラー メッセージが出力されるか、またはルータの機能に障害が起きます。 これらのすべてのコンポーネントに関する詳細な説明と、相互運用の仕組みについては、「Cisco 12000 シリーズ インターネット ルータのアーキテクチャ」を参照してください。

問題の特定

次の説明を読み、トラブルシューティング手順に従うと、現在起きているルータの問題がハードウェアに関連するものかどうかを判別できます。

情報の収集

最初に行う必要があるのは、ルータのクラッシュの原因、または表示されているコンソール エラーの原因を明らかにすることです。 故障している箇所を調べるには、次のコマンドによる出力を収集することが不可欠です。

  • show context summary

  • show logging

これらの特別な show コマンドの他、次の情報も収集する必要があります。

  • コンソール ログと syslog 情報:複数の症状が見られる場合に根本の原因を判別するには、これらが必須の情報になります。 ルータが syslog サーバにログを送信するよう設定されていれば、問題が発生したときの情報を確認できる可能性があります。 コンソール ログの場合は、ルータのコンソール ポートに直接接続して logging enabled を使用するのが最もよい方法です。

  • show technical-supportshow technical-support コマンドは、show versionshow running-configshow stacks などの複数のコマンドを 1 つにまとめたものです。 通常、ルータで問題が発生したときには、シスコ Technical Assistance Center(TAC)エンジニアからこの情報の提供を求められます。 ルータのリロードまたは電源のオフ/オンを行うと、問題に関する情報がすべて失われてしまうため、show technical-support は必ずリロードまたは電源のオフ/オンを行う前に実行してください。

誤解を招きやすい症状

実際にはハードウェアの問題ではないにもかかわらず、ハードウェアの問題と誤解されることがある問題がいくつかあります。 よく誤解されるのが、ルータが応答を停止する、つまり「ハング」した場合です。 もう 1 つは、新しいハードウェアをインストールした後に起きる障害です。 シャーシのコンポーネントによってこれらの症状が起きるということは、まずありません。 次の表に、誤解を招きやすい問題についての症状、説明、およびトラブルシューティング ステップを示します。

症状

説明/トラブルシューティング

Cisco 12000 が通常動作中にハングする

この症状は、一般にソフトウェアの問題が原因で発生しますが、ハードウェアが原因の場合もあります。 この問題については、「トラブルシューティング:ルータがハングする場合」を参照してください。

新しいラインカードが認識されない

Software Advisor ツール(登録ユーザのみ)を使用して、現在の Cisco IOS ソフトウェア バージョンで新しいカードがサポートされているかどうかを確認してください。 LC がサポートされている場合は、service upgrade all を設定し、copy run start コマンドで設定を保存して、ルータの電源をオフ/オンします。 リロードでは不十分なときもありますが、このときは電源のオフ/オンによって解決します。 現在使用中の Cisco IOS ソフトウェア バージョンで新しいカードがサポートされていない場合は、ラインカードに十分なルート メモリがあることを確認してから、Cisco IOS ソフトウェアのバージョンをアップグレードします。 リリース 12.0(21)S の場合、特に Border Gateway Protocol(BGP; ボーダーゲートウェイ プロトコル)で多数のピアと多数のルートが設定されている場合は、256 MB のルート メモリが必要です。

CPU 使用率が非常に高い

この症状については、ハードウェアの問題が原因である場合もありますが、それ以上に、ルータの設定に誤りがあるか、またはネットワーク上の何かが問題を引き起こしている可能性があります。 この症状をトラブルシューティングするには、「トラブルシューティング:Cisco ルータで CPU 高使用率が発生した場合」を参照してください。

ギガビット ルート プロセッサ(GRP)でメモリ割り当てエラーが発生する

ハードウェアの問題が原因でメモリ割り当てエラーが起こることはほとんどありません。 メモリ割り当てエラーに関するトラブルシューティングのヒントは、「トラブルシューティング:メモリの問題」に記載されています。

show interfaces コマンドの出力で、入力廃棄の数が増えている

この問題が、ルータのハードウェアが原因で起きることはありません。 この問題のトラブルシューティングについては、「トラブルシューティング:Cisco 12000 シリーズ インターネット ルータでの入力廃棄」を参照してください。

show interfaces コマンドの出力で、無視されるメッセージの数が増えている

いずれかのラインカードで過負荷が起きていると思われます。 手順は「トラブルシューティング:Cisco 12000 シリーズ インターネット ルータでの ignored エラーとメモリ不足による廃棄」に詳細に記載されています。

GRP に対して転送情報ベース(FIB)のエラー メッセージが表示される

エラーメッセージデコーダ登録ユーザのみ)ツールを使用して、このエラー メッセージの意味に関する情報を参照してください。 ラインカードまたはスイッチ ファブリック カード(SFC または CSC)のハードウェアの問題を指している場合があります。それ以外の場合は、Cisco IOS ソフトウェアのバグ、またはルータの他の部品のハードウェアの問題を指しています。 FIB および CEF に関連するメッセージの一部が「トラブルシューティング:CEF 関連のエラー メッセージ」で説明されています。

プロセス間通信(IPC)関連のメッセージが GRP に対して表示される

エラーメッセージデコーダ登録ユーザのみ)ツールを使用して、このエラー メッセージの意味に関する情報を参照してください。 ラインカードまたはスイッチ ファブリック カード(SFC または CSC)のハードウェアの問題を指している場合があります。それ以外の場合は、Cisco IOS ソフトウェアのバグ、またはルータの他の部品のハードウェアの問題を指しています。 IPC 関連のメッセージの一部は、「トラブルシューティング:Cisco 12000、10000、7600、および 7500 シリーズ ルータでの IPC-3-NOBUFF メッセージ」で説明されています。

GRP に対して次のエラー メッセージが表示される

%GRP-3-FABRIC_UNI: Unicast send timed out (1)
   %GRP-3-COREDUMP: Core dump incident on slot 1, 
   error: Fabric ping failure

ラインカードまたはセカンダリ GRP で、スイッチ ファブリックにあるプライマリ GRP からのファブリック ping 要求への応答ができない場合には、ファブリック ping 障害が発生します。 このような障害は、調査を要する症状です。 この問題の詳細は、「トラブルシューティング:Cisco 12000 シリーズ インターネット ルータにおけるファブリック Ping のタイムアウトおよび障害」で説明されています。

GRP に対して次のエラー メッセージが表示される

%GRP-3-UCODEFAIL: Download failed to slot 5
   

ラインカードにダウンロードされたイメージが、ラインカードによって拒否されています。microcode reload 設定コマンドを使用して、マイクロコードをリロードしてみてください。 引き続きエラー メッセージが表示される場合は、「Cisco 12000 シリーズ インターネット ルータのラインカード ファームウェアのアップグレード」で説明されている upgrade all slot コマンドを使用して、MBUS エージェント ROM、MBUS エージェント RAM、およびファブリック ダウンローダをアップグレードしてみてください。 また、この表にある「新しいラインカードが認識されない」という症状も参考にしてください。

  

トラブルシューティング ステップ

スイッチ ファブリック(CSC および SFC)のトラブルシューティング

GRP とラインカードは、クロスバー スイッチ ファブリックを経由して接続します。クロスバー スイッチ ファブリックは、ほとんどのカード間通信用に高速の物理パスを提供するものです。 スイッチ ファブリック上で GRP とラインカードの間を通過するメッセージには、ルートおよび受信されている実際のパケット、フォワーディング情報、トラフィック統計、ほとんどの管理情報と制御情報が含まれます。 したがって、このパスが正常に運用されていることは、GRP にとって非常に大切です。

スイッチ ファブリックの症状

スイッチ ファブリックについては、ログに次のようなファブリックに関連するエラー メッセージが出力されていないかどうかを常に確認する必要があります。

%FABRIC-3-CRC: Switch card 18

または

%FABRIC-3-PARITYERR: To Fabric parity error was detected. Grant parity error Data = 0x2.
   SLOT 1:%FABRIC-3-PARITYERR: To Fabric parity error was detected. 
   Grant parity error Data = 0x1
   

次のメッセージは、スイッチ ファブリックに関連するハードウェアの問題である場合も、そうでない場合もあります。

05:21:11: %GRP-3-FABRIC_UNI: Unicast send timed out (2)
   05:21:16: %GRP-3-FABRIC_UNI: Unicast send timed out (2)
   

このような障害は、調査を要する症状です。 この問題の詳細は、「トラブルシューティング:Cisco 12000 シリーズ インターネット ルータにおけるファブリック Ping のタイムアウトおよび障害」で説明されています。

スイッチ ファブリックのトラブル シューティング

スイッチ ファブリックの問題が疑われる場合は、次のステップに従ってください。

  1. データを収集します。

    LC に接続する場合には、attach コマンドを使用して、MBUS 上でデータを収集する必要があります。 execute-on コマンドは、スイッチ ファブリックで行われている Inter-Process Communication(IPC; プロセス間通信)によって動作が異なります。 IPC に関する問題(ファブリックの問題、ソフトウェアのバグなど)が起きている場合には、スイッチ ファブリックを経由してリモートで実行されているコマンドはタイムアウトになることがあります。 通常、多量の出力を行うコマンドの場合は、LC に割り当てて、コマンドを実行することを推奨します。 attach <slot #> コマンドは、常に MBUS 上で実行されます。

    • show controllers fia(GRP 上)

    • attach <slot #>show controllers fia の順に実行し、exit と入力(各 LC とセカンダリ GRP に対して繰り返す)

    • show controllers clock(GRP 上)

    • show log(ホットスワップ(OIR)イベントを探し、CSC マスターの変更を明らかにする。ファブリック関連のエラーを探す)

    • show log summary(ファブリック関連のエラーを探す)

    • show log slot <slot #>

  2. データを分析します。

    ファブリックの問題は、次のコンポーネントのいずれかの障害が原因で起きることがあります。

    • コントロール プレーン - GRP

    • データ プレーン

    • Tofab LC のハードウェア

    • バックプレーン

    • CSC/SFC

    • Frfab LC のハードウェア

    ファブリック エラーのトラブルシューティングを行う場合には、最初に、エラーを報告しているコンポーネントに関するパターンを探します。 たとえば、すべての GRP と LC からの show controllers fia の出力を組み合わせて、パターンがあるかどうかを調べます。

    注: この文書では、LC という用語は、あらゆる LC または GRP を指しています。

CRC の数の増加

show controllers fia コマンドの出力で crc16 が表示される場合は、この数が増えているかどうかをチェックすることが重要です。 また、プライマリ GRP と他の GRP や LC から得たデータを関連付けることは非常に重要です。 ある LC、または、あるスイッチ ファブリック カード(CSC または SFC およびその両方)が OIR に設定されている場合、ファブリック エラー メッセージと crc16 が発生する場合があります。 ただし、その後に、この数が増えることはありません。 数が増えている場合は、ハードウェアに問題があるため、一部のパーツを交換する必要があります。

次の出力では、プライマリ GRP とスロット 2 にある LC のステータスが分かります。

Router#show controllers fia 
   Fabric configuration: Full bandwidth, redundant fabric
   Master Scheduler: Slot 17  Backup Scheduler: Slot 16
   From Fabric FIA Errors
   -----------------------
   redund fifo parity 0    redund overflow 0      cell drops 0         
   crc32 lkup parity  0    cell parity     0      crc32      0         
   Switch cards present    0x001F    Slots  16 17 18 19 20
   Switch cards monitored  0x001F    Slots  16 17 18 19 20
   Slot:     16         17         18         19         20
   Name:    csc0       csc1       sfc0       sfc1       sfc2
          --------   --------   --------   --------   --------
   los    0          0          0          0          0          
   state  Off        Off        Off        Off        Off       
   crc16  0          0          0          1345       0
   To Fabric FIA Errors
   -----------------------
   sca not pres 0          req error     0          uni FIFO overflow 0         
   grant parity 0          multi req     0          uni FIFO undrflow 0         
   cntrl parity 0          uni req       0          crc32 lkup parity 0         
   multi FIFO   0          empty dst req 0          handshake error   0         
   cell parity  0
   Router#attach 2
   Entering Console for 4 port ATM Over SONET OC-3c/STM-1 in Slot: 2
   Type "exit" to end this session
   Press RETURN to get started!
   LC-Slot2>
   LC-Slot2>enable
   LC-Slot2#show controllers fia
   From Fabric FIA Errors
   -----------------------
   redund FIFO parity 0          redund overflow 0          cell drops 0         
   crc32 lkup parity  0          cell parity     0          crc32      0         
   Switch cards present    0x001F    Slots  16 17 18 19 20 
   Switch cards monitored  0x001F    Slots  16 17 18 19 20 
   Slot:     16         17         18         19         20
   Name:    csc0       csc1       sfc0       sfc1       sfc2
          --------   --------   --------   --------   --------
   Los    0          0          0          0          0          
   state  Off        Off        Off        Off        Off       
   crc16  0          0          0          1345       0
   To Fabric FIA Errors
   -----------------------
   sca not pres 0          req error     0          uni fifo overflow 0         
   grant parity 0          multi req     0          uni fifo undrflow 0         
   cntrl parity 0          uni req       0          crc32 lkup parity 0         
   multi fifo   0          empty DST req 0          handshake error   0         
   cell parity  0
   LC-Slot2#exit
   Disconnecting from slot 2.
   Connection Duration: 00:00:21
   Router#
   ... 
   
   

すべての show コマンドを解析すると、次のような表を作成できます。

hwts_12000_22281a.gif

この表では、1 枚以上のラインカードから、SFC1 に起因するエラーが報告されていることが示されています。 したがって、最初のステップはこの SFC の交換です。 一般的な障害のパターンと、推奨する対応策は次のとおりです(問題が解消するまで、一度に 1 ステップずつ実行してください)。

ヒント: 交換が推奨される場合には、まず最初に、そのカードが正しく取り付けられていることを確認してください(以下参照)。 該当するカードを必ず取り付け直し、正しく取り付けられているかを確認してください。 ブレードを取り付け直した後でも CRC の数が増え続ける場合は、その部品を交換します。

  • 同じファブリック カードに起因する Frfab エラーが複数の LC で起きる場合:

    1. エラーが発生しているスロットにあるファブリック カードを交換します。

    2. すべてのファブリック カードを交換します。

    3. バックプレーンを交換します。

  • 複数のファブリック カードに起因する Frfab エラーが 1 枚の LC で起きる場合:

    1. LC を交換します。

    2. エラーが増え続ける場合は、現在のマスター CSC を交換します。

    3. エラーが増加せず、現在のマスターが CSC0 の場合は、CSC1 を交換します。

スイッチ ファブリック カードの取り付け

12016 および 12416 のスイッチ ファブリック カードの挿入は容易ではなく、多少力強く差し込む必要がある場合もあります。 正しく挿入されていない CSC があると、次のようなエラーメッセージが表示されます。

%MBUS-0-NOCSC: Must have at least 1 CSC card in slot 16 or 17 
   %MBUS-0-FABINIT: Failed to initialize switch fabric infrastructure
   

1/4 帯域幅構成に必要なだけの CSC および SFC しか挿入されていない場合も、このようなエラーメッセージが表示されることがあります。 この場合、エンジン 1 以上のエンジンをベースとする LC はブートしません。

CSC または SFC で、カードが正しく取り付けられているかどうかを確認するためには、4 つのライトが「点灯」していることを確認する方法があります。 点灯していない場合は、当該のカードが正しく取り付けられていないことになります。

ファブリックおよび LC がブートしない問題に対処する場合、必要な CSC および SFC がすべて正しく挿入され、電源がオンになっているかどうかを確認する必要があります。 たとえば、フル帯域幅の冗長システムを実現するには、12016 では 3 枚の SFC と 2 枚の CSC が必要です。 フル帯域幅の非冗長システムを実現するには、3 枚の SFC と 1 枚の CSC が必要です。

show version コマンドおよび show controllers fia コマンドの出力から、現在ボックス内で動作しているハードウェア構成を確認できます。

Router#show version 
   Cisco Internetwork Operating System Software 
   IOS (tm) GS Software (GSR-P-M), Experimental Version 12.0(20010505:112551)
   Copyright (c) 1986-2001 by cisco Systems, Inc. 
   Compiled Mon 14-May-01 19:25 by tmcclure 
   Image text-base: 0x60010950, data-base: 0x61BE6000
   
   ROM: System Bootstrap, Version 11.2(17)GS2, [htseng 180] 
   EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) 
   BOOTFLASH: GS Software (GSR-BOOT-M), Version 12.0(15.6)S, 
   EARLY DEPLOYMENT MAINTENANCE INTERIM SOFTWARE
   
   Router uptime is 17 hours, 53 minutes 
   System returned to ROM by reload at 23:59:40 MET Mon Jul 2 2001 
   System restarted at 00:01:30 MET Tue Jul 3 2001 
   System image file is "tftp://172.17.247.195/gsr-p-mz.15S2plus-FT-14-May-2001"
   
   cisco 12016/GRP (R5000) processor (revision 0x01) with 262144K bytes of memory. 
   R5000 CPU at 200Mhz, Implementation 35, Rev 2.1, 512KB L2 Cache 
   Last reset from power-on
   
   2 Route Processor Cards 
   1 Clock Scheduler Card 
   3 Switch Fabric Cards 
   1 8-port OC3 POS controller (8 POs). 
   1 OC12 POS controller (1 POs). 
   1 OC48 POS E.D. controller (1 POs). 
 
   7 OC48 POS controllers (7 POs). 
   1 Ethernet/IEEE 802.3 interface(s) 
   17 Packet over SONET network interface(s) 
   507K bytes of non-volatile configuration memory.
   
   20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K). 
   8192K bytes of Flash internal SIMM (Sector size 256K).
   ...
   Router#show controller fia 
   Fabric configuration: Full bandwidth nonredundant
   Master Scheduler: Slot 17
   ...
   

詳細については、「Cisco 12000 シリーズ インターネット ルータ:スイッチ ファブリック」を参照してください。

grant parity エラー と request エラー

  

次のようなエラーが表示される場合があります。

  • show log コマンドのコンソール ログまたは出力を次に示します。

    %FABRIC-3-PARITYERR: To Fabric parity error was detected. 
       Grant parity error Data = 0x2.
       SLOT 1:%FABRIC-3-PARITYERR: To Fabric parity error was detected. 
       Grant parity error Data = 0x1
       
  • show controllers fia コマンドの出力は次のとおりです。

    Router#show controllers fia
       Fabric configuration: Full bandwidth, redundant fabric
       Master Scheduler: Slot 17     Backup Scheduler: Slot 16
       
       !-- この箇所で、マスター CSC である CSC が分かります。 
       デフォルトでは、スロット 17 の CSC1 がマスターです。
        
       
       From Fabric FIA Errors
       -----------------------
       redund FIFO parity 0   redund overflow 0   cell drops 76
       
       !-- いくつかのセルがドロップしていることが分かります。
       
       
       crc32 lkup parity  0    cell parity 0   crc32 0
       Switch cards present    0x001F    Slots  16 17 18 19 20
       Switch cards monitored  0x001F    Slots  16 17 18 19 20
       Slot:     16         17         18         19         20
       Name:    csc0       csc1       sfc0       sfc1       sfc2
              --------   --------   --------   --------   --------
       Los    0          0          0          0          0
       state  Off        Off        Off        Off        Off
       crc16  876        257        876        876        876
       
       !-- crc16 もいくつかあることが分かります。
       
       
       To Fabric FIA Errors
       -----------------------
       sca not pres 0          req error     1          uni fifo overflow 0
       grant parity 1          multi req     0          uni fifo undrflow 0
       
       !-- grant parity または request  error カウンタが 0 ではありません。
       
       
       cntrl parity 0          uni req       0          crc32 lkup parity 0
       multi fifo   0          empty DST req 0          handshake error   0
       cell parity  0
       

Fabric Interface ASIC(FIA; ファブリック インターフェイス ASIC)は、Gigabit Route Processor(GRP; ギガビット ルート プロセッサ)と Line Card(LC; ラインカード)の両方に存在します。 FIA は、GRP/LC とスイッチ ファブリック カード(CSC/SFC)間のインターフェイスを提供します。これに対し、Scheduler Control ASIC(SCA)は CSC 上にのみ存在します。 SCA は、ラインカードからの送信要求を処理し、ファブリックにアクセスするための許可を発行します。

ハードウェア要求エラー

  • req error : SCA が req ライン上でパリティ エラーを検出しました

  • grant parity : FIA が grant ライン上でパリティ エラーを検出しました

show controllers fia コマンドの出力を使用して、これらのエラーが複数のラインカードから報告されているかどうか、また CSC スイッチオーバーが発生しているかどうかを調べることができます。 この出力を特定のラインカードから取得するには、attach <slot #> と入力し、LC-Slot プロンプトが表示された後で show controller fia コマンドを実行します。

注: 前述したように、execute-on slot <slot #> show controllers fia コマンドは使用しないでください。Cisco IOS ソフトウェアでこのエラーを処理できない場合は、このコマンドを正しく実行できないためです。

  • 複数の LC で grant エラーが発生する場合:

    1. CSC を交換します(交換する CSC については、次の注を参照してください)。

    2. バックプレーンを交換します。

  • 1 枚の LC で grant エラーが発生する場合:

    1. LC を交換します。

    2. CSC を交換します(交換する CSC については、次の注を参照してください)。

    3. バックプレーンを交換します。

注: 複数のライン カードで grant parity エラー、または request エラーが報告され、なおかつボックスが動作を続けている場合、CSC スイッチオーバーが発生しています。 障害のある CSC は、現在のバックアップ CSC です(show controller fia の出力で「Master Scheduler」としてリストされる CSC ではありません)。 「From Fabric FIA Errors」または「To Fabric FIA Errors」の見出しの横に「Halted」が表示されている場合、またはルータがトラフィックを転送しなくなっている場合には、CSC スイッチオーバーは発生しておらず、障害のある CSC は「Master Scheduler」としてリストされている CSC になります。 デフォルトでは、スロット 17 の CSC がプライマリで、スロット 16 の CSC がバックアップです。

Software Bug CSCdw10748登録ユーザのみ)に対する修正が行われていない Cisco IOS ソフトウェア リリースが実行されているルータでは、grant parity エラーによってシステム レベルの障害が起きる場合があります。 CSCdw10748 に対する修正が行われていれば、冗長 CSC を搭載したルータでは、このハードウェア障害が発生した場合でもシステム レベルの障害は発生しません。 バックアップ CSC(搭載されている場合)へのフェールオーバーが実行されます。

一部ツールについては、ゲスト登録のお客様にはアクセスできない場合がありますことを、ご了承ください。

CSCdw10748 に対する修正は、Cisco IOS ソフトウェア リリース 12.0(17)ST4、12.0(21)S、12.0(21)ST、12.0(19)ST02、12.0(19)S02、12.0(17)S04、12.0(18)S04、および 12.0(16)S07 で実装されています。

その他のエラー

その他に、発生頻度は低いものの、show controllers fia コマンドの出力に表示されるエラーがあります。

From Fabric FIA エラー

  • First In First Out(FIFO)エラー: 冗長データ オーバーフロー エラー。 このエラーは、バック プレッシャが失敗した場合、つまり From Fab によってバック プレッシャが実行されても Scheduler Control ASIC(SCA)によってさらに多くのデータが与えられ続けた場合に発生します。 この問題は、Clock Scheduler Card(CSC; クロック スケジューラ カード)に関連している可能性があります。 カードを再装着し、それでも動作しない場合は交換してください。

  • シリアル リンク エラー:この問題は、From Fab FIA と、いずれかの Switch Fabric Card(SFC; スイッチ ファブリック カード)または Clock Scheduler Card(CSC; クロック スケジューラ カード)との間の同期が失われた場合に発生します(このエラーはカードが引き抜かれた状態では発生しません)。 FIA には、FIA を停止する前に一定のセル期間だけ待機するメカニズムが組み込まれています。 カードごとに損失カウンタが 1 つあります。すべての GRP および LC から収集された情報を基にすれば、障害のある部分が特定できると思われます。

To Fabric FIA エラー

  • FIFO エラー

    • uni FIFO overflow : Buffer Management ASIC(BMA)/Cisco Cell Segmentation and Reassembly(CSAR)と FIA 間の問題によって、ユニキャスト FIFO オーバーフローが発生しました。

    • uni FIFO underflow : SCA が実際には FIA からの要求を受け取っていないにもかかわらず許可を発行したことにより、ユニキャスト FIFO アンダーフローが発生しました。

    FIFO エラーの場合、ライン カードまたは CSC のどちらに障害があるかを判別するのは困難です。 多数のカードにエラーが表示される場合は、CSC に問題があると考えられます。

  • ファブリック エラー: sca not pre : マスター SCA(Scheduler Control ASIC)が動作していません。 このエラーの対処は、何もせず、上位のレイヤによって問題が検出されるのを待つことです。 このレベルで冗長 CSC への切り替えが自動的に行われない理由は、2 つの SCA が同期されているかどうかがわからないためです。 最初の電源投入後に CSC カードが取り付けられた場合、SCA チップの同期は行われません。

  • BMA/CSAR ハンドシェーク エラー:この問題の原因を示すパリティ エラーが同時に発生しているはずです。

  • ソフトウェア要求エラー:FIA に発生するその他のエラーで、FIA を停止させたり割り込みを引き起こしたりしないものがあります。 これらのエラーは 1 秒ごとにポーリングされてカウントされます。 To Fabric 側では、これらのエラーはソフトウェア要求エラーです。 次のエラーが検出されます。

    • multi req : マルチキャスト要求に単一の宛先が指定されています。 FIA はこのセルを宛先に送信します。 Bug CSCdw05067(show controller fia の出力で、マルチキャストで実行される ATM LC に対して複数の要求が表示される)に注意してください。 ATM Engine 0(1xOC12 および 4x0C3)ラインカードによって、分散型マルチキャスト トラフィックを処理するライン カードでの show controller fia コマンドの出力に「multi request」エラーが記録される場合があります。 このエラーは、単一の宛先のラインカードに対してのみ分散スイッチングされるマルチキャスト パケットごとに発生します。この現象は全く表面的なものであり、ドロップは起きていません。 この問題を回避するには、分散マルチキャスト スイッチングをディセーブルにしてください。

    • uni req : ユニキャスト要求に複数の宛先が指定されています。 FIA はこのセルをドロップします。

    • empty DST req : 宛先が空白の要求。 FIA はこのセルをドロップします。

メンテナンス バス(MBUS)のトラブルシューティング

初期ブートアップの際、プライマリ GRP では、ラインカードやスイッチ カードにある MBUS モジュールに対してカードに電源を入れるように、MBUS を使用して指示します。 その後、ブートストラップのイメージが MBUS 経由でラインカードにダウンロードされます。 MBUS は、リビジョン番号、環境情報、および一般的なメンテナンス情報の収集にも使用されます。 さらに、GRP は MBUS 上で冗長メッセージを交換し、それによって GRP 調停の結果が報告されます。

次のメッセージは問題のないもので、ルータが正常に動作しているときに表示されます。 このようなメッセージが発生する場合、対処する必要はありません。

%MBUS-6-GRP_STATUS: GRP in Slot 0 Mode = MBUS Secondary
   

または

%MBUS-6-FIA_CONFIG: Switch Cards 0x1F (bit mask); Primary Clock CSC_1
   

メッセージが問題のないものであるかどうか、対処が必要かどうかを判断するには、エラーメッセージデコーダ登録ユーザのみ)ツールを使用してください。

次のような「upgrade warning」メッセージが表示される場合:

%MBUS-0-DOWNREV: Fabric Downloader in slot 2; use 
   "upgrade fabric-downloader" command to update the image
   

ライン カードのファブリック ダウンローダのバージョンが、プライマリ GRP で現在実行されている Cisco IOS ソフトウェア リリースのバージョンと合致しているかどうかを確認してください。 MBUS エージェント RAM、ファブリック ダウンローダなどの同期を行うには、service upgrade all を設定し、コンフィギュレーションを保存し、ルータをリロードします。 リロードだけでは不十分な場合もありますが、電源のオフ/オンによって解消します。 Cisco IOS ソフトウェア リリースのサポートに十分な量のルート メモリが、ラインカードに搭載されていることを確認してください。

詳細については、「Cisco 12000 シリーズ インターネット ルータのラインカード ファームウェアのアップグレード」を参照してください。

MBUS の目的と、MBUS に関連するエラー メッセージの詳細については、「Cisco 12000 シリーズ インターネット ルータ:メンテナンス BUS」(登録ユーザのみ)を参照してください。

電源モジュールとブロアーのトラブルシューティング

Cisco 12000 シリーズ ルータは、AC 構成でも DC 構成でも使用できます。 電源モジュールはすべて負荷分散型で、ホットスワップに対応しています。

実際には低電圧ではないにもかかわらず、低電圧が報告されるソフトウェア バグがあります。 現時点で修正されている既知の電源関係のソフトウェア バグを排除するために、Download Software Area登録ユーザのみ)で入手可能な最新の Cisco IOS ソフトウェア リリース イメージを使用するようにしてください。

Cisco 12000 シリーズ インターネット ルータ:電源モジュールおよびブロワー」では、シャーシ別のリンクが記載されています。

アラーム カードのトラブルシューティング

12000 シャーシのタイプごとに、異なるタイプのアラーム カードがあります。 Cisco 12008 および 12016/12416 では、アラーム カードによって LC に電源が供給されるため、少なくとも 1 枚のアラーム カードを装着してください。 12008 はアラーム カードを 1 枚必要とします。これはアラーム カードが card scheduler and clock(CSC; クロック スケジューラ カード)に組み込まれているためです。 12016 と 12416 には、アラーム カード用のスロットが 2 つあります(冗長構成用)。 2 つのアラーム カードには、12016 の DC 電源モジュールのようなセグメント化されたサービス ゾーンはありません。

12404 では、統合スイッチ ファブリック カードをサポートしています。このカードでは、スイッチ ファブリック、アラーム、クロックとスケジュール機能が 1 枚のボードに納められています。

Cisco 12000 シリーズ インターネット ルータ:アラーム カード」では、シャーシ別のリンクが記載されています。

パリティ エラー メッセージのトラブルシューティング

Cisco 12000 シリーズ インターネット ルータのパリティ エラーのフォールト ツリー」では、Cisco 12000 シリーズ インターネット ルータでさまざまなパリティ エラー メッセージが発生した際のトラブルシューティングの手順や、問題のある部分やコンポーネントを切り離すための手順について説明されています。

TAC をオープンする場合の情報の収集

上記のトラブルシューティング手順を実行した後も、依然としてサポートが必要で、Cisco TAC でケースを開く登録ユーザのみ)必要がある場合は、次のような Cisco 12000 シリーズ インターネット ルータのハードウェア問題をトラブルシューティングするための情報を必ず収集してください。

  • 実施したトラブルシューティング ステップと各ステップを実施した際のブート シーケンスを示す show log の出力とコンソールのキャプチャ

  • トラブルシューティングのログ

  • show technical-support コマンドからの出力

収集したデータは、圧縮しないプレーンなテキスト形式(.txt)でケースに添付してください。 情報をケースに添付するには、Case Query ツール登録ユーザのみ)を使用してアップロードします。 Case Query ツールにアクセスできない場合は、情報を電子メールの添付ファイルとし、メッセージの件名にケース番号を付けて attach@cisco.com 宛てに送信してください。これにより、ケースに関連情報を関連付けることができます。

注: 必要でない限り、上記の情報を収集する前にルータを手作業でリロードしたり、電源のオフ/オンを行わないようにしてください。問題の原因の判断に必要な、重要な情報が失われます。

  


関連するシスコ サポート コミュニティ ディスカッション

シスコ サポート コミュニティは、どなたでも投稿や回答ができる情報交換スペースです。


関連情報


Document ID: 22281