Cisco インターフェイスとモジュール : Cisco インターフェイス プロセッサ

トラブルシューティング:バーサタイル インターフェイス プロセッサ(VIP)のクラッシュ

2009 年 7 月 17 日 - ライター翻訳版
その他のバージョン: PDFpdf | 機械翻訳版 (2013 年 8 月 21 日) | 英語版 (2006 年 10 月 2 日) | フィードバック

Interactive: This document offers customized analysis of your Cisco device.


目次


概要

このドキュメントでは、Versatile Interface Processor(VIP)のクラッシュをトラブルシューティングするための情報を提供しています。



前提条件

要件

7500 シリーズ ルータの Field Notice に関する知識があることが推奨されます。



使用するコンポーネント

このドキュメントの情報は、次のソフトウェアとハードウェアのバージョンに基づくものです。

  • VIP1

  • VIP2-10

  • VIP2-15

  • VIP2-20

  • VIP2-40

  • VIP2-50

  • FEIP2

  • GEIP

  • GEIP+

  • VIP4-50

  • VIP4-80

  • VIP6-80

このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されたものです。このドキュメントで使用するすべてのデバイスは、クリアな(デフォルト)設定で作業を開始しています。対象のネットワークが実稼働中である場合には、どのような作業についても、その潜在的な影響について確実に理解しておく必要があります。



表記法

ドキュメント表記の詳細は、『シスコ テクニカル ティップスの表記法』を参照してください。



VIP のアーキテクチャ

VIP のクラッシュを解明するためには、まず VIP の基本アーキテクチャを理解しておくことが重要です。このセクションの図は、下記のコンポーネントを含む VIP2 の機能ブロック ダイアグラムを示しています。

  • Orion Reduced Instruction Set Computing(RISC; 縮小命令セット コンピュータ)CPU と関連回路(これには Dynamic RAM(DRAM)、L2 cache、RENO Application-Specific Integrated Circuit(ASIC; 特定用途向け集積回路)、およびブート ROM が含まれます)。

  • CyBus ASIC:VIP2 Static RAM(SRAM)と System Packet Memory(MEMD)間での CyBus あるいは CxBus を介したパケットの管理と転送を行うコンポーネント。

  • パケット メモリ ASIC:ポート アダプタと SRAM 間のパケットの移動を担当。

  • Peripheral Component Interconnect(PCI)バス:ポート アダプタと VIP2 SRAM 間のデータ パス。

  • ブリッジ:ポート アダプタの個々の PCI バスの分離を担当。

VIP のアーキテクチャを表す図

VIP のアーキテクチャを表す図

VIP2 マイクロコード(ファームウェア)は、カード固有のソフトウェア命令を提供するイメージです。VIP2 上の Programmable Read-Only Memory(PROM)デバイスにはデフォルトのマイクロコード ブート イメージが格納されており、これによって、システムは Cisco IOS(R) ソフトウェア バンドルあるいはフラッシュ メモリからのマイクロコード イメージの検索とロードができます。PROM 内のマイクロコード ブート イメージは VIP2 を初期化して、さらに VIP2 のマイクロコード イメージのダウンロードを行います。同一タイプのすべてのインターフェイスでは、Cisco IOS ソフトウェア バンドルあるいはフラッシュ メモリのいずれかから同一のマイクロコード イメージがロードされます。フラッシュ メモリには特定のインターフェイス向けの複数のマイクロコード バージョンを格納できますが、始動時にロードできるイメージは 1 つだけです。

show controllers cbus コマンドを使用すると、各インターフェイス プロセッサおよび VIP2 ごとに、現在ロードされていて稼働中のマイクロコードのバージョンが表示されます。show startup-config コマンドを使用すると、スタートアップ時にマイクロコードをロードするための現在のシステム命令が表示されます。

トラブルシューティング時には、VIP crashinfo ファイルや syslog から情報を読むための指針として、このセクションの図を使用できます。例として、VIP SRAM から読み込んだ際に不良パリティが見つかったことを示す syslog 出力を見てみましょう。

Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6    Packet Memory Read Parity error 

! -- VIP SRAM からの読み取りで不良パリティが検出されています。

Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6   PCI master address = 0460000
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x00): cfid   = 0x00011011
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x04): cfcs   = 0x02800147
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x08): cfccid = 0x06040002
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x0C): cfpmlt = 0x00010000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x18): cfsmlt = 0x00010100 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x1C): cfsis  = 0x02807020 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x20): cfmla  = 0x01F00000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x24): cfpmla = 0x0000FE00 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x3C): cfbc   = 0x00030000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x40): cfseed = 0x00000000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x44): cfstwt = 0x00000000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x48): cfswac = 0x00FFFFFF 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x4C): cfpwac = 0x00FFFFFF 
Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error

次のセクションの推奨事項にあるように、この出力にある VIP を監視して、同様のクラッシュが再発した場合には SRAM か VIP を交換する必要があります。



VIP の識別方法

show diag コマンドの出力にある EEPROM のアドレス 0x21 の内容を調べると、VIP のモデルを確認できます。各 VIP タイプに対応する値を次の表に示します。

VIP コントローラのタイプ

0x14

VIP1

VIP コントローラ

0x15

VIP2(VIP2-10、VIP2-15、VIP2-20、VIP2-40)

VIP2 コントローラ

0x1E

VIP2-50

VIP2 R5K コントローラ

0x20

FEIP2

FEIP2 コントローラ

0x21

GEIP

GEIP コントローラ

0x40

GEIP +*

GEIP+ コントローラ

0x22

VIP4-80

VIP4-80 RM7000 コントローラ

0x31

VIP4-50

VIP4-50 RM5271 コントローラ

0x4E

VIP6-80

VIP6-80 RM7000B コントローラ


注:GEIP+ は VIP4-80 をベースにしています。このドキュメントでの VIP4-80 についての詳細情報は、すべて GEIP+ にも適用できます。

次に例を示します。

Router#show diag 10 
     Slot 10: 
             Physical slot 10, ~physical slot 0x5, logical slot 10, CBus 0 
             Microcode Status 0x4 
             Master Enable, LED, WCS Loaded 
             Board is analyzed 
             Pending I/O Status: None 
             EEPROM format version 1 
             VIP2 R5K controller, HW rev 2.02, board revision D0 
             Serial number: 17090200  Part number: 73-2167-05 
             Test history: 0x00        RMA number: 00-00-00 
             Flags: cisco 7000 board; 7500 compatible 

             EEPROM contents (hex): 
               0x20: 01 1E 02 02 01 04 C6 98 49 08 77 05 00 00 00 00 
               0x30: 68 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 

             Slot database information: 
             Flags: 0x4      Insertion time: 0x18C0 (00:29:13 ago) 

             Controller Memory Size: 32 MBytes DRAM, 4096 KBytes SRAM

この出力から、この VIP は VIP2-50 であることがわかります。

VIP2-10、VIP2-15、VIP2-20、VIP2-40 それぞれの差異は、DRAM と SRAM の合計量です。さまざまな VIP2 も(アップグレードされていなければ)、次の表に示すように show diag コマンドの出力のメモリ構成で識別できます。

メモリ VIP

8 MB DRAM/512 KB SRAM

VIP2-10

8 MB DRAM/1 MB SRAM

VIP2-15

16 MB DRAM/1 MB SRAM

VIP2-20

32 MB DRAM/2 MB SRAM

VIP2-40




VIP の Crashinfo ファイルの取得

ソフトウェアの問題の解決、およびシステム クラッシュが内包する原因の診断の際には、Crashinfo ファイルにある情報がきわめて重要な働きをします。crashinfo ファイルには、ロギング情報および VIP のスタック トレースが含まれるだけでなく、拡張メモリおよびコンテキストの情報も含まれています。VIP はクラッシュのつど、Crashinfo ファイルを RSP のブートフラッシュに書き出そうとします。Crashinfo ファイルは次の形式で保存されます。

crashinfo_vip_<slot#>_<data>_<time>

VIP の Crashinfo ファイルを見つけるには、次のように dir コマンドを使用できます。

7500a#dir bootflash: 
     Directory of bootflash:/ 

       1  -rw-     3951876   Jan 01 2000 00:01:22  rsp-boot-mz.111-22.CA 
       2  -rw-      162641   Jun 21 2000 12:53:40  crashinfo_vip_0_20000621-125340 
       3  -rw-      162778   Jun 21 2000 13:00:10  crashinfo_vip_0_20000621-130010 

     7602176 bytes total (3324492 bytes free) 
     7500a#

このルータのブートフラッシュには、2 つの VIP crashinfo ファイルが入っています。次の手順に従って、show file あるいは more コマンドを発行し、これらのファイルの内容の表示とキャプチャを行います。

  1. ターミナル プログラムでロギングを開始します。

  2. term length 0 コマンドを発行します。

  3. more bootflash:<crashinfo filename> コマンドを発行します。

  4. 出力をファイルに保存します。

crashinfo ファイルの取り扱い方法についての詳細は、『Crashinfo ファイルからの情報の取得』を参照してください。

ご使用の Cisco デバイスの、show technical-support コマンドの(イネーブル モードでの)出力データがあれば、アウトプットインタープリタ を使用して今後予想される障害や修正を表示できます。アウトプットインタープリタ を使用するためには、登録ユーザであり、ログインしていて、さらに JavaScript をイネーブルにしている必要があります。
一部ツールについては、ゲスト登録のお客様にはアクセスできない場合がありますことを、ご了承ください。



クラッシュのタイプ

クラッシュの原因に基づいて、VIP クラッシュをさまざまなカテゴリに分類できます。回復不能なエラーが見つかると、VIP は必ずクラッシュします。これらのエラーの原因には、パリティ エラー、CyBus 上に現れる Negative Acknowledgement(NACK; 否定応答)メッセージを引き起こすソフトウェアやハードウェア、あるいはソフトウェアの問題があります。このセクションでは、これらの各エラーの種類について説明しています。

ご使用の Cisco デバイスの、show technical-support コマンドの(イネーブル モードでの)出力データがあれば、アウトプットインタープリタ を使用して今後予想される障害や修正を表示できます。アウトプットインタープリタ を使用するためには、登録ユーザであり、ログインしていて、さらに JavaScript をイネーブルにしている必要があります。
一部ツールについては、ゲスト登録のお客様にはアクセスできない場合がありますことを、ご了承ください。



パリティ エラー

VIP2 のパリティ エラー検出

パリティ エラーは、ハードウェアが同一データについて計算されたパリティ値と元のパリティ値を比較して、データの妥当性をチェックしようとしたときに、VIP 上で発生します。データ内でビット フリップが 1 つ発生しても、パリティ エラーになる可能性があります。VIP でパリティ エラーの診断をするには、パリティがチェックされるそれぞれの場所を理解していることが重要です。これらの場所がパリティ エラー発生の可能性がある場所になります。次の図に、情報の概略を示します。また、パリティ エラーについての詳細は、『Cisco 7500 VIP のフォールト ツリー解析』を参照してください。

VIP2 でのパリティ チェック箇所

VIP2 でのパリティ チェック箇所

この図で示すように、VIP で発生する可能性があるパリティ エラーには 7 つのタイプがあります。エラーは別のソースから受け取る場合があること、および VIP 内が発生源ではない場合があること注意してください。パリティ エラーの発生源には、Route/Switch Processor(RSP)、別の VIP、またはきちんと取り付けられていないポート アダプタや不良ポート アダプタがあります。VIP クラッシュを適切に理解するためには、クラッシュの発生源を診断することが重要です。

不良パリティを伴なうデータがあると、VIP と Cisco 7500 シリーズ ルータ上の複数のパリティ チェック デバイスでの個々のあらゆる読み書き操作で、それが報告される可能性があることを理解しておくことが重要です。たとえば、VIP が RSP 上の送信キューにあるパケットを自分の SRAM に読み込んでいて、RSP の SRAM でパリティ エラーがある場合、RSP 上の MD ASIC、VIP 上の CYA ASIC、さらに VIP 上の PCI/パケット メモリ ASIC からもエラー メッセージが表示されます。

次のダイアグラムは VIP クラッシュのフォールトツリー解析を表しています。

VIP クラッシュのフォールトツリー解析フロー



VIP4 および VIP6 パリティ エラーと ECC 検出

VIP4-50、VIP4-80、VIP6-80 では、CPU メモリとパケット メモリでシングル ビット エラー訂正とダブル ビット エラー検出用の Error Code Correction(ECC)が使用されています。いずれも Synchronous Dynamic RAM(SDRAM)です。SDRAM でのシングル ビット エラーは訂正され、システムは平常に運用を続行します。

次のテーブルの 2 または 3 のマルチビット パリティ エラーは致命的イベントで、ECC マルチビット エラーが発生します。CPU 内部キャッシュとシステム内のバスでは、シングル ビット パリティ訂正が使用されます。ここに示すように、VIP4 と VIP6 のアーキテクチャは VIP2 とは異なっています。そのため、表示されないエラー メッセージもあり、それ以外のエラー メッセージでも VIP2 とは異なって表示されるものがあります。このパリティ エラーのセクションでは、VIP2、VIP4、VIP6 間の差異を取り上げて説明しています。

VIP4 でのパリティ チェック箇所

VIP4 でのパリティ チェック箇所



キャッシュ パリティ エラー例外

キャッシュ パリティ エラー例外は、CPU またはプライマリ データ キャッシュ内で不良パリティが検出されたときに発生します。このパリティ エラーは、VIP DRAM、DRAM コントローラ、プライマリ キャッシュ、または CPU 自体の中で発生した可能性があります。この場所で検出されたパリティ エラーは、プロセッサ メモリ パリティ エラー(PMPE)とも呼ばれます。このエラーの結果、VIP が即時クラッシュし、VIP と RSP の両方で同じような出力が行なわれます。sig 値 20 は(sig=20)、キャッシュ パリティ エラー例外が発生したことを示します。sig 値は、キャッシュのシステム ログ メッセージ中に表示されます。

最近のコードでは、次に示すような詳細な説明の行が表示されます。

Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System reloaded by a Cache Parity Exception 
Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System Reload called from 0x60125C8C, 
context=0x60220930 
Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System exception: sig=20, code=0x20025B69, 
context=0x60220930

VIP crashinfo ファイルの情報には、プライマリ データ キャッシュ内のパリティ エラーの場所も示されています。

Error: primary data cache, fields: data, 
         virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000 
         virtual address corresponds to main:data, cache word 0 

                      Low Data   High Data  Par    Low Data   High Data  Par 
         L1 Data :  0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 
                    2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8 

                       Low Data   High Data  Par    Low Data   High Data  Par 
          Mem Data:  0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 
                     2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8

プライマリ キャッシュあるいは PMPE は一時的なエラーである可能性があります。それが PMPE の初めての発生ならば、通常はこれを無視しても安全です。しかし、同じ VIP で二度以上の PMPE が発生するような場合、VIP を交換する必要があります。DRAM 自体を交換して問題が解決する場合もあります。

VIP4 と VIP6 での注意点:CPU 内部キャッシュおよび CyAsic で発生したパリティ エラーは、キャッシュ パリティ エラー例外として検出されます。CPU メモリ内でのシングル パリティ エラーは訂正されるので、特に対応は不要です。CPU メモリでのマルチビット パリティ エラーは、procmem ecc multi-bit パリティ エラーとして検出されます。procmem ecc multi-bit パリティ エラーが報告された場合は、VIP の CPU メモリを交換する必要があります。

Oct 25 09:30:54.708: %VIP4-50 RM5271-1-MSG: slot4 PMA error register1 00000000 
00002000
Oct 25 09:30:54.716: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit error
Oct 25 09:30:54.724: %VIP4-50 RM5271-1-MSG: slot4 PCI1 master address 00000000
Oct 25 09:30:54.732: %VIP4-50 RM5271-1-MSG: slot4 PCI1 slave address 00000000
Oct 25 09:30:54.740: %VIP4-50 RM5271-1-MSG: slot4 Latched Addresses
Oct 25 09:30:54.748: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception 
addr 22220000 025F0860
Oct 25 09:30:54.756: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception 
data 00000000 00000000
Oct 25 09:30:54.764: %VIP4-50 RM5271-1-MSG: slot4 MPU addr exception/WPE address 
00000000 00000000
Oct 25 09:30:54.772: %VIP4-50 RM5271-1-MSG: slot4 MPU WPE addr/WPE data 00000000 
00000000
Oct 25 09:30:54.780: %VIP4-50 RM5271-1-MSG: slot4 ProcMem addr exception 0 0000000
Oct 25 09:30:54.788: %VIP4-50 RM5271-1-MSG: slot4 Pakmem addr exception 00000000
Oct 25 09:31:15.824: %VIP4-50 RM5271-1-MSG: slot4 System reloaded by a fatal 
hardware error
Oct 25 09:31:15.836: %VIP4-50 RM5271-1-MSG: slot4 caller=0x600BCE18
Oct 25 09:31:15.844: %VIP4-50 RM5271-1-MSG: slot4 System exception: sig22, 
code 0x0, context=0x60615F28


CyBus からのパリティ エラー

VIP が RSP の MEMD からダウンロードした際に次のエラーが発生する場合、通常、別の VIP が不良パリティを MEMD に書き込んだか、MEMD が破損していることを示しています。原因が MEMD にあり、エラーが続く場合、RSP を交換する必要があります。逆に、不良パリティの原因が別の VIP である場合、VIP を挿入しなおし、必要であれば不良パリティを書き込んでいる VIP を交換します。

%VIP2-1-MSG: slot1 Nevada Error Interrupt Register 0x3 
%VIP2-1-MSG: slot1 CYASIC Error Interrupt register 0x2020000C 
%VIP2-1-MSG: slot1 Parity Error internal to CYA 
%VIP2-1-MSG: slot1 Parity Error in data from CyBus 

!--- VIP で CyBus からの不良パリティが受信されています。

%VIP2-1-MSG: slot1 CYASIC Other Interrupt register 0x200100 
%VIP2-1-MSG: slot1 QE HIGH Priority Interrupt 
%VIP2-1-MSG: slot1 CYBUS Error register 0xD001A02, PKT Bus Error register 0x0 
%VIP2-1-MSG: slot1 PMA error register = 0070000440000000 
%VIP2-1-MSG: slot1 Packet Bus Write Parity error 

!--- CyBus から受信された不良パリティが SRAM に書き出されています。

%VIP2-1-MSG: slot1 PCI master address = 0700004 
%VIP2-1-MSG: slot1 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 
%VIP2-1-MSG: slot1 DEC21050 bridge chip, config=0x0 
%VIP2-1-MSG: slot1 (0x00): cfid = 0x00011011 
%VIP2-1-MSG: slot1 (0x04): cfcs= 0x02800147 
%VIP2-1-MSG: slot1 (0x08):cfccid = 0x06040002 
%VIP2-1-MSG: slot1 (0x0C):cfpmlt = 0x00010000 
%VIP2-1-MSG: slot1 (0x18): cfsmlt = 0x00010100 
%VIP2-1-MSG: slot1 (0x1C): cfsis = 0x22807020 
%VIP2-1-MSG: slot1 Received Master Abort on secondary bus 
%VIP2-1-MSG: slot1 (0x20): cfmla = 0x01F00000

注:CyBus パリティ エラーに関しては、VIP4 と VIP6 では同じエラー メッセージが表示されますが、packet bus write parity error メッセージは表示されません。



VIP I/O コントローラおよび Reno 読み取りパリティ エラー

DRAM コントローラ パリティ エラーと Input/Output(I/O)コントローラ パリティ エラーは RENO ASIC で検出されます。DRAM あるいは DRAM コントローラに起因するパリティ エラーはキャッシュ パリティ例外として報告されます。I/O コントローラにより検出されたパリティ エラーは、次の出力例のように報告されます。I/O コントローラで報告されたパリティ エラーが、実は別の場所で発生しており、その他の場所からのメッセージに重複して I/O コントローラから報告されるのはよくあることです。

Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Reno read parity error - bytes 0 & 1 
Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 PMA error register = 0080004000001000 
Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Packet Memory Read Parity error

注:VIP4 と VIP6 では、このメッセージは表示されません。



VIP パケット メモリ読み取りパリティ エラー

PMA ASIC は、VIP のパケット メモリ(SRAM)からパリティ エラーが読み出されたときに必ず、パケット メモリ読み取りパリティ エラーを報告します。このエラーは、次に示すようにシステム ログ中に報告されます。

Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 Nevada Error Interrupt Register = 0x22 
Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 PCI bus 0 parity error 
Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PMA error register = 4080103C00004000 
Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PCI Transmit Parity error 
Oct 30 05:18:08.120: %VIP2-1-MSG: slot9 Packet Memory Read Parity error

packet memory read parity error の例は、VIP crashinfo ファイルでも確認できます。

Nevada Error Interrupt Register = 0x2 
PMA error register = 0046000000001000 
Packet Memory Read Parity error
PCI master address = 0460000

SRAM パリティ エラーも一時的なものである可能性があるので、初めて発生した場合には DRAM パリティ エラーと同様に取り扱ってください。エラーが続く場合には、SRAM または VIP を交換します。

VIP4 と VIP6 での注意点:パケット メモリでのシングル ビット パリティ エラーは訂正されます。パケット メモリでのマルチビット パリティ エラーは pakmem ecc multi-bit parity error として検出されます。pakmem ecc multi-bit parity error が報告された場合は、VIP のパケット メモリを交換する必要があります。

%VIP4-80 RM7000-1-MSG: slot1 PMA error register0 = 0000000000002000
%VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit error
%VIP4-80 RM7000-1-MSG: slot1 PCI0 master address = 00000000
%VIP4-80 RM7000-1-MSG: slot1 PCI0 slave address = 00000000
%VIP4-80 RM7000-1-MSG: slot1 PMA error register1 = 0000000000000000
%VIP4-80 RM7000-1-MSG: slot1 PCI1 master address = 00000000
%VIP4-80 RM7000-1-MSG: slot1 PCI1 slave address = 00000000
%VIP4-80 RM7000-1-MSG: slot1 Latched Addresses
%VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception addr = 00012358 000000CA
%VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception data = 00000000 00040800
%VIP4-80 RM7000-1-MSG: slot1 MPU addr exception/WPE address = 00000000 00000000
%VIP4-80 RM7000-1-MSG: slot1 MPU WPE addr/WPE data = 00000000 00000000
%VIP4-80 RM7000-1-MSG: slot1 ProcMem addr exception = 00000000
%VIP4-80 RM7000-1-MSG: slot1 Pakmem addr exception = 00000000


VIP パケット バス書き込みパリティ エラー

PMA ASIC では、パケット メモリにパリティ エラーが書き込まれる場合に、必ず packet bus write parity error が報告されます。この例では、VIP は単なるメッセンジャであり、この VIP のメモリには問題はありません。

May 10 09:22:14.520: %VIP2-1-MSG: slot11 PMA error register = 2080002800800200 
May 10 09:22:15.520: %VIP2-1-MSG: slot11 Packet Bus Write Parity error

注:VIP4 と VIP6 では、このメッセージは表示されません。



VIP PCI バス パリティ エラー

パリティ エラーが検出されるのは PCI バス 1 と 2 ですが、この両方ともポート アダプタとの直接インターフェイスとして機能しています。この両方のバスは、第 3 の PCI バスであるバス 0 により相互にブリッジングされており、このバス 0 でもパリティ エラーは検出されます。PCI バスに起因するどのパリティ エラーも、通常は、ポート アダプタが確実に装着されていないか、あるいはポート アダプタそのものの欠陥が原因となっています。VIP クラッシュの syslog 出力に次のメッセージが見られた場合には、ポート アダプタを取り付け直すことで通常は問題が解決します。

PCI bus <num> parity error 
PCI bus <num> system error
Detected Parity Error on secondary bus

ポート アダプタを装着し直しても問題が解決しない場合は、ポート アダプタそのものか VIP に問題があります。トラブルシューティングを行うには、そのポート アダプタを別のベイに移動し、別のポート アダプタを元のベイに挿入します。通常は、これによって問題のあるハードウェアが判断できます。ここに例を示します。

Mar 16 19:34:54: %GEIP-1-MSG: slot9 Nevada Error Interrupt Register = 0x6 
Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI bus 0 system error
Mar 16 19:34:54: %GEIP-1-MSG: slot9 PMA error register = 0080043800100000 
Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI IRDY time-out 
Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI master address = 0800438 
Mar 16 19:34:54: %GEIP-1-MSG: slot9 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0

注:同じエラーは VIP4 と VIP6 でも発生しますが、エラー メッセージが異なります。このエラーは、PCI マスター パリティ エラーおよび PCI スレーブ パリティ エラーとして検出されます。この問題のトラブルシューティングを行うには、VIP PCI バス パリティ エラーのために概略したものと同じ手順を実行してください。

00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register0 = 0000000001800000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Master Parity error
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Slave Parity error
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 master address = 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 slave address = 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register1 = 0000000000000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 master address = 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 slave address = 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Latched Addresses
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU addr exception/WPE address = 
00000000 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU WPE addr/WPE data = 
00000000 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 ProcMem addr exception = 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Pakmem addr exception = 00000000


VIP CyAsic パリティ エラー

CyBus でのデータやアドレスの読み書き操作中に、VIP でパリティ エラーが検出される場合もあります。これが発生した場合、次のような syslog 出力が見られます。

CYASIC Error Interrupt register 0x2020000C 
Parity Error internal to CYA 
Parity Error in data from CyBus

この情報をシステム ログにある情報と一緒に使用して、エラーの本当の原因を判別します。

注:CyBus パリティ エラーに関しては、VIP4 と VIP6 で同じエラー メッセージが表示されます。



CyBus 上の NACK

VIP が MEMD の無効アドレスに書き込みを行おうとすると、RSP はそのスロットの CyBus 上に NACK を発行します。これは、通常はソフトウェアの問題ですが、ハードウェアの問題である場合もあります。たとえば次の出力では、VIP が無効アドレスに 4 バイトを書き出しているので、RSP はそのスロットに対して CyBus で NACK を返しています。

%RSP-3-ERROR: CyBus0 error 10 
%RSP-3-ERROR: command/address mismatch 
%RSP-3-ERROR: bus command write 4bytes (0xE) 
%RSP-3-ERROR: address offset (bits 3:1) 0 
%RSP-3-ERROR: virtual address (bits 23:17) 000000 
%VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 
%VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20000003 
%VIP2-1-MSG: slot5 Missing ACK on CyBus access 
%VIP2-1-MSG: slot5 NACK present on CyBus access
%VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x0 
%VIP2-1-MSG: slot5 CYBUS Error register 0x8001C48, PKT Bus Error register 0x0 
%VIP2-1-MSG: slot5 System reloaded by a fatal hardware error 
%VIP2-1-MSG: slot5 caller=0x60126C44 
%VIP2-1-MSG: slot5 System exception: sig=22, code=0x0, context=0x60265C68

しかし、次に示すように、RSP は MEMD に不良パリティを書き込もうとしている VIP にも NACK を発行します。

CYASIC Error Interrupt register 0x1B 
Parity Error in data from Packet Bus 
Parity Error internal to CYA 
Missing ACK on CyBus access 
NACK present on CyBus access

この出力に示すように、すべてのスロットに NACK が現れた場合、これはハードウェア エラーです。このアービターには欠陥があり、カード ケージを交換する必要があります。

Jan  1 23:55:21: %FEIP2-1-MSG: slot0 Nevada Error Interrupt Register =0x1 
Jan  1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Error Interrupt register0x20000001 
Jan  1 23:55:21: %FEIP2-1-MSG: slot0 NACK present on CyBus access 
Jan  1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Other Interrupt register 0x0 
Jan  1 23:55:21: %FEIP2-1-MSG: slot0 CYBUS Error register 0x8001A00, 
PKTBus Error register 0x0 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 Nevada Error Interrupt Register = 0x1 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Error Interrupt register 0x20000001 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 NACK present on CyBus access
Jan  1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Other Interrupt register 0x0 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 CYBUS Error register 0x800006A, 
PKT Bus Error register 0x0 
Jan  1 23:55:21: %VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 
Jan  1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20200001 
Jan  1 23:55:21: %VIP2-1-MSG: slot5 NACK present on CyBus access 
Jan  1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x200000 
Jan  1 23:55:21: %VIP2-1-MSG: slot5 CYBUS Error register 0x800006C, 
PKT Bus Error register 0x0 
Jan  1 23:55:21: %FEIP2-1-MSG: slot8 Nevada Error Interrupt Register = 0x1 
Jan  1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Error Interrupt register 0x20000001 
Jan  1 23:55:21: %FEIP2-1-MSG: slot8 NACK present on CyBus access
Jan  1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Other Interrupt register 0x0 
Jan  1 23:55:21: %FEIP2-1-MSG: slot8 CYBUS Error register 0x8001B80, 
PKT Bus Error register 0x0 
Jan  1 23:55:21: %FEIP2-1-MSG: slot10 Nevada Error Interrupt Register = 0x1 
Jan  1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Error Interrupt register 0x20000001 
Jan  1 23:55:21: %FEIP2-1-MSG: slot10 NACK present on CyBus access
Jan  1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Other Interrupt register 0x0 
Jan  1 23:55:21: %FEIP2-1-MSG: slot10 CYBUS Error register 0x8001C08,
PKT Bus Error register 0x0 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 System reloaded by a fatal hardware error 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 caller=0x6012640C 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 System exception: sig=22, code=0x0, 
context=0x60265028


ソフトウェアによる VIP のクラッシュ

このドキュメントで説明したいずれの理由も当てはまらない VIP クラッシュは、他のソフトウェア問題が原因というのが最も一般的です。このようなクラッシュはさまざまな方法で明らかにすることができます。ソフトウェアの問題による VIP クラッシュのリスクを軽減し、発生した場合にそれを対処するための一般的な提言をいくつか次に示します。

  • Cisco IOS ソフトウェア イメージが VIP をサポートしていることを常に確認します。

  • RSP-BOOT イメージと主要な Cisco IOS ソフトウェア イメージを常に同じバージョンに保ちます。

  • VIP 構成とポート アダプタが現在のバージョンの Cisco IOS ソフトウェアでサポートされていることを確認します。

  • リリース ノートで、適切な Cisco IOS ソフトウェア レベルとメモリ要件をチェックします。

ソフトウェアの問題で発生した VIP クラッシュのシステム ログ出力の例を次に示します。

Apr 18 17:13:33.884: %VIP2 R5K-1-MSG: slot0 System reloaded by a 
Bus Error exception 
Apr 18 17:13:33.892: %VIP2 R5K-1-MSG: slot0 caller=0x600BC974 
Apr 18 17:13:33.900: %VIP2 R5K-1-MSG: slot0 System exception: 
sig=10, code=0x408, context=0x605B51E0 
Apr 18 17:13:33.912: %VIP2 R5K-1-MSG: slot0 $0 : 00000000, 
AT : 605B0000, v0 : 00000001, v1 : FFFFFFFC, 
Apr 18 17:13:33.924: %VIP2 R5K-1-MSG: slot0 a0 : 00000002, 
a1 : 6042CEE0, a2 : 00000000, a3 : 6112FEC4, 
Apr 18 17:13:33.936: %VIP2 R5K-1-MSG: slot0 t0 : 00000053, 
t1 : 3400FF01, t2 : 00000000, t3 : FFFFFFFF, 
Apr 18 17:13:33.948: %VIP2 R5K-1-MSG: slot0 t4 : 600BC9B0, 
t5 : 000000F8, t6 : 00000000, t7 : 00000002, 
Apr 18 17:13:33.956: %VIP2 R5K-1-MSG: slot0 s0 : 0C58BA24, 
s1 : 00000064, s2 : 6112C7AC, s3 : 60560000, 
Apr 18 17:13:33.964: %VIP2 R5K-1-MSG: slot0 s4 : 60560000, 
s5 : 00000001, s6 : 6041433C, s7 : 60414310, 
Apr 18 17:13:33.972: %VIP2 R5K-1-MSG: slot0 t8 : 00008945, 
t9 : 00000000, k0 : 607F6CA0, k1 : 00000200, 
Apr 18 17:13:33.980: %VIP2 R5K-1-MSG: slot0 gp : 6056AFC0, 
sp : 6112FEC0, s8 : 60414460, ra : 6026EC4C, 
Apr 18 17:13:33.988: %VIP2 R5K-1-MSG: slot0 EPC : 6026EAA0, 
ErrorEPC : 800086B8, SREG : 3400FF03 
Apr 18 17:13:33.996: %VIP2 R5K-1-MSG: slot0 Cause 00000408 (Code 0x2) 
Apr 18 17:13:34.004: %VIP2 R5K-1-MSG: slot0 Traceback= 6026EAA0 
6026E2E8 6009BAF4 6009BAE0 
Apr 18 17:13:35.012: %DBUS-3-DBUSINTERRSWSET: Slot 0, Internal 
Error due to VIP crash

ソフトウェア問題の場合に取得すべき最も重要な情報は、おそらく VIP の crashinfo ファイルです。この情報をキャプチャする手順については、「VIP Crashinfo ファイルの取得」セクションを参照してください。



バス エラー例外

VIP クラッシュが何度も発生する場合、Crashinfo ファイルを確認すると、次のメッセージが見られる場合があります。

00:00:11: %LINK-3-UPDOWN: Interface POS1/0, changed state to up

IOBUS Error Interrupt Status register 0x0


Unexpected exception, CPU signal 10, PC = 0x602A7660


-Traceback= 602A7660 602AB238

CPU signal 10 というエラー メッセージは、バス エラー例外を意味しています。バス エラーは、ハードウェアの問題である可能性もあれば、ソフトウェアの問題である可能性もあります。この問題を回避するには、モジュールを取り付け直し、ルータを監視します。モジュールを取り付けなおした後でもクラッシュが生じる場合は、Crashinfo ファイルを添えて、TAC Service Request Tool登録ユーザのみ)でご連絡ください。
一部ツールについては、ゲスト登録のお客様にはアクセスできない場合がありますことを、ご了承ください。



Cisco テクニカルサポートへの VIP クラッシュの報告

TAC サービス リクエストを作成する前に

サービス リクエストをオープンする前に、この情報を使用して VIP クラッシュ サマリー ファイルを作成することを推奨いたします。この情報を TAC Service Request Tool登録ユーザ専用)の Problem Description フィールドに取り込んでください。
一部ツールについては、ゲスト登録のお客様にはアクセスできない場合がありますことを、ご了承ください。

  • 問題の説明

  • show version コマンドの出力

  • show diag slot [x] コマンドの出力

  • crashinfo ファイルの抜粋

  • syslog の抜粋

次に TAC のサービス リクエストをオープンする場合に収集する情報を収集します。

クラッシュ サマリー ファイルの例を次に示します。

******problem description.. 
VIP crashed with parity errors. 
The parity errors are being read by the SRAM, suspect the PA! 

******show version 
Cisco Internetwork Operating System Software 
IOS (tm) GS Software (RSP-PV-M), Version 11.1(29)CC1, EARLY DEPLOYMENT 
RELEASE SOFTWARE (fc1) 
V111_29_CC_THROTTLE_BRANCH Synced to mainline version: 11.1(29)CA 
Copyright (c) 1986-1999 by cisco Systems, Inc. 
Compiled Wed 13-Oct-99 02:21 by sharpd 
Image text-base: 0x60010910, data-base: 0x60832000 

ROM: System Bootstrap, Version 11.1(8)CA1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) 
ROM: GS Software (RSP-BOOT-M), Version 11.1(29)CC1, EARLY DEPLOYMENT 
RELEASE SOFTWARE (fc1) 

attga711c7 uptime is 27 weeks, 11 minutes 
System restarted by reload at 00:49:05 UTC Sun Oct 24 1999 
System image file is "slot0:rsp-pv-mz.111-29.CC1", booted via slot0 
Host configuration file is "cbb/al/ar-2", booted via tftp from 199.37.184.170 

cisco RSP4 (R5000) processor with 262144K/2072K bytes of memory. 
R5000 processor, Implementation 35, Revision 2.1 (512KB Level 2 Cache) 
Last reset from power-on 
G.703/E1 software, Version 1.0. 
G.703/JT2 software, Version 1.0. 
X.25 software, Version 2.0, NET2, BFE and GOSIP compliant. 
Chassis Interface. 
3 VIP2 R5K controllers (3 ATM). 
3 ATM network interfaces. 
123K bytes of non-volatile configuration memory. 

20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K). 
8192K bytes of Flash internal SIMM (Sector size 256K). 


******show diag slot 6 
Slot 6: 
 Physical slot 6, ~physical slot 0x9, logical slot 0, CBus 0 
 Microcode Status 0x4 
 WCS Loaded 
 Board is disabled analyzed wedged 
 Pending I/O Status: None 
 EEPROM format version 1 
 VIP2 R5K controller, HW rev 2.02, board revision C0 
 Serial number: 12639078  Part number: 73-2167-05 
 Test history: 0x00        RMA number: 00-00-00 
 Flags: cisco 7000 board; 7500 compatible 

 EEPROM contents (hex): 
   0x20: 01 1E 02 02 00 C0 DB 66 49 08 77 05 00 00 00 00 
   0x30: 60 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 

 Slot database information: 
 Flags: 0x295 Insertion time: 0x3AA4 (27w0d ago) 

 Controller Memory Size: 128 MBytes DRAM, 8192 KBytes SRAM 

 PA Bay 0 Information: 
  ENHANCED ATM OC3 PA (MM), 1 port 
  EEPROM format version 1 
  HW rev 2.00, Board revision A0 
  Serial number: 12366362  Part number: 73-2430-04 

 1 crash since restart. 
 Last crash context (Apr 29 2000 23:19:26): 
 Nevada Error Interrupt Register = 0x2 
 PMA error interrupt 
 PMA Error Register = 0046000000001000 
     Packet Memory Read Parity error 
     PCI master address = 0460000 
 $0 : 00000000, AT : 60179244, v0 : 601D337C, v1 : 0000AAAA 
 a0 : 604CF3E0, a1 : 604C8180, a2 : 00001182, a3 : 00000050 
 t0 : 00000800, t1 : 4E90424C, t2 : 00000001, t3 : 6014A620 
 t4 : 6016E220, t5 : 000000F8, t6 : 00000000, t7 : 00000000 
 s0 : 321735CC, s1 : 6052B508, s2 : 604C8180, s3 : 604CF3E0 
 s4 : 3226C120, s5 : 604D1440, s6 : 00000002, s7 : 00000CED 
 t8 : 34000000, t9 : 603C9930, k0 : 00000000, k1 : 00000002 
 gp : 60337700, sp : 603C0350, s8 : 00000001, ra : 601476E8 
 EPC : 601D337C, ErrorEPC : 800086B8, SREG : 3400E103 
 Cause 00000000 (Code 0x0): Interrupt exception 
 Traceback= 0x601D337C 0x601476E8 0x6014A674 

******excerpt from crashinfo 
Nevada Error Interrupt Register = 0x2 
PMA error register = 0046000000001000 
    Packet Memory Read Parity error 
    PCI master address = 0460000 

******excerpt from syslog 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6     Packet Memory Read Parity error 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6     PCI master address = 0460000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x00): cfid   = 0x00011011 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x04): cfcs   = 0x02800147 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x08): cfccid = 0x06040002 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x0C): cfpmlt = 0x00010000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x18): cfsmlt = 0x00010100 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x1C): cfsis  = 0x02807020 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x20): cfmla  = 0x01F00000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x24): cfpmla = 0x0000FE00 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x3C): cfbc   = 0x00030000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x40): cfseed = 0x00000000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x44): cfstwt = 0x00000000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x48): cfswac = 0x00FFFFFF 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x4C): cfpwac = 0x00FFFFFF 
Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error


TAC のサービス リクエストをオープンする場合に収集する情報

このドキュメントで説明したトラブルシューティング手順を実行した後も、依然としてサポートが必要で、Cisco テクニカルサポートでサービス リクエストをオープンする場合は、次の情報を必ず添付してください。
  • サービス リクエストをオープンする前に実行したトラブルシューティング

  • show technical-support コマンドの出力(可能であればイネーブル モードで)

  • show log コマンドの出力、または(可能であれば)コンソールのキャプチャ

  • VIP crashinfo ファイル

収集したデータは、圧縮しないプレーンなテキスト形式(.txt)でサービス リクエストに添付してください。情報を添付するには、TAC Service Request Tool登録ユーザ専用)を使用してアップロードします。TAC Service Request Tool にアクセスできない場合は、メッセージの件名の行にお客様のサービス リクエスト番号を記入し、attach@cisco.com にメッセージを送信することにより、お客様のサービス リクエストに関連情報を添付できます。
一部ツールについては、ゲスト登録のお客様にはアクセスできない場合がありますことを、ご了承ください。

注:問題の根本原因を特定するのに必要な重要情報が失われる可能性があるため、可能であれば、上記情報を収集する前に、手動によるリロードやルータの電源のオフ/オンなどの操作は実行しないようにしてください。




関連するシスコ サポート コミュニティ ディスカッション

シスコ サポート コミュニティは、どなたでも投稿や回答ができる情報交換スペースです。


関連情報




Document ID: 12811