Interactive: This document offers customized analysis of your Cisco device.目次
概要このドキュメントでは、Versatile Interface Processor(VIP)のクラッシュをトラブルシューティングするための情報を提供しています。 前提条件要件7500 シリーズ ルータの Field Notice に関する知識があることが推奨されます。 使用するコンポーネントこのドキュメントの情報は、次のソフトウェアとハードウェアのバージョンに基づくものです。
このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されたものです。このドキュメントで使用するすべてのデバイスは、クリアな(デフォルト)設定で作業を開始しています。対象のネットワークが実稼働中である場合には、どのような作業についても、その潜在的な影響について確実に理解しておく必要があります。 表記法ドキュメント表記の詳細は、『シスコ テクニカル ティップスの表記法』を参照してください。 VIP のアーキテクチャVIP のクラッシュを解明するためには、まず VIP の基本アーキテクチャを理解しておくことが重要です。このセクションの図は、下記のコンポーネントを含む VIP2 の機能ブロック ダイアグラムを示しています。
VIP のアーキテクチャを表す図
VIP2 マイクロコード(ファームウェア)は、カード固有のソフトウェア命令を提供するイメージです。VIP2 上の Programmable Read-Only Memory(PROM)デバイスにはデフォルトのマイクロコード ブート イメージが格納されており、これによって、システムは Cisco IOS(R) ソフトウェア バンドルあるいはフラッシュ メモリからのマイクロコード イメージの検索とロードができます。PROM 内のマイクロコード ブート イメージは VIP2 を初期化して、さらに VIP2 のマイクロコード イメージのダウンロードを行います。同一タイプのすべてのインターフェイスでは、Cisco IOS ソフトウェア バンドルあるいはフラッシュ メモリのいずれかから同一のマイクロコード イメージがロードされます。フラッシュ メモリには特定のインターフェイス向けの複数のマイクロコード バージョンを格納できますが、始動時にロードできるイメージは 1 つだけです。 show controllers cbus コマンドを使用すると、各インターフェイス プロセッサおよび VIP2 ごとに、現在ロードされていて稼働中のマイクロコードのバージョンが表示されます。show startup-config コマンドを使用すると、スタートアップ時にマイクロコードをロードするための現在のシステム命令が表示されます。 トラブルシューティング時には、VIP crashinfo ファイルや syslog から情報を読むための指針として、このセクションの図を使用できます。例として、VIP SRAM から読み込んだ際に不良パリティが見つかったことを示す syslog 出力を見てみましょう。 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Packet Memory Read Parity error ! -- VIP SRAM からの読み取りで不良パリティが検出されています。 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PCI master address = 0460000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x00): cfid = 0x00011011 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x04): cfcs = 0x02800147 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x08): cfccid = 0x06040002 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x0C): cfpmlt = 0x00010000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x18): cfsmlt = 0x00010100 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x1C): cfsis = 0x02807020 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x20): cfmla = 0x01F00000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x24): cfpmla = 0x0000FE00 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x3C): cfbc = 0x00030000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x40): cfseed = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x44): cfstwt = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x48): cfswac = 0x00FFFFFF Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x4C): cfpwac = 0x00FFFFFF Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error 次のセクションの推奨事項にあるように、この出力にある VIP を監視して、同様のクラッシュが再発した場合には SRAM か VIP を交換する必要があります。 VIP の識別方法show diag コマンドの出力にある EEPROM のアドレス 0x21 の内容を調べると、VIP のモデルを確認できます。各 VIP タイプに対応する値を次の表に示します。
注:GEIP+ は VIP4-80 をベースにしています。このドキュメントでの VIP4-80 についての詳細情報は、すべて GEIP+ にも適用できます。 次に例を示します。
Router#show diag 10
Slot 10:
Physical slot 10, ~physical slot 0x5, logical slot 10, CBus 0
Microcode Status 0x4
Master Enable, LED, WCS Loaded
Board is analyzed
Pending I/O Status: None
EEPROM format version 1
VIP2 R5K controller, HW rev 2.02, board revision D0
Serial number: 17090200 Part number: 73-2167-05
Test history: 0x00 RMA number: 00-00-00
Flags: cisco 7000 board; 7500 compatible
EEPROM contents (hex):
0x20: 01 1E 02 02 01 04 C6 98 49 08 77 05 00 00 00 00
0x30: 68 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00
Slot database information:
Flags: 0x4 Insertion time: 0x18C0 (00:29:13 ago)
Controller Memory Size: 32 MBytes DRAM, 4096 KBytes SRAM
この出力から、この VIP は VIP2-50 であることがわかります。 VIP2-10、VIP2-15、VIP2-20、VIP2-40 それぞれの差異は、DRAM と SRAM の合計量です。さまざまな VIP2 も(アップグレードされていなければ)、次の表に示すように show diag コマンドの出力のメモリ構成で識別できます。
VIP の Crashinfo ファイルの取得ソフトウェアの問題の解決、およびシステム クラッシュが内包する原因の診断の際には、Crashinfo ファイルにある情報がきわめて重要な働きをします。crashinfo ファイルには、ロギング情報および VIP のスタック トレースが含まれるだけでなく、拡張メモリおよびコンテキストの情報も含まれています。VIP はクラッシュのつど、Crashinfo ファイルを RSP のブートフラッシュに書き出そうとします。Crashinfo ファイルは次の形式で保存されます。 crashinfo_vip_<slot#>_<data>_<time> VIP の Crashinfo ファイルを見つけるには、次のように dir コマンドを使用できます。
7500a#dir bootflash:
Directory of bootflash:/
1 -rw- 3951876 Jan 01 2000 00:01:22 rsp-boot-mz.111-22.CA
2 -rw- 162641 Jun 21 2000 12:53:40 crashinfo_vip_0_20000621-125340
3 -rw- 162778 Jun 21 2000 13:00:10 crashinfo_vip_0_20000621-130010
7602176 bytes total (3324492 bytes free)
7500a#
このルータのブートフラッシュには、2 つの VIP crashinfo ファイルが入っています。次の手順に従って、show file あるいは more コマンドを発行し、これらのファイルの内容の表示とキャプチャを行います。
crashinfo ファイルの取り扱い方法についての詳細は、『Crashinfo ファイルからの情報の取得』を参照してください。 ご使用の Cisco デバイスの、show technical-support コマンドの(イネーブル モードでの)出力データがあれば、アウトプットインタープリタ クラッシュのタイプクラッシュの原因に基づいて、VIP クラッシュをさまざまなカテゴリに分類できます。回復不能なエラーが見つかると、VIP は必ずクラッシュします。これらのエラーの原因には、パリティ エラー、CyBus 上に現れる Negative Acknowledgement(NACK; 否定応答)メッセージを引き起こすソフトウェアやハードウェア、あるいはソフトウェアの問題があります。このセクションでは、これらの各エラーの種類について説明しています。 ご使用の Cisco デバイスの、show technical-support コマンドの(イネーブル モードでの)出力データがあれば、アウトプットインタープリタ パリティ エラーVIP2 のパリティ エラー検出パリティ エラーは、ハードウェアが同一データについて計算されたパリティ値と元のパリティ値を比較して、データの妥当性をチェックしようとしたときに、VIP 上で発生します。データ内でビット フリップが 1 つ発生しても、パリティ エラーになる可能性があります。VIP でパリティ エラーの診断をするには、パリティがチェックされるそれぞれの場所を理解していることが重要です。これらの場所がパリティ エラー発生の可能性がある場所になります。次の図に、情報の概略を示します。また、パリティ エラーについての詳細は、『Cisco 7500 VIP のフォールト ツリー解析』を参照してください。 VIP2 でのパリティ チェック箇所
この図で示すように、VIP で発生する可能性があるパリティ エラーには 7 つのタイプがあります。エラーは別のソースから受け取る場合があること、および VIP 内が発生源ではない場合があること注意してください。パリティ エラーの発生源には、Route/Switch Processor(RSP)、別の VIP、またはきちんと取り付けられていないポート アダプタや不良ポート アダプタがあります。VIP クラッシュを適切に理解するためには、クラッシュの発生源を診断することが重要です。 不良パリティを伴なうデータがあると、VIP と Cisco 7500 シリーズ ルータ上の複数のパリティ チェック デバイスでの個々のあらゆる読み書き操作で、それが報告される可能性があることを理解しておくことが重要です。たとえば、VIP が RSP 上の送信キューにあるパケットを自分の SRAM に読み込んでいて、RSP の SRAM でパリティ エラーがある場合、RSP 上の MD ASIC、VIP 上の CYA ASIC、さらに VIP 上の PCI/パケット メモリ ASIC からもエラー メッセージが表示されます。 次のダイアグラムは VIP クラッシュのフォールトツリー解析を表しています。
VIP4 および VIP6 パリティ エラーと ECC 検出VIP4-50、VIP4-80、VIP6-80 では、CPU メモリとパケット メモリでシングル ビット エラー訂正とダブル ビット エラー検出用の Error Code Correction(ECC)が使用されています。いずれも Synchronous Dynamic RAM(SDRAM)です。SDRAM でのシングル ビット エラーは訂正され、システムは平常に運用を続行します。 次のテーブルの 2 または 3 のマルチビット パリティ エラーは致命的イベントで、ECC マルチビット エラーが発生します。CPU 内部キャッシュとシステム内のバスでは、シングル ビット パリティ訂正が使用されます。ここに示すように、VIP4 と VIP6 のアーキテクチャは VIP2 とは異なっています。そのため、表示されないエラー メッセージもあり、それ以外のエラー メッセージでも VIP2 とは異なって表示されるものがあります。このパリティ エラーのセクションでは、VIP2、VIP4、VIP6 間の差異を取り上げて説明しています。 VIP4 でのパリティ チェック箇所
キャッシュ パリティ エラー例外キャッシュ パリティ エラー例外は、CPU またはプライマリ データ キャッシュ内で不良パリティが検出されたときに発生します。このパリティ エラーは、VIP DRAM、DRAM コントローラ、プライマリ キャッシュ、または CPU 自体の中で発生した可能性があります。この場所で検出されたパリティ エラーは、プロセッサ メモリ パリティ エラー(PMPE)とも呼ばれます。このエラーの結果、VIP が即時クラッシュし、VIP と RSP の両方で同じような出力が行なわれます。sig 値 20 は(sig=20)、キャッシュ パリティ エラー例外が発生したことを示します。sig 値は、キャッシュのシステム ログ メッセージ中に表示されます。 最近のコードでは、次に示すような詳細な説明の行が表示されます。 Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System reloaded by a Cache Parity Exception Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System Reload called from 0x60125C8C, context=0x60220930 Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System exception: sig=20, code=0x20025B69, context=0x60220930 VIP crashinfo ファイルの情報には、プライマリ データ キャッシュ内のパリティ エラーの場所も示されています。
Error: primary data cache, fields: data,
virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000
virtual address corresponds to main:data, cache word 0
Low Data High Data Par Low Data High Data Par
L1 Data : 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89
2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8
Low Data High Data Par Low Data High Data Par
Mem Data: 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89
2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8
プライマリ キャッシュあるいは PMPE は一時的なエラーである可能性があります。それが PMPE の初めての発生ならば、通常はこれを無視しても安全です。しかし、同じ VIP で二度以上の PMPE が発生するような場合、VIP を交換する必要があります。DRAM 自体を交換して問題が解決する場合もあります。 VIP4 と VIP6 での注意点:CPU 内部キャッシュおよび CyAsic で発生したパリティ エラーは、キャッシュ パリティ エラー例外として検出されます。CPU メモリ内でのシングル パリティ エラーは訂正されるので、特に対応は不要です。CPU メモリでのマルチビット パリティ エラーは、procmem ecc multi-bit パリティ エラーとして検出されます。procmem ecc multi-bit パリティ エラーが報告された場合は、VIP の CPU メモリを交換する必要があります。 Oct 25 09:30:54.708: %VIP4-50 RM5271-1-MSG: slot4 PMA error register1 00000000 00002000 Oct 25 09:30:54.716: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit error Oct 25 09:30:54.724: %VIP4-50 RM5271-1-MSG: slot4 PCI1 master address 00000000 Oct 25 09:30:54.732: %VIP4-50 RM5271-1-MSG: slot4 PCI1 slave address 00000000 Oct 25 09:30:54.740: %VIP4-50 RM5271-1-MSG: slot4 Latched Addresses Oct 25 09:30:54.748: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception addr 22220000 025F0860 Oct 25 09:30:54.756: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception data 00000000 00000000 Oct 25 09:30:54.764: %VIP4-50 RM5271-1-MSG: slot4 MPU addr exception/WPE address 00000000 00000000 Oct 25 09:30:54.772: %VIP4-50 RM5271-1-MSG: slot4 MPU WPE addr/WPE data 00000000 00000000 Oct 25 09:30:54.780: %VIP4-50 RM5271-1-MSG: slot4 ProcMem addr exception 0 0000000 Oct 25 09:30:54.788: %VIP4-50 RM5271-1-MSG: slot4 Pakmem addr exception 00000000 Oct 25 09:31:15.824: %VIP4-50 RM5271-1-MSG: slot4 System reloaded by a fatal hardware error Oct 25 09:31:15.836: %VIP4-50 RM5271-1-MSG: slot4 caller=0x600BCE18 Oct 25 09:31:15.844: %VIP4-50 RM5271-1-MSG: slot4 System exception: sig22, code 0x0, context=0x60615F28 CyBus からのパリティ エラーVIP が RSP の MEMD からダウンロードした際に次のエラーが発生する場合、通常、別の VIP が不良パリティを MEMD に書き込んだか、MEMD が破損していることを示しています。原因が MEMD にあり、エラーが続く場合、RSP を交換する必要があります。逆に、不良パリティの原因が別の VIP である場合、VIP を挿入しなおし、必要であれば不良パリティを書き込んでいる VIP を交換します。 %VIP2-1-MSG: slot1 Nevada Error Interrupt Register 0x3 %VIP2-1-MSG: slot1 CYASIC Error Interrupt register 0x2020000C %VIP2-1-MSG: slot1 Parity Error internal to CYA %VIP2-1-MSG: slot1 Parity Error in data from CyBus !--- VIP で CyBus からの不良パリティが受信されています。 %VIP2-1-MSG: slot1 CYASIC Other Interrupt register 0x200100 %VIP2-1-MSG: slot1 QE HIGH Priority Interrupt %VIP2-1-MSG: slot1 CYBUS Error register 0xD001A02, PKT Bus Error register 0x0 %VIP2-1-MSG: slot1 PMA error register = 0070000440000000 %VIP2-1-MSG: slot1 Packet Bus Write Parity error !--- CyBus から受信された不良パリティが SRAM に書き出されています。 %VIP2-1-MSG: slot1 PCI master address = 0700004 %VIP2-1-MSG: slot1 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 %VIP2-1-MSG: slot1 DEC21050 bridge chip, config=0x0 %VIP2-1-MSG: slot1 (0x00): cfid = 0x00011011 %VIP2-1-MSG: slot1 (0x04): cfcs= 0x02800147 %VIP2-1-MSG: slot1 (0x08):cfccid = 0x06040002 %VIP2-1-MSG: slot1 (0x0C):cfpmlt = 0x00010000 %VIP2-1-MSG: slot1 (0x18): cfsmlt = 0x00010100 %VIP2-1-MSG: slot1 (0x1C): cfsis = 0x22807020 %VIP2-1-MSG: slot1 Received Master Abort on secondary bus %VIP2-1-MSG: slot1 (0x20): cfmla = 0x01F00000 注:CyBus パリティ エラーに関しては、VIP4 と VIP6 では同じエラー メッセージが表示されますが、packet bus write parity error メッセージは表示されません。 VIP I/O コントローラおよび Reno 読み取りパリティ エラーDRAM コントローラ パリティ エラーと Input/Output(I/O)コントローラ パリティ エラーは RENO ASIC で検出されます。DRAM あるいは DRAM コントローラに起因するパリティ エラーはキャッシュ パリティ例外として報告されます。I/O コントローラにより検出されたパリティ エラーは、次の出力例のように報告されます。I/O コントローラで報告されたパリティ エラーが、実は別の場所で発生しており、その他の場所からのメッセージに重複して I/O コントローラから報告されるのはよくあることです。 Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Reno read parity error - bytes 0 & 1 Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 PMA error register = 0080004000001000 Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Packet Memory Read Parity error 注:VIP4 と VIP6 では、このメッセージは表示されません。 VIP パケット メモリ読み取りパリティ エラーPMA ASIC は、VIP のパケット メモリ(SRAM)からパリティ エラーが読み出されたときに必ず、パケット メモリ読み取りパリティ エラーを報告します。このエラーは、次に示すようにシステム ログ中に報告されます。 Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 Nevada Error Interrupt Register = 0x22 Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 PCI bus 0 parity error Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PMA error register = 4080103C00004000 Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PCI Transmit Parity error Oct 30 05:18:08.120: %VIP2-1-MSG: slot9 Packet Memory Read Parity error packet memory read parity error の例は、VIP crashinfo ファイルでも確認できます。 Nevada Error Interrupt Register = 0x2 PMA error register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000 SRAM パリティ エラーも一時的なものである可能性があるので、初めて発生した場合には DRAM パリティ エラーと同様に取り扱ってください。エラーが続く場合には、SRAM または VIP を交換します。 VIP4 と VIP6 での注意点:パケット メモリでのシングル ビット パリティ エラーは訂正されます。パケット メモリでのマルチビット パリティ エラーは pakmem ecc multi-bit parity error として検出されます。pakmem ecc multi-bit parity error が報告された場合は、VIP のパケット メモリを交換する必要があります。 %VIP4-80 RM7000-1-MSG: slot1 PMA error register0 = 0000000000002000 %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit error %VIP4-80 RM7000-1-MSG: slot1 PCI0 master address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PCI0 slave address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PMA error register1 = 0000000000000000 %VIP4-80 RM7000-1-MSG: slot1 PCI1 master address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PCI1 slave address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 Latched Addresses %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception addr = 00012358 000000CA %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception data = 00000000 00040800 %VIP4-80 RM7000-1-MSG: slot1 MPU addr exception/WPE address = 00000000 00000000 %VIP4-80 RM7000-1-MSG: slot1 MPU WPE addr/WPE data = 00000000 00000000 %VIP4-80 RM7000-1-MSG: slot1 ProcMem addr exception = 00000000 %VIP4-80 RM7000-1-MSG: slot1 Pakmem addr exception = 00000000 VIP パケット バス書き込みパリティ エラーPMA ASIC では、パケット メモリにパリティ エラーが書き込まれる場合に、必ず packet bus write parity error が報告されます。この例では、VIP は単なるメッセンジャであり、この VIP のメモリには問題はありません。 May 10 09:22:14.520: %VIP2-1-MSG: slot11 PMA error register = 2080002800800200 May 10 09:22:15.520: %VIP2-1-MSG: slot11 Packet Bus Write Parity error 注:VIP4 と VIP6 では、このメッセージは表示されません。 VIP PCI バス パリティ エラーパリティ エラーが検出されるのは PCI バス 1 と 2 ですが、この両方ともポート アダプタとの直接インターフェイスとして機能しています。この両方のバスは、第 3 の PCI バスであるバス 0 により相互にブリッジングされており、このバス 0 でもパリティ エラーは検出されます。PCI バスに起因するどのパリティ エラーも、通常は、ポート アダプタが確実に装着されていないか、あるいはポート アダプタそのものの欠陥が原因となっています。VIP クラッシュの syslog 出力に次のメッセージが見られた場合には、ポート アダプタを取り付け直すことで通常は問題が解決します。 PCI bus <num> parity error PCI bus <num> system error Detected Parity Error on secondary bus ポート アダプタを装着し直しても問題が解決しない場合は、ポート アダプタそのものか VIP に問題があります。トラブルシューティングを行うには、そのポート アダプタを別のベイに移動し、別のポート アダプタを元のベイに挿入します。通常は、これによって問題のあるハードウェアが判断できます。ここに例を示します。 Mar 16 19:34:54: %GEIP-1-MSG: slot9 Nevada Error Interrupt Register = 0x6 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI bus 0 system error Mar 16 19:34:54: %GEIP-1-MSG: slot9 PMA error register = 0080043800100000 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI IRDY time-out Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI master address = 0800438 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 注:同じエラーは VIP4 と VIP6 でも発生しますが、エラー メッセージが異なります。このエラーは、PCI マスター パリティ エラーおよび PCI スレーブ パリティ エラーとして検出されます。この問題のトラブルシューティングを行うには、VIP PCI バス パリティ エラーのために概略したものと同じ手順を実行してください。 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register0 = 0000000001800000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Master Parity error 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Slave Parity error 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 master address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 slave address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register1 = 0000000000000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 master address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 slave address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Latched Addresses 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU addr exception/WPE address = 00000000 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU WPE addr/WPE data = 00000000 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 ProcMem addr exception = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Pakmem addr exception = 00000000 VIP CyAsic パリティ エラーCyBus でのデータやアドレスの読み書き操作中に、VIP でパリティ エラーが検出される場合もあります。これが発生した場合、次のような syslog 出力が見られます。 CYASIC Error Interrupt register 0x2020000C Parity Error internal to CYA Parity Error in data from CyBus この情報をシステム ログにある情報と一緒に使用して、エラーの本当の原因を判別します。 注:CyBus パリティ エラーに関しては、VIP4 と VIP6 で同じエラー メッセージが表示されます。 CyBus 上の NACKVIP が MEMD の無効アドレスに書き込みを行おうとすると、RSP はそのスロットの CyBus 上に NACK を発行します。これは、通常はソフトウェアの問題ですが、ハードウェアの問題である場合もあります。たとえば次の出力では、VIP が無効アドレスに 4 バイトを書き出しているので、RSP はそのスロットに対して CyBus で NACK を返しています。 %RSP-3-ERROR: CyBus0 error 10 %RSP-3-ERROR: command/address mismatch %RSP-3-ERROR: bus command write 4bytes (0xE) %RSP-3-ERROR: address offset (bits 3:1) 0 %RSP-3-ERROR: virtual address (bits 23:17) 000000 %VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 %VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20000003 %VIP2-1-MSG: slot5 Missing ACK on CyBus access %VIP2-1-MSG: slot5 NACK present on CyBus access %VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x0 %VIP2-1-MSG: slot5 CYBUS Error register 0x8001C48, PKT Bus Error register 0x0 %VIP2-1-MSG: slot5 System reloaded by a fatal hardware error %VIP2-1-MSG: slot5 caller=0x60126C44 %VIP2-1-MSG: slot5 System exception: sig=22, code=0x0, context=0x60265C68 しかし、次に示すように、RSP は MEMD に不良パリティを書き込もうとしている VIP にも NACK を発行します。 CYASIC Error Interrupt register 0x1B Parity Error in data from Packet Bus Parity Error internal to CYA Missing ACK on CyBus access NACK present on CyBus access この出力に示すように、すべてのスロットに NACK が現れた場合、これはハードウェア エラーです。このアービターには欠陥があり、カード ケージを交換する必要があります。 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 Nevada Error Interrupt Register =0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Error Interrupt register0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYBUS Error register 0x8001A00, PKTBus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %VIP2-1-MSG: slot2 NACK present on CyBus access Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYBUS Error register 0x800006A, PKT Bus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20200001 Jan 1 23:55:21: %VIP2-1-MSG: slot5 NACK present on CyBus access Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x200000 Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYBUS Error register 0x800006C, PKT Bus Error register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYBUS Error register 0x8001B80, PKT Bus Error register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYBUS Error register 0x8001C08, PKT Bus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 System reloaded by a fatal hardware error Jan 1 23:55:21: %VIP2-1-MSG: slot2 caller=0x6012640C Jan 1 23:55:21: %VIP2-1-MSG: slot2 System exception: sig=22, code=0x0, context=0x60265028 ソフトウェアによる VIP のクラッシュこのドキュメントで説明したいずれの理由も当てはまらない VIP クラッシュは、他のソフトウェア問題が原因というのが最も一般的です。このようなクラッシュはさまざまな方法で明らかにすることができます。ソフトウェアの問題による VIP クラッシュのリスクを軽減し、発生した場合にそれを対処するための一般的な提言をいくつか次に示します。
ソフトウェアの問題で発生した VIP クラッシュのシステム ログ出力の例を次に示します。 Apr 18 17:13:33.884: %VIP2 R5K-1-MSG: slot0 System reloaded by a Bus Error exception Apr 18 17:13:33.892: %VIP2 R5K-1-MSG: slot0 caller=0x600BC974 Apr 18 17:13:33.900: %VIP2 R5K-1-MSG: slot0 System exception: sig=10, code=0x408, context=0x605B51E0 Apr 18 17:13:33.912: %VIP2 R5K-1-MSG: slot0 $0 : 00000000, AT : 605B0000, v0 : 00000001, v1 : FFFFFFFC, Apr 18 17:13:33.924: %VIP2 R5K-1-MSG: slot0 a0 : 00000002, a1 : 6042CEE0, a2 : 00000000, a3 : 6112FEC4, Apr 18 17:13:33.936: %VIP2 R5K-1-MSG: slot0 t0 : 00000053, t1 : 3400FF01, t2 : 00000000, t3 : FFFFFFFF, Apr 18 17:13:33.948: %VIP2 R5K-1-MSG: slot0 t4 : 600BC9B0, t5 : 000000F8, t6 : 00000000, t7 : 00000002, Apr 18 17:13:33.956: %VIP2 R5K-1-MSG: slot0 s0 : 0C58BA24, s1 : 00000064, s2 : 6112C7AC, s3 : 60560000, Apr 18 17:13:33.964: %VIP2 R5K-1-MSG: slot0 s4 : 60560000, s5 : 00000001, s6 : 6041433C, s7 : 60414310, Apr 18 17:13:33.972: %VIP2 R5K-1-MSG: slot0 t8 : 00008945, t9 : 00000000, k0 : 607F6CA0, k1 : 00000200, Apr 18 17:13:33.980: %VIP2 R5K-1-MSG: slot0 gp : 6056AFC0, sp : 6112FEC0, s8 : 60414460, ra : 6026EC4C, Apr 18 17:13:33.988: %VIP2 R5K-1-MSG: slot0 EPC : 6026EAA0, ErrorEPC : 800086B8, SREG : 3400FF03 Apr 18 17:13:33.996: %VIP2 R5K-1-MSG: slot0 Cause 00000408 (Code 0x2) Apr 18 17:13:34.004: %VIP2 R5K-1-MSG: slot0 Traceback= 6026EAA0 6026E2E8 6009BAF4 6009BAE0 Apr 18 17:13:35.012: %DBUS-3-DBUSINTERRSWSET: Slot 0, Internal Error due to VIP crash ソフトウェア問題の場合に取得すべき最も重要な情報は、おそらく VIP の crashinfo ファイルです。この情報をキャプチャする手順については、「VIP Crashinfo ファイルの取得」セクションを参照してください。 バス エラー例外VIP クラッシュが何度も発生する場合、Crashinfo ファイルを確認すると、次のメッセージが見られる場合があります。 00:00:11: %LINK-3-UPDOWN: Interface POS1/0, changed state to up IOBUS Error Interrupt Status register 0x0 Unexpected exception, CPU signal 10, PC = 0x602A7660 -Traceback= 602A7660 602AB238 CPU signal 10 というエラー メッセージは、バス エラー例外を意味しています。バス エラーは、ハードウェアの問題である可能性もあれば、ソフトウェアの問題である可能性もあります。この問題を回避するには、モジュールを取り付け直し、ルータを監視します。モジュールを取り付けなおした後でもクラッシュが生じる場合は、Crashinfo ファイルを添えて、TAC Service Request Tool(登録ユーザのみ)でご連絡ください。 Cisco テクニカルサポートへの VIP クラッシュの報告TAC サービス リクエストを作成する前にサービス リクエストをオープンする前に、この情報を使用して VIP クラッシュ サマリー ファイルを作成することを推奨いたします。この情報を TAC Service Request Tool(登録ユーザ専用)の Problem Description フィールドに取り込んでください。
次に TAC のサービス リクエストをオープンする場合に収集する情報を収集します。 クラッシュ サマリー ファイルの例を次に示します。
******problem description..
VIP crashed with parity errors.
The parity errors are being read by the SRAM, suspect the PA!
******show version
Cisco Internetwork Operating System Software
IOS (tm) GS Software (RSP-PV-M), Version 11.1(29)CC1, EARLY DEPLOYMENT
RELEASE SOFTWARE (fc1)
V111_29_CC_THROTTLE_BRANCH Synced to mainline version: 11.1(29)CA
Copyright (c) 1986-1999 by cisco Systems, Inc.
Compiled Wed 13-Oct-99 02:21 by sharpd
Image text-base: 0x60010910, data-base: 0x60832000
ROM: System Bootstrap, Version 11.1(8)CA1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1)
ROM: GS Software (RSP-BOOT-M), Version 11.1(29)CC1, EARLY DEPLOYMENT
RELEASE SOFTWARE (fc1)
attga711c7 uptime is 27 weeks, 11 minutes
System restarted by reload at 00:49:05 UTC Sun Oct 24 1999
System image file is "slot0:rsp-pv-mz.111-29.CC1", booted via slot0
Host configuration file is "cbb/al/ar-2", booted via tftp from 199.37.184.170
cisco RSP4 (R5000) processor with 262144K/2072K bytes of memory.
R5000 processor, Implementation 35, Revision 2.1 (512KB Level 2 Cache)
Last reset from power-on
G.703/E1 software, Version 1.0.
G.703/JT2 software, Version 1.0.
X.25 software, Version 2.0, NET2, BFE and GOSIP compliant.
Chassis Interface.
3 VIP2 R5K controllers (3 ATM).
3 ATM network interfaces.
123K bytes of non-volatile configuration memory.
20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K).
8192K bytes of Flash internal SIMM (Sector size 256K).
******show diag slot 6
Slot 6:
Physical slot 6, ~physical slot 0x9, logical slot 0, CBus 0
Microcode Status 0x4
WCS Loaded
Board is disabled analyzed wedged
Pending I/O Status: None
EEPROM format version 1
VIP2 R5K controller, HW rev 2.02, board revision C0
Serial number: 12639078 Part number: 73-2167-05
Test history: 0x00 RMA number: 00-00-00
Flags: cisco 7000 board; 7500 compatible
EEPROM contents (hex):
0x20: 01 1E 02 02 00 C0 DB 66 49 08 77 05 00 00 00 00
0x30: 60 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00
Slot database information:
Flags: 0x295 Insertion time: 0x3AA4 (27w0d ago)
Controller Memory Size: 128 MBytes DRAM, 8192 KBytes SRAM
PA Bay 0 Information:
ENHANCED ATM OC3 PA (MM), 1 port
EEPROM format version 1
HW rev 2.00, Board revision A0
Serial number: 12366362 Part number: 73-2430-04
1 crash since restart.
Last crash context (Apr 29 2000 23:19:26):
Nevada Error Interrupt Register = 0x2
PMA error interrupt
PMA Error Register = 0046000000001000
Packet Memory Read Parity error
PCI master address = 0460000
$0 : 00000000, AT : 60179244, v0 : 601D337C, v1 : 0000AAAA
a0 : 604CF3E0, a1 : 604C8180, a2 : 00001182, a3 : 00000050
t0 : 00000800, t1 : 4E90424C, t2 : 00000001, t3 : 6014A620
t4 : 6016E220, t5 : 000000F8, t6 : 00000000, t7 : 00000000
s0 : 321735CC, s1 : 6052B508, s2 : 604C8180, s3 : 604CF3E0
s4 : 3226C120, s5 : 604D1440, s6 : 00000002, s7 : 00000CED
t8 : 34000000, t9 : 603C9930, k0 : 00000000, k1 : 00000002
gp : 60337700, sp : 603C0350, s8 : 00000001, ra : 601476E8
EPC : 601D337C, ErrorEPC : 800086B8, SREG : 3400E103
Cause 00000000 (Code 0x0): Interrupt exception
Traceback= 0x601D337C 0x601476E8 0x6014A674
******excerpt from crashinfo
Nevada Error Interrupt Register = 0x2
PMA error register = 0046000000001000
Packet Memory Read Parity error
PCI master address = 0460000
******excerpt from syslog
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Packet Memory Read Parity error
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PCI master address = 0460000
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x00): cfid = 0x00011011
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x04): cfcs = 0x02800147
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x08): cfccid = 0x06040002
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x0C): cfpmlt = 0x00010000
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x18): cfsmlt = 0x00010100
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x1C): cfsis = 0x02807020
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x20): cfmla = 0x01F00000
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x24): cfpmla = 0x0000FE00
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x3C): cfbc = 0x00030000
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x40): cfseed = 0x00000000
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x44): cfstwt = 0x00000000
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x48): cfswac = 0x00FFFFFF
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x4C): cfpwac = 0x00FFFFFF
Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error
TAC のサービス リクエストをオープンする場合に収集する情報
Cisco サポート コミュニティ - 特集対話関連情報
|