思科接口和模块 : Cisco Gigabit 以太网接口处理器

多用途接口处理器 (VIP) 崩溃故障排除

2016 年 10 月 24 日 - 机器翻译
其他版本: PDFpdf | 英语 (2015 年 8 月 22 日) | 反馈


交互:本文档对您的 Cisco 设备进行自定义分析。


目录


简介

本文提供信息排除故障多用途接口处理器失败。

先决条件

要求

Cisco建议您有7500系列路由器问题信息通告(Field Notice)的知识。

使用的组件

本文档中的信息基于以下软件和硬件版本:

  • VIP1

  • VIP2-10

  • VIP2-15

  • VIP2-20

  • VIP2-40

  • VIP2-50

  • FEIP2

  • GEIP

  • GEIP+

  • VIP4-50

  • VIP4-80

  • VIP6-80

本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。

规则

有关文档规则的详细信息,请参阅 Cisco 技术提示规则

VIP 体系结构

为了解释VIP崩溃,对首先是重要了解VIP的基本体系结构。在此部分的图显示VIP2的功能块结构图,包括这些组件:

  • 猎户星座精简的指令集计算(RISC) CPU和相关的电路,包括动态RAM (DRAM)、L2缓存、里诺application-specific integrated circuit (ASIC)和引导程序ROM。

  • CyBus ASIC —控制并且传输数据包在VIP2静态RAM的组件(SRAM)和系统信息包存储(MEMD)之间在CyBus或Cxbus间。

  • 数据包内存ASIC —负责对移动数据包在端口适配器和SRAM之间。

  • 外围部件互连(PCI) BUS —端口适配器和VIP2 SRAM之间的数据路径。

  • 网桥—负责对隔离端口适配器的个人PCI BUS。

vip_crash1.gif

VIP2微码(固件)是该的镜像提供卡片细节的软件指令。在VIP2的可编程只读存储器(PROM)设备包含协助解决在查找和装载微码镜像的系统从思科IOSï ¿  ½软件套件或从闪存的默认微码启动镜像。在PROM的微码启动镜像初始化VIP2,然后协助解决下载VIP2微码镜像。同一个类型的所有接口装载同一个微码镜像,从Cisco IOS软件套件或从闪存。虽然闪存能一种特定接口类型的存储多个微码版本,只有一镜像能加载在启动。

show controllers cbus命令显示每个接口处理器和VIP2的当前装载的和运行微码版本。show startup-config命令显示装载的微码当前系统说明在启动。

当您排除故障时,您在此部分能使用图作为指南读从VIP崩溃信息文件或Syslog的信息。为例,显示错误奇偶校验的此系统日志输出找到看看,当读从VIP SRAM :

Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6    Packet Memory Read Parity error 

!--- Bad parity is found when read from the VIP SRAM.

Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6   PCI master address = 0460000
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x00): cfid   = 0x00011011
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x04): cfcs   = 0x02800147
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x08): cfccid = 0x06040002
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x0C): cfpmlt = 0x00010000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x18): cfsmlt = 0x00010100 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x1C): cfsis  = 0x02807020 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x20): cfmla  = 0x01F00000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x24): cfpmla = 0x0000FE00 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x3C): cfbc   = 0x00030000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x40): cfseed = 0x00000000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x44): cfstwt = 0x00000000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x48): cfswac = 0x00FFFFFF 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x4C): cfpwac = 0x00FFFFFF 
Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error

您从在下一部分的建议看到, VIP在此输出中应该是受监视,并且应该替换SRAM或VIP,如果相似的失败再发生。

如何识别 VIP

您能检查地址0x21内容在EEPROM的在show diag命令输出中为了验证VIP的型号。对应于每个VIP类型的值在此表里显示:

VIP 控制器类型
0x14 VIP1 VIP控制器
0x15 VIP2 (VIP2-10、VIP2-15、VIP2-20, VIP2-40) VIP2控制器
0x1E VIP2-50 VIP2 R5K控制器
0x20 FEIP2 FEIP2控制器
0x21 GEIP GEIP控制器
0x40 GEIP +* GEIP+控制器
0x22 VIP4-80 VIP4-80 RM7000控制器
0x31 VIP4-50 VIP4-50 RM5271控制器
0x4E VIP6-80 VIP6-80 RM7000B控制器

注意: GEIP+根据VIP4-80。在本文的所有更多信息关于VIP4-80也适用于GEIP+。

示例如下:

Router#show diag 10 
     Slot 10: 
             Physical slot 10, ~physical slot 0x5, logical slot 10, CBus 0 
             Microcode Status 0x4 
             Master Enable, LED, WCS Loaded 
             Board is analyzed 
             Pending I/O Status: None 
             EEPROM format version 1 
             VIP2 R5K controller, HW rev 2.02, board revision D0 
             Serial number: 17090200  Part number: 73-2167-05 
             Test history: 0x00        RMA number: 00-00-00 
             Flags: cisco 7000 board; 7500 compatible 

             EEPROM contents (hex): 
               0x20: 01 1E 02 02 01 04 C6 98 49 08 77 05 00 00 00 00 
               0x30: 68 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 

             Slot database information: 
             Flags: 0x4      Insertion time: 0x18C0 (00:29:13 ago) 

             Controller Memory Size: 32 MBytes DRAM, 4096 KBytes SRAM

从此输出,您能看到此VIP是VIP2-50。

在VIP2-10、VIP2-15、VIP2-20和VIP2-40之间的区别是相当数量DRAM和SRAM在其中每一。多种VIP2s (如果他们未升级)在show diag命令输出中可以区分由在此表里显示的内存配置:

内存 VIP
8 MB DRAM/512 KB SRAM VIP2-10
8 MB DRAM/1 MB SRAM VIP2-15
16 MB DRAM/1 MB SRAM VIP2-20
32 MB DRAM/2MB SRAM VIP2-40

得到VIP崩溃信息文件

当您设法解决软件问题或尝试诊断系统崩溃的根本原因时,在crashinfo文件包含的信息能证明无价的。不仅crashinfo文件包含记录信息,并且VIP的一个堆栈跟踪,也包含广泛的内存和上下文信息。每次VIP失败, VIP尝试把crashinfo文件写到RSP的Bootflash。Crashinfo文件在此格式存储:

crashinfo_vip_<slot#>_<data>_<time>

您能发出dir命令为了寻找VIP崩溃信息文件如显示此处:

7500a#dir bootflash: 
     Directory of bootflash:/ 

       1  -rw-     3951876   Jan 01 2000 00:01:22  rsp-boot-mz.111-22.CA 
       2  -rw-      162641   Jun 21 2000 12:53:40  crashinfo_vip_0_20000621-125340 
       3  -rw-      162778   Jun 21 2000 13:00:10  crashinfo_vip_0_20000621-130010 

     7602176 bytes total (3324492 bytes free) 
     7500a#

路由器的此Bootflash包含两个VIP崩溃信息文件。发出show file更多命令为了查看和捕获这些文件的内容在符合的到此步骤:

  1. 与您的终端程序的开始录音。

  2. 发出term length 0命令

  3. 发出更多Bootflash :<crashinfo filename>命令。

  4. 保存输出到文件。

参考获取信息从Crashinfo文件关于如何的更多信息与crashinfo文件一起使用。

如果有show technical-support (从特权模式)命令的输出从您的Cisco设备的,您能使用 为了显示潜在问题和修正。您必须是注册用户,登陆和安排Javascript启用为了使用

崩溃类型

VIP崩溃分类到根据事故的原因的几个类别。找到非可恢复错误, VIP失败。这些错误可以是造成否定应答消息奇偶校验错误的结果、软件或者硬件(纳克)是存在CyBus,或者软件问题。此部分在这些错误类型中的每一种提供信息。

如果有show technical-support (从特权模式)命令的输出从您的Cisco设备的,您能使用 显示潜在问题和修正。您必须是注册用户,登陆和安排Javascript启用为了使用

奇偶校验错误

VIP2奇偶检验错误检测

奇偶校验错误在VIP出现,当硬件尝试通过比较计算奇偶值检查数据时正确性与上一个奇偶值同一个数据。在数据的一次一位轻碰能导致奇偶校验错误。当您诊断在VIP时的奇偶校验错误,了解奇偶校验被检查,并且在的每个位置在是重要的哪些奇偶校验错误能潜在出现。此图表概要此信息。另外,参考Cisco 7500 VIP故障树分析关于奇偶校验错误的更多信息。

/image/gif/paws/12811/vip_crash2.gif

如此图表所显示,有在VIP能生成的七不同种类的奇偶校验错误。注意错误从另一来源,并且也许没有在VIP内产生接收。奇偶校验错误的来源可以是从路由/交换处理器(RSP),另一个VIP,或者从不足装置或有故障的端口适配器。为了适当地了解VIP崩溃,诊断失败的来源是重要的。

应该了解的是数据以错误奇偶校验可以由数在VIP的对称校验所有单个读或写操作的设备和Cisco 7500系列路由器报告。例如,如果VIP在RSP的一个传输队列读一数据包到其自己的SRAM和有在RSP的SRAM的一奇偶校验错误,然后您看到从MD ASIC在RSP,在VIP的CYA ASIC,并且PCI/packet存储器ASIC的错误消息在VIP。

此图表显示VIP崩溃的故障树分析:

/image/gif/paws/12811/vip_crash3.gif

VIP4和VIP6奇偶校验错误和ECC检测

VIP4-50、VIP4-80和VIP6-80使用单bit错误更正和双比特错误检测误码纠错(ECC) C.p.u内存和数据包内存的。两个是同步动态RAM (SDRAM)。更正在SDRAM的个别位错误,并且系统继续正常运行。

在第造成ECC多位错误生成的2或3的多位奇偶校验错误在此表里是致命事件。CPU内部缓存和BUS在系统使用一位奇偶校验检测。如显示此处, VIP4的体系结构和VIP6是与VIP2不同。所以,一些错误消息看不到,并且其他错误消息跟他们在VIP2不同地报告。在此奇偶校验错误部分, VIP2之间的差异, VIP4和VIP6表示并且解释。

/image/gif/paws/12811/vip_crash4.gif

缓存奇偶校验错误例外

当错误奇偶校验发现在CPU或在主要数据缓存时,缓存奇偶校验错误例外发生。奇偶校验错误也许已经出现在VIP DRAM, DRAM控制器,主要缓存,或者在CPU。奇偶校验错误已发现在此位置也指处理器内存奇偶校验错误(PMPE)。这些错误导致VIP的立即失败,并且输出看似类似在VIP和RSPs。信号值为二十(SIG=20)表明缓存奇偶校验错误例外发生了。信号值在失败的系统日志信息显示。

最近代码也提供一条有意义的冗长的线路如显示此处:

Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System reloaded by a Cache Parity Exception 
Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System Reload called from 0x60125C8C, 
context=0x60220930 
Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System exception: sig=20, code=0x20025B69, 
context=0x60220930

在VIP崩溃信息文件包含的信息也指向同一个奇偶错误位置在主要数据缓存:

Error: primary data cache, fields: data, 
         virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000 
         virtual address corresponds to main:data, cache word 0 

                      Low Data   High Data  Par    Low Data   High Data  Par 
         L1 Data :  0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 
                    2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8 

                       Low Data   High Data  Par    Low Data   High Data  Par 
          Mem Data:  0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 
                     2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8

主要缓存或PMPE可以是临时错误。如果这是PMPE的一审,您能通常安全忽略它。然而,如果同样VIP体验第二或随后的PMPE,您应该替换VIP。有时DRAM的更换能也解决问题。

VIP4和VIP6注意—生成在CPU内部缓存和在CyAsic的奇偶校验错误检测作为缓存奇偶校验错误例外。更正在c.p.u内存的一位奇偶校验错误,并且行动不需要采取。在c.p.u内存的多位奇偶校验错误检测作为procmem ecc多位奇偶校验错误。在VIP的c.p.u内存,如果procmem ecc多位奇偶校验错误报告,应该更换。

Oct 25 09:30:54.708: %VIP4-50 RM5271-1-MSG: slot4 PMA error register1 00000000 
00002000
Oct 25 09:30:54.716: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit error
Oct 25 09:30:54.724: %VIP4-50 RM5271-1-MSG: slot4 PCI1 master address 00000000
Oct 25 09:30:54.732: %VIP4-50 RM5271-1-MSG: slot4 PCI1 slave address 00000000
Oct 25 09:30:54.740: %VIP4-50 RM5271-1-MSG: slot4 Latched Addresses
Oct 25 09:30:54.748: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception 
addr 22220000 025F0860
Oct 25 09:30:54.756: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception 
data 00000000 00000000
Oct 25 09:30:54.764: %VIP4-50 RM5271-1-MSG: slot4 MPU addr exception/WPE address 
00000000 00000000
Oct 25 09:30:54.772: %VIP4-50 RM5271-1-MSG: slot4 MPU WPE addr/WPE data 00000000 
00000000
Oct 25 09:30:54.780: %VIP4-50 RM5271-1-MSG: slot4 ProcMem addr exception 0 0000000
Oct 25 09:30:54.788: %VIP4-50 RM5271-1-MSG: slot4 Pakmem addr exception 00000000
Oct 25 09:31:15.824: %VIP4-50 RM5271-1-MSG: slot4 System reloaded by a fatal 
hardware error
Oct 25 09:31:15.836: %VIP4-50 RM5271-1-MSG: slot4 caller=0x600BCE18
Oct 25 09:31:15.844: %VIP4-50 RM5271-1-MSG: slot4 System exception: sig22, 
code 0x0, context=0x60615F28

从CyBus的奇偶校验错误

当从MEMD在RSP和这些错误的VIP下载被看到时,这通常表明另一个VIP写入错误奇偶校验对MEMD,或者MEMD毁损了。如果来源是从MEMD,并且继续,您需要替换RSP。相反地,如果错误奇偶校验的来源是另一个VIP,写入错误奇偶校验的您应该重新安装,并且,如果需要,替换VIP。

%VIP2-1-MSG: slot1 Nevada Error Interrupt Register 0x3 
%VIP2-1-MSG: slot1 CYASIC Error Interrupt register 0x2020000C 
%VIP2-1-MSG: slot1 Parity Error internal to CYA 
%VIP2-1-MSG: slot1 Parity Error in data from CyBus 

!--- Bad parity is received by the VIP from the CyBus.

%VIP2-1-MSG: slot1 CYASIC Other Interrupt register 0x200100 
%VIP2-1-MSG: slot1 QE HIGH Priority Interrupt 
%VIP2-1-MSG: slot1 CYBUS Error register 0xD001A02, PKT Bus Error register 0x0 
%VIP2-1-MSG: slot1 PMA error register = 0070000440000000 
%VIP2-1-MSG: slot1 Packet Bus Write Parity error 

!--- The bad parity that was received from the CyBus is written to SRAM.

%VIP2-1-MSG: slot1 PCI master address = 0700004 
%VIP2-1-MSG: slot1 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 
%VIP2-1-MSG: slot1 DEC21050 bridge chip, config=0x0 
%VIP2-1-MSG: slot1 (0x00): cfid = 0x00011011 
%VIP2-1-MSG: slot1 (0x04): cfcs= 0x02800147 
%VIP2-1-MSG: slot1 (0x08):cfccid = 0x06040002 
%VIP2-1-MSG: slot1 (0x0C):cfpmlt = 0x00010000 
%VIP2-1-MSG: slot1 (0x18): cfsmlt = 0x00010100 
%VIP2-1-MSG: slot1 (0x1C): cfsis = 0x22807020 
%VIP2-1-MSG: slot1 Received Master Abort on secondary bus 
%VIP2-1-MSG: slot1 (0x20): cfmla = 0x01F00000

注意: VIP4和VIP6表示关于CyBus奇偶校验错误的同样错误消息,但是信息包总线写奇偶错误消息没有显示。

VIP I/O控制器和里诺读奇偶校验错误

DRAM控制器奇偶校验错误和输入/输出(I/O)控制器奇偶校验错误由里诺ASIC检测。发起于DRAM或于DRAM控制器的奇偶校验错误报告作为缓存奇偶校验异常。如此输出所显示, I/O控制器检测的奇偶校验错误报告。通常,除从其他位置的消息之外I/O控制器报告的奇偶校验错误在别处产生和由I/O控制器报告。

Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Reno read parity error - bytes 0 & 1 
Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 PMA error register = 0080004000001000 
Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Packet Memory Read Parity error

注意: VIP4和VIP6不表示此错误消息。

VIP信息包内存读奇偶校验错误

PMA ASIC报告信息包内存读操作奇偶校验错误,在奇偶校验错误读在数据包内存(SRAM)外面时候在VIP。此错误在系统日志报告如显示此处:

Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 Nevada Error Interrupt Register = 0x22 
Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 PCI bus 0 parity error 
Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PMA error register = 4080103C00004000 
Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PCI Transmit Parity error 
Oct 30 05:18:08.120: %VIP2-1-MSG: slot9 Packet Memory Read Parity error

您能也看到一个信息包内存读操作奇偶校验错误的证据在VIP崩溃信息文件的:

Nevada Error Interrupt Register = 0x2 
PMA error register = 0046000000001000 
Packet Memory Read Parity error
PCI master address = 0460000

SRAM奇偶错误可以也瞬变,因此请对待第一出现方式和DRAM奇偶校验错误一样。如果错误仍然存在,请替换SRAM或VIP。

VIP4和VIP6注意—更正在数据包内存的一位奇偶校验错误。在数据包内存的多位奇偶校验错误检测作为pakmem ecc多位奇偶校验错误。VIP信息包内存,如果pakmem ecc多位奇偶校验错误报告,应该更换。

%VIP4-80 RM7000-1-MSG: slot1 PMA error register0 = 0000000000002000
%VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit error
%VIP4-80 RM7000-1-MSG: slot1 PCI0 master address = 00000000
%VIP4-80 RM7000-1-MSG: slot1 PCI0 slave address = 00000000
%VIP4-80 RM7000-1-MSG: slot1 PMA error register1 = 0000000000000000
%VIP4-80 RM7000-1-MSG: slot1 PCI1 master address = 00000000
%VIP4-80 RM7000-1-MSG: slot1 PCI1 slave address = 00000000
%VIP4-80 RM7000-1-MSG: slot1 Latched Addresses
%VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception addr = 00012358 000000CA
%VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception data = 00000000 00040800
%VIP4-80 RM7000-1-MSG: slot1 MPU addr exception/WPE address = 00000000 00000000
%VIP4-80 RM7000-1-MSG: slot1 MPU WPE addr/WPE data = 00000000 00000000
%VIP4-80 RM7000-1-MSG: slot1 ProcMem addr exception = 00000000
%VIP4-80 RM7000-1-MSG: slot1 Pakmem addr exception = 00000000

VIP信息包总线写入奇偶校验错误

在奇偶校验错误写入对数据包内存时候, PMA ASIC报告信息包总线写入奇偶校验错误。在本例中, VIP是只有信使,并且问题不存在与此VIP内存。

May 10 09:22:14.520: %VIP2-1-MSG: slot11 PMA error register = 2080002800800200 
May 10 09:22:15.520: %VIP2-1-MSG: slot11 Packet Bus Write Parity error

注意: VIP4和VIP6不表示此错误消息。

VIP PCI总线奇偶校验错误

奇偶校验错误在PCI BUS 1和2上可以检测,其中之二直接地协调与端口适配器。这些BUS由第三PCI总线一起桥接,总线0,奇偶校验错误可能也检测。起源于任何PCI BUS的奇偶校验错误通常是由不足装置导致的或有故障的端口适配器。在您在VIP的系统日志输出中看到这些消息失败时候,您需要重新安装端口适配器为了解决问题。

PCI bus <num> parity error 
PCI bus <num> system error
Detected Parity Error on secondary bus

如果重新安装端口适配器不解决问题,问题位于随着端口适配器或VIP。移动端口适配器向另一个海湾并且插入第二个端口适配器到原始海湾为了排除故障。这通常指向冲突的硬件。示例如下所示:

Mar 16 19:34:54: %GEIP-1-MSG: slot9 Nevada Error Interrupt Register = 0x6 
Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI bus 0 system error
Mar 16 19:34:54: %GEIP-1-MSG: slot9 PMA error register = 0080043800100000 
Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI IRDY time-out 
Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI master address = 0800438 
Mar 16 19:34:54: %GEIP-1-MSG: slot9 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0

注意: 同样错误发生在VIP4和VIP6,但是错误消息不同的。它检测作为PCI主控奇偶校验错误和PCI从奇偶校验错误。执行步骤和概述一样为了VIP PCI总线奇偶校验错误能排除故障此问题。

00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register0 = 0000000001800000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Master Parity error
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Slave Parity error
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 master address = 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 slave address = 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register1 = 0000000000000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 master address = 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 slave address = 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Latched Addresses
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU addr exception/WPE address = 
00000000 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU WPE addr/WPE data = 
00000000 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 ProcMem addr exception = 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Pakmem addr exception = 00000000

VIP CyAsic奇偶校验错误

奇偶校验错误可能由在读或写操作的数据或地址的VIP也检测在CyBus的。如果这发生,您看到系统日志输出类似于此:

CYASIC Error Interrupt register 0x2020000C 
Parity Error internal to CYA 
Parity Error in data from CyBus

与现在的信息一道请使用此信息在系统日志确定错误的真正的源。

注意: VIP4和VIP6表示CyBus奇偶校验错误的同样错误消息。

NACK 出现在 CyBus 上

当VIP设法写入到在MEMD时的一个无效的地址, RSP在该slot的CyBus放置纳克。这通常是软件问题,但是可以也是硬件问题。例如,在此输出中, VIP在该slot的CyBus写入4个字节对无效的地址, RSP如此放置纳克。

%RSP-3-ERROR: CyBus0 error 10 
%RSP-3-ERROR: command/address mismatch 
%RSP-3-ERROR: bus command write 4bytes (0xE) 
%RSP-3-ERROR: address offset (bits 3:1) 0 
%RSP-3-ERROR: virtual address (bits 23:17) 000000 
%VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 
%VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20000003 
%VIP2-1-MSG: slot5 Missing ACK on CyBus access 
%VIP2-1-MSG: slot5 NACK present on CyBus access
%VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x0 
%VIP2-1-MSG: slot5 CYBUS Error register 0x8001C48, PKT Bus Error register 0x0 
%VIP2-1-MSG: slot5 System reloaded by a fatal hardware error 
%VIP2-1-MSG: slot5 caller=0x60126C44 
%VIP2-1-MSG: slot5 System exception: sig=22, code=0x0, context=0x60265C68

然而,如此输出所显示, RSP在尝试的VIP也放置纳克能写入错误奇偶校验对MEMD。

CYASIC Error Interrupt register 0x1B 
Parity Error in data from Packet Bus 
Parity Error internal to CYA 
Missing ACK on CyBus access 
NACK present on CyBus access

如此输出所显示时,当纳克出现在所有slot,它是硬件错误。裁决者有故障,并且必须替换卡柜。

Jan  1 23:55:21: %FEIP2-1-MSG: slot0 Nevada Error Interrupt Register =0x1 
Jan  1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Error Interrupt register0x20000001 
Jan  1 23:55:21: %FEIP2-1-MSG: slot0 NACK present on CyBus access 
Jan  1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Other Interrupt register 0x0 
Jan  1 23:55:21: %FEIP2-1-MSG: slot0 CYBUS Error register 0x8001A00, 
PKTBus Error register 0x0 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 Nevada Error Interrupt Register = 0x1 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Error Interrupt register 0x20000001 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 NACK present on CyBus access
Jan  1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Other Interrupt register 0x0 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 CYBUS Error register 0x800006A, 
PKT Bus Error register 0x0 
Jan  1 23:55:21: %VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 
Jan  1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20200001 
Jan  1 23:55:21: %VIP2-1-MSG: slot5 NACK present on CyBus access 
Jan  1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x200000 
Jan  1 23:55:21: %VIP2-1-MSG: slot5 CYBUS Error register 0x800006C, 
PKT Bus Error register 0x0 
Jan  1 23:55:21: %FEIP2-1-MSG: slot8 Nevada Error Interrupt Register = 0x1 
Jan  1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Error Interrupt register 0x20000001 
Jan  1 23:55:21: %FEIP2-1-MSG: slot8 NACK present on CyBus access
Jan  1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Other Interrupt register 0x0 
Jan  1 23:55:21: %FEIP2-1-MSG: slot8 CYBUS Error register 0x8001B80, 
PKT Bus Error register 0x0 
Jan  1 23:55:21: %FEIP2-1-MSG: slot10 Nevada Error Interrupt Register = 0x1 
Jan  1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Error Interrupt register 0x20000001 
Jan  1 23:55:21: %FEIP2-1-MSG: slot10 NACK present on CyBus access
Jan  1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Other Interrupt register 0x0 
Jan  1 23:55:21: %FEIP2-1-MSG: slot10 CYBUS Error register 0x8001C08,
PKT Bus Error register 0x0 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 System reloaded by a fatal hardware error 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 caller=0x6012640C 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 System exception: sig=22, code=0x0, 
context=0x60265028

软件导致的 VIP 故障

没引起的VIP崩溃任何原因的本文通常归结于其它软件问题。这些失败可以表明用各种各样的不同的方式。如果他们发生,这些是一般建议减小VIP崩溃风险由于软件问题和应付他们:

  • 总是请确保Cisco IOS软件镜像支持VIP。

  • 总是请保持RSP-BOOT镜像和主Cisco IOS软件镜像在同一个版本。

  • 保证VIP配置和端口适配器由Cisco IOS软件当前版本支持。

  • 检查版本注释正确Cisco IOS软件级别和内存要求。

这是VIP崩溃的syslog输出的示例由于软件问题:

Apr 18 17:13:33.884: %VIP2 R5K-1-MSG: slot0 System reloaded by a 
Bus Error exception 
Apr 18 17:13:33.892: %VIP2 R5K-1-MSG: slot0 caller=0x600BC974 
Apr 18 17:13:33.900: %VIP2 R5K-1-MSG: slot0 System exception: 
sig=10, code=0x408, context=0x605B51E0 
Apr 18 17:13:33.912: %VIP2 R5K-1-MSG: slot0 $0 : 00000000, 
AT : 605B0000, v0 : 00000001, v1 : FFFFFFFC, 
Apr 18 17:13:33.924: %VIP2 R5K-1-MSG: slot0 a0 : 00000002, 
a1 : 6042CEE0, a2 : 00000000, a3 : 6112FEC4, 
Apr 18 17:13:33.936: %VIP2 R5K-1-MSG: slot0 t0 : 00000053, 
t1 : 3400FF01, t2 : 00000000, t3 : FFFFFFFF, 
Apr 18 17:13:33.948: %VIP2 R5K-1-MSG: slot0 t4 : 600BC9B0, 
t5 : 000000F8, t6 : 00000000, t7 : 00000002, 
Apr 18 17:13:33.956: %VIP2 R5K-1-MSG: slot0 s0 : 0C58BA24, 
s1 : 00000064, s2 : 6112C7AC, s3 : 60560000, 
Apr 18 17:13:33.964: %VIP2 R5K-1-MSG: slot0 s4 : 60560000, 
s5 : 00000001, s6 : 6041433C, s7 : 60414310, 
Apr 18 17:13:33.972: %VIP2 R5K-1-MSG: slot0 t8 : 00008945, 
t9 : 00000000, k0 : 607F6CA0, k1 : 00000200, 
Apr 18 17:13:33.980: %VIP2 R5K-1-MSG: slot0 gp : 6056AFC0, 
sp : 6112FEC0, s8 : 60414460, ra : 6026EC4C, 
Apr 18 17:13:33.988: %VIP2 R5K-1-MSG: slot0 EPC : 6026EAA0, 
ErrorEPC : 800086B8, SREG : 3400FF03 
Apr 18 17:13:33.996: %VIP2 R5K-1-MSG: slot0 Cause 00000408 (Code 0x2) 
Apr 18 17:13:34.004: %VIP2 R5K-1-MSG: slot0 Traceback= 6026EAA0 
6026E2E8 6009BAF4 6009BAE0 
Apr 18 17:13:35.012: %DBUS-3-DBUSINTERRSWSET: Slot 0, Internal 
Error due to VIP crash

可能获取的最重要的信息在软件问题情形下是VIP的crashinfo文件。请参阅获取VIP崩溃信息文件文件部分关于说明获取此信息。

总线错误异常

VIP失败许多次,并且,当您查看崩溃信息文件时,您也许发现此消息:

00:00:11: %LINK-3-UPDOWN: Interface POS1/0, changed state to up

IOBUS Error Interrupt Status register 0x0


Unexpected exception, CPU signal 10, PC = 0x602A7660


-Traceback= 602A7660 602AB238

CPU信号10错误消息含义总线例外错误。总线错误可以是软件或硬件问题。此问题的应急方案是重新安装模块和监控路由器。如果模块继续失败,在您重新安装模块后,请与TAC案例创建工具(仅限注册用户)联系用崩溃信息文件。

报告VIP崩溃对思科技术支持

在您创建TAC案例前

在您开Case前,它是一个好想法创建有此信息的一个VIP崩溃汇总文件。包括此信息在TAC案例创建工具(仅限注册用户)的Problem Description字段。

  • 问题说明

  • 输出show version命令

  • 输出show diag slot [x]命令

  • Crashinfo文件摘要

  • Syslog摘要

然后,如果开TAC案例,请收集应收集的信息

这是崩溃汇总文件的示例:

******problem description.. 
VIP crashed with parity errors. 
The parity errors are being read by the SRAM, suspect the PA! 

******show version 
Cisco Internetwork Operating System Software 
IOS (tm) GS Software (RSP-PV-M), Version 11.1(29)CC1, EARLY DEPLOYMENT 
RELEASE SOFTWARE (fc1) 
V111_29_CC_THROTTLE_BRANCH Synced to mainline version: 11.1(29)CA 
Copyright (c) 1986-1999 by cisco Systems, Inc. 
Compiled Wed 13-Oct-99 02:21 by sharpd 
Image text-base: 0x60010910, data-base: 0x60832000 

ROM: System Bootstrap, Version 11.1(8)CA1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) 
ROM: GS Software (RSP-BOOT-M), Version 11.1(29)CC1, EARLY DEPLOYMENT 
RELEASE SOFTWARE (fc1) 

attga711c7 uptime is 27 weeks, 11 minutes 
System restarted by reload at 00:49:05 UTC Sun Oct 24 1999 
System image file is "slot0:rsp-pv-mz.111-29.CC1", booted via slot0 
Host configuration file is "cbb/al/ar-2", booted via tftp from 199.37.184.170 

cisco RSP4 (R5000) processor with 262144K/2072K bytes of memory. 
R5000 processor, Implementation 35, Revision 2.1 (512KB Level 2 Cache) 
Last reset from power-on 
G.703/E1 software, Version 1.0. 
G.703/JT2 software, Version 1.0. 
X.25 software, Version 2.0, NET2, BFE and GOSIP compliant. 
Chassis Interface. 
3 VIP2 R5K controllers (3 ATM). 
3 ATM network interfaces. 
123K bytes of non-volatile configuration memory. 

20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K). 
8192K bytes of Flash internal SIMM (Sector size 256K). 


******show diag slot 6 
Slot 6: 
 Physical slot 6, ~physical slot 0x9, logical slot 0, CBus 0 
 Microcode Status 0x4 
 WCS Loaded 
 Board is disabled analyzed wedged 
 Pending I/O Status: None 
 EEPROM format version 1 
 VIP2 R5K controller, HW rev 2.02, board revision C0 
 Serial number: 12639078  Part number: 73-2167-05 
 Test history: 0x00        RMA number: 00-00-00 
 Flags: cisco 7000 board; 7500 compatible 

 EEPROM contents (hex): 
   0x20: 01 1E 02 02 00 C0 DB 66 49 08 77 05 00 00 00 00 
   0x30: 60 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 

 Slot database information: 
 Flags: 0x295 Insertion time: 0x3AA4 (27w0d ago) 

 Controller Memory Size: 128 MBytes DRAM, 8192 KBytes SRAM 

 PA Bay 0 Information: 
  ENHANCED ATM OC3 PA (MM), 1 port 
  EEPROM format version 1 
  HW rev 2.00, Board revision A0 
  Serial number: 12366362  Part number: 73-2430-04 

 1 crash since restart. 
 Last crash context (Apr 29 2000 23:19:26): 
 Nevada Error Interrupt Register = 0x2 
 PMA error interrupt 
 PMA Error Register = 0046000000001000 
     Packet Memory Read Parity error 
     PCI master address = 0460000 
 $0 : 00000000, AT : 60179244, v0 : 601D337C, v1 : 0000AAAA 
 a0 : 604CF3E0, a1 : 604C8180, a2 : 00001182, a3 : 00000050 
 t0 : 00000800, t1 : 4E90424C, t2 : 00000001, t3 : 6014A620 
 t4 : 6016E220, t5 : 000000F8, t6 : 00000000, t7 : 00000000 
 s0 : 321735CC, s1 : 6052B508, s2 : 604C8180, s3 : 604CF3E0 
 s4 : 3226C120, s5 : 604D1440, s6 : 00000002, s7 : 00000CED 
 t8 : 34000000, t9 : 603C9930, k0 : 00000000, k1 : 00000002 
 gp : 60337700, sp : 603C0350, s8 : 00000001, ra : 601476E8 
 EPC : 601D337C, ErrorEPC : 800086B8, SREG : 3400E103 
 Cause 00000000 (Code 0x0): Interrupt exception 
 Traceback= 0x601D337C 0x601476E8 0x6014A674 

******excerpt from crashinfo 
Nevada Error Interrupt Register = 0x2 
PMA error register = 0046000000001000 
    Packet Memory Read Parity error 
    PCI master address = 0460000 

******excerpt from syslog 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6     Packet Memory Read Parity error 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6     PCI master address = 0460000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x00): cfid   = 0x00011011 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x04): cfcs   = 0x02800147 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x08): cfccid = 0x06040002 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x0C): cfpmlt = 0x00010000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x18): cfsmlt = 0x00010100 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x1C): cfsis  = 0x02807020 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x20): cfmla  = 0x01F00000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x24): cfpmla = 0x0000FE00 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x3C): cfbc   = 0x00030000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x40): cfseed = 0x00000000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x44): cfstwt = 0x00000000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x48): cfswac = 0x00FFFFFF 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x4C): cfpwac = 0x00FFFFFF 
Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error

报告TAC案例应收集的信息

如果还需要援助,在您在本文执行故障排除步骤并且要开有思科技术支持的后一个Case,请确保包括此信息:
  • 您执行的故障排除,在您开Case前
  • show technical-support命令的输出若可能(在特权模式)
  • show log命令或控制台获取的若可能输出,
  • VIP崩溃信息文件
请以非压缩的纯文本格式 (.txt) 将收集的数据附加到请求中。使用案例查询工具(仅限注册用户),您能通过上传它附上信息。如果不能访问Case Query工具,您可以附上关于案例的相关信息,并在标题栏注明案例编号,然后通过电子attach@cisco.com发送出去。

注意: 若可能,请勿手工重新加载也请勿重新启动路由器,在您收集此信息前,当这能造成是需要的确定问题的根本原因的重要信息丢失。


相关信息


Document ID: 12811