Módulos e interfaces de Cisco : Cisco Gigabit Ethernet Interface Processors

Resolución de problemas por desperfectos del procesador de interfaz virtual (VIP)

18 Octubre 2015 - Traducción Automática
Otras Versiones: PDFpdf | Inglés (22 Agosto 2015) | Comentarios


Interactivo: Este documento ofrece un análisis personalizado de su dispositivo Cisco.


Contenido


Introducción

Este documento provee información para resolver un problema de colapso del Procesador de Interfaz Versátil (VIP).

prerrequisitos

Requisitos

Cisco recomienda que usted tiene conocimiento de los Field Notice del 7500 Series Router.

Componentes Utilizados

La información que contiene este documento se basa en las siguientes versiones de software y hardware.

  • VIP1

  • VIP2-10

  • VIP2-15

  • VIP6-20

  • VIP 2-40

  • VIP2-50

  • FEIP2

  • GEIP

  • GEIP+

  • VIP4-50

  • VIP4-80

  • VIP6-80

La información que contiene este documento se creó a partir de los dispositivos en un ambiente de laboratorio específico. Todos los dispositivos que se utilizan en este documento se pusieron en funcionamiento con una configuración verificada (predeterminada). Si la red está funcionando, asegúrese de haber comprendido el impacto que puede tener cualquier comando.

Convenciones

Consulte Convenciones de Consejos TécnicosCisco para obtener más información sobre las convenciones del documento.

Arquitectura VIP

Para interpretar un desperfecto de VIP, es importante para primero entiende la arquitectura básica del VIP. La figura en esta sección muestra el diagrama del bloque funcional del VIP2, que incluye estos componentes:

  • Computación configurados con instrucciones reducidas (RISC) CPU de Orión y conjunto de circuitos asociado, que incluye el RAM dinámica (DRAM), el caché L2, el circuito específico de la aplicación RENO (ASIC), y la ROM del inicio.

  • CyBus ASIC — El componente que controla y transfiere los paquetes entre el VIP2 Static RAM (SRAM) y la memoria del paquete del sistema (MEMD) a través del CyBus o del CxBus.

  • Memoria del paquete ASIC — Responsable de mover los paquetes entre los adaptadores de puerto y SRAM.

  • Busses del Interconexión de componentes periféricos (PCI) — Trayectos de datos entre los adaptadores de puerto y el VIP2 SRAM.

  • Bridges — Responsable de aislar los busses individuales PCI de los adaptadores de puerto.

vip_crash1.gif

El microcódigo VIP2 (firmware) es una imagen que proporciona las instrucciones de software indicador luminoso LED amarillo de la placa muestra gravedad menor-específicas. Un dispositivo de la Memoria programable de sólo lectura (PROM) en el VIP2 contiene una imagen del arranque de sistema del microcódigo predeterminado que ayude al sistema en el hallazgo y el cargamento la imagen de microcódigo del conjunto del software de Cisco IOS� o de la memoria flash. La imagen de reinicio de microcódigo en el PROM inicializa el VIP2 y entonces contribuye descargando la imagen del microcódigo VIP2. Todas las interfaces del mismo tipo cargan la misma imagen de microcódigo desde el grupo de software del IOS de Cisco o desde la memoria Flash. Pese a que la memoria Flash puede almacenar múltiples versiones de microcode para un tipo de interfaz específico, sólo una imagen puede cargarse al iniciar.

El comando show controllers cbus visualiza la versión de microcódigo actualmente cargada y que se ejecuta para cada procesador de interfaz y el VIP2. El comando show startup-config muestra las instrucciones actuales del sistema para la carga de microcódigo durante el inicio.

Cuando usted Troubleshooting, usted puede utilizar la figura en esta sección como guía para leer la información de un archivo de información de desperfecto de VIP o del Syslog. Como un ejemplo, la mirada en esta salida de Syslog que muestre la paridad incorrecta se encuentra cuando está leído en el VIP SRAM:

Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6    Packet Memory Read Parity error 

!--- Bad parity is found when read from the VIP SRAM.

Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6   PCI master address = 0460000
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x00): cfid   = 0x00011011
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x04): cfcs   = 0x02800147
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x08): cfccid = 0x06040002
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x0C): cfpmlt = 0x00010000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x18): cfsmlt = 0x00010100 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x1C): cfsis  = 0x02807020 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x20): cfmla  = 0x01F00000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x24): cfpmla = 0x0000FE00 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x3C): cfbc   = 0x00030000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x40): cfseed = 0x00000000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x44): cfstwt = 0x00000000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x48): cfswac = 0x00FFFFFF 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x4C): cfpwac = 0x00FFFFFF 
Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error

Como usted ve de las recomendaciones en la siguiente sección, el VIP en esta salida debe ser monitoreado, y SRAM o el VIP debe ser substituido si ocurren de nuevo las caídas similares.

Cómo identificar su VIP

Usted puede marcar el contenido del direccionamiento 0x21 en el EEPROM en el comando show diag hecho salir para verificar el modelo de un VIP. Los valores que corresponden a cada tipo VIP se muestran en esta tabla:

Valor VIP Tipo de controlador
0x14 VIP1 Controlador VIP
0x15 VIP2 (VIP2-10, VIP2-15, VIP2-20, VIP2-40) controlador VIP2
0x1E VIP2-50 Controlador VIP2 R5K
0x20 FEIP2 Controlador FEIP2
0x21 GEIP controlador GEIP
0x40 GEIP +* Regulador GEIP+
0x22 VIP4-80 Controlador VIP4-80 RM7000
0x31 VIP4-50 Regulador VIP4-50 RM5271
0x4E VIP6-80 controlador VIP6-80 RM7000B

Nota: El GEIP+ se basa en el VIP4-80. Toda la Más información en este documento sobre el VIP4-80 también se aplica al GEIP+.

Aquí tiene un ejemplo:

Router#show diag 10 
     Slot 10: 
             Physical slot 10, ~physical slot 0x5, logical slot 10, CBus 0 
             Microcode Status 0x4 
             Master Enable, LED, WCS Loaded 
             Board is analyzed 
             Pending I/O Status: None 
             EEPROM format version 1 
             VIP2 R5K controller, HW rev 2.02, board revision D0 
             Serial number: 17090200  Part number: 73-2167-05 
             Test history: 0x00        RMA number: 00-00-00 
             Flags: cisco 7000 board; 7500 compatible 

             EEPROM contents (hex): 
               0x20: 01 1E 02 02 01 04 C6 98 49 08 77 05 00 00 00 00 
               0x30: 68 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 

             Slot database information: 
             Flags: 0x4      Insertion time: 0x18C0 (00:29:13 ago) 

             Controller Memory Size: 32 MBytes DRAM, 4096 KBytes SRAM

En esta salida puede ver que este VIP es un VIP2-50.

La diferencia entre un VIP2-10, VIP2-15, VIP2-20 y un VIP2-40 es la cantidad de DRAM y SRAM presente en cada uno. Los diversos VIP2 (si no se han actualizado) se pueden distinguir en el comando show diag hecho salir por las configuraciones de la memoria mostradas en esta tabla:

Memoria VIP
8 MB DRAM/512 KB SRAM VIP2-10
8 MB DRAM/1 MB SRAM VIP2-15
16 MB DRAM/1 MB SRAM VIP6-20
32 MB DRAM/2 MB SRAM VIP 2-40

Obtenga un archivo de información de desperfecto de VIP

La información contenida en el archivo CRASHINFO puede demostrar ser inestimable cuando usted intenta resolver los problemas de software o intentar diagnosticar la causa subyacente de las caídas del sistema. El archivo crashinfo no sólo contiene información de registro y una referencia de la pila para el VIP, sino que también contiene la memoria extensiva y la información de contexto. Cada vez que un VIP sufre una caída, éste intenta escribir un archivo crashinfo en la memoria flash de inicialización del RSP. Los archivos CRASHINFO se salvan en este formato:

crashinfo_vip_<slot#>_<data>_<time>

Usted puede publicar el comando dir para localizar los archivos de información de desperfecto de VIP como se muestra aquí:

7500a#dir bootflash: 
     Directory of bootflash:/ 

       1  -rw-     3951876   Jan 01 2000 00:01:22  rsp-boot-mz.111-22.CA 
       2  -rw-      162641   Jun 21 2000 12:53:40  crashinfo_vip_0_20000621-125340 
       3  -rw-      162778   Jun 21 2000 13:00:10  crashinfo_vip_0_20000621-130010 

     7602176 bytes total (3324492 bytes free) 
     7500a#

Este bootflash del router contiene dos archivos de información de desperfecto de VIP. Publique los comandos show file o more para ver y capturar el contenido de estos archivos del acuerdo a este procedimiento:

  1. Comience el registro con su programa para terminal.

  2. Publique el comando term length 0.

  3. Publique el más bootflash: nombre de fichero > comando del <crashinfo.

  4. Guarde el resultado en un archivo.

Refiera a extraer la información del archivo CRASHINFO para más información sobre cómo trabajar con los archivos CRASHINFO.

Si usted tiene la salida de un comando del Soporte técnico de la demostración (del enable mode) de su dispositivo de Cisco, usted puede utilizar para visualizar los problemas potenciales y los arreglos. Usted debe ser un cliente registrado, ser abierto una sesión, y hacer el Javascript habilitar para utilizar .

‘Tipo de desperfecto’

Los desperfectos de VIP se clasifican en varias categorías basadas en la causa de la caída. Siempre se encuentra un error no recuperable, los desperfectos de VIP. Estos errores pueden ser el resultado de los errores de paridad, el software o el soporte físico que hacen un mensaje de reconocimiento negativo (NACK) estar presente en el CyBus, o los problemas del software. Esta sección proporciona la información sobre cada uno de estos tipos de error.

Si usted tiene la salida de un comando del Soporte técnico de la demostración (del enable mode) de su dispositivo de Cisco, usted puede utilizar para visualizar los problemas potenciales y los arreglos. Usted debe ser un cliente registrado, ser abierto una sesión, y hacer el Javascript habilitar para utilizar .

Errores de paridad

Detección de error de paridad VIP2

Ocurren errores de paridad en un VIP cuando el hardware intenta controlar la validez de los datos mediante la comparación de los valores de paridad calculados con valores de paridad anteriores para los mismos datos. Una única rotación de bits en los datos puede causar un error de paridad. Cuando usted diagnostica los errores de paridad en un VIP, es importante entender cada ubicación en la cual se marque la paridad y en qué errores de paridad pueden potencialmente ocurrir. Este diagrama delinea esta información. Además, refiera a la análisis del árbol de fallas de VIP del Cisco 7500 para más información sobre los errores de paridad.

/image/gif/paws/12811/vip_crash2.gif

Tal y como se muestra en de este diagrama, hay siete diversos tipos de errores de paridad que puedan ocurrir en un VIP. Observe que los errores se pueden recibir de otra fuente y no pudieron haber originado dentro del VIP sí mismo. La fuente del error de paridad puede ser de la ruta/del Procesador del switch (RSP), de otro VIP, o de asentado mal o los adaptadores de puerto defectuosos. Para entender correctamente un desperfecto de VIP, es importante diagnosticar la fuente de la caída.

Es también importante entender que los datos con la paridad incorrecta pueden ser señalados por varios de los dispositivos de la verificación de paridad en el VIP y del Cisco 7500 Series Router para haber leído sola o escribir la operación. Por ejemplo, si el VIP lee un paquete en una cola de transmisión en el RSP en su propio SRAM, y hay un error de paridad en SRAM del RSP, después usted ve los mensajes de error del MD ASIC en el RSP, el CYA ASIC en el VIP, y también la memoria ASIC PCI/packet en el VIP.

Este diagrama muestra la análisis del árbol de fallos para los desperfectos de VIP:

/image/gif/paws/12811/vip_crash3.gif

Errores de paridad VIP4 y VIP6 y detección de ECC

La corrección de error de bit único y Error Code Correction doble de la detección de error de bit (ECC) del uso VIP4-50, VIP4-80, y VIP6-80 para la memoria de la CPU y la memoria del paquete. Ambos son RAM dinámico síncrono SDRAM. Un error de un solo bit en SDRAM se corrige y el sistema continúa actuando normalmente.

Los errores de paridad del multibit en los números 2 o 3 en esta tabla son un evento fatal que hagan los errores del multibit ECC ocurrir. El caché interno de la CPU y los bus en el sistema utilizan la detección de paridad de un solo bit. Como se muestra aquí, la arquitectura del VIP4 y el VIP6 son diferentes del VIP2. Por lo tanto, algunos mensajes de error no se consideran y otros mensajes de error están señalados diferentemente que están en el VIP2. En esta sección del error de paridad, las diferencias entre el VIP2, el VIP4, y el VIP6 se denotan y se explican.

/image/gif/paws/12811/vip_crash4.gif

Excepción de error de paridad de la memoria caché

Las excepciones de error de paridad de la memoria caché ocurren cuando la paridad incorrecta se descubre en el CPU o en el caché de datos primario. El error de paridad pudo haber ocurrido en el DRAM VIP, el controlador de DRAM, el caché principal, o en el CPU sí mismo. También se hace referencia a los errores de paridad descubiertos en esta ubicación como errores de paridad de la memoria del procesador (PMPE). Estos errores dan lugar a una caída inmediata del VIP y la salida parece similar en los VIP y los RSP. Un valor sig de veinte (sig=20) indica que ha acontecido una excepción de error de paridad de la memoria caché. El valor sig se muestra en los mensajes de registro del sistema para la falla.

El código reciente también proporciona una línea prolija significativa como se muestra aquí:

Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System reloaded by a Cache Parity Exception 
Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System Reload called from 0x60125C8C, 
context=0x60220930 
Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System exception: sig=20, code=0x20025B69, 
context=0x60220930

La información incluida en el archivo de información de desperfecto de VIP también indica la misma ubicación del error de paridad en la memoria caché de datos principal:

Error: primary data cache, fields: data, 
         virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000 
         virtual address corresponds to main:data, cache word 0 

                      Low Data   High Data  Par    Low Data   High Data  Par 
         L1 Data :  0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 
                    2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8 

                       Low Data   High Data  Par    Low Data   High Data  Par 
          Mem Data:  0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 
                     2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8

Un caché primario o PMPE puede ser un error transitorio. Si éste es el primer caso de un PMPE, usted puede ignorarlo generalmente con seguridad. Sin embargo, si la misma VIP experimenta un segundo o más PMPE, debería reemplazar la VIP. El reemplazo del DRAM sí mismo puede también resolver a veces el problema.

Nota VIP4 y VIP6 — Los errores de paridad que ocurren en la memoria caché interna CPU y en el CyAsic se detectan como excepciones de error de paridad de la memoria caché. Los simples errores de paridad de bit en la memoria de la CPU son corregidos y no se necesita seguir ninguna acción. Los errores de paridad de bit múltiple en la memoria de la CPU se detectan como error de paridad de bit múltiple ecc del procmem. Si se informa el error procmem ecc multi-bit parity, se debe reemplazar la memoria de la CPU en el VIP.

Oct 25 09:30:54.708: %VIP4-50 RM5271-1-MSG: slot4 PMA error register1 00000000 
00002000
Oct 25 09:30:54.716: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit error
Oct 25 09:30:54.724: %VIP4-50 RM5271-1-MSG: slot4 PCI1 master address 00000000
Oct 25 09:30:54.732: %VIP4-50 RM5271-1-MSG: slot4 PCI1 slave address 00000000
Oct 25 09:30:54.740: %VIP4-50 RM5271-1-MSG: slot4 Latched Addresses
Oct 25 09:30:54.748: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception 
addr 22220000 025F0860
Oct 25 09:30:54.756: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception 
data 00000000 00000000
Oct 25 09:30:54.764: %VIP4-50 RM5271-1-MSG: slot4 MPU addr exception/WPE address 
00000000 00000000
Oct 25 09:30:54.772: %VIP4-50 RM5271-1-MSG: slot4 MPU WPE addr/WPE data 00000000 
00000000
Oct 25 09:30:54.780: %VIP4-50 RM5271-1-MSG: slot4 ProcMem addr exception 0 0000000
Oct 25 09:30:54.788: %VIP4-50 RM5271-1-MSG: slot4 Pakmem addr exception 00000000
Oct 25 09:31:15.824: %VIP4-50 RM5271-1-MSG: slot4 System reloaded by a fatal 
hardware error
Oct 25 09:31:15.836: %VIP4-50 RM5271-1-MSG: slot4 caller=0x600BCE18
Oct 25 09:31:15.844: %VIP4-50 RM5271-1-MSG: slot4 System exception: sig22, 
code 0x0, context=0x60615F28

Error de paridad del CyBus

Cuando las descargas VIP del MEMD en el RSP y de estos errores se consideran, ésta indica generalmente que otro VIP ha escrito la paridad incorrecta al MEMD, o se ha corrompido el MEMD. Si la fuente es del MEMD y continúa, usted necesita substituir el RSP. Inversamente, si la fuente de la paridad incorrecta es otro VIP, usted debe volver a sentar y, en caso necesario, substituir el VIP que escribe la paridad incorrecta.

%VIP2-1-MSG: slot1 Nevada Error Interrupt Register 0x3 
%VIP2-1-MSG: slot1 CYASIC Error Interrupt register 0x2020000C 
%VIP2-1-MSG: slot1 Parity Error internal to CYA 
%VIP2-1-MSG: slot1 Parity Error in data from CyBus 

!--- Bad parity is received by the VIP from the CyBus.

%VIP2-1-MSG: slot1 CYASIC Other Interrupt register 0x200100 
%VIP2-1-MSG: slot1 QE HIGH Priority Interrupt 
%VIP2-1-MSG: slot1 CYBUS Error register 0xD001A02, PKT Bus Error register 0x0 
%VIP2-1-MSG: slot1 PMA error register = 0070000440000000 
%VIP2-1-MSG: slot1 Packet Bus Write Parity error 

!--- The bad parity that was received from the CyBus is written to SRAM.

%VIP2-1-MSG: slot1 PCI master address = 0700004 
%VIP2-1-MSG: slot1 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 
%VIP2-1-MSG: slot1 DEC21050 bridge chip, config=0x0 
%VIP2-1-MSG: slot1 (0x00): cfid = 0x00011011 
%VIP2-1-MSG: slot1 (0x04): cfcs= 0x02800147 
%VIP2-1-MSG: slot1 (0x08):cfccid = 0x06040002 
%VIP2-1-MSG: slot1 (0x0C):cfpmlt = 0x00010000 
%VIP2-1-MSG: slot1 (0x18): cfsmlt = 0x00010100 
%VIP2-1-MSG: slot1 (0x1C): cfsis = 0x22807020 
%VIP2-1-MSG: slot1 Received Master Abort on secondary bus 
%VIP2-1-MSG: slot1 (0x20): cfmla = 0x01F00000

Nota: El VIP4 y el VIP6 muestran los mismos mensajes de error sobre el error de paridad del CyBus, pero el bus de paquetes escribe el mensaje de error de paridad no se visualiza.

Error de paridad del controlador de entrada/salida de VIP y de lectura de Reno

ASIC RENO detecta tanto los errores de paridad del controlador de DRAM como los del controlador de Entrada/Salida (I/O). Un error de paridad que origina en el DRAM o en el controlador de DRAM está señalado como excepción de paridad de la memoria caché. Un error de paridad detectado por controlador de I/O está señalado, tal y como se muestra en de esta salida. A menudo, los errores de paridad informados por el controlador I/O se han originado en alguna otra parte y son informados por el controlador I/O y a través de los mensajes desde otras ubicaciones.

Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Reno read parity error - bytes 0 & 1 
Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 PMA error register = 0080004000001000 
Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Packet Memory Read Parity error

Nota: El VIP4 y VIP6 no muestran este mensaje de error.

Error de paridad de lectura de la memoria del paquete VIP

El ASIC de PMA informa un error de paridad de lectura de la memoria de paquete cada vez que el error de paridad se extrae mediante lectura de la memoria de paquete (SRAM) en el VIP. Este error está señalado en el registro del sistema como se muestra aquí:

Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 Nevada Error Interrupt Register = 0x22 
Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 PCI bus 0 parity error 
Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PMA error register = 4080103C00004000 
Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PCI Transmit Parity error 
Oct 30 05:18:08.120: %VIP2-1-MSG: slot9 Packet Memory Read Parity error

También podemos ver evidencia de un error de paridad de lectura de la memoria del paquete en el archivo crashinfo del VIP:

Nevada Error Interrupt Register = 0x2 
PMA error register = 0046000000001000 
Packet Memory Read Parity error
PCI master address = 0460000

Los errores de paridad SRAM pueden también ser transitorios, así que trate el primer acontecimiento la misma manera que los errores de paridad DRAM. Si continúan los errores, reemplace el SRAM o el VIP.

Nota VIP4 y VIP6 — Los errores de paridad de un solo bit en la memoria del paquete se corrigen. Los errores de paridad de bit múltiple en la memoria del paquete se detectan como error de paridad de bit múltiple ecc del pakmem. La memoria de paquetes VIP debería reemplazarse si se registra un error pakmem ecc de paridad de bit múltiple.

%VIP4-80 RM7000-1-MSG: slot1 PMA error register0 = 0000000000002000
%VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit error
%VIP4-80 RM7000-1-MSG: slot1 PCI0 master address = 00000000
%VIP4-80 RM7000-1-MSG: slot1 PCI0 slave address = 00000000
%VIP4-80 RM7000-1-MSG: slot1 PMA error register1 = 0000000000000000
%VIP4-80 RM7000-1-MSG: slot1 PCI1 master address = 00000000
%VIP4-80 RM7000-1-MSG: slot1 PCI1 slave address = 00000000
%VIP4-80 RM7000-1-MSG: slot1 Latched Addresses
%VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception addr = 00012358 000000CA
%VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception data = 00000000 00040800
%VIP4-80 RM7000-1-MSG: slot1 MPU addr exception/WPE address = 00000000 00000000
%VIP4-80 RM7000-1-MSG: slot1 MPU WPE addr/WPE data = 00000000 00000000
%VIP4-80 RM7000-1-MSG: slot1 ProcMem addr exception = 00000000
%VIP4-80 RM7000-1-MSG: slot1 Pakmem addr exception = 00000000

Error de paridad de escritura en bus de paquetes VIP

El ASIC PMA informa un error de paridad de escritura en bus de paquetes siempre que se escribe un error de paridad en la memoria de paquete. En este ejemplo, el VIP es solamente el mensajero y el problema no existe con la memoria de este VIP.

May 10 09:22:14.520: %VIP2-1-MSG: slot11 PMA error register = 2080002800800200 
May 10 09:22:15.520: %VIP2-1-MSG: slot11 Packet Bus Write Parity error

Nota: El VIP4 y VIP6 no muestran este mensaje de error.

Error de paridad en bus de PCI VIP

Pueden detectarse los errores de paridad en los bus 1 y 2 PCI, que conectan directamente la interfaz con los adaptadores de puerto. Estos buses están conectados en puente por un tercer bus PCI, bus 0, en el cual los errores de paridad pueden también detectarse. Los errores de paridad que originan de los busses uces de los PCI son causados lo más comúnmente posible por asentado mal o los adaptadores de puerto defectuosos. Cualquier momento usted ve estos mensajes en la salida de Syslog de un desperfecto de VIP, usted necesita volver a sentar el adaptador de puerto para resolver el problema.

PCI bus <num> parity error 
PCI bus <num> system error
Detected Parity Error on secondary bus

Si volver a sentar el adaptador de puerto no soluciona el problema, el problema miente con el adaptador de puerto o el VIP. Mueva el adaptador de puerto a otra bahía e inserte un segundo adaptador de puerto en la bahía original para resolver problemas. Esto por lo general señala el hardware agresor. Un ejemplo se muestra aquí:

Mar 16 19:34:54: %GEIP-1-MSG: slot9 Nevada Error Interrupt Register = 0x6 
Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI bus 0 system error
Mar 16 19:34:54: %GEIP-1-MSG: slot9 PMA error register = 0080043800100000 
Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI IRDY time-out 
Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI master address = 0800438 
Mar 16 19:34:54: %GEIP-1-MSG: slot9 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0

Nota: Los mismos errores ocurren con el VIP4 y el VIP6, pero el mensaje de error es diferente. Se detecta como un error de paridad del master PCI y error de paridad del esclavo PCI. Realice los mismos pasos según lo delineado para que los errores de paridad de bus VIP PCI resolver problemas este problema.

00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register0 = 0000000001800000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Master Parity error
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Slave Parity error
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 master address = 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 slave address = 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register1 = 0000000000000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 master address = 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 slave address = 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Latched Addresses
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU addr exception/WPE address = 
00000000 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU WPE addr/WPE data = 
00000000 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 ProcMem addr exception = 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Pakmem addr exception = 00000000

Error de paridad del CyAsic VIP

Los errores de paridad pueden también ser detectados por el VIP en los datos o el direccionamiento de una haber leído o escribir la operación en el CyBus. Si ocurre esto, usted ve la salida de Syslog similar a esto:

CYASIC Error Interrupt register 0x2020000C 
Parity Error internal to CYA 
Parity Error in data from CyBus

Utilice esta información conjuntamente con la información presente en los registros del sistema para determinar la verdadera fuente del error.

Nota: VIP4 y VIP6 muestran los mismos mensajes de error para errores de paridad de CyBus.

NACK presente en CyBus

Cuando VIP intenta escribir a una dirección no válida en MEMD, RSP coloca un NACK en CyBus para esa ranura. Esto es generalmente un problema del software, pero puede también ser problemas del hardware. Por ejemplo, en esta salida, el VIP escribe 4 bytes a una dirección no válida, el RSP coloca tan un NACK en el CyBus para ese slot.

%RSP-3-ERROR: CyBus0 error 10 
%RSP-3-ERROR: command/address mismatch 
%RSP-3-ERROR: bus command write 4bytes (0xE) 
%RSP-3-ERROR: address offset (bits 3:1) 0 
%RSP-3-ERROR: virtual address (bits 23:17) 000000 
%VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 
%VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20000003 
%VIP2-1-MSG: slot5 Missing ACK on CyBus access 
%VIP2-1-MSG: slot5 NACK present on CyBus access
%VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x0 
%VIP2-1-MSG: slot5 CYBUS Error register 0x8001C48, PKT Bus Error register 0x0 
%VIP2-1-MSG: slot5 System reloaded by a fatal hardware error 
%VIP2-1-MSG: slot5 caller=0x60126C44 
%VIP2-1-MSG: slot5 System exception: sig=22, code=0x0, context=0x60265C68

Sin embargo, tal y como se muestra en de esta salida, el RSP también coloca un NACK en un VIP para que el intentar escriba la paridad incorrecta al MEMD.

CYASIC Error Interrupt register 0x1B 
Parity Error in data from Packet Bus 
Parity Error internal to CYA 
Missing ACK on CyBus access 
NACK present on CyBus access

Cuando un NACK aparece en todos los slots, tal y como se muestra en de esta salida, es un Error de hardware. El árbitro posee fallas y la caja de la tarjeta debe reemplazarse.

Jan  1 23:55:21: %FEIP2-1-MSG: slot0 Nevada Error Interrupt Register =0x1 
Jan  1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Error Interrupt register0x20000001 
Jan  1 23:55:21: %FEIP2-1-MSG: slot0 NACK present on CyBus access 
Jan  1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Other Interrupt register 0x0 
Jan  1 23:55:21: %FEIP2-1-MSG: slot0 CYBUS Error register 0x8001A00, 
PKTBus Error register 0x0 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 Nevada Error Interrupt Register = 0x1 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Error Interrupt register 0x20000001 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 NACK present on CyBus access
Jan  1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Other Interrupt register 0x0 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 CYBUS Error register 0x800006A, 
PKT Bus Error register 0x0 
Jan  1 23:55:21: %VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 
Jan  1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20200001 
Jan  1 23:55:21: %VIP2-1-MSG: slot5 NACK present on CyBus access 
Jan  1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x200000 
Jan  1 23:55:21: %VIP2-1-MSG: slot5 CYBUS Error register 0x800006C, 
PKT Bus Error register 0x0 
Jan  1 23:55:21: %FEIP2-1-MSG: slot8 Nevada Error Interrupt Register = 0x1 
Jan  1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Error Interrupt register 0x20000001 
Jan  1 23:55:21: %FEIP2-1-MSG: slot8 NACK present on CyBus access
Jan  1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Other Interrupt register 0x0 
Jan  1 23:55:21: %FEIP2-1-MSG: slot8 CYBUS Error register 0x8001B80, 
PKT Bus Error register 0x0 
Jan  1 23:55:21: %FEIP2-1-MSG: slot10 Nevada Error Interrupt Register = 0x1 
Jan  1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Error Interrupt register 0x20000001 
Jan  1 23:55:21: %FEIP2-1-MSG: slot10 NACK present on CyBus access
Jan  1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Other Interrupt register 0x0 
Jan  1 23:55:21: %FEIP2-1-MSG: slot10 CYBUS Error register 0x8001C08,
PKT Bus Error register 0x0 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 System reloaded by a fatal hardware error 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 caller=0x6012640C 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 System exception: sig=22, code=0x0, 
context=0x60265028

Desperfectos de VIP a causa del software

Los desperfectos de VIP no causados por las razones unas de los en este documento son lo más comúnmente posible debido a los problemas del otro software. Estos desperfectos se pueden manifestar de muchas maneras diferentes. Éstas son sugerencias generales para reducir el riesgo de desperfectos de VIP debido a los problemas del software y a hacer frente a ellos si ocurren:

  • Aseegurese siempre que la imagen del Cisco IOS Software soporta el VIP.

  • Siempre mantenga la imagen RSP-BOOT y la imagen de software Cisco IOS en la misma versión.

  • Asegúrese de que la versión actual del software del IOS de Cisco admite la configuración VIP y el adaptador de puerto.

  • Verifique las notas de la versión para el nivel correcto del software del Cisco IOS y los requerimientos de memoria.

Éste es un ejemplo de una salida del registro del sistema de un desperfecto de VIP debido a un problema del software:

Apr 18 17:13:33.884: %VIP2 R5K-1-MSG: slot0 System reloaded by a 
Bus Error exception 
Apr 18 17:13:33.892: %VIP2 R5K-1-MSG: slot0 caller=0x600BC974 
Apr 18 17:13:33.900: %VIP2 R5K-1-MSG: slot0 System exception: 
sig=10, code=0x408, context=0x605B51E0 
Apr 18 17:13:33.912: %VIP2 R5K-1-MSG: slot0 $0 : 00000000, 
AT : 605B0000, v0 : 00000001, v1 : FFFFFFFC, 
Apr 18 17:13:33.924: %VIP2 R5K-1-MSG: slot0 a0 : 00000002, 
a1 : 6042CEE0, a2 : 00000000, a3 : 6112FEC4, 
Apr 18 17:13:33.936: %VIP2 R5K-1-MSG: slot0 t0 : 00000053, 
t1 : 3400FF01, t2 : 00000000, t3 : FFFFFFFF, 
Apr 18 17:13:33.948: %VIP2 R5K-1-MSG: slot0 t4 : 600BC9B0, 
t5 : 000000F8, t6 : 00000000, t7 : 00000002, 
Apr 18 17:13:33.956: %VIP2 R5K-1-MSG: slot0 s0 : 0C58BA24, 
s1 : 00000064, s2 : 6112C7AC, s3 : 60560000, 
Apr 18 17:13:33.964: %VIP2 R5K-1-MSG: slot0 s4 : 60560000, 
s5 : 00000001, s6 : 6041433C, s7 : 60414310, 
Apr 18 17:13:33.972: %VIP2 R5K-1-MSG: slot0 t8 : 00008945, 
t9 : 00000000, k0 : 607F6CA0, k1 : 00000200, 
Apr 18 17:13:33.980: %VIP2 R5K-1-MSG: slot0 gp : 6056AFC0, 
sp : 6112FEC0, s8 : 60414460, ra : 6026EC4C, 
Apr 18 17:13:33.988: %VIP2 R5K-1-MSG: slot0 EPC : 6026EAA0, 
ErrorEPC : 800086B8, SREG : 3400FF03 
Apr 18 17:13:33.996: %VIP2 R5K-1-MSG: slot0 Cause 00000408 (Code 0x2) 
Apr 18 17:13:34.004: %VIP2 R5K-1-MSG: slot0 Traceback= 6026EAA0 
6026E2E8 6009BAF4 6009BAE0 
Apr 18 17:13:35.012: %DBUS-3-DBUSINTERRSWSET: Slot 0, Internal 
Error due to VIP crash

Posiblemente la información más importante que debe obtener en caso de un problema de software es el archivo crashinfo para el VIP. Vea la obtención una sección de archivo de información de desperfecto de VIP para que las instrucciones capturen esta información.

excepción de error de bus

Los desperfectos de VIP muchas veces y cuando usted revisa el archivo de información del desperfecto, usted puede ser que vea este mensaje:

00:00:11: %LINK-3-UPDOWN: Interface POS1/0, changed state to up

IOBUS Error Interrupt Status register 0x0


Unexpected exception, CPU signal 10, PC = 0x602A7660


-Traceback= 602A7660 602AB238

El mensaje de error de la señal 10 CPU significa el error de excepción del bus. Los errores en el bus pueden ser software o problemas del hardware. La solución alternativa para este problema es volver a sentar el módulo y monitorear al router. Si el módulo guarda el causar un crash después de que usted vuelva a sentar el módulo, entre en contacto

Señale los desperfectos de VIP al Soporte técnico de Cisco

Antes de que usted cree un caso TAC

Es una buena idea crear un archivo de resumen del desperfecto de VIP con esta información antes de que usted abra un caso. Incluya esta información en el campo de descripción de problemas del herramienta para abrir casos de TAC (clientes registrados solamente).

  • Descripción de problemas

  • Salida del comando show version

  • Salida del comando show diag slot [x]

  • Extracto del archivo CRASHINFO

  • Fragmento de Syslog

Entonces, recoja la información para recolectar si usted abre un caso TAC.

Éste es un ejemplo de un archivo de resumen del desperfecto:

******problem description.. 
VIP crashed with parity errors. 
The parity errors are being read by the SRAM, suspect the PA! 

******show version 
Cisco Internetwork Operating System Software 
IOS (tm) GS Software (RSP-PV-M), Version 11.1(29)CC1, EARLY DEPLOYMENT 
RELEASE SOFTWARE (fc1) 
V111_29_CC_THROTTLE_BRANCH Synced to mainline version: 11.1(29)CA 
Copyright (c) 1986-1999 by cisco Systems, Inc. 
Compiled Wed 13-Oct-99 02:21 by sharpd 
Image text-base: 0x60010910, data-base: 0x60832000 

ROM: System Bootstrap, Version 11.1(8)CA1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) 
ROM: GS Software (RSP-BOOT-M), Version 11.1(29)CC1, EARLY DEPLOYMENT 
RELEASE SOFTWARE (fc1) 

attga711c7 uptime is 27 weeks, 11 minutes 
System restarted by reload at 00:49:05 UTC Sun Oct 24 1999 
System image file is "slot0:rsp-pv-mz.111-29.CC1", booted via slot0 
Host configuration file is "cbb/al/ar-2", booted via tftp from 199.37.184.170 

cisco RSP4 (R5000) processor with 262144K/2072K bytes of memory. 
R5000 processor, Implementation 35, Revision 2.1 (512KB Level 2 Cache) 
Last reset from power-on 
G.703/E1 software, Version 1.0. 
G.703/JT2 software, Version 1.0. 
X.25 software, Version 2.0, NET2, BFE and GOSIP compliant. 
Chassis Interface. 
3 VIP2 R5K controllers (3 ATM). 
3 ATM network interfaces. 
123K bytes of non-volatile configuration memory. 

20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K). 
8192K bytes of Flash internal SIMM (Sector size 256K). 


******show diag slot 6 
Slot 6: 
 Physical slot 6, ~physical slot 0x9, logical slot 0, CBus 0 
 Microcode Status 0x4 
 WCS Loaded 
 Board is disabled analyzed wedged 
 Pending I/O Status: None 
 EEPROM format version 1 
 VIP2 R5K controller, HW rev 2.02, board revision C0 
 Serial number: 12639078  Part number: 73-2167-05 
 Test history: 0x00        RMA number: 00-00-00 
 Flags: cisco 7000 board; 7500 compatible 

 EEPROM contents (hex): 
   0x20: 01 1E 02 02 00 C0 DB 66 49 08 77 05 00 00 00 00 
   0x30: 60 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 

 Slot database information: 
 Flags: 0x295 Insertion time: 0x3AA4 (27w0d ago) 

 Controller Memory Size: 128 MBytes DRAM, 8192 KBytes SRAM 

 PA Bay 0 Information: 
  ENHANCED ATM OC3 PA (MM), 1 port 
  EEPROM format version 1 
  HW rev 2.00, Board revision A0 
  Serial number: 12366362  Part number: 73-2430-04 

 1 crash since restart. 
 Last crash context (Apr 29 2000 23:19:26): 
 Nevada Error Interrupt Register = 0x2 
 PMA error interrupt 
 PMA Error Register = 0046000000001000 
     Packet Memory Read Parity error 
     PCI master address = 0460000 
 $0 : 00000000, AT : 60179244, v0 : 601D337C, v1 : 0000AAAA 
 a0 : 604CF3E0, a1 : 604C8180, a2 : 00001182, a3 : 00000050 
 t0 : 00000800, t1 : 4E90424C, t2 : 00000001, t3 : 6014A620 
 t4 : 6016E220, t5 : 000000F8, t6 : 00000000, t7 : 00000000 
 s0 : 321735CC, s1 : 6052B508, s2 : 604C8180, s3 : 604CF3E0 
 s4 : 3226C120, s5 : 604D1440, s6 : 00000002, s7 : 00000CED 
 t8 : 34000000, t9 : 603C9930, k0 : 00000000, k1 : 00000002 
 gp : 60337700, sp : 603C0350, s8 : 00000001, ra : 601476E8 
 EPC : 601D337C, ErrorEPC : 800086B8, SREG : 3400E103 
 Cause 00000000 (Code 0x0): Interrupt exception 
 Traceback= 0x601D337C 0x601476E8 0x6014A674 

******excerpt from crashinfo 
Nevada Error Interrupt Register = 0x2 
PMA error register = 0046000000001000 
    Packet Memory Read Parity error 
    PCI master address = 0460000 

******excerpt from syslog 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6     Packet Memory Read Parity error 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6     PCI master address = 0460000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x00): cfid   = 0x00011011 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x04): cfcs   = 0x02800147 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x08): cfccid = 0x06040002 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x0C): cfpmlt = 0x00010000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x18): cfsmlt = 0x00010100 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x1C): cfsis  = 0x02807020 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x20): cfmla  = 0x01F00000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x24): cfpmla = 0x0000FE00 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x3C): cfbc   = 0x00030000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x40): cfseed = 0x00000000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x44): cfstwt = 0x00000000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x48): cfswac = 0x00FFFFFF 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x4C): cfpwac = 0x00FFFFFF 
Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error

Información para recopilar si abre un caso del TAC

Si usted todavía necesita la ayuda después de que usted realice los pasos de Troubleshooting en este documento y quiera abrir un caso con el Soporte técnico de Cisco, aseegurese para incluir esta información:
  • El troubleshooting que usted se realizó antes de que usted abra el caso
  • Resultado del comando show technical-support (en modo habilitar, de ser posible)
  • El resultado desde el comando show log o las capturas de consolas, es posible
  • Archivo de información de desperfecto de VIP
Adjunte los datos recopilados para su caso en un texto sin formato (.txt), sin compactar. Puede vincular información transfiriéndola mediante la herramienta Case Query (sólo para clientes registrados). Si no puede ingresar a la herramienta Case Query y desea adjuntar información pertinente a su caso, puede enviarla a attach@cisco.com, recuerde escribir el número de su caso en el asunto del mensaje.

Nota: Si es posible, no recargue manualmente o ciclo de la potencia el router antes de que usted recoja esta información mientras que ésta puede hacer la información importante ser perdido que es necesaria determinar la causa raíz del problema.

Discusiones relacionadas de la comunidad de soporte de Cisco

La Comunidad de Soporte de Cisco es un foro donde usted puede preguntar y responder, ofrecer sugerencias y colaborar con colegas.


Información Relacionada


Document ID: 12811