Software Cisco IOS y NX-OS : Software Cisco IOS versión 12.1 Mainline

Resolución de problemas de caída por error del bus

19 Mayo 2008 - Traducción manual
Otras Versiones: PDFpdf | Traducción Automática (31 Julio 2013) | Inglés (29 Noviembre 2006) | Comentarios

Interactivo: Este documento ofrece un análisis personalizado de su dispositivo Cisco.


Contenidos

Introducción
Requisitos previos
     Requisitos
     Componentes utilizados
     Convenciones
Identificación de desperfectos por errores de bus
Resolución de problemas de caída por error del bus
     Solución de problemas de caídas de error de bus en plataformas de procesador 68000
     Resolución de problemas de caídas de error de bus en las plataformas de procesador RISC
     Tipos especiales de desperfectos por error en el bus
Técnicas de solución de problemas para bucles de inicio de excepción de error de bus
     El software Cisco IOS cargado no soporta el hardware instalado
     Error de software
     Hardware instalado incorrectamente
     Error de hardware
Información para recopilar si abre un pedido de servicio
Discusiones relacionadas de la comunidad de soporte de Cisco

Introducción

En este documento se explica cómo identificar fallas por errores de bus y cómo resolver estos errores en función del tipo de procesador que tiene en el router de Cisco.

Requisitos previos

Requisitos

Recomendamos que lea la Resolución de problemas por desperfectos del router antes de continuar con este documento.

Componentes utilizados

La información de este documento se basa en estas versiones de software y hardware:

  • Todas las versiones del software Cisco IOS®

  • Todos los routers Cisco

Nota: Este documento no es aplicable a los switches Cisco Catalyst o las plataformas MGX.

La información de este documento se ha creado a partir de los dispositivos en un entorno específico de laboratorio. Todos los dispositivos utilizados en este documento se pusieron en funcionamiento con una configuración despejada (predeterminada). Si la red está funcionando, asegúrese de comprender el posible efecto de cualquier comando.

Convenciones

Si desea obtener más información sobre las convenciones utilizadas en este documento, consulte las Convenciones de consejos técnicos de Cisco.

Identificación de desperfectos por errores de bus

El sistema encuentra un error de bus cuando el procesador intenta obtener acceso a una ubicación de la memoria que no existe (un error de software) o no responde correctamente (un problema de hardware). Puede identificar un error de bus al observar el resultado del comando show versiones proporcionado por el router si no se sometió a un ciclo de apagado y encendido ni recargó manualmente.

Si tiene el resultado de un comando show version o show technical-support (desde el modo habilitar) del dispositivo Cisco, podrá utilizar para mostrar posibles problemas y sus soluciones. Para utilizarlo, debe ser un cliente registrado conectado al sistema y tener JavaScript habilitado.

Router uptime is 2 days, 21 hours, 30 minutes

System restarted by bus error at PC 0x30EE546, address 0xBB4C4

System image file is "flash:igs-j-l.111-24.bin", booted via flash
.........

En el indicador de comandos de la consola, también puede verse el siguiente mensaje de error durante un error del bus:

*** System received a Bus Error exception ***
signal= 0xa, code= 0x8, context= 0x608c3a50
PC = 0x60368518, Cause = 0x20, Status Reg = 0x34008002
.........

A esto le sigue una recarga del router. No obstante, en algunos casos, el router atraviesa una serie de fallas y se recarga, y se requiere la intervención manual para interrumpir este bucle (consulte la sección Más técnicas de resolución de problemas).

Otro problema relacionado es el desperfecto del Procesador de interfaz versátil (VIP). Si se presenta este problema, se registrarán mensajes de error similares a aquellos incluidos a continuación:

%VIP2 R5K-1-MSG: slot0 System reloaded by a Bus Error exception
%VIP2 R5K-1-MSG: slot0 caller=0x600BC974
%VIP2 R5K-1-MSG: slot0 System exception: sig=10, code=0x408,
context=0x605B51E0

Para este problema, consulte Resolución de problemas por desperfectos del procesador de interfaz versátil.

Finalmente, otro tipo de falla de error de bus es un desperfecto de la tarjeta de línea en un router de Internet de la serie 12000 de Cisco. Si este problema se presenta, se registrarán mensajes de error similares a aquellos mencionados a continuación en el resultado de show context :

Router#show context

...

CRASH INFO: Slot 1, Index 1, Crash at 11:27:15 utc  Wed May 16 2001
 VERSION:

 GS Software (GLC1-LC-M), Version 12.0(16.5)S, EARLY DEPLOYMENT MAINTENANCE

 INTERIM SOFTWARE

 TAC Support: http://www.cisco.com/pcgi-bin/ibld/view.pl?i=support

 Compiled Thu 29-Mar-01 17:12 by ninahung

 Card Type: 3 Port Gigabit Ethernet, S/N

 System exception: SIG=10, code=0x2008, context=0x40D8DF44

 System restarted by a Bus Error exception

 STACK TRACE:

 -Traceback= 40165800 4038D0FC 4025C7BC 4026287C 4029581C 402EECF8 400C0144

 CONTEXT:

 $0 : 00000000, AT : 00000000, v0 : 00000044, v1 : 0FE00020

 a0 : 00000000, a1 : 0FE00000, a2 : 00000000, a3 : 39EC6AAB

 t0 : 00000030, t1 : 34008D01, t2 : 34008100, t3 : FFFF00FF

 t4 : 400C01E8, t5 : 00000001, t6 : 00000001, t7 : 00000001

 s0 : 40DCDD20, s1 : 0FE00000, s2 : 00000000, s3 : 000005DC

 s4 : 00000000, s5 : 0FE00020, s6 : 00000004, s7 : 414CF120

 t8 : 41680768, t9 : 00000000, k0 : 00000000, k1 : FFFF8DFD

 gp : 40CB9780, sp : 4105BFE8, s8 : 41652BA0, ra : 4038D0FC

 EPC : 0x40165800, SREG : 0x34008D03, Cause : 0x00002008

 ErrorEPC : 0xBFC22B94
 -Process Traceback= No Extra Traceback

Consulte Resolución de problemas de desperfectos de tarjetas de línea en el router de Internet de la serie Cisco 12000 para obtener más detalles.

Si tiene el resultado de un comando show context del dispositivo Cisco, podrá utilizar para mostrar posibles problemas y sus soluciones. Para utilizarlo, debe ser un cliente registrado conectado al sistema y tener JavaScript habilitado.

Resolución de problemas de caída por error del bus

Lo primero que debe hacer es averiguar en qué lugar de la memoria (también conocida como “address” o “address operand”) el router intentó acceder cuando ocurrió el error de bus. Con esta información, tiene una indicación sobre si la falla se encuentra en el software Cisco IOS o en el hardware del router. En el ejemplo mencionado arriba, "System restarted by bus error at PC 0x30EE546, address 0xBB4C4" (Sistema reiniciado debido a un error de bus en la PC 0x30EE546, dirección 0xBB4C4), la ubicación de la memoria a la que el router intentó obtener acceso es 0xBB4C4. No confundir con el valor del contador de programa (PC) anterior.

Lo segundo que debe hacer es determinar el tipo de procesador en el router. Las ubicaciones de la dirección de la memoria para los routers son diferentes en función del tipo de procesador. Existen dos tipos principales de procesadores en los routers Cisco:

  • Procesadores 68000

    A continuación se incluye parte de un resultado de show version que indica que el router tiene un procesador 68000:

    cisco 2500 (68030) processor (revision D) with 8192K/2048K bytes of memory.
    

    Las plataformas de router con procesadores 68000 incluyen:

    • Routers de la serie 1000 de Cisco

    • Routers de la serie 1600 de Cisco

    • Routers de la serie 2500 de Cisco

    • Routers de la serie 4000 de Cisco

    • Módulos de procesador de ruta (RP) en routers de la serie 7000 de Cisco (RP)

  • Procesadores de computación con conjunto de instrucciones reducido (RISC)

    A continuación se incluye parte de un resultado de show version que indica que el router tiene un procesador RISC:

    cisco 3640 (R4700) processor (revision 0x00) with 49152K/16384K bytes of memory.

    La R en (R4700) indica un procesador RISC.

    Las plataformas de router con procesadores RISC incluyen:

    • Routers de la serie 3600 de Cisco

    • Routers de la serie Cisco 4500

    • Routers de la serie 4700 de Cisco

    • Módulos Route Switch Processors (RSP) en routers Cisco series 7500 y 7000 (RSP7000)

    • Módulos del Motor del procesador de red (NPE) en los routers Cisco serie 7200

    • Tarjeta de función del switch de capas múltiples (MSFC) en los routers Cisco serie 7600 o el switch Catalyst 6000

    • Módulos del Motor de ruteo de desempeño (PRE) en los routers de Internet Cisco serie 10000

    • Módulos del Procesador de ruteo Gigabit (GRP) en los routers de Internet Cisco serie 12000

Una vez que haya determinado la dirección y el tipo de procesador, puede comenzar una resolución de problemas más detallada.

Solución de problemas de caídas de error de bus en plataformas de procesador 68000

Con la dirección con la que obtuvo acceso el router cuando ocurrió el error de bus, use el comando show region para determinar la ubicación de la memoria a la que pertenece la dirección. Si la dirección notificada por el error de bus no está dentro de los rangos visualizados en el resultado de show region, esto significa que el router intentó obtener acceso a una dirección no válida. Esto indica que es un problema del software Cisco IOS. Use la Resultado Herramienta Output Interpreter (solamente clientes registrados) para decodificar el resultado del comando show stacks e identificar el error de procesamiento del software Cisco IOS que genera el error de bus.

Por el contrario, si la dirección no está dentro de uno de los rangos del resultado de show region, esto significa que el router accedía a una dirección de la memoria válida, pero el hardware correspondiente a esa dirección no responde correctamente. Esto indica un problema de hardware.

A continuación se incluye un ejemplo del resultado de show region :

Router#show region

Region Manager:

     Start         End     Size(b)  Class  Media  Name

0x00000000  0x007FFFFF     8388608  Local  R/W    main

0x00001000  0x0001922F       98864  IData  R/W    main:data

0x00019230  0x000666B3      316548  IBss   R/W    main:bss

0x000666B4  0x007FEFFF     7965004  Local  R/W    main:heap

0x007FF000  0x007FFFFF        4096  Local  R/W    main:flhlog

0x00800000  0x009FFFFF     2097152  Iomem  R/W    iomem

0x03000000  0x037FFFFF     8388608  Flash  R/O    flash

0x0304033C  0x037A7D3F     7764484  IText  R/O    flash:text

Nota: En las versiones anteriores del software Cisco IOS, este comando posiblemente no esté disponible. El resultado de show region es parte del resultado de show tech-support de la versión 12.0(9) del software Cisco IOS.

Las direcciones se muestran en forma hexadecimal. Las direcciones que están dentro de los rangos anteriores "Inicio" y "Final" son direcciones de memoria válidas.

Main corresponde a la memoria principal o RAM dinámica (DRAM).

iomem corresponde a la memoria entrada/salida (I/O) que significa diferentes partes para diferentes plataformas. Por ejemplo, DRAM para el Cisco 2500, RAM compartida (SRAM) para el Cisco 4000.

Utilizando el ejemplo anterior: “System restarted by bus error at PC 0x30EE546, address 0xBB4C4" (Sistema reiniciado debido a un error de bus en la PC 0x30EE546, dirección 0xBB4C4)", este error de bus proviene de un router Cisco 2500 con el resultado de show region anterior. La dirección 0xBB4C4 es equivalente a 0x000BB4C4. Utilizando el resultado de show region, esta dirección se encuentra dentro del rango de “main” o, más específicamente, “main:heap” o 0x000666B4-0x007FEFFF. Como se mencionó anteriormente, “main” corresponde a la memoria principal o la DRAM, por lo que deben verificarse los chips DRAM.

Si éste es un nuevo router, o si el router se ha trasladado de una ubicación a otra, los chips de la memoria con frecuencia se pierden. Es una buena opción volver a colocar o presionar firmemente los chips de memoria en la ranura. La mayoría de las veces, esto es suficiente para resolver este tipo de desperfecto.

Para los desperfectos de errores de bus con direcciones que no están dentro de los rangos de dirección show region, use la Herramienta Output Interpreter para decodificar el resultado del comando show stacks e identificar el error de procesamiento del software Cisco IOS que genera el error de bus. Si no está seguro sobre el Id. de error que puede coincidir o la versión del software Cisco IOS que incluye la solución para el problema, puede intentar actualizando el software Cisco IOS a la versión más reciente en su serie de versiones. Esta acción con frecuencia resuelve el problema, ya que generalmente incluye la solución para una gran cantidad de errores.

Si tiene el resultado de un comando show stacks o show technical-support (desde modo habilitar) del dispositivo Cisco, podrá utilizar para mostrar posibles problemas y sus soluciones. Para utilizarlo, debe ser un cliente registrado conectado al sistema y tener JavaScript habilitado.

Resolución de problemas de caídas de error de bus en las plataformas de procesador RISC

Se recomienda que lea la sección sobre Resolución de problemas de caída por error del bus en plataformas de procesador 68000 antes de continuar con esta sección.

En los procesadores RISC, el software Cisco IOS usa direcciones virtuales a través del uso del Búfer de traducción de direcciones (TLB) que traduce direcciones virtuales en direcciones físicas. La dirección notificada por errores de bus en procesadores RISC es por ende la dirección virtual a diferencia de la dirección física utilizada por los procesadores 68000.

El resultado del comando show region debe utilizarse para verificar la dirección notificada por el error de bus. Para ejemplificar esto, tomemos el siguiente ejemplo:

System was restarted by bus error at PC 0x60104864, address 0xC

Utilizando el resultado del comando show region a continuación, puede verificar que 0xC no es una dirección virtual válida y puede concluir que el error de bus se debió a un problema de software. Use la herramienta intérprete de resultados (solamente clientes registrados) para decodificar el resultado del comando show stacks o show technical-support (desde modo habilitar) e identificar el error del software Cisco IOS que provoca el error de bus.

Otra ventaja de utilizar el comando show region es que el mapeo de la memoria depende de la cantidad de memoria instalada en el router. Por ejemplo, si tiene 64 MB de DRAM (64 x 1024 x 1024 = 67108864 bytes = 0x4000000 bytes), el rango de DRAM es 0x60000000 - 0x63FFFFFF para 64 MB. Esto se confirma a través del comando show region:

Router#show version | i of memory 

cisco RSP2 (R4700) processor with 65536K/2072K bytes of memory.


Router#show region

Region Manager:


     Start         End     Size(b)  Class  Media  Name

0x40000000  0x40001FFF        8192  Iomem  REG    qa

0x40002000  0x401FFFFF     2088960  Iomem  R/W    memd

0x48000000  0x48001FFF        8192  Iomem  REG    QA:writethru

0x50002000  0x501FFFFF     2088960  Iomem  R/W    memd:(memd_bitswap)

0x58002000  0x581FFFFF     2088960  Iomem  R/W    memd:(memd_uncached)

0x60000000  0x63FFFFFF    67108864  Local  R/W    main

0x60010908  0x60C80B11    13042186  IText  R/O    main:text

0x60C82000  0x60F5AF1F     2985760  IData  R/W    main:data

0x60F5AF20  0x610E35FF     1607392  IBss   R/W    main:BSS

0x610E3600  0x611035FF      131072  Local  R/W    main:fastheap

0x61103600  0x63FFFFFF    49269248  Local  R/W    main:heap

0x80000000  0x83FFFFFF    67108864  Local  R/W    main:(main_k0)

0x88000000  0x88001FFF        8192  Iomem  REG    QA_k0

0x88002000  0x881FFFFF     2088960  Iomem  R/W    memd:(memd_k0)

0xA0000000  0xA3FFFFFF    67108864  Local  R/W    main:(main_k1)

0xA8000000  0xA8001FFF        8192  Iomem  REG    QA_k1

0xA8002000  0xA81FFFFF     2088960  Iomem  R/W    memd:(memd_k1)

Si experimenta un error de bus en 0x65FFFFFF, el resultado de show region toma la cantidad de memoria en la cuenta y le indica que es una dirección ilegal (error de software).

En resumen:

  • Utilice el comando show region para verificar si la dirección indicada por el error de bus está dentro de los rangos de dirección utilizados por el router.

  • Si la dirección no está dentro de un rango de direcciones virtuales, reemplace el hardware correspondiente a este rango.

  • Si la dirección no está dentro de un rango de direcciones virtuales, utilice la Herramienta Output Interpreter (solamente clientes registrados) para decodificar el resultado del comando show stacks o el comando show technical-support (desde modo habilitar) e identificar el error del software Cisco IOS que genera el error de bus.

  • Considere seriamente instalar la versión de mantenimiento más reciente de la serie del software Cisco IOS que está ejecutando actualmente.

Tipos especiales de desperfectos por error en el bus

Un tipo especial de desperfecto por error de bus es cuando el desperfecto es provocado por un contador de programa (PC) actual. El valor de PC es la ubicación de la instrucción que el procesador estaba ejecutando cuando ocurrió el error de bus. Durante un error del bus provocado por un PC dañado, aparece el siguiente mensaje en la consola:

%ALIGN-1-FATAL: Corrupted program counter

  pc=0x0, ra=0x601860BC, sp=0x60924540, at=0x60224854

En este caso, el PC ha saltado a la dirección 0x0 (probablemente debido a un puntero nulo), pero aquí no está ubicada la instrucción. Éste es un problema de software por lo que no hay necesidad de verificar con el comando show region.

En otras plataformas RISC (Cisco 3600, 4500 y así sucesivamente), cuando se hace un salto a un PC ilegal, se obtiene una excepción SegV y no un error de bus.

Otro tipo de desperfecto de error de bus que se presenta de vez en cuando es cuando el valor de PC es igual al valor de dirección. Por ejemplo:

System returned to ROM by bus error at PC 0x606B34F0, address 0x606B34F0

Desde el archivo crashinfo:

Unexpected exception, CPU signal 10, PC = 0x606B34F0

  $0 : 00000000, AT : A001A24A, v0 : 00000000, v1 : 00000000
  a0 : 00000000, a1 : 429CC394, a2 : 00000000, a3 : 62544344
  t0 : 6069F424, t1 : 3400FF00, t2 : FFFFFFFB, t3 : 00000000
  t4 : 606B8E68, t5 : 80000000, t6 : AA5C1022, t7 : 62FDE9D4
  s0 : 62300000, s1 : 6281A1B8, s2 : 80007E20, s3 : 00000001
  s4 : 00000001, s5 : 00000000, s6 : 62310000, s7 : 62544344
  t8 : 62FDEA1C, t9 : 0D0D0D0D, k0 : 623079C0, k1 : 00000014
  gp : 620B9E20, sp : 61E7E300, s8 : 00000000, ra : 606B8E68
  EPC : 606B34F0, ErrorEPC : 606B8E68, SREG : 3400FF02
  Cause 00004018 (Code 0x6): Instruction Bus Error exception

  -Traceback= 606B34F0 606B8E68

Observe que el valor de registro k1 es 0x14 (hexadecimal) equivalente a 20 en decimal. Esto indica una excepción de paridad de la memoria caché. En este caso en particular, el error de paridad no se maneja correctamente y se enmascara por un error de bus. El router ha dejado de funcionar debido a un error de bus de software en la función y ha gestionado una excepción de paridad de la memoria caché.

Debe considerar este desperfecto como un desperfecto de error de paridad común de memoria del procesador y seguir las recomendaciones proporcionadas en Errores de paridad de la memoria del procesador (PMPE).

También debe considerar la actualización de la versión del software Cisco IOS a la versión que incluye una solución para CSCdv68388 - "Cambiar el administrador de excepción de error de caché para reanudar sin problema", que ha sido resuelto en la versión 12.12(10) 12.2(10) del software Cisco IOS.

Técnicas de solución de problemas para bucles de inicio de excepción de error de bus

Esta sección se centra en las técnicas de solución de problemas generales para bucles de inicio de excepción de error de bus:

  • El software Cisco IOS cargado no soporta el hardware instalado.

  • Error de software

  • Hardware instalado incorrectamente

  • Error de hardware

El software Cisco IOS cargado no soporta el hardware instalado

Verifique que todas las tarjetas de red sean compatibles con el software Cisco IOS. El Asesor de software (solamente clientes registrados) le proporciona las versiones mínimas del software Cisco IOS necesarias para el hardware. Además, verifique que la imagen de bootflash sea compatible con el hardware instalado si tiene un router que soporta una imagen de inicialización como el router Cisco series 7200 o 7500.

Error de software

En los routers 2600 y 3600, la memoria de I/O del router se puede configurar como un porcentaje de la memoria principal. Si la configuración de la memoria de I/O es adecuada para los módulos de red instalados o las tarjetas de interfaz WAN (WIC), la plataforma 2600/3600 puede tener problemas al inicio y puede sufrir desperfectos por errores de bus. Utilice la 2600/3600 Calculadora de memoria (solamente clientes registrados) para verificar la configuración.

Si se ha realizado un cambio reciente en la configuración del software y el router se encuentra en un bucle de inicio, es posible que este problema se deba a un error de software.

Si el router no puede iniciarse, puede omitir la configuración para identificar si ésta es la causa del problema. Siga estos pasos:

  1. Entre a ROMMON enviando la secuencia de interrupción al router durante los primeros 60 segundos del arranque inicial.

  2. Desde el monitor de la memoria ROM, utilice el comando confreg para cambiar el registro de la configuración a una configuración, como 0x2142, para ignorar la configuración del router:

    rommon 1 > confreg 0x2142
    
    You must reset or power cycle for new config to take effect
    
    rommon 2 > reset

Si el router se inicia sin ningún error, hay un error de configuración que es la causa del problema Verifique que su configuración se compatible con el software Cisco IOS y el hardware. Si es compatible, use la herramienta Bug Toolkit (solamente clientes registrados) para identificar los errores de software que está experimentando. Considere seriamente instalar la versión de mantenimiento más reciente de la serie del software Cisco IOS que está ejecutando actualmente.

Hardware instalado incorrectamente

Si está experimentando un bucle de inicio de excepción de error de bus, es posible que se deba a un hardware instalado incorrectamente. Para plataformas de gama más baja como el router 3600 o 4000, enganche nuevamente los módulos de red/procesadores de red.

Para las plataformas de mayor capacidad, como los routers 7200 o 7500, enganche nuevamente el procesador, VIP, los adaptadores de puertos o la tarjeta de línea que está recargando debido a una excepción de error de bus.

Error de hardware

La información incluida en el error de bus no ayuda a aislar el hardware. Por lo tanto, es importante quitar y volver a insertar las tarjetas para encontrar el problema de hardware. A continuación se incluyen algunos pasos recomendados para aislar el problema:

flow1.jpg

**Si el router no experimenta el bucle continuo luego de seguir los pasos de solución de problemas descritos anteriormente, entonces el problema pudo haber sido causado por un módulo de red mal asentado. Se recomienda que supervise el router durante 24 horas para asegurarse de que siga funcionando sin que vuelva a producirse el error.

Información para recopilar si abre un pedido de servicio

Sí aún requiere asistencia después de realizar los pasos de solución de problemas y desea abrir un caso en el Soporte técnico de Cisco, no olvide incluir la siguiente información a su caso de solución de problemas de errores de bus o excepciones de error de bus:

  • Solución de problemas antes de abrir el caso

  • Resultado de show technical-support (si es posible, en modo habilitar)

  • Resultado show logo capturas de la consola si están disponibles

  • Archivo crashinfo (si está presente y no incluido ya en el resultado de show technical-support)

  • Resultado de show region (si no está incluido ya en el resultado de show technical-support )

Adjunte los datos recolectados a su caso en formato de texto sin comprimir (.txt). Puede vincular información a su caso cargándola a través de la herramienta Case Query (solamente clientes registrados) . Si no puede acceder a la herramienta Case Query, puede incluir la información relevante a su caso enviándola a attach@cisco.com junto con el número de su caso en el asunto del mensaje.

Nota: Si es posible, no recargue manualmente el router ni lo someta a un ciclo de apagado y encendido antes de recopilar la información antes mencionada, salvo que sea necesario para solucionar un problema de excepción de error de bus ya que esto puede provocar la pérdida de información importante necesaria para determinar la causa raíz del problema.


Discusiones relacionadas de la comunidad de soporte de Cisco

La Comunidad de Soporte de Cisco es un foro donde usted puede preguntar y responder, ofrecer sugerencias y colaborar con colegas.


Document ID: 7949