Software Cisco IOS y NX-OS : Software Cisco IOS versión 12.1 Mainline

Resolución de problemas de caída por error del bus

16 Enero 2016 - Traducción Automática
Otras Versiones: PDFpdf | Traducción Manual (19 Mayo 2008) | Inglés (31 Diciembre 2015) | Comentarios


Interactivo: Este documento ofrece un análisis personalizado de su dispositivo Cisco.


Contenido


Introducción

Este documento explica cómo identificar fallas por errores de bus y cómo resolver esas fallas según el tipo de procesador que tenga en su router Cisco.

prerrequisitos

Requisitos

Cisco recomienda que usted lee los desperfectos del router del troubleshooting antes de proceder con este documento.

Componentes Utilizados

La información que contiene este documento se basa en las siguientes versiones de software y hardware.

  • Todas las versiones de software de Cisco IOS�

  • Todos los routers Cisco

Nota: Este documento no se aplica a los switches Cisco Catalyst o plataformas MGX.

La información que contiene este documento se creó a partir de los dispositivos en un ambiente de laboratorio específico. Todos los dispositivos que se utilizan en este documento se pusieron en funcionamiento con una configuración verificada (predeterminada). Si la red está funcionando, asegúrese de haber comprendido el impacto que puede tener cualquier comando.

Convenciones

Consulte Convenciones de Consejos Técnicos de Cisco para obtener más información sobre las convenciones sobre documentos.

Identificación de desperfectos por errores de bus

El sistema detecta un error de bus cuando el procesador intenta tener acceso a un lugar de la memoria que no existe (un error de software) o no responde correctamente (un problema de hardware). A error de bus se puede identificar de la salida del comando show version proporcionado por el power-cycled del router si no o recargado manualmente.

Si usted tiene la salida de un comando show version o show technical-support (del enable mode) de su dispositivo de Cisco, usted puede utilizarlo para visualizar los problemas potenciales y los arreglos. Para utilizarlo, usted debe ser un cliente registrado, se abra una sesión, y hace el Javascript habilitar.

Router uptime is 2 days, 21 hours, 30 minutes 

System restarted by bus error at PC 0x30EE546, address 0xBB4C4 

System image file is "flash:igs-j-l.111-24.bin", booted via flash 
.........

En el prompt de consola, este mensaje de error se puede también considerar durante a error de bus:

*** System received a Bus Error exception *** 
signal= 0xa, code= 0x8, context= 0x608c3a50
PC = 0x60368518, Cause = 0x20, Status Reg = 0x34008002
.........

Después de esto, las recargas de router. En algunos casos, sin embargo, el router entra un loop de las caídas y las recargas y la intervención manual se requiere explotar de este loop.

Otro asunto relacionado es una caída del procesador de interfaz versátil (VIP). Si ocurre este problema, los mensajes de error similares a éstos se registran:

%VIP2 R5K-1-MSG: slot0 System reloaded by a Bus Error exception
%VIP2 R5K-1-MSG: slot0 caller=0x600BC974
%VIP2 R5K-1-MSG: slot0 System exception: sig=10, code=0x408,
context=0x605B51E0

Finalmente, otro tipo del caída de error de bus es un error de placa de línea en un Cisco 12000 Series Internet Router. Si ocurre este problema, los mensajes de error similares a éstos son abiertos una sesión el contexto de la demostración hecho salir:

Router#show context

... 

CRASH INFO: Slot 1, Index 1, Crash at 11:27:15 utc  Wed May 16 2001
 VERSION: 

 GS Software (GLC1-LC-M), Version 12.0(16.5)S, EARLY DEPLOYMENT MAINTENANCE 

 INTERIM SOFTWARE 

 TAC Support: http://www.cisco.com/pcgi-bin/ibld/view.pl?i=support    

 Compiled Thu 29-Mar-01 17:12 by ninahung 

 Card Type: 3 Port Gigabit Ethernet, S/N 

 System exception: SIG=10, code=0x2008, context=0x40D8DF44 

 System restarted by a Bus Error exception 

 STACK TRACE: 

 -Traceback= 40165800 4038D0FC 4025C7BC 4026287C 4029581C 402EECF8 400C0144    

 CONTEXT: 

 $0 : 00000000, AT : 00000000, v0 : 00000044, v1 : 0FE00020 

 a0 : 00000000, a1 : 0FE00000, a2 : 00000000, a3 : 39EC6AAB 

 t0 : 00000030, t1 : 34008D01, t2 : 34008100, t3 : FFFF00FF 

 t4 : 400C01E8, t5 : 00000001, t6 : 00000001, t7 : 00000001 

 s0 : 40DCDD20, s1 : 0FE00000, s2 : 00000000, s3 : 000005DC 

 s4 : 00000000, s5 : 0FE00020, s6 : 00000004, s7 : 414CF120 

 t8 : 41680768, t9 : 00000000, k0 : 00000000, k1 : FFFF8DFD 

 gp : 40CB9780, sp : 4105BFE8, s8 : 41652BA0, ra : 4038D0FC 

 EPC : 0x40165800, SREG : 0x34008D03, Cause : 0x00002008 

 ErrorEPC : 0xBFC22B94
 -Process Traceback= No Extra Traceback

Vea los errores de placa de línea del troubleshooting en el Cisco 12000 Series Internet Router para más detalles.

Si usted tiene la salida de un comando show context de su dispositivo de Cisco, usted puede utilizar para visualizar los problemas potenciales y los arreglos. Para utilizar , usted debe ser un cliente registrado, se abra una sesión, y hace el Javascript habilitar.

Resolución de problemas de caída por error del bus

Lo primero que se debe realizar es averiguar a qué ubicación de memoria (también denominada “dirección” u “operando de dirección”) intentó acceder el router cuando se produjo el error de bus. Con esta información, tiene un indicio para determinar si la falla tiene que ver con el software Cisco IOS o con el hardware del router. En el ejemplo, “sistema recomenzado por error de bus en PC 0x30EE546, direccionamiento el 0xBB4C4", la ubicación de memoria que el router intentado para acceder es 0xBB4C4. No confundir con el valor del contador de programa (PC) anterior.

La segunda cosa a hacer es determinar el tipo de procesador en el router. Las ubicaciones de dirección de memoria para el Routers diferencian dependiendo del tipo de procesador. Existen dos tipos principales de procesadores en los routers Cisco:

  • Procesadores 68000

    Ésta es parte de a la demostración version output que indica que el router tiene un procesador 68000:

    cisco 2500 (68030) processor (revision D) with 8192K/2048K bytes of memory.
    

    Las plataformas de router con procesadores 68000 incluyen:

  • Procesadores de computación con conjunto de instrucciones reducido (RISC)

    Ésta es parte de a la demostración version output que indica que el router tiene un procesador RISC:

    cisco 3640 (R4700) processor (revision 0x00) with 49152K/16384K bytes of memory.

    El R adentro (R4700) indica un procesador RISC.

    Las plataformas de router con procesadores RISC incluyen:

    • Cisco 3600 Series routers

    • Routers de la serie Cisco 4500

    • Routers de la serie 4700 de Cisco

    • Módulos RSP (procesador de conmutación de rutas) en routers de la serie Cisco 7500 y Cisco 7000 (RSP7000)

    • Módulos del Network Processor Engine (NPE) en los Cisco 7200 Series Router

    • (MSFC) de la Multilayer Switch Feature Card en los Cisco 7600 Series Router o el Catalyst 6000 Switch

    • Módulos de Performance Routing Engine (PRE) en los Cisco 10000 Series Internet Routers

    • Módulos de Procesador de ruta Gigabit (GRP) en routers de Internet de la serie 12000 de Cisco

Una vez que usted ha determinado el direccionamiento y el tipo de procesador, usted puede comenzar con un troubleshooting más detallado.

Solución de problemas de caídas de error de bus en plataformas de procesador 68000

Con la dirección a la que accedió el router cuando ocurrió el error de bus, utilice el comando show region para determinar la ubicación de memoria a la que corresponde la dirección. Si el direccionamiento señaló por error de bus no baja dentro de los rangos visualizados en la salida de la región de la demostración, esto significa que el router intentó acceder un direccionamiento que es inválido. Esto indica que es un problema con el software del IOS de Cisco. Utilice la herramienta del Output Interpreter (clientes registrados solamente) para decodificar la salida del comando show stacks y para identificar el bug del Cisco IOS Software que causa error de bus.

Por otra parte, si el direccionamiento baja dentro de uno de los rangos en la salida de la región de la demostración, significa que el router accedió a una dirección de memoria válida, pero el hardware correspondiente a ese direccionamiento no responde correctamente. Esto indica un problema de hardware.

Aquí hay un ejemplo de la salida de show region:

Router#show region 

Region Manager: 

     Start         End     Size(b)  Class  Media  Name 

0x00000000  0x007FFFFF     8388608  Local  R/W    main 

0x00001000  0x0001922F       98864  IData  R/W    main:data 

0x00019230  0x000666B3      316548  IBss   R/W    main:bss 

0x000666B4  0x007FEFFF     7965004  Local  R/W    main:heap 

0x007FF000  0x007FFFFF        4096  Local  R/W    main:flhlog 

0x00800000  0x009FFFFF     2097152  Iomem  R/W    iomem 

0x03000000  0x037FFFFF     8388608  Flash  R/O    flash 

0x0304033C  0x037A7D3F     7764484  IText  R/O    flash:text

Nota: En algunas versiones del Cisco IOS Software anteriores, este comando no está disponible. El comando show region output es parte del comando tech-support output desde la versión 12.0(9) de software del IOS de Cisco.

Los direccionamientos se visualizan en el formato hexadecimal. Los direccionamientos que bajan dentro de los rangos del “comienzo” y del “extremo” son direcciones de memoria válida.

Main" corresponde a la memoria principal o RAM dinámica (DRAM).

el iomem corresponde a memoria de entrada/salida (I/O), que significa diversas piezas para diversas Plataformas. Por ejemplo, DRAM para el Cisco 2500, RAM compartido (SRAM) para el Cisco 4000.

Todavía usando el ejemplo anterior, el sistema recomenzado por error de bus en PC 0x30EE546, el direccionamiento 0xBB4C4, este caída de error de bus viene de un Cisco 2500 Router con la salida de la región de la demostración. El direccionamiento 0xBB4C4 es equivalente a 0x000BB4C4. Usando la salida de la región de la demostración, este direccionamiento baja dentro del rango de la “tubería”, o más concretamente, “tubería: montón” o 0x000666B4-0x007FEFFF. Como se mencionó antes, "main" corresponde a la memoria principal o a la DRAM, por lo que deben verificarse los chips DRAM.

Si este es un nuevo router o si el router fue movido de su ubicación hacia otra, los chips de memoria a menudo se aflojan. Una buena opción es volver a colocar o presionar firmemente los chips de memoria en la ranura. La mayor parte del tiempo, esto es suficiente para solucionar este tipo de caída.

Para los caída de error de bus con los direccionamientos que no bajan dentro de los intervalos de direcciones de la región de la demostración, utilizan la herramienta del Output Interpreter para decodificar la salida del comando show stacks e identifican el bug del Cisco IOS Software que es el causar error de bus. Si no está seguro sobre qué identificación de falla puede coincidir o qué versión del software IOS de Cisco contiene la solución del problema, una opción que suele resolverlo es actualizar la versión de dicho software a la versión final del tren de versión, ya que esto generalmente contiene la solución para un gran número de fallas.

Si usted tiene la salida de los stack de una demostración o muestra el comando del Soporte técnico (del enable mode) de su dispositivo de Cisco, usted puede utilizar para visualizar los problemas potenciales y los arreglos. Para utilizar , usted debe ser un cliente registrado, se abra una sesión, y hace el Javascript habilitar.

Resolución de problemas de caídas de error de bus en las plataformas de procesador RISC

Se recomienda que usted lee la sección en los caída de error de bus del troubleshooting en 68000 Plataformas del procesador antes de que usted proceda con esta sección.

En procesadores RISC, el software IOS de Cisco usa direcciones virtuales mediante el uso del Búfer de traducción de direcciones (TLB) que traduce direcciones virtuales en direcciones físicas. La dirección notificada por errores de bus en procesadores RISC es por ende la dirección virtual a diferencia de la dirección física utilizada por los procesadores 68000.

La salida del comando show region se debe utilizar para marcar el direccionamiento señalado por error de bus. Para ilustrar esto, consideremos el siguiente ejemplo:

System was restarted by bus error at PC 0x60104864, address 0xC

Mediante la salida del comando show region que se muestra a continuación puede verificar que 0xC no es una dirección virtual válida, y puede concluir que el error de bus fue causado por un problema de software. Utilice la Herramienta Output Interpreter (sólo para clientes registrados) para decodificar la salida del comando show stacks o show technical-support (desde el modo enable (activar)) e identificar el error de funcionamiento del software Cisco IOS que está causando el error de bus.

Otra ventaja de utilizar el comando show region es que el mapeo de la memoria depende de la cantidad de memoria instalada en el router. Por ejemplo, si tiene 64 MB de DRAM (64 x 1024 x 1024 = 67108864 bytes = 0x4000000 bytes), el rango DRAM es 0x60000000 - 0x63FFFFFF para 64 MB. Esto se confirma con el comando show region:

Router#show version | i of memory 

cisco RSP2 (R4700) processor with 65536K/2072K bytes of memory. 


Router#show region 

Region Manager: 


     Start         End     Size(b)  Class  Media  Name 

0x40000000  0x40001FFF        8192  Iomem  REG    qa 

0x40002000  0x401FFFFF     2088960  Iomem  R/W    memd 

0x48000000  0x48001FFF        8192  Iomem  REG    QA:writethru 

0x50002000  0x501FFFFF     2088960  Iomem  R/W    memd:(memd_bitswap) 

0x58002000  0x581FFFFF     2088960  Iomem  R/W    memd:(memd_uncached) 

0x60000000  0x63FFFFFF    67108864  Local  R/W    main 

0x60010908  0x60C80B11    13042186  IText  R/O    main:text 

0x60C82000  0x60F5AF1F     2985760  IData  R/W    main:data 

0x60F5AF20  0x610E35FF     1607392  IBss   R/W    main:BSS 

0x610E3600  0x611035FF      131072  Local  R/W    main:fastheap 

0x61103600  0x63FFFFFF    49269248  Local  R/W    main:heap 

0x80000000  0x83FFFFFF    67108864  Local  R/W    main:(main_k0) 

0x88000000  0x88001FFF        8192  Iomem  REG    QA_k0 

0x88002000  0x881FFFFF     2088960  Iomem  R/W    memd:(memd_k0) 

0xA0000000  0xA3FFFFFF    67108864  Local  R/W    main:(main_k1) 

0xA8000000  0xA8001FFF        8192  Iomem  REG    QA_k1 

0xA8002000  0xA81FFFFF     2088960  Iomem  R/W    memd:(memd_k1)

Si usted tiene a error de bus en 0x65FFFFFF, la salida de la región de la demostración toma en cuenta la cantidad de memoria y le dice que es una extensión ilegal (bug de software).

En resumen:

  • Utilice el comando show region para verificar si la dirección indicada por el error de bus se encuentra dentro de los rangos de direcciones utilizados por el router.

  • Si el direccionamiento baja dentro de un intervalo de direcciones virtual, substituya el hardware correspondiente a este rango.

  • Si el direccionamiento no baja dentro de un intervalo de direcciones virtual, utilice la herramienta del Output Interpreter (clientes registrados solamente) para decodificar la salida de los stack de la demostración o del comando del Soporte técnico de la demostración (del enable mode) y para identificar el bug del Cisco IOS Software que es el causar error de bus.

  • Considere seriamente instalar la versión de mantenimiento más reciente de la serie de software del IOS de Cisco que está ejecutando actualmente.

Tipos especiales de desperfectos por error en el bus

Un tipo especial de caída por error de bus es cuando la caída es provocada por un Contador de programa (PC) dañado. El valor de PC es la ubicación de la instrucción que el procesador estaba ejecutando cuando ocurrió el error de bus. Cuando ocurre error de bus causado por un PC corrompido, el siguiente mensaje aparece en la consola:

%ALIGN-1-FATAL: Corrupted program counter 

  pc=0x0, ra=0x601860BC, sp=0x60924540, at=0x60224854

En este caso, la PC ha saltado a la dirección 0x0 (probablemente debido a un puntero nulo), pero aquí no está ubicada la instrucción. Es un problema de software por lo que no hay necesidad de verificar con el comando show region.

En otras plataformas RISC (Cisco 3600, 4500,etc. ), cuando se hace un salto a una PC ilegal, se obtiene una excepción SegV y no un error de bus.

Otro tipo de caída de error de bus que ocurra está de vez en cuando cuando el valor PC es igual al valor de dirección. Por ejemplo:

System returned to ROM by bus error at PC 0x606B34F0, address 0x606B34F0

Del archivo CRASHINFO:

Unexpected exception, CPU signal 10, PC = 0x606B34F0
   
  $0 : 00000000, AT : A001A24A, v0 : 00000000, v1 : 00000000
  a0 : 00000000, a1 : 429CC394, a2 : 00000000, a3 : 62544344
  t0 : 6069F424, t1 : 3400FF00, t2 : FFFFFFFB, t3 : 00000000
  t4 : 606B8E68, t5 : 80000000, t6 : AA5C1022, t7 : 62FDE9D4
  s0 : 62300000, s1 : 6281A1B8, s2 : 80007E20, s3 : 00000001
  s4 : 00000001, s5 : 00000000, s6 : 62310000, s7 : 62544344
  t8 : 62FDEA1C, t9 : 0D0D0D0D, k0 : 623079C0, k1 : 00000014
  gp : 620B9E20, sp : 61E7E300, s8 : 00000000, ra : 606B8E68
  EPC : 606B34F0, ErrorEPC : 606B8E68, SREG : 3400FF02
  Cause 00004018 (Code 0x6): Instruction Bus Error exception
   
  -Traceback= 606B34F0 606B8E68

Note que el valor del registro del k1 es 0x14 que (hexadecimal) es igual a 20 en el decimal. Esto señala a una excepción de paridad de la memoria caché. En este caso particular, el error de paridad no se maneja correctamente y está siendo enmascarado por a error de bus. El router ha dejado de funcionar debido a un error de bus de software en la función y ha gestionado una excepción de paridad de la memoria caché.

Debe considerar esta caída como una provocada por error de paridad común de la memoria del procesador y seguir las recomendaciones suministradas en Errores de paridad de la memoria del procesador (PMPE).

También debe considerar la actualización de la versión del software IOS de Cisco a una versión que tenga una corrección para CSCdv68388 - “Cambiar el administrador de excepción de error de caché para reanudar sin problema” que se corrigió a partir de la versión 12.2(10) del software IOS de Cisco.

Técnicas de solución de problemas para loops de inicio de excepción de error de bus

Esta sección se centra en las técnicas de Troubleshooting general para los loopes del inicio del excepción de error de bus:

  • El Cisco IOS Software cargado no soporta el hardware instalado

  • Falla de software

  • Hardware instalado incorrectamente

  • Falla de hardware

El software del IOS de Cisco cargado no admite el hardware instalado

Verifique que todas las placas de red sean soportadas por el Cisco IOS Software. El Software Advisor (clientes registrados solamente) le da las versiones mínimas del Cisco IOS Software necesarias para el hardware. Verifique también que la imagen de la memoria de inicialización sea compatible con el hardware que se instaló si posee un router que soporta una imagen de arranque, como los routers de la serie Cisco 7200 y Cisco 7500.

Falla de software

En los 2600 y 3600 Router, el router memoria de I/O es configurable como porcentaje de memoria principal. Si memoria de I/O las configuraciones son inadecuadas para los módulos de red instalados o los WAN Interface Cards (WIC), la plataforma de 2600/3600 puede tener arranque del problema y puede causar un crash con los errores en el bus.

Si un Cambio de configuración del software se ha realizado recientemente, y el router está en un Booting Loop, un bug de software puede causar este problema.

Si el router no puede arrancar, usted puede desviar la configuración para identificar si ésa está causando el problema. Siga estos pasos:

  1. Rómpase en el ROMMON enviando la secuencia de interrupción al router durante los primeros 60 segundos del inicio para arriba.

  2. Del ROM Monitor, utilice el comando confreg de cambiar el registro de la configuración a una configuración, tal como 0x2142, para ignorar la configuración del router:

    rommon 1 > confreg 0x2142
    
    You must reset or power cycle for new config to take effect
    
    rommon 2 > reset

Si el router inicia sin ningunos errores, hay un problema de configuración que causa el problema. Compruebe que su configuración es compatible con el software del IOS de Cisco y con el hardware. Si se soporta, utilice el Bug Toolkit (clientes registrados solamente) para identificar cualquier bug de software que usted pueda experimentar. Dé la consideración grave a instalar la mayoría de la versión de mantenimiento reciente del tren del Cisco IOS Software que usted está funcionando con actualmente.

Hardware instalado incorrectamente

Si usted está experimentando un Booting Loop del excepción de error de bus, puede ser causado por el hardware instalado incorrectamente. Para Plataformas más bajas tales como el 3600 o 4000 Router, vuelva a sentar los módulos de red/los procesadores de red.

Para las plataformas de alto nivel tales como los 7200 o 7500 Router, vuelva a sentar el procesador, el VIP, los adaptadores de puerto, o el linecard que es el recargar debido a un excepción de error de bus.

Falla de hardware

La información contenida en error de bus no ayuda a aislar el hardware. Por lo tanto, es importante quitar y volver a insertar las tarjetas para encontrar el problema de hardware. Aquí están algunos pasos recomendados para aislar el problema:

/image/gif/paws/7949/flow1.jpg

**Si el router no experimenta el loop continuo luego de seguir los pasos de solución de problemas descriptos anteriormente, entonces el problema pudo haber sido causado por un módulo de red mal asentado. Se recomienda que vigile el router durante 24 horas para asegurarse de que siga funcionando sin que vuelva a producirse el error.

Información que Debe Recopilarse si se Abre una Solicitud de Servicio

Si usted todavía necesita la ayuda después de seguir los pasos de Troubleshooting arriba y quiere abrir un caso con el Soporte técnico de Cisco, esté seguro de incluir la siguiente información para resolver problemas error de bus o el excepción de error de bus:
  • Trobleshooting realizado antes de abrir el caso
  • muestre el Soporte técnico hecho salir (si es posible, en el enable mode)
  • el resultado o la captura de la consola del show log, si está disponible
  • crashinfo file (de estar presente y de no estar incluido en el resultado show technical-support)
  • muestre la región hecha salir (si no incluido ya en el Soporte técnico de la demostración hecho salir)
Adjunte los datos recopilados para su caso en un texto sin formato (.txt), sin compactar. Puede vincular información a su caso transfiriéndola mediante la herramienta Case Query (sólo para clientes registrados) . Si no puede ingresar a la herramienta Case Query y desea adjuntar información pertinente a su caso, puede enviarla a attach@cisco.com, recuerde escribir el número de su caso en el asunto del mensaje.

Nota: No recargue manualmente o ciclo de la potencia el router antes de recoger la información antedicha a menos que esté requerido para resolver problemas un excepción de error de bus como esto puede hacer la información importante ser perdido que es necesaria para determinar la causa raíz del problema.

Discusiones relacionadas de la comunidad de soporte de Cisco

La Comunidad de Soporte de Cisco es un foro donde usted puede preguntar y responder, ofrecer sugerencias y colaborar con colegas.


Información Relacionada


Document ID: 7949