Routers : Routers Cisco de la serie 7500

Introducción a la caída forzada del sistema por software

23 Marzo 2008 - Traducción manual
Otras Versiones: PDFpdf | Traducción Automática (31 Julio 2013) | Inglés (31 Julio 2006) | Comentarios

Interactivo: Este documento ofrece un análisis personalizado de su dispositivo Cisco.


Contenidos

Introducción
Requisitos previos
Requisitos
Componentes utilizados
Convenciones
Identificación de una caída forzada por software
Posibles causas
Resolución de problemas
Procedimientos de configuración
Procedimiento de configuración del enrutador
Procedimiento de configuración del host servidor TFTP
Información para recopilar si abre un pedido de servicio del TAC

Introducción

Este documento explica las causas más frecuentes de errores originados en el software y describe la información que debe obtenerse para la resolución de problemas. Si abre una solicitud de servicio del TAC para un error originado en el software, la información que se le solicite será esencial para resolver el problema.

Requisitos previos

Requisitos

Quienes lean este documento deben tener conocimiento de los siguientes temas:

Componentes utilizados

Este documento no tiene restricciones específicas en cuanto a versiones de software y de hardware.

La información que contiene este documento se creó a partir de los dispositivos en un ambiente de laboratorio específico. Todos los dispositivos que se utilizan en este documento se pusieron en funcionamiento con una configuración despejada (predeterminada). Si la red está funcionando, asegúrese de haber comprendido el impacto que puede tener cualquier comando.

Convenciones

Si desea más información sobre convenciones de documentos, consulte las Convenciones sobre consejos técnicos de Cisco.

Identificación de una caída forzada por software

Una caída forzada por software se produce cuando el enrutador detecta un error grave e irrecuperable y se recarga sin transmitir los datos dañados. La mayoría de las caídas forzadas por software se deben a errores de procesamiento del software Cisco IOS®, aunque algunas plataformas (como la antigua Cisco 4000) pueden notificar un problema de hardware como caída forzada por software.

Si no apaga y enciende o vuelve a cargar manualmente el enrutador, el resultado del comando show version mostrará lo siguiente:

Router uptime is 2 days, 21 hours, 30 minutes
System restarted by error - Software-forced crash, PC 0x316EF90 at 20:22:37 edt
System image file is "flash:c2500-is-l.112-15a.bin", booted via flash

Si tiene la salida de un comando show version del dispositivo Cisco, podrá utilizar para mostrar posibles problemas y sus soluciones. Para utilizar debe ser un cliente registrado, estar conectado al sistema y tener JavaScript habilitado.

Posibles causas

Esta tabla explica las razones posibles de las caídas del sistema forzadas por software:

Motivo

Explicación

Tiempos de espera de vigilancia

El procesador usa temporizadores para evitar bucles infinitos y hace que el enrutador deje de responder. Bajo un funcionamiento normal, la CPU reinicia esos temporizadores a intervalos regulares. Si esto no se realiza, el sistema se recargará.

Los tiempos de espera de vigilancia informados como caídas del sistema forzadas por software están relacionados con el software. Para obtener información sobre los tipos de tiempos de espera de vigilancia, consulte Solución de problemas de caídas del sistema por agotamiento del tiempo de espera de vigilancia. El sistema se atascó en un bucle antes de la recarga. Por lo tanto, el seguimiento de pila no es necesariamente pertinente. Puede reconocer este tipo de caídas del sistema forzadas por software en estas líneas de los registros de la consola:

%SYS-2-WATCHDOG: Process aborted on watchdog timeout, process = Exec

               and

               *** System received a Software forced crash ***
               signal = 0x17, code = 0x24, context= 0x60ceca60

Memoria baja

Cuando un enrutador tiene poca memoria, es posible que se recargue y notifique una caída forzada por el software. En este caso, aparecerán mensajes de error de asignación de memoria en los registros de la consola:

%SYS-2-MALLOCFAIL: Memory allocation of 734 bytes failed from 0x6015EC84,
               pool Processor, alignment 0 

Imagen principal dañada

Al momento del inicio del sistema, el enrutador puede detectar que la imagen del software Cisco IOS está dañada, devolver un mensaje compressed image checksum is incorrect (suma de comprobación de imagen es incorrecta) e intentar una recarga. En este caso, el evento se informa como caída forzada del sistema por software.

Error : compressed image checksum is incorrect 0x54B2C70A
        Expected a checksum of 0x04B2C70A


*** System received a Software forced crash ***
signal= 0x17, code= 0x5, context= 0x0
PC = 0x800080d4, Cause = 0x20, Status Reg = 0x3041f003

Esto se puede deber a una imagen del software Cisco IOS dañada durante la transferencia al enrutador. En este caso, puede cargar una nueva imagen en el enrutador para resolver el problema. [Para buscar un método de recuperación de ROMMON para su plataforma, consulte el Procedimiento de recuperación de ROMmon para enrutadores de las series 7200, 7300, 7400, 7500, RSP7000, Catalyst 5500 RSM, uBR7100, uBR7200, uBR10000 y 12000 de Cisco].

También se puede deber a hardware de memoria defectuoso o a un error de funcionamiento del software.

Otros errores

Por lo general, los errores que causan desperfectos se detectan mediante el hardware del procesador, que automáticamente invoca códigos especiales de gestión de errores en el monitor de la memoria ROM. El monitor de la memoria ROM identifica el error, imprime un mensaje, almacena información acerca del mismo y reinicia el sistema.

Existen caídas en las que no ocurre nada de esto (consulte Tiempos de espera de vigilancia) y existen caídas en las que el software detecta el problema e invoca la función crashdump. Esta es una verdadera caída "forzada por el software".

En plataformas Power PC, las "caídas forzadas por software" no son la razón de reinicio que aparece cuando se activa la función crashdump, al menos hasta hace muy poco tiempo. En esas plataformas (previo a la Versión 12.2(12.7) del software Cisco IOS), se las denomina excepciones “SIGTRA”: En los demás casos, SIGTRAP y SFC son iguales.

Resolución de problemas

Las caídas forzadas por software son típicamente causadas por errores de procesamiento del software Cisco IOS. Si se presentan mensajes de error de asignación de memoria en los registros, consulte Resolución de problemas de la memoria.

Si no hay mensajes de error de asignación de memoria y no ha apagado y encendido o recargado en forma manual el enrutador después de una caída forzada por software, la mejor herramienta que puede utilizar es el intérprete de resultados (solamente clientes registrados) para buscar un ID de error de funcionamiento conocido que coincida. Esta herramienta incorpora la funcionalidad de la antigua herramienta Stack Decoder.

Ejemplo:

  1. Recopile el resultado del comando show stack del enrutador.

  2. Vaya a la herramienta intérprete de resultados (solamente clientes registrados).

  3. Seleccione show stack en el menú despegable.

  4. Pegue el resultado recopilado.

  5. Haga clic en Submit (Enviar).

    Si el resultado decodificado del comando show stack coincide con un error de funcionamiento conocido, recibirá las ID de posibles errores de funcionamiento de software que podrían haber causado la caída forzada del sistema por software.

  6. Haga clic en el hipervínculo de la ID del error de funcionamiento para ver más detalles de la herramienta para errores de funcionamiento (solamente clientes registrados) de Cisco que pueden ayudar a determinar la correcta coincidencia de ID de error de funcionamiento.

Una vez identificada la ID del error de funcionamiento que coincide con su error, consulte el campo "fixed in" (corregido en) para determinar la primera versión del software Cisco IOS que contiene la solución para el error de funcionamiento.

Si no está seguro sobre qué identificación de error de funcionamiento o versión del software Cisco IOS contiene la solución del problema, actualice su software Cisco IOS a la versión más reciente en su serie de versiones. Esto será de ayuda porque la versión más reciente contiene las soluciones para un gran número de errores de funcionamiento. Incluso si esto no soluciona el problema, el proceso de resolución y notificación de errores de funcionamiento es más simple y rápido si posee la versión más reciente del software.

Si, tras utilizar la herramienta intérprete de resultados, sospecha que existe o ha identificado definitivamente un error de funcionamiento que no fue resuelto, recomendamos que abra una solicitud de servicio del TAC, a fin obtener más información para resolver el error de funcionamiento y para acelerar el proceso de notificación cuando el error finalmente se haya resuelto.

Procedimientos de configuración

Si el problema se identifica como un nuevo error de funcionamiento del software, el ingeniero del TAC de Cisco puede solicitarle que configure su enrutador para obtener un vaciado de memoria. A veces se requiere un vaciado de memoria para identificar qué se puede hacer para corregir el error de funcionamiento de software.

Para obtener más información sobre el vaciado de memoria, recomendamos usar el comando oculto debug sanity. Esto genera que se compruebe la integridad de cada búfer que se utiliza en el sistema tanto cuando se le asigna como cuando se le libera. Los comandos debug sanity deben ejecutarse en el modo EXEC privilegiado (modo de habilitación) e implica el uso parcial de la CPU, pero no afectan a la funcionalidad del enrutador de manera significativa. Si desea inhabilitar la verificación de estado, utilice el comando EXEC privilegiado undebug sanity.

Para los enrutadores con 16 MB o menos de memoria principal, puede utilizar el Protocolo de transferencia de archivos trivial (TFTP) para recolectar una descarga del núcleo. Si el enrutador tiene más de 16MB de memoria principal, se recomienda el uso de un Protocolo de transferencia de archivos (FTP). Utilice los procedimientos de la configuración de esta sección. También puede consultar Creación de vaciados de memoria.

Procedimiento de configuración del enrutador

Siga estos pasos para configurar su enrutador:

  1. Configure el enrutador con el comando configure terminal.

  2. Escriba exception dump n.n.n.n, donde n.n.n.n es la dirección IP para el host del servidor de Protocolo de transferencia de archivos trivial (TFTP) remoto.

  3. Salga del modo de configuración.

Procedimiento de configuración del host servidor TFTP

Siga estos pasos para configurar un host del servidor TFTP:

  1. Cree un archivo en el directorio /tftpboot en el host remoto con la ayuda de un editor a su elección. El nombre del archivo es el hostname-core (núcleo del nombre del host) del enrutador de Cisco.

  2. En sistemas UNIX, cambie el modo de permiso del archivo "hostname-core" para que tenga compatibilidad global (666). Puede verificar la configuración TFTP a través del comando copy running-config tftp en dicho archivo.

  3. Verifique que dispone de más de 16 MB de espacio libre en el disco en el directorio /tftpboot.

    Si el sistema colapsa, el comando exception dump crea su resultado hacia el archivo anterior. Si el enrutador tiene más de 16 MB de memoria principal, utilice el protocolo de transferencia de archivos (FTP) o el protocolo de copia remota (RCP) para vaciar la memoria. En el enrutador, configure lo siguiente:

    exception protocol ftp
    exception dump n.n.n.n
    ip ftp username 
    ip ftp password  
    ip ftp source-interface 
    exception core-file 

    Si ha obtenido un vaciado de memoria, cárguelo en ftp://ftp-sj.cisco.com/incoming (en UNIX, escriba pftp ftp-sj.cisco.com y, a continuación, cd incoming), notifique al propietario de su caso e incluya el nombre del archivo.

Información para recopilar si abre un pedido de servicio del TAC

Si aún necesita ayuda después de cumplir con los pasos anteriores para la resolución de problemas y desea abrir una solicitud de servicio con el TAC de Cisco, no olvide incluir la siguiente información:

  • Resultado del comando show technical-support: el resultado del comando show technical-support proporciona información acerca del estado actual del enrutador, así como información clave almacenada por el enrutador antes de un error.

  • Registros de la consola: los registros de la consola, a menudo guardados en un servidor de registros del sistema (syslog), pueden proporcionar información importante sobre los eventos que ocurren en el enrutador antes de un error. Estas pistas suelen ser la información más importante que usted puede recoger.

  • Archivo crashinfo (si existe): Cisco recomienda que utilice el software Cisco IOS que soporta la función crashinfo para solucionar completamente el problema. Para ello, la versión debe cumplir con otros requisitos de su red.

    Para obtener una versión del software Cisco IOS compatible con la función crashinfo, consulte Recuperación de la información desde el archivo crashinfo o utilice la herramienta Software Advisor (Asesor de software) (solamente clientes registrados).

    Una ventaja potencial es que si tiene una versión anterior del software Cisco IOS, las versiones más recientes compatibles con esta función ya podrían haber solucionado el error de funcionamiento.

Puede adjuntar información a su solicitud de servicio mediante la herramienta de pedido de servicio TAC (solamente clientes registrados). Si no puede obtener acceso a la Herramienta de pedido de servicio TAC y desea adjuntar información pertinente a su caso, puede enviarla como documento adjunto de un correo electrónico a attach@cisco.com; recuerde escribir el número de su caso en el asunto del mensaje.

precauciónPrecaución: Si es posible, no recargue manualmente el enrutador ni lo someta a un ciclo de apagado y encendido antes de recopilar la información anterior, ya que esto puede causar la pérdida de información importante necesaria para determinar la causa raíz del problema.


Discusiones relacionadas de la comunidad de soporte de Cisco

La Comunidad de Soporte de Cisco es un foro donde usted puede preguntar y responder, ofrecer sugerencias y colaborar con colegas.


Document ID: 26145