Introducción
Este documento describe la causa de los tiempos de espera de vigilancia en los routers Cisco, y explica cómo resolverlos.
Prerequisites
Requirements
Quienes lean este documento deben tener conocimiento de los siguientes temas:
Componentes Utilizados
La información que contiene este documento se basa en las siguientes versiones de software y hardware.
Nota: Este documento no se aplica a los switches Catalyst de Cisco o a las plataformas MGX, sino únicamente a los routers de Cisco.
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. If your network is live, make sure that you understand the potential impact of any command.
Convenciones
For more information on document conventions, refer to the Cisco Technical Tips Conventions.
Identificación de tiempos de espera de vigilancia
Los procesadores de Cisco tienen temporizadores que protegen contra ciertos tipos bloqueos del sistema. La CPU reinicia periódicamente un temporizador de vigilancia El temporizador de vigilancia básicamente controla el tiempo de cada proceso. Si no se reinicia el temporizador, se produce una trampa. Si un proceso es más largo de lo que debe ser, se utiliza el temporizador de vigilancia para escapar de este proceso.
Esto sólo ocurre si algo sale mal. En base a la situación, el router puede restablecerse o recuperarse de la falla y generar un mensaje de error en los registros de la consola, que tiene el siguiente aspecto:
*** Watch Dog Timeout ***
PC = 0x6022536C, SP = 0x00000000
or
%SYS-2-WATCHDOG: Process aborted on watchdog timeout, process = Exec
*** System received a Software forced crash ***
signal = 0x17, code = 0x24, context= 0x60ceca60
Si no enciende el router o lo recarga manualmente, el resultado del comando show version es similar al siguiente:
Router#show version
...
Router uptime is 1 hour, 47 minutes
System restarted by watchdog timer expired at 09:26:24 UTC Mon Mar 27 2000
System image file is "flash:c3640-is-mz.113-7-T.bin", booted via flash
...
Si tiene el resultado de un comando show version de su dispositivo Cisco, puede utilizar Cisco CLI Analyzer para mostrar posibles problemas y soluciones. Para utilizar la herramienta Analizador Cisco CLI, debe ser un cliente registrado, iniciar sesión y tener JavaScript habilitado.
Troubleshoot
La causa raíz del tiempo de espera de vigilancia puede estar relacionado con el hardware o con el software. Estos son los síntomas comunes a través de los cuales puede identificar el origen del problema:
-
Si un router que ha estado funcionando correctamente durante meses de repente comienza a recargarse cada 20 minutos, o si se reinicia continuamente y ya no puede acceder a él, el problema es probablemente un problema relacionado con el hardware. Este también es el caso si se ha instalado un nuevo módulo recientemente y el router falla por el tiempo de espera de vigilancia después.
-
Si el router comienza a fallar después de un cambio de configuración o un cambio en la versión del software del IOS de Cisco, probablemente se trate de un problema relacionado con el software.
El primer paso para resolver este tipo de problema es identificar el tipo de tiempo de espera de vigilancia que se encuentra. Hay dos tipos de tiempos de espera de Watchdog:
-
El tiempo de espera de vigilancia del software, que, a pesar de su nombre, por lo general está relacionado con el hardware.
-
El proceso de tiempo de espera de vigilancia, que frecuentemente está relacionado con el software.
Tiempo de espera de vigilancia de software
Este tiempo de espera es causado por un loop infinito en el nivel de interrupción o por un problema de hardware. A continuación se muestran algunos indicadores de este tipo de tiempo de espera:
-
Los registros de la consola contienen estas líneas:
*** Tiempo de espera de perro de Watch ***
PC = 0x6022536C, SP = 0x00000000
-
La salida show version informa la razón de la recarga como "temporizador de vigilancia vencido":
Router#show version
...
Router uptime is 1 hour, 47 minutes
System restarted by watchdog timer expired at 06:30:24 UTC Mon Jan 28 2000
System image file is "flash:c3640-is-mz.113-7-T.bin", booted via flash
-
No se genera ningún archivo crashinfo. Consulte Recuperación de Información del Archivo Crashinfo para obtener detalles.
La mayoría de las veces, estos mensajes indican un problema de hardware, ya sea con la placa del procesador principal o con uno de los módulos.
Después de identificar un tiempo de espera de vigilancia del software, el siguiente paso es verificar el Resumen de aviso de campo del producto para su plataforma y todos los componentes instalados en ese sistema para los problemas de hardware críticos conocidos. Por ejemplo, hay un aviso de campo para el Cisco 3600 Series Router: Tiempos de espera agotados de vigilancia del módulo 3600 T1/E1 PRI de Cisco. Asegúrese de comprobar los avisos de campo antes de resolver problemas adicionales.
Si se ha instalado recientemente un nuevo módulo, primero debe intentar quitarlo para verificar si es la razón del tiempo de espera de vigilancia. Si el tiempo de espera de vigilancia persiste, intente volver a colocar todos los componentes extraíbles.
Si el tiempo de espera de vigilancia continúa en este punto, no hay avisos de campo para su hardware y si no se ha instalado ningún módulo nuevo recientemente, continúe y reemplace la placa del procesador principal. En plataformas de mayor capacidad, la placa del procesador es un tarjeta separada (como la NPE-400 ó RSP8). En las plataformas de menor capacidad (Cisco 1700, 2500, 4000, 2600, 3600, etc.), la placa madre no se puede enviar en forma separada. En este caso, deberá cambiar el chasis en sí.
Tiempo de espera de vigilancia de procesos
Este tiempo de espera se produce a partir de un loop infinito en el nivel del proceso. A continuación se muestran algunos indicadores de este tiempo de espera:
-
Los registros de la consola contienen estas líneas:
%SYS-2-WATCHDOG: Process aborted on watchdog timeout,
process = Exec
*** System received a Software forced crash ***
signal = 0x17, code = 0x24, context= 0x60ceca60
-
La salida show version informa del desperfecto como un "desperfecto forzado por el software":
Router#show version
...
Router uptime is 2 days, 21 hours, 30 minutes
System restarted by error - Software-forced crash,
PC 0x316EF90 at 20:22:37 edt
System image file is "flash:c2500-is-l.112-15a.bin",
booted via flash
-
Se genera un archivo crashinfo para las plataformas que lo soportan.
Este problema es muy probable que sea un error de funcionamiento del software del IOS de Cisco.
Si tiene el resultado de un comando show stacks de su dispositivo Cisco, puede utilizar Cisco CLI Analyzer para mostrar posibles problemas y soluciones. Para utilizar la herramienta Analizador Cisco CLI, debe ser un cliente registrado, iniciar sesión y tener JavaScript habilitado.
Sin embargo, el sistema estaba atascado en un loop antes de la recarga. Por lo tanto, el seguimiento de la pila no necesariamente debe ser relevante. Puede actualizar a la última versión de software del IOS de Cisco de su serie de versiones para eliminar todos los problemas conocidos de Process Watchdog. Si todavía se produce un desperfecto después de la actualización, recopile toda la información posible (consulte Resolución de problemas de desperfectos del router) y póngase en contacto con su representante de soporte técnico.
Mensajes de error relacionados con el tiempo de espera de vigilancia
Hay otros mensajes de error de consola relacionados con los temporizadores de vigilancia. No confunda estos mensajes con una caída del temporizador de vigilancia. Asegúrese de verificar el significado de estos mensajes de error con la ayuda del Decodificador de mensajes de error (sólo clientes registrados) . Esta herramienta le ofrece una explicación detallada de muchos mensajes de error y recomienda acciones para resolverlos.
Tenga en cuenta este mensaje:
%SYS-2-WATCHDOG: Process aborted on watchdog timeout,
process = [chars]
Este mensaje indica que el proceso especificado se ha ejecutado durante demasiado tiempo y que el procesador no se ha abandonado. El sistema ha apagado el proceso indicado. En función de su configuración, esto puede conducir a una caída del sistema. Si el mensaje ocurre sólo una vez, no es necesario que realice ninguna acción. Sin embargo, si se vuelve a producir, debe tratarlo como un Tiempo de espera de vigilancia del proceso y tomar las medidas necesarias.
Información para recopilar si abre un pedido de servicio del TAC
Si todavía necesita ayuda después de seguir los pasos de solución de problemas anteriores y desea abrir una solicitud de servicio (sólo clientes registrados) con el TAC de Cisco, asegúrese de incluir la siguiente información: |
- Resolución de problemas realizada antes de abrir el servicio solicitado.
- show technical-support output (en modo de activación si es posible).
- el resultado o la captura de la consola del show log, si está disponible.
- execute-on slot [slot #] show tech para la ranura que experimentó la caída de la tarjeta de línea.
- El archivo crashinfo (si está disponible, y no se ha incluido en el resultado show technical-support).
Adjunte los datos recolectados a su pedido de servicio en formato de texto sin comprimir (.txt). Puede vincular información a su solicitud de servicio transfiriéndola mediante la Herramienta de solicitud de servicio TAC (sólo para clientes registrados). Si no puede acceder a la herramienta Solicitud de servicio, puede enviar la información en un archivo adjunto de correo electrónico a attach@cisco.com con su número de solicitud de servicio en el asunto del mensaje. Nota: No recargue ni apague manualmente el router antes de recopilar la información anterior, a menos que sea necesario para resolver un desperfecto de la tarjeta de línea en el router de Internet de la serie 12000 de Cisco, ya que esto puede causar la pérdida de información importante necesaria para determinar la causa raíz del problema. |
Información Relacionada