Introducción
Este documento describe la causa de los tiempos de espera de vigilancia en los routers Cisco, y explica cómo resolverlos.
Prerequisites
Requirements
Quienes lean este documento deben tener conocimiento de los siguientes temas:
Componentes Utilizados
La información que contiene este documento se basa en las siguientes versiones de software y hardware.
Nota: Este documento no se aplica a los switches Cisco Catalyst o a las plataformas MGX, sino únicamente a los routers Cisco.
La información que contiene este documento se creó a partir de los dispositivos en un ambiente de laboratorio específico. Todos los dispositivos que se utilizan en este documento se pusieron en funcionamiento con una configuración verificada (predeterminada). If your network is live, make sure that you understand the potential impact of any command.
Convenciones
For more information on document conventions, refer to the Cisco Technical Tips Conventions.
Identificar tiempos de espera de vigilancia
Los procesadores de Cisco tienen temporizadores que protegen contra ciertos tipos bloqueos del sistema. La CPU reinicia periódicamente un temporizador de vigilancia El temporizador de vigilancia básicamente controla el tiempo de cada proceso. Si no se reinicia el temporizador, se produce una trampa. Si un proceso es más largo de lo que debe ser, el temporizador de vigilancia se utiliza para escapar de este proceso.
Esto solo ocurre si algo va mal. Según la situación, el router puede restablecerse a sí mismo, o recuperarse de la falla y generar un mensaje de error en los registros de la consola, que tiene el siguiente aspecto:
*** Watch Dog Timeout ***
PC = 0x6022536C, SP = 0x00000000
or
%SYS-2-WATCHDOG: Process aborted on watchdog timeout, process = Exec
*** System received a Software forced crash ***
signal = 0x17, code = 0x24, context= 0x60ceca60
Si no apaga o recarga manualmente el router, la salida del comando show version tiene el siguiente aspecto:
Router#show version
...
Router uptime is 1 hour, 47 minutes
System restarted by watchdog timer expired at 09:26:24 UTC Mon Mar 27 2000
System image file is "flash:c3640-is-mz.113-7-T.bin", booted via flash
...
Si tiene el resultado de un comando show version de su dispositivo Cisco, puede utilizar Cisco CLI Analyzer para mostrar los posibles problemas y soluciones. Para utilizar la herramienta Analizador Cisco CLI, debe ser un cliente registrado, iniciar sesión y tener JavaScript habilitado.
Troubleshoot
La causa raíz del tiempo de espera de vigilancia puede estar relacionado con el hardware o con el software. Estos son los síntomas comunes a través de los cuales puede identificar el origen del problema:
-
Si un router que ha estado funcionando correctamente durante meses de repente comienza a recargarse cada 20 minutos, o si se reinicia continuamente y ya no puede acceder a él, el problema es probablemente un problema relacionado con el hardware. Este también es el caso si un nuevo módulo ha sido instalado recientemente, y el router falla por el tiempo de espera del vigilante después.
-
Si el router comienza a fallar después de un cambio de configuración o un cambio en la versión del software del IOS de Cisco, probablemente se trate de un problema relacionado con el software.
El primer paso para resolver este tipo de problema es identificar el tipo de tiempo de espera de vigilancia que encuentra. Existen dos tipos de tiempos de espera de vigilancia:
-
El tiempo de espera de vigilancia del software, que, a pesar de su nombre, por lo general está relacionado con el hardware.
-
El proceso de tiempo de espera de vigilancia, que frecuentemente está relacionado con el software.
Tiempo de espera de vigilancia de software
Este tiempo de espera es causado por un loop infinito en el nivel de interrupción, o por un problema de hardware. Aquí hay algunas indicaciones de este tipo de tiempo de espera:
-
Los logs de la consola contienen estas líneas:
*** Watch Dog Timeout ***
PC = 0x6022536C, SP = 0x00000000
-
El resultado de show version informa el motivo de la recarga como un "temporizador de vigilancia vencido":
Router#show version
...
Router uptime is 1 hour, 47 minutes
System restarted by watchdog timer expired at 06:30:24 UTC Mon Jan 28 2000
System image file is "flash:c3640-is-mz.113-7-T.bin", booted via flash
-
No se genera ningún archivo crashinfo. Consulte Recuperación de Información del Archivo Crashinfo para obtener más detalles.
La mayoría de las veces, estos mensajes indican un problema de hardware, ya sea con la placa del procesador principal o con uno de los módulos.
Después de identificar un tiempo de espera de vigilancia de software, el siguiente paso es verificar el Resumen de avisos de campo del producto para su plataforma y todos los componentes instalados en ese sistema para conocer problemas críticos de hardware conocidos. Por ejemplo, hay un aviso de campo para el Cisco 3600 Series Router: Tiempos de espera agotados de vigilancia del módulo 3600 T1/E1 PRI de Cisco. Asegúrese de comprobar los avisos de campo antes de continuar con la resolución de problemas.
Si se ha instalado recientemente un nuevo módulo, primero debe intentar quitarlo para verificar si es la razón del tiempo de espera de vigilancia. Si el tiempo de espera de vigilancia persiste, intente volver a colocar todos los componentes extraíbles.
Si el tiempo de espera de vigilancia continúa en este punto, no hay avisos de campo para su hardware, y si no se ha instalado ningún módulo nuevo recientemente, continúe y reemplace la placa del procesador principal. En plataformas de mayor capacidad, la placa del procesador es un tarjeta separada (como la NPE-400 ó RSP8). En las plataformas de menor capacidad (Cisco 1700, 2500, 4000, 2600, 3600, etc.), la placa madre no se puede enviar en forma separada. En este caso, deberá cambiar el chasis en sí.
Tiempo de espera de vigilancia de procesos
Este tiempo de espera se produce a partir de un loop infinito en el nivel del proceso. Aquí hay algunas indicaciones de este tiempo de espera:
-
Los logs de la consola contienen estas líneas:
%SYS-2-WATCHDOG: Process aborted on watchdog timeout,
process = Exec
*** System received a Software forced crash ***
signal = 0x17, code = 0x24, context= 0x60ceca60
-
El resultado de show version informa del desperfecto como un "desperfecto forzado por software":
Router#show version
...
Router uptime is 2 days, 21 hours, 30 minutes
System restarted by error - Software-forced crash,
PC 0x316EF90 at 20:22:37 edt
System image file is "flash:c2500-is-l.112-15a.bin",
booted via flash
-
Se genera un archivo crashinfo para las plataformas que lo soportan.
Este problema es probablemente un bug del software del IOS de Cisco.
Si tiene el resultado de un comando show stacks desde su dispositivo Cisco, puede utilizar Cisco CLI Analyzer para mostrar los posibles problemas y soluciones. Para utilizar la herramienta Analizador Cisco CLI, debe ser un cliente registrado, iniciar sesión y tener JavaScript habilitado.
Sin embargo, el sistema se atascó en un loop antes de la recarga. Por lo tanto, el seguimiento de la pila no tiene que ser necesariamente relevante. Puede actualizar a la última versión del software Cisco IOS en su tren de versiones para eliminar todos los problemas conocidos de Process Watchdog. Si todavía se produce un desperfecto después de la actualización, recopile toda la información posible (consulte Resolución de problemas de desperfectos del router) y comuníquese con su representante de soporte técnico.
Mensajes de Error Relacionados con el Tiempo de Espera del Vigilante
Existen otros mensajes de error de la consola relacionados con los temporizadores de vigilancia. No confunda estos mensajes con un desperfecto del temporizador de vigilancia. Asegúrese de verificar el significado de estos mensajes de error con la ayuda del decodificador de mensajes de error (sólo para clientes registrados) . Esta herramienta proporciona una explicación detallada de muchos mensajes de error y recomienda acciones para resolverlos.
Tenga en cuenta este mensaje:
%SYS-2-WATCHDOG: Process aborted on watchdog timeout,
process = [chars]
Este mensaje indica que el proceso especificado se ha ejecutado durante demasiado tiempo y que no se ha abandonado el procesador. El sistema ha apagado el proceso indicado. Según su configuración, esto puede provocar un fallo del sistema. Si el mensaje aparece sólo una vez, no es necesario que realice ninguna acción. Sin embargo, si se vuelve a producir, debe tratarlo como un tiempo de espera de vigilancia de procesos y realizar la acción necesaria.
Información para recopilar si abre un pedido de servicio del TAC
| Si aún necesita ayuda después de seguir los pasos de troubleshooting anteriores y desea abrir una solicitud de servicio (sólo para clientes registrados) con el Cisco TAC, asegúrese de incluir la siguiente información: |
- Resolución de problemas realizada antes de abrir el servicio solicitado.
- show technical-support output (en modo enable si es posible).
- el resultado o la captura de la consola del show log, si está disponible.
- execute-on slot [slot # ] show tech para la ranura que experimentó el desperfecto de la tarjeta de línea.
- El archivo crashinfo (si está disponible, y no se ha incluido ya en el resultado de show technical-support).
Adjunte los datos recolectados a su pedido de servicio en formato de texto sin comprimir (.txt). Puede vincular información a su solicitud de servicio transfiriéndola mediante la Herramienta de solicitud de servicio TAC (sólo para clientes registrados). Si no puede acceder a la herramienta de solicitud de servicio, puede enviar la información en un archivo adjunto de correo electrónico a attach@cisco.com con su número de solicitud de servicio en el asunto del mensaje. Nota: No recargue ni apague y encienda manualmente el router antes de recopilar la información anterior, a menos que sea necesario para solucionar un problema de caída de la tarjeta de línea en el router de Internet de la serie 12000 de Cisco, ya que esto puede causar la pérdida de información importante necesaria para determinar la causa raíz del problema. |
Información Relacionada