¿Tiene una cuenta?
Este documento describe cómo investigar el motivo detrás de un reinicio de un módulo Supervisor o de la tarjeta de línea Distributed Forwarding Card (DFC) asociado con el error %EARL-SP-2-PATCH_INVOCATION_LIMIT.
Este documento se aplica a las plataformas Catalyst 6500/Cisco 7600.
En Catalyst 6500/7600, la mayoría de los paquetes se reenvían únicamente en hardware a través de una serie de ASIC y el motor de reenvío.
En caso de que se detecte un problema entre estos componentes que pueda conducir a un reenvío de paquetes inválido, el software Cisco IOS® activa el mecanismo de recuperación de la Lógica de reconocimiento de direcciones codificadas (EARL) cuando aplica un parche. El parche restablece los elementos que corresponden (motor de reenvío/ASIC) para que se pueda restaurar la funcionalidad adecuada del dispositivo.
Por diseño, se activa un reinicio del módulo cuando se ejecutan 10 intentos consecutivos de revisión de EARL en 30 segundos y no se soluciona el problema. Ingrese el comando show platform software earl reset config desde el SP para verificar:
6500-sp#show platform software earl reset config
EBUS Out of seq. : Enabled
Earl freeze check. : Enabled
EARL Patch invocation limit per every 30 secs : 10
Upon reaching EARL patch invocation limit : Crash
Cuando un módulo se reinicia inesperadamente, debe haber un archivo crashinfo generado y almacenado en el sistema de archivos flash local.
Este error puede ser generado por el módulo Supervisor:
%EARL-SP-2-PATCH_INVOCATION_LIMIT: 10 Recovery patch invocations in the last 30 secs
have been attempted. Max limit reached
%Software-forced reload
o por la tarjeta de línea DFC:
%EARL-DFC9-2-PATCH_INVOCATION_LIMIT: 10 Recovery patch invocations in the last 30 secs
have been attempted.
Max limit reached
%Software-forced reload
Este mensaje se muestra en el archivo crashinfo. Indica que el módulo se reinició porque el parche de recuperación EARL se aplicó 10 veces en 30 segundos sin éxito. El reinicio del módulo se activa para restaurar su funcionalidad adecuada.
Para verificar un disparador de invocaciones de parches excesivas, debe investigar el archivo crashinfo.
En este ejemplo, puede ver cuántas veces, cuándo y por qué se solicitó el parche:
Num. of times patch applied : 10
Num. of times patch requested : 11 <<<<<<<
AclDeny detection: (Total=12 Failed=1)
Time Reason InProgress Data
---------------------------------+----------------------+----------+------------
Jan 21 2014,05:52:57.281 GMT Earl Patch Limit Reach 0100 0
Jan 21 2014,05:52:57.281 GMT Tycho L2 mode L3 rst 0000 CAFE000C
Jan 21 2014,05:52:56.905 GMT Tycho L2 mode L3 rst 0000 CAFE000C
Jan 21 2014,05:52:54.677 GMT Tycho L2 mode L3 rst 0000 CAFE000C
Jan 21 2014,05:52:53.625 GMT Tycho L2 mode L3 rst 0000 CAFE000C
Jan 21 2014,05:52:52.773 GMT Tycho L2 mode L3 rst 0000 CAFE000C
Jan 21 2014,05:52:51.661 GMT Tycho L2 mode L3 rst 0000 CAFE000C
Jan 21 2014,05:52:51.257 GMT Tycho L2 mode L3 rst 0000 CAFE000C
Jan 21 2014,05:52:50.321 GMT Tycho L2 mode L3 rst 0000 CAFE000C
Jan 21 2014,05:52:48.709 GMT Tycho L2 mode L3 rst 0000 CAFE000C
Jan 21 2014,05:52:47.933 GMT Tycho L2 mode L3 rst 0000 CAFE000C
Jan 21 2014,05:52:38.509 GMT Tycho L2 mode L3 rst 0000 CAFE000C
Cuando se muestra "CAFE000C" en la columna "Datos", debe comprobar más a fondo la salida "mostrar estado de los comienzos" disponible en el archivo crashinfo:
--------- show earl status --------
Adj. table interface block : Total interrupts - 11
AT_SEQ_ERR_INT : 0
AT_FOVR_INT : 0
AT_FUDR_INT : 0
AT_IB_ADJ_INT : 0
AT_BZONE_INT : 0
AT_CORR_ECC_ERR_INT : 0
AT_UNCORR_ECC_ERR_INT : 11 <<<<<<<
Esto significa que el parche EARL se ejecutó en un intento de recuperarse del error AT_UNCORR_ECC_ERR_INT. Se trata de un error de código de corrección de errores (ECC) de adyacencia que indica un problema de hardware.
El siguiente paso es volver a colocar el módulo en la ranura. Si los errores siguen presentes, el módulo debe ser reemplazado.
Ingrese este comando para verificar el estado actual del mecanismo EARL en el módulo Supervisor:
# remote command switch show platform hardware earl status
En el caso de un problema de tarjeta de línea DFC, ingrese este comando:
# remote command module [slot number] show platform hardware earl status
En el siguiente ejemplo se muestra un resultado ejemplar con la sección correspondiente. Observe que el contador AT_UNCORR_ECC_ERR_INT tiene un valor distinto de cero, que valida la sustitución del módulo:
6500# remote command switch show platform hardware earl status
<snip>
Adj. table interface block : Total interrupts - 2
AT_SEQ_ERR_INT : 0
AT_FOVR_INT : 0
AT_FUDR_INT : 0
AT_IB_ADJ_INT : 0
AT_BZONE_INT : 0
AT_CORR_ECC_ERR_INT : 0
AT_UNCORR_ECC_ERR_INT : 2
AT_ECC_ERR_DATA_CAPT : 1
Si se muestra un valor diferente en la columna Data del archivo crashinfo, se recomienda abrir un caso del Centro de asistencia técnica de Cisco (TAC) y cargar el resultado show tech junto con los archivos crashinfo relevantes.
Field Notice 63743 puede ser aplicable si se informa el error %EARL-xxx-2-PATCH_INVOCATION_LIMIT.
Revisión | Fecha de publicación | Comentarios |
---|---|---|
1.0 |
02-Mar-2015 |
Versión inicial |