Para parceiros
Este documento descreve como investigar o motivo por trás de um módulo Supervisor ou da reinicialização da placa de linha do Distributed Forwarding Card (DFC) associada ao erro %EARL-SP-2-PATCH_INVOCATION_LIMIT.
Este documento é aplicável às plataformas Catalyst 6500/Cisco 7600.
No Catalyst 6500/7600, a maioria dos pacotes é encaminhada puramente em hardware através de uma série de ASICs e do mecanismo de encaminhamento.
Caso seja detectado um problema entre esses componentes que possa levar a um encaminhamento de pacotes inválido, o software Cisco IOS® aciona o mecanismo de recuperação EARL (Encoded Address Recognition Logic) quando aplica um patch. O patch redefine elementos que correspondem (mecanismo de encaminhamento/ASICs) para que a funcionalidade adequada do dispositivo possa ser restaurada.
Por design, uma reinicialização do módulo é acionada quando 10 tentativas consecutivas de correção de recuperação EARL são executadas em 30 segundos e não corrigem o problema. Insira o comando show platform software earl reset config no SP para verificar:
6500-sp#show platform software earl reset config
EBUS Out of seq. : Enabled
Earl freeze check. : Enabled
EARL Patch invocation limit per every 30 secs : 10
Upon reaching EARL patch invocation limit : Crash
Quando um módulo é reinicializado inesperadamente, deve haver um arquivo crashinfo gerado e armazenado no sistema de arquivos flash local.
Esse erro pode ser gerado pelo módulo Supervisor:
%EARL-SP-2-PATCH_INVOCATION_LIMIT: 10 Recovery patch invocations in the last 30 secs
have been attempted. Max limit reached
%Software-forced reload
ou pela placa de linha DFC:
%EARL-DFC9-2-PATCH_INVOCATION_LIMIT: 10 Recovery patch invocations in the last 30 secs
have been attempted.
Max limit reached
%Software-forced reload
Esta mensagem é mostrada no arquivo crashinfo. Indica que o módulo foi reinicializado porque o patch de recuperação EARL foi aplicado 10 vezes em 30 segundos sem êxito. A redefinição do módulo é acionada para restaurar sua funcionalidade adequada.
Para verificar um disparo de invocações de patch excessivas, você precisa investigar o arquivo crashinfo.
Neste exemplo, você pode ver quantas vezes, quando e por que o patch foi solicitado:
Num. of times patch applied : 10
Num. of times patch requested : 11 <<<<<<<
AclDeny detection: (Total=12 Failed=1)
Time Reason InProgress Data
---------------------------------+----------------------+----------+------------
Jan 21 2014,05:52:57.281 GMT Earl Patch Limit Reach 0100 0
Jan 21 2014,05:52:57.281 GMT Tycho L2 mode L3 rst 0000 CAFE000C
Jan 21 2014,05:52:56.905 GMT Tycho L2 mode L3 rst 0000 CAFE000C
Jan 21 2014,05:52:54.677 GMT Tycho L2 mode L3 rst 0000 CAFE000C
Jan 21 2014,05:52:53.625 GMT Tycho L2 mode L3 rst 0000 CAFE000C
Jan 21 2014,05:52:52.773 GMT Tycho L2 mode L3 rst 0000 CAFE000C
Jan 21 2014,05:52:51.661 GMT Tycho L2 mode L3 rst 0000 CAFE000C
Jan 21 2014,05:52:51.257 GMT Tycho L2 mode L3 rst 0000 CAFE000C
Jan 21 2014,05:52:50.321 GMT Tycho L2 mode L3 rst 0000 CAFE000C
Jan 21 2014,05:52:48.709 GMT Tycho L2 mode L3 rst 0000 CAFE000C
Jan 21 2014,05:52:47.933 GMT Tycho L2 mode L3 rst 0000 CAFE000C
Jan 21 2014,05:52:38.509 GMT Tycho L2 mode L3 rst 0000 CAFE000C
Quando "CAFE000C" é mostrado na coluna "Dados", você deve verificar ainda mais a saída "show earl status" disponível no arquivo crashinfo:
--------- show earl status --------
Adj. table interface block : Total interrupts - 11
AT_SEQ_ERR_INT : 0
AT_FOVR_INT : 0
AT_FUDR_INT : 0
AT_IB_ADJ_INT : 0
AT_BZONE_INT : 0
AT_CORR_ECC_ERR_INT : 0
AT_UNCORR_ECC_ERR_INT : 11 <<<<<<<
Isso significa que o patch EARL foi executado em uma tentativa de recuperação do erro AT_UNCORR_ECC_ERR_INT. Este é um erro ECC (Error Correcting Code) de adjacência que indica um problema de hardware.
A próxima etapa é recolocar o módulo no slot. Se os erros ainda estiverem presentes, o módulo deve ser substituído.
Insira este comando para verificar o status atual do mecanismo EARL no módulo Supervisor:
# remote command switch show platform hardware earl status
No caso de um problema de placa de linha DFC, digite este comando:
# remote command module [slot number] show platform hardware earl status
Uma saída exemplar com a seção relevante é mostrada no próximo exemplo. Observe que o contador AT_UNCORR_ECC_ERR_INT tem um valor diferente de zero, que valida a substituição do módulo:
6500# remote command switch show platform hardware earl status
<snip>
Adj. table interface block : Total interrupts - 2
AT_SEQ_ERR_INT : 0
AT_FOVR_INT : 0
AT_FUDR_INT : 0
AT_IB_ADJ_INT : 0
AT_BZONE_INT : 0
AT_CORR_ECC_ERR_INT : 0
AT_UNCORR_ECC_ERR_INT : 2
AT_ECC_ERR_DATA_CAPT : 1
Se um valor diferente for mostrado na coluna Dados no arquivo crashinfo, é recomendável abrir um caso do Cisco Technical Assistance Center (TAC) e carregar a saída show tech junto com os arquivos crashinfo relevantes.
O Aviso de campo 63743 pode ser aplicável se o erro %EARL-xxx-2-PATCH_INVOCATION_LIMIT for relatado.