Software Cisco IOS e NX-OS : Software Cisco IOS versões 12.2 Mainline

Pesquisando defeitos Timeout do Watchdog

16 Janeiro 2016 - Tradução por Computador
Outras Versões: Versão em PDFpdf | Inglês (31 Dezembro 2015) | Feedback


Índice


Introdução

Este documento descreve a causa dos Tempos limite do Watchdog em roteadores Cisco e explica como resolvê-los.

Pré-requisitos

Requisitos

Os leitores deste documento devem estar cientes destes tópicos:

Componentes Utilizados

As informações neste documento são baseadas nestas versões de software e hardware:

  • Todos os Cisco Routers

  • Todas as versões de software de Cisco IOS�

Nota: Este documento não se aplica ao Switches ou às plataformas MGX do Cisco catalyst, mas somente aos roteadores Cisco.

As informações neste documento foram criadas a partir de dispositivos em um ambiente de laboratório específico. Todos os dispositivos utilizados neste documento foram iniciados com uma configuração (padrão) inicial. Se a sua rede estiver ativa, certifique-se de que entende o impacto potencial de qualquer comando.

Convenções

Para obter mais informações sobre convenções de documento, consulte as Convenções de dicas técnicas Cisco.

Identifique Timeout do Watchdog

Os processadores Cisco possuem cronômetros que protegem contra determinados tipos de suspensões. A CPU reinicia periodicamente um cronômetro de vigilante. O cronômetro de vigilante basicamente controla o tempo de cada processo. Se o cronômetro não for reiniciado, uma armadilha ocorre. Se um processo é mais longo do que deve ser, o temporizador de watchdog é usado para escapar deste processo.

Isto ocorre somente se algo vai mal. Baseado na situação, o roteador pode restaurar-se, ou recupere da falha e gere um Mensagem de Erro nos logs do console, que olhe como este:

*** Watch Dog Timeout ***

PC = 0x6022536C, SP = 0x00000000

ou

%SYS-2-WATCHDOG: Process aborted on watchdog timeout, process = Exec 

*** System received a Software forced crash *** 

signal = 0x17, code = 0x24, context= 0x60ceca60

Se você não faz ciclo de energia ou para recarregar manualmente o roteador, a saída do comando show version olha como esta:

Router#show version
...
Router uptime is 1 hour, 47 minutes 
System restarted by watchdog timer expired at 09:26:24 UTC Mon Mar 27 2000 
System image file is "flash:c3640-is-mz.113-7-T.bin", booted via flash
...

Se você tem a saída de um comando show version de seu dispositivo Cisco, você pode usar-se para indicar problemas potenciais e reparos. Para usar-se , você deve ser um cliente registrado, ser entrado, e ter o Javascript permitido.

Troubleshooting

A causa-raiz do timeout do watchdog pode estar relacionada a hardware ou software. Estão aqui os sintomas comuns com que você pode identificar a fonte do problema:

  • Se um roteador que seja corretamente operacional por meses comece de repente recarregar cada 20 minutos, ou se recarrega continuamente e você pode já não alcançá-lo, o problema é mais provável uma questão relacionada de hardware. Este é igualmente o caso se um módulo novo tem sido instalado recentemente, e os ruídos elétricos de roteador pelo Timeout do Watchdog mais tarde.

  • Se o roteador começa causar um crash depois que uma alteração de configuração ou uma mudança na versão de Cisco IOS Software, ele são provavelmente uma questão relacionada ao software.

A primeira etapa para pesquisar defeitos este tipo de edição é identificar o tipo de Timeout do Watchdog que você encontra. Há dois tipos de Timeout do Watchdog:

Intervalo de vigilante do software

Este intervalo é causado por um loop infinito a nível de interrupção, ou por um problema de hardware. Estão aqui algumas indicações deste tipo de intervalo:

  • Os logs do console contêm estas linhas:

    *** do Timeout do Watchdog do ***

    PC = 0x6022536C, SP = 0x00000000

  • Os relatórios de saídas de versão da mostra a razão do reload como um “temporizador de watchdog expirou”:

    Router#show version
    ...
    Router uptime is 1 hour, 47 minutes
    System restarted by watchdog timer expired at 06:30:24 UTC Mon Jan 28 2000 
    System image file is "flash:c3640-is-mz.113-7-T.bin", booted via flash
  • Nenhum arquivo crashinfo (informaçoes de travamento) é gerado. Veja a recuperação da informação do arquivo crashinfo (informaçoes de travamento) para detalhes.

Na maioria das vezes, estas mensagens indicam um problema de hardware, com a placa de processador principal ou com um dos módulos.

Depois que você identifica um Software de Timeout do Watchdog, a próxima etapa é verificar o sumário do Field Notice de produto para ver se há sua plataforma e todos os componentes instalados nesse sistema para edições conhecidas do hardware crítico. Por exemplo, há um Field Notice para o Cisco 3600 Series Router: Timeout do Watchdog do módulo PRI do Cisco 3600 T1/E1. Assegure-se de que você verifique os Field Notice antes que você pesquise defeitos mais.

Se um módulo novo tem sido instalado recentemente, você deve primeiramente tentar removê-lo para verificar se é a razão para o Timeout do Watchdog. Se o Timeout do Watchdog persiste, tente assentar todos os componentes removíveis.

Se o Timeout do Watchdog continua neste momento, não há nenhum Field Notice para seu hardware, e se nenhum módulo novo tem sido instalado recentemente, vai adiante e substitui a placa de processador principal. Em plataformas avançadas, a placa do processador é uma placa separada (como o NPE-400 ou o RSP8). Em plataformas de extremidade baixa (Cisco 1700, 2500, 4000, 2600, 3600 e assim por diante), a placa-mãe não pode ser enviada separadamente. Nesse caso, você tem que substituir o próprio chassi.

Intervalo de vigilante do processo

Esse timeout é gerado por um loop infinito durante o processo. Estão aqui algumas indicações deste intervalo:

  • Os logs do console contêm estas linhas:

    %SYS-2-WATCHDOG: Process aborted on watchdog timeout,
    	 process = Exec 
    
    *** System received a Software forced crash ***
    	 
    signal = 0x17, code = 0x24, context= 0x60ceca60
  • Os relatórios de saídas de versão da mostra o impacto como um “travamento forçado por software”:

    Router#show version
    ...
    Router uptime is 2 days, 21 hours, 30 minutes 
    System restarted by error - Software-forced crash,
    PC 0x316EF90 at 20:22:37 edt 
    System image file is "flash:c2500-is-l.112-15a.bin",
    booted via flash
  • Um arquivo crashinfo (informaçoes de travamento) é gerado para as Plataformas que o apoiam.

Este problema é mais provável um Bug do Software da Cisco IOS.

Se você tem a saída de um comando show stacks de seu dispositivo Cisco, você pode usar-se para indicar problemas potenciais e reparos. Para usar-se , você deve ser um cliente registrado, ser entrado, e ter o Javascript permitido.

Contudo, o sistema foi colado em um laço antes do reload. Consequentemente, o rastreamento de pilha não precisa necessariamente de ser relevante. Você pode promover à versão de Cisco IOS Software a mais atrasada em seu trem de versão eliminar todas as edições conhecidas do cão de guarda do processo. Se um impacto ainda ocorre depois que a elevação, recolhe tanta informação como possível (veja ruídos elétricos de roteador do Troubleshooting), e contacte seu representante de suporte técnico.

Mensagens de Erro relativos ao Timeout do Watchdog

Há outros mensagens de erro de console relativos aos temporizadores de watchdog. Não confunda estas mensagens com um impacto do temporizador de watchdog. Seja certo verificar o significado destes Mensagens de Erro com a ajuda do decodificador do mensagem de erro (clientes registrados somente). Esta ferramenta dá-lhe uma explicação detalhada de muitos Mensagens de Erro, e recomenda-a ações resolvê-las.

Considere esta mensagem:

%SYS-2-WATCHDOG: Process aborted on watchdog timeout, 
process = [chars]

Esta mensagem indica que o processo especificado tem sido executado durante bastante tiempo, e o processador não foi abandonado. O sistema encerrou o processo indicado. Baseado em sua configuração, isto pode conduzir a um travamento de sistema. Se a mensagem ocorre somente uma vez, você não precisa de tomar nenhuma ação. Contudo, se ocorre outra vez, você deve tratá-la como um Timeout do Watchdog do processo, e toma a ação necessária.

Informações a serem coletadas se você abrir um pedido de serviço de TAC

Se você ainda precisa o auxílio após ter seguido os passos de Troubleshooting acima e o quer abrir um pedido do serviço (clientes registrados somente) com o tac Cisco, seja certo incluir a informação seguinte:
  • Troubleshooting executado antes de abrir o pedido do serviço.
  • mostre a saída do Suporte técnico (no modo enable se possível).
  • mostre o registro de saída ou as capturas de console, se disponível.
  • tecnologia da mostra do [slot -] do execute-on slot para o entalhe que experimentou o ruído da placa.
  • O arquivo crashinfo (informaçoes de travamento) (se está disponível, e não tem sido incluído já no Suporte técnico da mostra output).
Anexe os dados coletados à sua requisição de serviço em um texto não compactado e simples (.txt). Você pode anexar a informação a seu pedido do serviço transferindo arquivos pela rede o que usa a ferramenta do pedido do serviço TAC (clientes registrados somente). Se você não pode alcançar a ferramenta do pedido do serviço, você pode enviar a informação em um anexo de Email a attach@cisco.com com seu número do pedido do serviço na linha de assunto de sua mensagem.

Nota: Por favor não recarregue manualmente ou ciclo de energia o roteador antes de recolher a informação acima a menos que exigido para pesquisar defeitos um ruído da placa no Cisco 12000 Series Internet Router, como este pode fazer com que a informação importante seja perdida que é precisada determinando a causa de raiz do problema.

Discussões relacionadas da comunidade de suporte da Cisco

A Comunidade de Suporte da Cisco é um fórum onde você pode perguntar e responder, oferecer sugestões e colaborar com colegas.


Informações Relacionadas


Document ID: 7956