Roteadores : Roteadores Cisco 7500 Series

Solucionando Problemas de Suspensões de Router

22 Maio 2008 - Tradução Manual
Outras Versões: Versão em PDFpdf | Tradução por Computador (29 Julho 2013) | Inglês (2 Agosto 2006) | Feedback


Índice

Introdução
Pré-requisitos
     Requisitos
     Componentes Usados
     Convenções
Console Não Responde
     Etapas para Solucionar Problemas
Não Há Tráfego
     Causas Possíveis
Obter um Rastreamento de Pilha a Partir do Monitor de ROM
Informações a Serem Coletadas se uma Solicitação de Serviço da TAC for Aberta
Discussões relacionadas da comunidade de suporte da Cisco
Informações Relacionadas

Introdução

Este documento ajuda a solucionar problemas em um sistema que não responde. O documento discute também a causa e como o problema pode ser eliminado.

Um roteador parece parar de funcionar quando o sistema não estiver respondendo no console ou a consultas feitas a partir da rede (por exemplo, Telnet, SNMP (Simple Network Management Protocol (SNMP)), etc.). Esses problemas podem ser classificados em duas amplas categorias:

  • Quando o console não responde.

  • Quando não há tráfego.

Pré-requisitos

Requisitos

Não existem requisitos específicos para este documento.

Componentes Usados

As informações neste documento são baseadas nestas versões de hardware e de software:

  • Todas as versões do Cisco IOS® Software

  • Todos os roteadores Cisco

Este documento não se aplica a switches Cisco Catalyst nem a plataformas MGX.

As informações apresentadas neste documento foram criadas a partir dos dispositivos em um ambiente específico de laboratório. Todos os dispositivos usados neste documento foram iniciados com uma configuração vazia (padrão). Se a sua rede estiver ativa, certifique-se de entender o impacto potencial de todos os comandos.

Convenções

Para obter mais informações sobre convenções de documentos, consulte Convenções de Dicas Técnicas da Cisco.

Console Não Responde

Problemas de console ocorrem quando o roteador não responde à entrada na porta do console. Se o console não estiver respondendo, significa que um processo de prioridade alta impede que o driver do console responda à entrada.

Etapas para Solucionar Problemas

  • Verifique a conectividade do cabo.

  • Verifique se a fonte de alimentação está ligada.

  • Verifique o status do LED do roteador. Se todos os LEDs estiverem desligados, o mais provável é que o problema esteja na fonte de alimentação do roteador.

Se o tráfego ainda estiver fluindo pelo roteador:

  • Desconecte as interfaces de rede e veja se o roteador responde. Muitas vezes, o roteador supõe que esteja fazendo algo muito importante para as sessões de exec de serviço.

  • Você também pode tentar reproduzir o problema depois de executar estes comandos:

    Nos Cisco 7200 e 7500 Series:

                      configure terminal
    scheduler allocate 3000 1000
    ^Z
                   

    O comando scheduler allocate garante tempo de CPU para processos de baixa prioridade. Ele coloca um tempo máximo alocado para comutação rápida (3000 microssegundos - usec) e comutação de processos (1000 usec) por contexto de interrupção de rede.

    Em todas as outras plataformas, use:

                      configure terminal
    scheduler interval 500
    ^Z 
                   

    O comando scheduler interval permite que processos de baixa prioridade sejam agendados a cada 500 usec e por meio disso alguns comandos sejam digitados caso a utilização da CPU atinja 100%.

    Verifique os Comandos Básicos de Gerenciamento do Sistema nas Referências a Comandos do Cisco IOS Software para obter mais informações sobre esses comandos.

  • Se o console não responder porque a utilização da CPU do roteador está alta, é importante localizar e corrigir a causa da alta utilização da CPU. Por exemplo, se o tráfego de IP comutado pelo processo causar problemas, isso refletirá no processo "Entrada de IP" da saída do comando show processes cpu . Nessa situação, é importante coletar a saída dos comandos show interfaces, show interfaces stat e possivelmente show processes para diagnosticar o problema. Para corrigir o problema, é necessário reduzir a quantidade de tráfego de IP que é comutada pelo processo. Consulte Solucionando Problemas de Alta Utilização de CPU em Roteadores Cisco para obter mais informações.

  • Outra possível causa de uma suspensão aparente é falha de alocação de memória; ou seja, o roteador usou toda a memória disponível ou a memória foi fragmentada em peças tão pequenas que o roteador não pode encontrar um bloco utilizável disponível. Para obter mais informações, consulte Solucionando Problemas de Memória.

  • O roteador pode parar de responder devido a um problema relacionado à segurança, como um worm ou um vírus. Essa é a causa mais provável, caso não tenha havido alterações recentes na rede, como uma atualização do IOS do roteador. Normalmente, uma alteração na configuração, como a adição de linhas adicionais às suas listas de acesso, pode abrandar os efeitos do problema. Os Relatórios Formais e Notas de Segurança da Cisco contêm informações sobre detecção das causas mais prováveis e soluções específicas.

    Para obter mais informações, consulte:

  • Se o roteador parecer congelar durante o processo de inicialização, poderá ser o resultado de um recurso configurado incorretamente ou de um defeito de software em um recurso configurado. Isso fica geralmente evidente a partir da aparência de um aviso ou de uma mensagem de erro no console imediatamente antes de o roteador congelar.

    Como solução para esse problema, inicialize o roteador no ROMMON e ignore a configuração armazenada e configure-a novamente. Conclua estas etapas:

    1. Conecte um terminal ou um PC com emulação de terminal à porta de console do roteador.

      Use estas configurações de terminal:

      • taxa de baud 9600

      • Sem paridade

      • 8 bits de dados

      • 1 bit de parada

      • Nenhum controle de fluxo

    2. Reinicialize o roteador e entre no ROMMON pressionando break no teclado do terminal em até 60 segundos após a inicialização. Se a seqüência de break não funcionar, consulte Combinações de Seqüência de Tecla Break Padrão Durante a Recuperação de Senha para obter outras combinações de teclas.

    3. Altere o registro de configuração para 0x2142 e redefina o roteador. Para isso, execute o comando confreg 0x2142 no prompt rommon 1> . Em seguida, digite reset no prompt rommon 2> prompt. Isso faz com que o roteador inicialize a partir do Flash sem carregar a configuração.

    4. Digite no depois de cada pergunta de configuração ou pressione Ctrl-C para pular o procedimento inicial de configuração.

    5. Digite enable no prompt .

      Você está no modo enable e verá o prompt Router# .

    6. Agora, é possível salvar uma configuração vazia (todos os comandos removidos). Execute o comando copy running-config startup-config. Ou então, se você suspeitar de que um determinado comando esteja causando o problema, poderá editar a configuração. Para fazer isso, execute o comando copy startup-config running-config. Em seguida, digite configure terminal e faça as alterações.

    7. Quando concluir, altere o registro de configuração novamente para 0x2102. Para isso, digite config-register 0x2102. Execute o comando copy running-config startup-config para confirmar as alterações.

Se o tráfego não fluir pelo roteador:

  • Se o tráfego não passar mais pelo roteador e o console não estiver respondendo, provavelmente haverá um problema com o sistema. Geralmente isso significa que o roteador foi pego em um loop contínuo ou ficou travado em uma função. Isso é quase sempre causado por um bug no software. Instale a versão de manutenção mais recente do treinamento do Cisco IOS Software que você está executando no momento.

    Antes de criar uma solicitação de serviço com o TAC da Cisco, obtenha um rastreamento de pilha a partir do Monitor de ROM. A obtenção de rastreamentos de pilha durante um problema permite determinar em que lugar do código o roteador está em loop ou travado.

Não Há Tráfego

Problemas de tráfego ocorrem quando o console continua a responder, mas o tráfego não passa pelo roteador. Nesse caso, parte do tráfego ou parte das interfaces não estão respondendo. Esse comportamento pode ser provocado por muitas causas diferentes. Quando esse problema ocorre, podem ser coletadas informações do roteador por meio da porta do console. As causas desses problemas de tráfego podem variar de erros nas interfaces a problemas de software e de hardware.

Causas Possíveis

  • Problema de roteamento – Alterações na topologia da rede ou na configuração de alguns roteadores poderiam ter afetado as tabelas de roteamento.

  • Alta Utilização da CPU – Execute o comando show process cpu. Se a CPU ficar acima de 95%, o desempenho do roteador poderá ser afetado e os pacotes poderão ser atrasados ou descartados. Consulte Solucionando Problemas de Alta Utilização de CPU em Roteadores para obter mais informações.

  • Interface inativa – Uma das interfaces do roteador pode estar inativa. Há vários eventos que poderiam causar isso, desde um comando errado de configuração até uma falha de hardware da interface ou do cabo. Se algumas interfaces parecerem inativas ao executar um comando show interfaces, tente descobrir a causa.

  • Interfaces divididas – Esse é um caso específico de vazamentos de buffer que fazem com que a fila de entrada de uma interface seja preenchida até o ponto em que não possa mais aceitar pacotes. Recarregue o roteador. Isso libera essa fila de entrada e restaura o tráfego até que a fila esteja cheia novamente. Isso pode levar de alguns segundos a algumas semanas, dependendo da gravidade do vazamento.

    A maneira mais fácil de identificar uma interface dividida é executando um comando show interfaces e consultando algo semelhante a isto:

    Output queue 0/40, 0 drops; input queue 76/75, 27 drops 

    Consulte Solucionando Problemas de Vazamentos de Buffer para obter orientações detalhadas e exemplos.

Obter um Rastreamento de Pilha a Partir do Monitor de ROM

K-trace refere-se ao procedimento usado para obter um rastreamento de pilha a partir do roteador do Monitor de ROM. Em roteadores com código de Monitor de ROM mais antigo, um rastreamento de pilha será obtido com o comando k. Em roteadores que executam código de Monitor de ROM mais recente, o comando stack também pode ser usado.

Conclua estas etapas para obter rastreamentos de pilha a partir de um roteador que não responde:

  1. Habilite a seqüência de break. Para isso, altere o valor do registro de configuração. O valor do oitavo bit deve ser definido como zero para que esse break não seja ignorado. Um valor de 0x2002 funciona.

    Router#configure terminal
    Enter configuration commands, one per line.  End with CNTL/Z.
    Router(config)#config-register 0x2002
                   
  2. Recarregue o roteador de forma que o valor de registro de nova configuração seja usado.

  3. Envie a seqüência de break quando ocorrer o problema. O prompt do Monitor de ROM ">" ou "rommon 1 >" deve ser exibido.

  4. Capture um rastreamento de pilha. Para isso, colete a saída dos comandos k 50 ou stack 50. Adicione 50 ao comando para imprimir um rastreamento de pilha mais longo.

  5. Execute o comando c ou cont para continuar.

  6. Repita os três últimos passos diversas vezes para garantir que diversos pontos em um loop contínuo foram capturados.

  7. Depois de ter obtido vários rastreamentos de pilha, reinicialize o roteador para que ele se recupere do estado suspenso.

Segue um exemplo deste procedimento:

User break detected at location 0x80af570
rommon 1 > k 50
Stack trace:
PC = 0x080af570
Frame 00: FP = 0x02004750    RA = 0x0813d1b4
Frame 01: FP = 0x02004810    RA = 0x0813a8b8
Frame 02: FP = 0x0200482c    RA = 0x08032000
Frame 03: FP = 0x0200483c    RA = 0x040005b0
Frame 04: FP = 0x02004b34    RA = 0x0401517a
Frame 05: FP = 0x02004bf0    RA = 0x04014d9c
Frame 06: FP = 0x02004c00    RA = 0x040023d0
Frame 07: FP = 0x02004c68    RA = 0x04002e9e
Frame 08: FP = 0x02004c78    RA = 0x040154fe
Frame 09: FP = 0x02004e68    RA = 0x04001fc0
Frame 10: FP = 0x02004f90    RA = 0x0400c41e
Frame 11: FP = 0x02004fa4    RA = 0x04000458
Suspect bogus FP = 0x00000000, aborting
rommon 2 > cont
         

Repita este procedimento várias vezes no caso de um problema do sistema para coletar várias instâncias do rastreamento de pilha.

Quando um roteador não responde, quase sempre é um problema de software. Nesse caso, colete o máximo possível de informações, inclusive o rastreamento de pilha, antes de abrir uma solicitação de serviço no TAC. É importante também incluir a saída a partir dos comandos show version, show run e show interfaces.

Informações a Serem Coletadas se uma Solicitação de Serviço da TAC for Aberta

Se você abrir uma Solicitação de Serviço do TAC, anexe as seguintes informações à sua solicitação para solucionar problemas de Suspensões do Roteador:

Anexe os dados coletados sobre seu caso em formato de texto simples, não zipado (.txt). Você pode fazer upload e anexar informações ao seu caso com a Ferramenta de Solicitação de Serviço do TAC (clientes registrados somente) . Se não for possível acessar a Ferramenta de Solicitação de Serviço do TAC, você poderá anexar as informações relevantes ao seu caso, enviando-as para attach@cisco.com, com o número do caso na linha de assunto de sua mensagem.

Observação: Se o console estiver respondendo, não recarrege nem ligue/desligue manualmente o roteador antes de coletar as informações acima, a menos que seja necessário solucionar problemas de suspensão do roteador, pois isso pode causar a perda de informações importantes e necessárias à determinação da causa raiz do problema.

Discussões relacionadas da comunidade de suporte da Cisco

A Comunidade de Suporte da Cisco é um fórum onde você pode perguntar e responder, oferecer sugestões e colaborar com colegas.


Informações Relacionadas


Document ID: 15105