Roteadores : Roteadores Cisco 7500 Series

Compreendendo Travamentos Forçados por Software

3 Abril 2008 - Tradução Manual
Outras Versões: Versão em PDFpdf | Tradução por Computador (29 Julho 2013) | Inglês (31 Julho 2006) | Feedback


Interativo: Este documento oferece uma análise personalizada do seu dispositivo Cisco.


Índice

Introdução
Pré-requisitos
     Requisitos
     Componentes Usados
     Convenções
Identificar um Travamento Forçado por Software
Causas Possíveis
Solução de Problemas
Procedimentos de Configuração
     Procedimento de Configuração de Roteador
     Procedimento de Configuração de Host do Servidor TFTP
Informações a Serem Coletadas se uma Solicitação de Serviço da TAC for Aberta
Discussões relacionadas da comunidade de suporte da Cisco
Informações Relacionadas

Introdução

Este documento explica as causas mais freqüentes de travamentos forçados por software e descreve as informações que devem ser coletadas para finalidades de solução de problemas. Se você abrir uma solicitação de serviço da TAC para um travamento forçado por software, as informações solicitadas a você serão essenciais para resolver o problema.

Pré-requisitos

Requisitos

Os leitores deste documento devem ter conhecimento dos seguintes tópicos:

Componentes Usados

Este documento não está restrito a versões específicas de software e de hardware.

As informações apresentadas neste documento foram criadas a partir dos dispositivos em um ambiente de laboratório específico. Todos os dispositivos usados neste documento começaram com uma configuração vazia (padrão). Se a sua rede estiver ativa, certifique-se de entender o impacto potencial de todos os comandos.

Convenções

Consulte Cisco Technical Tips Conventions (Convenções de Dicas Técnicas da Cisco) para obter mais informações sobres as convenções de documentos.

Identificar um Travamento Forçado por Software

Um travamento forçado por software ocorre quando o roteador detecta um erro severo e irrecuperável e se recarrega para não transmitir dados corrompidos. A grande maioria dos travamentos forçados por software são causados por bugs do Cisco IOS® Software, embora algumas plataformas (como o antigo Cisco 4000) possam relatar um problema de hardware como travamento forçado por software.

Se você não tiver executado o ciclo de força do roteador ou recarregado o mesmo manualmente, a saída do comando show version exibirá o seguinte:

Router uptime is 2 days, 21 hours, 30 minutes
System restarted by error - Software-forced crash, PC 0x316EF90 at 20:22:37 edt
System image file is "flash:c2500-is-l.112-15a.bin", booted via flash

Se você tiver a saída de um comando show version de seu dispositivo da Cisco, é possível usar para exibir possíveis problemas e correções. Para utilizar , você deve ser um usuário registrado, estar conectado e possuir o JavaScript habilitado.

Causas Possíveis

Esta tabela explica as possíveis razões para travamentos forçados pelo software:

Razão

Explicação

Expirações de vigilência

O processador utiliza cronômetros para evitar loops e faz com que o roteador pare de responder. Na operação normal, a CPU redefine esses cronômetros em intervalos regulares. Falha ao fazer isso resulta em um recarregamento do sistema.

As expirações de vigilência relatadas como travamentos forçados pelo software são relacionados ao software. Consulte Troubleshooting Watchdog Timeouts (Solucionando Problemas com Expiração de Vigilância) para obter informações sobre outros tipos de expiração de vigilência. O sistema ficou travado em um loop antes de ser recarregado. Portanto, o rastreamento de pilha não é necessariamente relevante. Você pode reconhecer este tipo de travamento forçado pelo software nas seguintes linhas dos logs do console:

%SYS-2-WATCHDOG: Process aborted on watchdog timeout, process = Exec

               and

               *** System received a Software forced crash ***
               signal = 0x17, code = 0x24, context= 0x60ceca60

Memória insuficiente

Quando um roteador é executado com memória insuficiente, ele pode se recarregar e relatar o fato como um travamento forçado por software. Nesse caso, as mensagens de erro de falha de alocação de memória serão exibidas nos registros de console.

%SYS-2-MALLOCFAIL: Memory allocation of 734 bytes failed from 0x6015EC84,
               pool Processor, alignment 0 

Corrompimento de imagem de software

No momento da inicialização, um roteador pode detectar que a imagem do Cisco IOS Software está corrompida, retornar uma mensagem informando que o checksum da imagem compactada está incorreto e tentar recarregar. Nesse caso, o evento é relatado como um travamento forçado por software.

Error : compressed image checksum is incorrect 0x54B2C70A
        Expected a checksum of 0x04B2C70A


*** System received a Software forced crash ***
signal= 0x17, code= 0x5, context= 0x0
PC = 0x800080d4, Cause = 0x20, Status Reg = 0x3041f003

Isso pode ser causado por uma imagem do Cisco IOS Software que, na realidade, tenha sido corrompida durante a transferência para o roteador. Nesse caso, você pode carregar a nova imagem no roteador para resolver o problema. [Para obter informações adicionais com relação à recuperação de ROMMON, consulte Procedimento de Rexuperação de ROMmon para Cisco 7200, 7300, 7400, 7500, RSP7000, Catalyst 5500 RSM, uBR7100, uBR7200, uBR10000 e 12000 Series Router.]

O erro também pode ser causado por hardware de memória defeituoso ou por um bug de software.

Outras falhas

Os erros que causam travamento freqüentemente são detectados pelo hardware do processador, que chama automaticamente o código de manipulação de erros no monitor de ROM. O monitor de ROM identifica o erro, imprime uma mensagem, salva as informações sobre a falha e reinicia o sistema.

Há travamentos em que nada disso ocorre (consulte Watchdog timeouts [Expirações de vigilência]) e há travamentos em que o software detecta o problema e chama a função crashdump. Esse é um verdadeiro travamento "forçado por software”.

Nas plataformas do Power PC, o travamento forçado por software não é a razão de reinício, quando a função crashdump é chamada – pelo menos até muito recentemente. Nessas plataformas (anteriores ao Cisco IOS Software Release 12.2(12.7)), esses travamentos são conhecidos como exceções "SIGTRAP". De qualquer maneira, SIGTRAPs e SFCs são a mesma coisa.

Solução de Problemas

Os travamentos forçados pelo software normalmente são causados por bugs do Cisco IOS Software. Se houver mensagens de erro de falha de alocação nos logs, consulte Troubleshooting Memory Problems (Solucionando Problemas de Memória).

Se você não receber mensagens de erro de falha de alocação de memória e não tiver recarregado ou religado manualmente o roteador depois do travamento forçado pelo software, a melhor ferramenta que poderá usar é o Output Interpreter (clientes registrados somente) para pesquisar uma ID de erro correspondente conhecida. Essa ferramenta incorpora a funcionalidade da antiga ferramenta Stack Decoder.

Exemplo:

  1. Colete a saída de show stack do roteador.

  2. Vá para a ferramenta Output Interpreter (clientes registrados somente) .

  3. Selecione show stack no menu suspenso.

  4. Cole o que coletou na saída.

  5. Clique em submit.

    Se a saída decodificada do comando show stack corresponder ao bug de software conhecido, você receberá as IDs de erro dos erros mais prováveis que podem ter causado o travamento forçado pelo software.

  6. Clique nos hiperlinks da ID do erro para ver mais detalhes do erro da Cisco Bug Toolkit (clientes registrados somente) , o que pode ajudá-lo a determinar a correspondência de ID de erro correta.

Depois de identificar uma ID de bug correspondente ao seu erro, consulte o campo “fixed in” (corrigido em) para determinar qual é a primeira versão do Cisco IOS Software que contém a correção do bug.

Se não tiver certeza sobre a ID do bug ou sobre a versão do Cisco IOS Software que contém a correção para o problema, melhore o Cisco IOS Software para a versão mais recente no treinamento da versão. Isso ajuda porque a versão mais recente contém correções para vários bugs. Mesmo se a correção falhar em resolver o problema, o relato do bug e o processo de resolução são mais simples e rápidos quando com a versão mais recente do software.

Se depois de usar a ferramenta Output Interpreter Tool, você suspeitar da existência ou identificar positivamente um bug sem solução, recomendamos que abra uma solreceber fornecer uma notificação mais rápida quando o bug for finalmente resolvido.

Procedimentos de Configuração

Se o problema for identificado como um novo bug de software, um engenheiro do Cisco TAC poderá solicitar que você configure o roteador para coletar um core dump. Algumas vezes, é necessário um dump central para identificar o que pode ser feito para corrigir o bug do software.

Para coletar informações mais úteis no dump central, recomendamos usar o comando hidden debug sanity. Isso faz com que cada buffer usado no sistema tenha sua sanidade verificada quando alocado e quando liberado. O comando debug sanity deve ser executado no modo privilegiado EXEC (modo ativo) e envolve alguns recursos da CPU, mas não afeta as funcionalidades do roteador de modo significativo. Para desabilitar as verificações de sanidade, use o comando de EXEC privilegiado undebug sanity.

Para roteadores que tenham 16 MB ou menos de memória principal, use o Trivial File Transfer Protocol (TFTP) para coletar o dump central. Recomendamos que você use o File Transfer Protocol (FTP) se o roteador tiver mais de 16 MB de memória principal. Use os procedimentos de configuração desta seção. Como alternativa, consulte Creating Core Dumps (Criando Dumps Centrais).

Procedimento de Configuração de Roteador

Conclua essas etapas para configurar o roteador:

  1. Configure o roteador com o comando configure terminal.

  2. Digite exception dump n.n.n.n, onde n.n.n.n é o endereço IP do host do servidor Trivial File Transfer Protocol (TFTP).

  3. Sair do modo de configuração.

Procedimento de Configuração de Host do Servidor TFTP

Conclua essas etapas para configurar um host do servidor TFTP:

  1. Crie um arquivo no diretório /tftpboot no host remoto usando com a ajuda de um editor de sua preferência. O nome do arquivo é o nome do host central do roteador da Cisco.

  2. Em sistemas UNIX, altere o modo de permissão do arquivo “hostname-core” para que seja globalmente compatível (666). Você pode verificar a configuração do TFTO pelo comando copy running-config tftp no arquivo.

  3. Assegure-se de que tenha mais de 16 MB de espaço em disco em /tftpboot.

    Se o sistema travar, o comando exception dump criará sua saída para o arquivo acima. Se o roteador tiver mais do que 16 MB de memória principal, use o File Transfer Protocol (FTP) ou o Remote Copy Protocol (RCP) para obter o dump central. No roteador, configure o seguinte:

                      exception protocol ftp
    exception dump n.n.n.n
    ip ftp username <string>
    ip ftp password <string> 
    ip ftp source-interface <slot/port/interface>
    exception core-file <core-filename>
                      
                   

    Ao coletar um dump central, faça upload do mesmo em ftp://ftp-sj.cisco.com/incoming (em UNIX, tipo pftp ftp-sj.cisco.com e, em seguida, cd incoming) e notifique o proprietário sobre seu caso, incluindo o nome do arquivo.

Informações a Serem Coletadas se uma Solicitação de Serviço da TAC for Aberta

Se você ainda precisar de assistência após seguir as etapas de solução de problemas mencionadas acima e quiser criar uma solicitação de serviço com o TAC Cisco, certifique-se de incluir as informações a seguir para solucionar problemas:

  • show technical-support output – A saída do comando show technical-support apresenta informações sobre o estado atual do roteador, assim como informações fundamentais armazenadas pelo roteador antes de um travamento.

  • Logs do console – freqüentemente salvos em um servidor syslog, podem apresentar informações valiosas sobre os eventos que ocorrem no roteador antes de um travamento. Essas dicas costumam ser as informações mais importantes que você consegue coletar.

  • crashinfo file (se houver) – A Cisco recomenda a utilização de uma versão do Cisco IOS Software que suporte o recurso crashinfo para solucionar problemas com êxito. Por isso, a versão deve atender a outras necessidades da sua rede.

    Consulte Retrieving Information from the Crashinfo File (Recuperando Informações do Arquivo Crashinfo) ou use a ferramenta Software Advisor (clientes registrados somente) para localizar uma versão do Cisco IOS Software que oferece suporte ao recurso de crashinfo.

    Se você tiver uma versão mais antiga do Cisco IOS Software, as versões mais recentes que suportam este recurso já poderão ter o bug corrigido.

Para incluir informações na solicitação do serviço, faça upload das mesmas por meio da Ferramenta de Solicitação de Serviço do TAC (clientes registrados somente) . Se você não conseguir acessar a Ferramenta de Solicitação de Serviço de TAC, poderá enviar as informações em um anexo de e-mail para attach@cisco.com com o número do caso na linha de assunto da mensagem.

cuidado Cuidado: Não recarregue manualmente ou execute ciclo de força do roteador antes de coletar as informações acima, se possível, porque esse procedimento pode causar a perda de informações importantes necessárias para a determinação da causa raiz do problema.

Discussões relacionadas da comunidade de suporte da Cisco

A Comunidade de Suporte da Cisco é um fórum onde você pode perguntar e responder, oferecer sugestões e colaborar com colegas.


Informações Relacionadas


Document ID: 26145