Software Cisco IOS e NX-OS : Software Cisco IOS versões 12.1 Mainline

Solucionando Problemas de Travamento por Erro no Barramento

22 Maio 2008 - Tradução Manual
Outras Versões: Versão em PDFpdf | Tradução por Computador (29 Julho 2013) | Inglês (29 Novembro 2006) | Feedback


Interativo: Este documento oferece uma análise personalizada do seu dispositivo Cisco.


Índice

Introdução
Pré-requisitos
     Requisitos
     Componentes Usados
     Convenções
Identificando Travamentos por Erro no Barramento
Solucionando Problemas de Travamento por Erros no Barramento
     Solucionando Problemas de Travamento por Erro no Barramento em Plataformas do Processador 68000
     Solucionando Problemas de Travamento por Erro no Barramento em Plataformas com Processador RISC
     Tipos Especiais de Travamentos por Erro no Barramento
Técnicas de Solução de Problemas para Loops de Inicialização de Exceção para Erro no Barramento
     O Cisco IOS Software carregado não suporta o hardware instalado
     Falha de Software
     Hardware Mal Fixado
     Falha de Hardware
Informações a Serem Coletadas ao Abrir uma Requisição de Serviço
Discussões relacionadas da comunidade de suporte da Cisco

Introdução

Este documento explica como identificar travamentos por erro no barramento e como resolvê-los, dependendo do tipo de processador presente no roteador Cisco.

Pré-requisitos

Requisitos

Convém ler Solucionando Problemas de Travamento do Roteador antes de prosseguir com este documento.

Componentes Usados

As informações neste documento são baseadas nestas versões de hardware e software:

  • Todas as versões do Cisco IOS® Software

  • Todos os roteadores Cisco

Observação: Este documento não se aplica a switches Cisco Catalyst nem a plataformas MGX.

As informações apresentadas neste documento foram criadas a partir dos dispositivos em um ambiente de laboratório específico. Todos os dispositivos usados neste documento foram iniciados com uma configuração vazia (padrão). Se a sua rede estiver ativa, certifique-se de entender o impacto potencial de todos os comandos.

Convenções

Para obter mais informações sobre convenções de documentos, consulte Convenções e Dicas Técnicas da Cisco.

Identificando Travamentos por Erro no Barramento

O sistema encontra erro de barramento quando o processador tenta acessar um local da memória que não existe (erro de software) ou não responde adequadamente (problema de hardware). Um erro de barramento pode ser identificado pela análise da saída do comando show version fornecida pelo roteador caso este não passe por um religamento de energia ou recarregamento manual.

Se tiver a saída de um comando show version ou show technical-support (no modo de ativação) do dispositivo Cisco, utilize para exibir possíveis problemas e correções. Para usar , você deve ser um cliente registrado, estar conectado e possuir o JavaScript habilitado.

Router uptime is 2 days, 21 hours, 30 minutes

System restarted by bus error at PC 0x30EE546, address 0xBB4C4

System image file is "flash:igs-j-l.111-24.bin", booted via flash
.........

O prompt do console pode exibir a seguinte mensagem de erro durante um erro no barramento:

*** System received a Bus Error exception ***
signal= 0xa, code= 0x8, context= 0x608c3a50
PC = 0x60368518, Cause = 0x20, Status Reg = 0x34008002
.........

Ela é seguida por um recarregamento do roteador. Em alguns casos, no entanto, o roteador fica em um loop de travamentos e recarregamentos e é necessário interrompê-lo com uma intervenção manual (consulte a seção Técnicas Adicionais de Solução de Problemas).

Outro problema relacionado é o travamento do Versatile Interface Processor (VIP). Se esse problema ocorrer, mensagens de erro similares a estas serão registradas:

%VIP2 R5K-1-MSG: slot0 System reloaded by a Bus Error exception
%VIP2 R5K-1-MSG: slot0 caller=0x600BC974
%VIP2 R5K-1-MSG: slot0 System exception: sig=10, code=0x408,
context=0x605B51E0

No que se refere a esse problema, consulte Solucionando Problemas de Travamentos do Versatile Interface Processor.

Finalmente, outro tipo de travamento por erro no barramento é o travamento de placa de linha em um Cisco 12000 Series Internet Router. Se esse problema ocorrer, mensagens de erro similares a estas serão registradas na saída do comando show context:

Router#show context

...

CRASH INFO: Slot 1, Index 1, Crash at 11:27:15 utc  Wed May 16 2001
 VERSION:

 GS Software (GLC1-LC-M), Version 12.0(16.5)S, EARLY DEPLOYMENT MAINTENANCE

 INTERIM SOFTWARE

 TAC Support: http://www.cisco.com/pcgi-bin/ibld/view.pl?i=support

 Compiled Thu 29-Mar-01 17:12 by ninahung

 Card Type: 3 Port Gigabit Ethernet, S/N

 System exception: SIG=10, code=0x2008, context=0x40D8DF44

 System restarted by a Bus Error exception

 STACK TRACE:

 -Traceback= 40165800 4038D0FC 4025C7BC 4026287C 4029581C 402EECF8 400C0144

 CONTEXT:

 $0 : 00000000, AT : 00000000, v0 : 00000044, v1 : 0FE00020

 a0 : 00000000, a1 : 0FE00000, a2 : 00000000, a3 : 39EC6AAB

 t0 : 00000030, t1 : 34008D01, t2 : 34008100, t3 : FFFF00FF

 t4 : 400C01E8, t5 : 00000001, t6 : 00000001, t7 : 00000001

 s0 : 40DCDD20, s1 : 0FE00000, s2 : 00000000, s3 : 000005DC

 s4 : 00000000, s5 : 0FE00020, s6 : 00000004, s7 : 414CF120

 t8 : 41680768, t9 : 00000000, k0 : 00000000, k1 : FFFF8DFD

 gp : 40CB9780, sp : 4105BFE8, s8 : 41652BA0, ra : 4038D0FC

 EPC : 0x40165800, SREG : 0x34008D03, Cause : 0x00002008

 ErrorEPC : 0xBFC22B94
 -Process Traceback= No Extra Traceback

Consulte Solucionando Problemas de Travamento de Placa de Linha no Cisco 12000 Series Internet Router para obter detalhes adicionais.

Se tiver a saída do comando show context no seu dispositivo da Cisco, use o para exibir possíveis problemas e correções. Para usar o , você deve ser um cliente registrado, estar conectado e possuir o JavaScript habilitado.

Solucionando Problemas de Travamento por Erros no Barramento

A primeira coisa a fazer é descobrir qual local de memória (também conhecido como “endereço” ou “operando de endereço”) que o roteador tentou acessar quando ocorreu o erro de barramento. Com essas informações, você tem uma indicação quanto à falha estar no software Cisco IOS ou no hardware do roteador. No exemplo acima, "System restarted by bus error at PC 0x30EE546, address 0xBB4C4", o local da memória que o roteador tentou acessar é 0xBB4C4. Não confunda esse com o valor do contador de programas (PC) acima.

A segunda coisa a fazer é determinar o tipo de processador no roteador. Os locais de endereço de memória dos roteadores são diferentes, dependendo do tipo de processador. Há dois tipos principais de processadores nos roteadores Cisco:

  • Processadores 68000

    Abaixo encontra-se parte da saída do comando show version, indicando se o roteador tem um processador 68000:

    cisco 2500 (68030) processor (revision D) with 8192K/2048K bytes of memory.
    

    As plataformas de roteadores que têm 68000 processadores incluem:

    • Cisco 1000 Series Routers

    • Cisco 1600 Series Routers

    • Cisco 2500 Series Routers

    • Cisco 4000 Series Routers

    • Módulos de processador de rota (RP) nos Cisco 7000 Series Routers (RP)

  • Processadores RISC (Reduced Instruction Set Computing)

    Abaixo encontra-se parte da saída do comando show version, indicando que o roteador tem um processador RISC:

    cisco 3640 (R4700) processor (revision 0x00) with 49152K/16384K bytes of memory.

    O R em (R4700) indica um processador RISC.

    Plataformas de roteador que têm processadores RISC incluem:

    • Cisco 3600 Series Routers

    • Cisco 4500 Series Routers

    • Cisco 4700 Series Routers

    • Módulos RSP (Route Switch Processor) em Cisco 7500 e Cisco 7000 (RSP7000) Series Routers

    • Módulos NPE (Network Processor Engine) nos Cisco 7200 Series Routers

    • Multilayer Switch Feature Card (MSFC) no Cisco 7600 Series Routers ou Switch Catalyst 6000

    • Módulos PRE (Performance Routing Engine) nos roteadores da Internet da série Cisco 10000

    • Módulos Gigabit Route Processor (GRP) em roteadores de Internet Cisco da série 12000

Uma vez determinado o endereço e o tipo de processador, é possível iniciar com a solução de problema mais detalhada.

Solucionando Problemas de Travamento por Erro no Barramento em Plataformas do Processador 68000

Com o endereço acessado pelo roteador durante o erro de barramento, utilize o comando show region para determinar a locação de memória à qual o endereço corresponde. Se o endereço informado pelo erro de barramento não estiver nos intervalos exibidos na saída do comando show region, isso significa que o roteador estava tentando acessar um endereço que não era válido. O problema é do Cisco IOS Software. Use a Ferramenta de Interpretação de Saída (clientes registrados somente) para decodificar a saída do comando show stacks e identificar o erro do Cisco IOS Software que está afetando o barramento.

Por outro lado, se o endereço estiver em um dos intervalos na saída do comando show region, isso significa que o roteador estava acessando um endereço de memória válido, mas o hardware correspondente a esse endereço não está respondendo apropriadamente. Isso indica um problema de hardware.

Este é um exemplo do comando show region:

Router#show region

Region Manager:

     Start         End     Size(b)  Class  Media  Name

0x00000000  0x007FFFFF     8388608  Local  R/W    main

0x00001000  0x0001922F       98864  IData  R/W    main:data

0x00019230  0x000666B3      316548  IBss   R/W    main:bss

0x000666B4  0x007FEFFF     7965004  Local  R/W    main:heap

0x007FF000  0x007FFFFF        4096  Local  R/W    main:flhlog

0x00800000  0x009FFFFF     2097152  Iomem  R/W    iomem

0x03000000  0x037FFFFF     8388608  Flash  R/O    flash

0x0304033C  0x037A7D3F     7764484  IText  R/O    flash:text

Observação: Em versões anteriores do Cisco IOS Software, esse comando pode não estar disponível. A saída show region é parte da saída show tech-support do Cisco IOS Software Release 12.0(9).

Os endereços são exibidos no formato hexadecimal. Os endereços que recaem sobre as faixas Inicial e Final acima são endereços de memória válidos.

Main corresponde à memória principal ou à DRAM (Dynamic RAM).

iomem corresponde à memória de entrada/saída (E/S) o que significa peças diferentes para plataformas diferentes. Por exemplo, DRAM para o Cisco 2500, RAM compartilhado (SRAM) para o Cisco 4000.

Ainda utilizando o exemplo anterior, “System restarted by bus error at PC 0x30EE546, address 0xBB4C4", o travamento por erro no barramento provém de um Roteador Cisco 2500 com a saída show region acima. O endereço 0xBB4C4 é equivalente a 0x000BB4C4. Com a saída show region, esse endereço está dentro do intervalo "main" ou, de modo mais específico: "main:heap" ou 0x000666B4-0x007FEFFF. Como mencionado anteriormente, “main” corresponde à memória principal ou à DRAM, então os chips DRAM precisam ser verificados.

Se esse é um novo roteador, ou se o roteador foi deslocado de um local para outro, os chips de memória costumam ficar frouxos. É uma boa idéia recolocar ou empurrar com firmeza os chips de memória no slot. A maior parte do tempo, isso é suficiente para resolver esse tipo de travamento.

Para travamentos por erro no barramento com endereços pertencentes ao intervalo show region, use a Ferramenta de Interpretação de Saída para decodificar a saída do comando show stacks e identificar o erro do Cisco IOS Software responsável por tal comportamento. Caso não tenha certeza qual ID de erro pode ser o correspondente ou qual versão do software Cisco IOS contém a correção para o problema, atualizar o software Cisco IOS para a versão mais recente na sua versão de treinamento é uma opção que normalmente resolve o problema, pois ela costuma conter a correção para um grande número de erros.

Se tiver a saída de um comando show stacks ou show technical-support (no modo de ativação) do dispositivo Cisco, você pode utilizar para exibir possíveis problemas e correções. Para usar , você deve ser um cliente registrado, estar conectado e possuir o JavaScript habilitado.

Solucionando Problemas de Travamento por Erro no Barramento em Plataformas com Processador RISC

Convém ler a seção em Solucionando Problemas de Travamento por Erro no Barramento em Plataformas com Processador 68000 antes de continuar com esta seção.

Em processadores RISC, o software Cisco IOS usa endereços virtuais por meio do uso do TLB (Buffer de conversão à parte) que converte endereços virtuais em endereços físicos. O endereço reportado por erros de barramento nos processadores RISC é, portanto, o endereço virtual, ao contrário do endereço físico usado pelos processadores 68000.

A saída do comando show region deve ser usada para verificar o endereço informado pelo erro de barramento. Para demonstrar isso, usaremos o seguinte exemplo:

System was restarted by bus error at PC 0x60104864, address 0xC

Utilizando a saída do comando show region abaixo, é possível verificar que 0xC não é um endereço virtual válido e concluir que o erro de barramento foi causado por um problema de software. Use a Ferramenta de Interpretação de Saída (clientes registrados somente) para decodificar a saída do comando show stacks ou show technical-support (no modo de ativação) e identificar o erro do Cisco IOS Software que está causando tal comportamento.

Outra vantagem da utilização do comando show region é que o mapeamento de memória depende da quantidade de memória instalada no roteador. Por exemplo: se você possuir 64 MB de DRAM (64 x 1024 x 1024 = 67108864 bytes = 0x4000000 bytes), a faixa de DRAM será 0x60000000 - 0x63FFFFFF para 64 MB. Isso é confirmado com o comando show region:

Router#show version | i of memory 

cisco RSP2 (R4700) processor with 65536K/2072K bytes of memory.


Router#show region

Region Manager:


     Start         End     Size(b)  Class  Media  Name

0x40000000  0x40001FFF        8192  Iomem  REG    qa

0x40002000  0x401FFFFF     2088960  Iomem  R/W    memd

0x48000000  0x48001FFF        8192  Iomem  REG    QA:writethru

0x50002000  0x501FFFFF     2088960  Iomem  R/W    memd:(memd_bitswap)

0x58002000  0x581FFFFF     2088960  Iomem  R/W    memd:(memd_uncached)

0x60000000  0x63FFFFFF    67108864  Local  R/W    main

0x60010908  0x60C80B11    13042186  IText  R/O    main:text

0x60C82000  0x60F5AF1F     2985760  IData  R/W    main:data

0x60F5AF20  0x610E35FF     1607392  IBss   R/W    main:BSS

0x610E3600  0x611035FF      131072  Local  R/W    main:fastheap

0x61103600  0x63FFFFFF    49269248  Local  R/W    main:heap

0x80000000  0x83FFFFFF    67108864  Local  R/W    main:(main_k0)

0x88000000  0x88001FFF        8192  Iomem  REG    QA_k0

0x88002000  0x881FFFFF     2088960  Iomem  R/W    memd:(memd_k0)

0xA0000000  0xA3FFFFFF    67108864  Local  R/W    main:(main_k1)

0xA8000000  0xA8001FFF        8192  Iomem  REG    QA_k1

0xA8002000  0xA81FFFFF     2088960  Iomem  R/W    memd:(memd_k1)

Se tiver um erro de barramento no 0x65FFFFFF, a saída do comando show region leva em consideração a quantidade de memória e informa que é um endereço ilegal (erro de software).

Em resumo:

  • Use o comando show region para verificar se o endereço indicado pelo erro de barramento está dentro dos intervalos de endereço usados pelo roteador.

  • Se o endereço falhar dentro de um intervalo de endereço virtual, substitua o hardware correspondente a tal intervalo.

  • Se o endereço não cair dentro de um intervalo de endereços virtuais, use a Ferramenta do Output Interpreter (clientes registrados somente) para decodificar a saída dos comandos show stacks ou show technical-support (no modo de ativação), e identifica o erro do Cisco IOS Software que está causando o erro no barramento.

  • Instale a versão de manutenção mais recente do treinamento do Cisco IOS Software que você está executando no momento.

Tipos Especiais de Travamentos por Erro no Barramento

Um tipo especial de travamento por erro no barramento é quando o travamento é causado por um PC (contador de programa) corrompido. O valor de PC é o local de instrução que o processador estava executando quando o erro no barramento ocorreu. Quando um erro no barramento causado por um PC inválido ocorre, o console exibe a mensagem a seguir:

%ALIGN-1-FATAL: Corrupted program counter

  pc=0x0, ra=0x601860BC, sp=0x60924540, at=0x60224854

Neste caso, o PC pulou para o endereço 0x0 (provavelmente por causa de um ponteiro nulo), mas não é onde a instrução está localizada. Esse é um problema de software, assim não há necessidade de ser verificado com o comando show region.

Em outras plataformas RISC (Cisco 3600, 4500 e assim por diante), você receberá uma exceção SegV ao saltar para um PC ilegal e não um erro de barramento.

Outro tipo de travamento por erro no barramento que ocorre periodicamente é quando o valor PC é igual ao valor do endereço. Por exemplo:

System returned to ROM by bus error at PC 0x606B34F0, address 0x606B34F0

No arquivo crashinfo:

Unexpected exception, CPU signal 10, PC = 0x606B34F0

  $0 : 00000000, AT : A001A24A, v0 : 00000000, v1 : 00000000
  a0 : 00000000, a1 : 429CC394, a2 : 00000000, a3 : 62544344
  t0 : 6069F424, t1 : 3400FF00, t2 : FFFFFFFB, t3 : 00000000
  t4 : 606B8E68, t5 : 80000000, t6 : AA5C1022, t7 : 62FDE9D4
  s0 : 62300000, s1 : 6281A1B8, s2 : 80007E20, s3 : 00000001
  s4 : 00000001, s5 : 00000000, s6 : 62310000, s7 : 62544344
  t8 : 62FDEA1C, t9 : 0D0D0D0D, k0 : 623079C0, k1 : 00000014
  gp : 620B9E20, sp : 61E7E300, s8 : 00000000, ra : 606B8E68
  EPC : 606B34F0, ErrorEPC : 606B8E68, SREG : 3400FF02
  Cause 00004018 (Code 0x6): Instruction Bus Error exception

  -Traceback= 606B34F0 606B8E68

Observe que o valor do registro k1 é 0x14 (hexadecimal), o que equivale a 20 no sistema decimal. Aponta para uma Exceção de Paridade de Cache. Neste caso específico, o erro de paridade não é processado apropriadamente e está sendo mascarado por um erro no barramento. O roteador pode falhar devido a um erro no barramento de software na função que manipula uma Exceção de Paridade de Cache.

Considere esse como um travamento regular por erro de paridade de memória do processador e siga as recomendações apresentadas em Erros de Paridade de Memória do Processador (PMPEs).

Você também deve considerar a atualização da versão do software Cisco IOS para uma versão que tenha uma correção CSCdv68388 – "Altere o controlador de exceção de erro de cache para que continue e não falhe", que foi retificada desde o Cisco IOS, Versão12.2(10).

Técnicas de Solução de Problemas para Loops de Inicialização de Exceção para Erro no Barramento

Esta seção aborda técnicas de solução de problemas para loops de inicialização por exceção gerada por erro no barramento:

  • O Cisco IOS Software carregado não suporta o hardware instalado

  • Falha de Software

  • Hardware Mal Fixado

  • Falha de Hardware

O Cisco IOS Software carregado não suporta o hardware instalado

Verifique se todas as placas de rede são suportadas pelo Cisco IOS Software. O Software Advisor (clientes registrados somente) atribui as versões mínimas do Cisco IOS Software exigidas pelo hardware. Verifique também se a imagem de flash de inicialização oferece suporte para o hardware instalado caso você possua um roteador com suporte para uma imagem de inicialização, como um Cisco 7200 ou 7500 Series Router.

Falha de Software

Nos roteadores 2600 e 3600, a memória de E/S do roteador é configurável como uma porcentagem da memória principal. Se as definições da memória de E/S forem inapropriadas para os módulos de rede instalados ou placas de interface de WAN (WICs), a plataforma 2600/3600 pode ter problemas de inicialização e travar com erros no barramento. Use a Calculadora de Memória 2600/3600 (clientes registrados somente) para verificar as definições.

Se houve uma alteração recente na configuração de software e o roteador cair em um laço de boot, a causa do problema pode ser um erro de software.

Se o roteador não for capaz de inicializar, você pode contornar a configuração para identificar o que está causando o problema. Siga estas etapas:

  1. Aplique um break no ROMMON, enviando a seqüência de break para o roteador durante os primeiros 60 segundos de inicialização.

  2. No Monitor de ROM, utilize o comando confreg para alterar o registro de configuração para uma definição, como 0x2142, a fim de ignorar a configuração do roteador:

    rommon 1 > confreg 0x2142
    
    You must reset or power cycle for new config to take effect
    
    rommon 2 > reset

Se o roteador iniciar sem nenhum erro, o problema é de configuração. Verifique se a sua configuração é suportada pelo Cisco IOS Software e pelo hardware. Em caso afirmativo, use o Bug Toolkit (clientes registrados somente) para identificar quaisquer erros de software presentes. Pense seriamente em instalar a versão de manutenção mais recente do treinamento do Cisco IOS Software atualmente em execução.

Hardware Mal Fixado

Em caso de loop de inicialização de exceção por erro no barramento, isso pode ser causado devido a um problema de fixação do hardware. Para plataformas low-end, como o roteador 3600 ou 4000, reinstale os módulos e processadores de rede.

No caso de plataformas high-end, como os roteadores 7200 ou 7500, fixe novamente o processador, VIP, adaptadores de porta ou a placa de linha que está sendo recarregada devido a uma exceção causada por um erro no barramento.

Falha de Hardware

As informações contidas no erro de barramento não ajuda a isolar o hardware. Portanto, é importante remover e reinserir as placas para encontrar o hardware com problema. Estas são algumas etapas recomendadas para isolar o problema:

flow1.jpg

**Se o roteador não passar pelo loop contínuo depois das etapas de solução de problemas acima, o problema pode ser um módulo de rede mal fixado. É recomendado que você monitore o roteador 24 horas para garantir que ele continuará a funcionar sem incorrer no mesmo problema.

Informações a Serem Coletadas ao Abrir uma Requisição de Serviço

Se ainda precisar de assistência após seguir as etapas de solução de problemas mencionadas acima e quiser abrir um caso junto ao Suporte Técnico Cisco, não se esqueça de incluir as informações a seguir para resolver o erro no barramento ou a exceção gerada por esse:

  • Solução de problemas executada antes de abrir o caso

  • Saída do comando show technical-support (se possível, no modo de ativação)

  • Saída do comando show log ou capturas do console, se disponíveis

  • o arquivo crashinfo (se presente e já não estiver incluído na saída show technical-support)

  • a saída show region (se já não estiver incluída na saída show technical-support)

Gentileza anexar os dados coletados sobre seu caso em formato de texto simples, não zipado (.txt). Você pode anexar informações carregando-as com o uso da ferramenta Case Query (clientes registrados somente) . Se não conseguir acessar a ferramenta Case Query Tool, envie as informações pertinentes por e-mail, em um anexo, para attach@cisco.com com o número do caso na linha de assunto da mensagem.

Observação: Não recarregue nem faça um religamento manual de energia no roteador antes de coletar as informações acima, a menos que seja necessário resolver uma exceção gerado pelo erro no barramento, pois isso pode causar a perda de informações importantes e necessárias à determinação da causa raiz do problema.


Discussões relacionadas da comunidade de suporte da Cisco

A Comunidade de Suporte da Cisco é um fórum onde você pode perguntar e responder, oferecer sugestões e colaborar com colegas.


Document ID: 7949