Software Cisco IOS e NX-OS : Software Cisco IOS versões 12.1 Mainline

Troubleshooting de Travamentos de Erro de Barramento

16 Janeiro 2016 - Tradução por Computador
Outras Versões: Versão em PDFpdf | Tradução Manual (22 Maio 2008) | Inglês (31 Dezembro 2015) | Feedback


Interativo: Este documento oferece análise personalizada do seu dispositivo Cisco.


Índice


Introdução

Este documento explica como identificar ruídos elétricos de erro de barramento e como solucionar o problema com estes ruídos dependendo do tipo de processador que você tem em seu roteador Cisco.

Pré-requisitos

Requisitos

Cisco recomenda que você lê ruídos elétricos de roteador do Troubleshooting antes de continuar com este documento.

Componentes Utilizados

As informações neste documento são baseadas nestas versões de software e hardware:

  • Todas as versões de software de Cisco IOS�

  • Todos os Cisco Routers

Nota: Este documento não se aplica ao Switches ou às plataformas MGX do Cisco catalyst.

As informações neste documento foram criadas a partir de dispositivos em um ambiente de laboratório específico. Todos os dispositivos utilizados neste documento foram iniciados com uma configuração (padrão) inicial. Se a sua rede estiver ativa, certifique-se de que entende o impacto potencial de qualquer comando.

Convenções

Consulte as Convenções de Dicas Técnicas da Cisco para obter mais informações sobre convenções de documentos.

Identificando travamentos de erro de barramento

O sistema encontra um erro de barramento quando o processador tenta acessar um local de memória que não existe (um erro de software) ou não responde adequadamente (um problema de hardware). Um erro de barramento pode ser identificado da saída do comando show version fornecido pelo power-cycled do roteador se não ou recarregado manualmente.

Se você tem a saída de um comando show version ou show technical-support (do modo enable) de seu dispositivo Cisco, você pode usá-lo para indicar problemas potenciais e reparos. A fim usá-lo, você deve ser um cliente registrado, ser entrado, e ter o Javascript permitido.

Router uptime is 2 days, 21 hours, 30 minutes 

System restarted by bus error at PC 0x30EE546, address 0xBB4C4 

System image file is "flash:igs-j-l.111-24.bin", booted via flash 
.........

Na alerta do console, este Mensagem de Erro pode igualmente ser considerado durante um erro de barramento:

*** System received a Bus Error exception *** 
signal= 0xa, code= 0x8, context= 0x608c3a50
PC = 0x60368518, Cause = 0x20, Status Reg = 0x34008002
.........

Após isto, os recarregamentos de roteador. Em alguns casos, contudo, o roteador entra em um laço dos impactos e os reloads e a intervenção manual são exigidos estoirar deste laço.

Um outro problema relacionado é um impacto do Versatile Interface Processor (VIP). Se este problema ocorre, os Mensagens de Erro similares a estes estão registrados:

%VIP2 R5K-1-MSG: slot0 System reloaded by a Bus Error exception
%VIP2 R5K-1-MSG: slot0 caller=0x600BC974
%VIP2 R5K-1-MSG: slot0 System exception: sig=10, code=0x408,
context=0x605B51E0

Finalmente, um outro tipo do ruído elétrico de erro de barramento é um ruído da placa em um Cisco 12000 Series Internet Router. Se este problema ocorre, os Mensagens de Erro similares a estes são entrados o contexto da mostra output:

Router#show context

... 

CRASH INFO: Slot 1, Index 1, Crash at 11:27:15 utc  Wed May 16 2001
 VERSION: 

 GS Software (GLC1-LC-M), Version 12.0(16.5)S, EARLY DEPLOYMENT MAINTENANCE 

 INTERIM SOFTWARE 

 TAC Support: http://www.cisco.com/pcgi-bin/ibld/view.pl?i=support    

 Compiled Thu 29-Mar-01 17:12 by ninahung 

 Card Type: 3 Port Gigabit Ethernet, S/N 

 System exception: SIG=10, code=0x2008, context=0x40D8DF44 

 System restarted by a Bus Error exception 

 STACK TRACE: 

 -Traceback= 40165800 4038D0FC 4025C7BC 4026287C 4029581C 402EECF8 400C0144    

 CONTEXT: 

 $0 : 00000000, AT : 00000000, v0 : 00000044, v1 : 0FE00020 

 a0 : 00000000, a1 : 0FE00000, a2 : 00000000, a3 : 39EC6AAB 

 t0 : 00000030, t1 : 34008D01, t2 : 34008100, t3 : FFFF00FF 

 t4 : 400C01E8, t5 : 00000001, t6 : 00000001, t7 : 00000001 

 s0 : 40DCDD20, s1 : 0FE00000, s2 : 00000000, s3 : 000005DC 

 s4 : 00000000, s5 : 0FE00020, s6 : 00000004, s7 : 414CF120 

 t8 : 41680768, t9 : 00000000, k0 : 00000000, k1 : FFFF8DFD 

 gp : 40CB9780, sp : 4105BFE8, s8 : 41652BA0, ra : 4038D0FC 

 EPC : 0x40165800, SREG : 0x34008D03, Cause : 0x00002008 

 ErrorEPC : 0xBFC22B94
 -Process Traceback= No Extra Traceback

Veja ruídos da placa do Troubleshooting no Cisco 12000 Series Internet Router para mais detalhes.

Se você tem a saída de um comando show context de seu dispositivo Cisco, você pode usar-se para indicar problemas potenciais e reparos. Para usar-se , você deve ser um cliente registrado, ser entrado, e ter o Javascript permitido.

Troubleshooting de Travamentos de Erro de Barramento

A primeira coisa a fazer é descobrir qual local de memória (também conhecido como “endereço” ou “operando de endereço”) que o roteador tentou acessar quando ocorreu o erro de barramento. Com essas informações, você tem uma indicação quanto à falha estar no Cisco IOS Software ou no hardware do roteador. No exemplo, o “sistema reiniciado pelo erro de barramento em PC 0x30EE546, o endereço 0xBB4C4", o local de memória que o roteador tentou alcançar é 0xBB4C4. Não confunda isso com o valor contrário de programa (PC) acima.

A segunda coisa a fazer é determinar o tipo de processador no roteador. Os locais de endereço de memória para o Roteadores diferem segundo o tipo de processador. Há dois tipos principais de processadores nos Cisco routers:

  • Processadores 68000

    Esta é parte de umas saídas de versão da mostra que indiquem que o roteador tem um processador 68000:

    cisco 2500 (68030) processor (revision D) with 8192K/2048K bytes of memory.
    

    As plataformas de roteadores que têm 68000 processadores incluem:

  • Processadores RISC (Computação de conjunto de instruções reduzido)

    Esta é parte de umas saídas de versão da mostra que indiquem que o roteador tem um processador de RISC:

    cisco 3640 (R4700) processor (revision 0x00) with 49152K/16384K bytes of memory.

    O R dentro (R4700) indica um processador de RISC.

    Plataformas de roteador que têm processadores RISC incluem:

    • Cisco 3600 Series Routers

    • Cisco 4500 Series Routers

    • Cisco 4700 Series Routers

    • Módulos RSP (Route Switch Processor) em Routers das Cisco 7500 Series e Cisco 7000 (RSP7000)

    • Módulos do Network Processor Engine (NPE) em Cisco 7200 Series Router

    • Multilayer Switch Feature Card (MSFC) nos Cisco 7600 Series Router ou no Catalyst 6000 Switch

    • Módulos PRE (Performance Routing Engine) nos Cisco 10000 Series Internet Routers

    • Módulos Gigabit Route Processor (GRP) em Cisco 12000 Series Internet Routers

Uma vez que você determinou o endereço e o tipo de processamento, você pode começar com Troubleshooting mais detalhado.

Troubleshooting de Travamento por Erro de Barramento em 68000 Processor Platforms

Com o endereço acessado pelo roteador quando ocorreu o erro de barramento, use o comando show region para determinar a localização de memória correspondente ao endereço. Se o endereço relatou pelo erro de barramento não cai dentro das escalas indicadas na saída da região da mostra, isto significa que o roteador tentou alcançar um endereço que seja inválido. Isso indica que se trata de um problema do Software Cisco IOS. Use a ferramenta Output Interpreter (clientes registrados somente) para descodificar a saída do comando show stacks e para identificar o Bug do Software da Cisco IOS que causa o erro de barramento.

Por outro lado, se o endereço cai dentro de uma das escalas na saída da região da mostra, significa que o roteador alcançou um endereço de memória válido, mas o hardware que corresponde a esse endereço não responde corretamente. Isso indica um problema de hardware.

Abaixo encontra-se um exemplo de resultado do comando show region:

Router#show region 

Region Manager: 

     Start         End     Size(b)  Class  Media  Name 

0x00000000  0x007FFFFF     8388608  Local  R/W    main 

0x00001000  0x0001922F       98864  IData  R/W    main:data 

0x00019230  0x000666B3      316548  IBss   R/W    main:bss 

0x000666B4  0x007FEFFF     7965004  Local  R/W    main:heap 

0x007FF000  0x007FFFFF        4096  Local  R/W    main:flhlog 

0x00800000  0x009FFFFF     2097152  Iomem  R/W    iomem 

0x03000000  0x037FFFFF     8388608  Flash  R/O    flash 

0x0304033C  0x037A7D3F     7764484  IText  R/O    flash:text

Nota: Em algumas versões de Cisco IOS Software mais adiantadas, este comando não está disponível. A saída show region faz parte da saída show tech-support do software Cisco IOS versão 12.0(9).

Os endereços são indicados no formato hexadecimal. Os endereços que caem dentro das escalas do “começo” e da “extremidade” são endereços de memória válidos.

“Principal” corresponde à memória principal ou DRAM (RAM dinâmico).

o iomem corresponde ao entrada/saída (I/O) a memória, que significa as peças diferentes para Plataformas diferentes. Por exemplo, DRAM para o Cisco 2500, RAM compartilhado (SRAM) para o Cisco 4000.

Ainda usando o exemplo anterior, o sistema reiniciado pelo erro de barramento em PC 0x30EE546, o endereço 0xBB4C4, este ruído elétrico de erro de barramento vem de um Cisco 2500 Router com a saída da região da mostra. O endereço 0xBB4C4 é equivalente a 0x000BB4C4. Usando a saída da região da mostra, este endereço cai dentro da escala do “cano principal”, ou mais especificamente, “cano principal: montão” ou 0x000666B4-0x007FEFFF. Como mencionado anteriormente, “main” corresponde à memória principal ou à DRAM, então os chips DRAM precisam ser verificados.

Se esse for um roteador novo, ou se o roteador tiver sido deslocado de um local para outro, os chips de memória costumam ficar frouxos. É uma boa idéia recolocar ou empurrar com firmeza os chips de memória no slot. Na maioria das vezes, isto é suficiente para resolver este tipo de travamento.

Para ruídos elétricos de erro de barramento com endereços que não caem dentro das escalas de endereço da região da mostra, usam a ferramenta Output Interpreter para descodificar a saída do comando show stacks e identificam o Bug do Software da Cisco IOS que está causando o erro de barramento. Caso não tenha certeza qual ID de bug pode ser o correspondente ou qual versão do Cisco IOS Software contém a correção para o problema, atualizar o Cisco IOS Software para a versão mais recente na sua versão de treinamento é uma opção que normalmente resolve o problema, pois ela costuma conter a correção para um grande número de bugs.

Se você tem a saída de pilhas de uma mostra ou mostra o comando do Suporte técnico (do modo enable) de seu dispositivo Cisco, você pode usar-se para indicar problemas potenciais e reparos. Para usar-se , você deve ser um cliente registrado, ser entrado, e ter o Javascript permitido.

Troubleshooting de Travamentos por Erro de Barramento nas Plataformas do Processador RISC

Recomenda-se que você lê a seção em ruídos elétricos de erro de barramento do Troubleshooting em 68000 plataformas de processador antes que você continue com esta seção.

Em processadores RISC, o software Cisco IOS usa endereços virtuais por meio do uso do TLB (Buffer de conversão à parte) que converte endereços virtuais em endereços físicos. O endereço reportado por erros de barramento nos processadores RISC é, portanto, o endereço virtual, ao contrário do endereço físico usado pelos processadores 68000.

A saída do comando show region deve ser usada para verificar o endereço relatado pelo erro de barramento. Para demonstrar isso, usaremos o seguinte exemplo:

System was restarted by bus error at PC 0x60104864, address 0xC

Utilizando a saída do comando show region abaixo, é possível verificar que 0xC não é um endereço virtual válido e concluir que o erro de barramento foi causado por um problema de software. Utilize a ferramenta Output Interpreter (somente para clientes registrados) para decodificar a saída do comando show stacks ou show technical-support (no modo habilitado) e identificar o bug do Cisco IOS Software que está causando o erro de barramento.

Outra vantagem da utilização do comando show region é que o mapeamento de memória depende da quantidade de memória instalada no roteador. Por exemplo: se você possuir 64 MB de DRAM (64 x 1024 x 1024 = 67108864 bytes = 0x4000000 bytes), a faixa de DRAM será 0x60000000 - 0x63FFFFFF para 64 MB. Isto é confirmado com o comando show region:

Router#show version | i of memory 

cisco RSP2 (R4700) processor with 65536K/2072K bytes of memory. 


Router#show region 

Region Manager: 


     Start         End     Size(b)  Class  Media  Name 

0x40000000  0x40001FFF        8192  Iomem  REG    qa 

0x40002000  0x401FFFFF     2088960  Iomem  R/W    memd 

0x48000000  0x48001FFF        8192  Iomem  REG    QA:writethru 

0x50002000  0x501FFFFF     2088960  Iomem  R/W    memd:(memd_bitswap) 

0x58002000  0x581FFFFF     2088960  Iomem  R/W    memd:(memd_uncached) 

0x60000000  0x63FFFFFF    67108864  Local  R/W    main 

0x60010908  0x60C80B11    13042186  IText  R/O    main:text 

0x60C82000  0x60F5AF1F     2985760  IData  R/W    main:data 

0x60F5AF20  0x610E35FF     1607392  IBss   R/W    main:BSS 

0x610E3600  0x611035FF      131072  Local  R/W    main:fastheap 

0x61103600  0x63FFFFFF    49269248  Local  R/W    main:heap 

0x80000000  0x83FFFFFF    67108864  Local  R/W    main:(main_k0) 

0x88000000  0x88001FFF        8192  Iomem  REG    QA_k0 

0x88002000  0x881FFFFF     2088960  Iomem  R/W    memd:(memd_k0) 

0xA0000000  0xA3FFFFFF    67108864  Local  R/W    main:(main_k1) 

0xA8000000  0xA8001FFF        8192  Iomem  REG    QA_k1 

0xA8002000  0xA81FFFFF     2088960  Iomem  R/W    memd:(memd_k1)

Se você tem um erro de barramento em 0x65FFFFFF, a saída da região da mostra leva em conta a quantidade de memória e diz-lhe que é um endereço ilegal (Bug de Software).

Em resumo:

  • Use o comando show region para verificar se o endereço verificado pelo erro de barramento está dentro dos intervalos de endereço usados pelo roteador.

  • Se o endereço cai dentro de um intervalo de endereço virtual, substitua o hardware que corresponde a esta escala.

  • Se o endereço não cai dentro de um intervalo de endereço virtual, use a ferramenta Output Interpreter (clientes registrados somente) para descodificar a saída das pilhas da mostra ou do comando do Suporte técnico da mostra (do modo enable) e para identificar o Bug do Software da Cisco IOS que está causando o erro de barramento.

  • Considere seriamente a instalação da versão de manutenção mais recente do treinamento de Cisco IOS Software que está sendo executado no momento.

Tipos especiais de travamentos por erro de barramento

Um tipo especial de erro de travamento de barramento é quando o travamento é causado por um PC (contador de programa) corrompido. O valor de PC é o local de instrução que o processador estava executando quando o erro de barramento ocorreu. Quando um erro de barramento causado por um PC corrompido ocorre, o seguinte mensagem aparece no console:

%ALIGN-1-FATAL: Corrupted program counter 

  pc=0x0, ra=0x601860BC, sp=0x60924540, at=0x60224854

Neste caso, o PC pulou para o endereço 0x0 (provavelmente por causa de um ponteiro nulo), mas não é onde a instrução está localizada. Isso é um problema de software, portanto, é necessário verificar com o comando show region.

Em outras plataformas RISC (Cisco 3600, 4500 e assim por diante), você receberá uma exceção SegV ao saltar para um PC ilegal e não um erro de barramento.

Um outro tipo de ruído elétrico de erro de barramento que ocorre de vez em quando é quando o valor PC é igual ao valor de endereço. Por exemplo:

System returned to ROM by bus error at PC 0x606B34F0, address 0x606B34F0

Do arquivo crashinfo (informaçoes de travamento):

Unexpected exception, CPU signal 10, PC = 0x606B34F0
   
  $0 : 00000000, AT : A001A24A, v0 : 00000000, v1 : 00000000
  a0 : 00000000, a1 : 429CC394, a2 : 00000000, a3 : 62544344
  t0 : 6069F424, t1 : 3400FF00, t2 : FFFFFFFB, t3 : 00000000
  t4 : 606B8E68, t5 : 80000000, t6 : AA5C1022, t7 : 62FDE9D4
  s0 : 62300000, s1 : 6281A1B8, s2 : 80007E20, s3 : 00000001
  s4 : 00000001, s5 : 00000000, s6 : 62310000, s7 : 62544344
  t8 : 62FDEA1C, t9 : 0D0D0D0D, k0 : 623079C0, k1 : 00000014
  gp : 620B9E20, sp : 61E7E300, s8 : 00000000, ra : 606B8E68
  EPC : 606B34F0, ErrorEPC : 606B8E68, SREG : 3400FF02
  Cause 00004018 (Code 0x6): Instruction Bus Error exception
   
  -Traceback= 606B34F0 606B8E68

Observe que o valor de registro k1 é 0x14 (hexadecimal) que é igual a 20 no decimal. Isto aponta a uma exceção da paridade de cache. Neste caso particular, o erro de paridade não é segurado corretamente e está sendo mascarado por um erro de barramento. O roteador pode falhar devido a um erro de barramento de software na função que manipula uma Exceção de Paridade de Cache.

Você deve considerar esse travamento como um erro de paridade normal da memória do processador e seguir as recomendações constantes de PMPEs (Erros de paridade da memória do processador).

Você também deve considerar a atualização da versão do software Cisco IOS para uma versão que tenha uma correção CSCdv68388 – "Altere o controlador de exceção de erro de cache para que continue e não falhe", a qual foi retificada desde o Cisco IOS, Versão12.2(10).

Técnicas de Troubleshooting para Loops de Inicialização de Exceção do Erro de Barramento

Esta seção centra-se sobre técnicas do Troubleshooting geral para laços da bota da exceção de erro de barramento:

  • O Cisco IOS Software carregado não apoia o hardware instalado

  • Falha de software

  • Hardware mal encaixado

  • Falha do hardware

O Cisco IOS Software carregado não suporta o hardware instalado

Verifique que todas as placas de rede estão apoiadas pelo Cisco IOS Software. O Software Advisor (clientes registrados somente) dá-lhe as versões mínimas do Cisco IOS Software necessárias para o hardware. Verifique também se a imagem de flash de inicialização oferece suporte para o hardware instalado caso você possua um roteador com suporte para uma imagem de inicialização, como um Cisco 7200 ou 7500 Series Router.

Falha de software

Em 2600 e 3600 Router, a memória de E/S do roteador é configurável como uma porcentagem da memória principal. Se os ajustes da memória de E/S são impróprios para os módulos de rede instalados ou o WAN Interface Card (WIC), a plataforma de 2600/3600 pode ter o booting do problema e pode causar um crash com erros de barramento.

Se uma alteração de configuração de software tem sido feita recentemente, e o roteador está em um loop de inicialização, um Bug de Software pode causar esta edição.

Se o roteador não pode carreg acima, você pode contornear a configuração para identificar se aquela está causando a edição. Siga estes passos:

  1. Quebre no ROMMON enviando a sequência de break ao roteador durante os primeiros 60 segundos da bota acima.

  2. Do monitor de ROM, use o comando confreg mudar o registro de configuração a um ajuste, tal como 0x2142, para ignorar a configuração do roteador:

    rommon 1 > confreg 0x2142
    
    You must reset or power cycle for new config to take effect
    
    rommon 2 > reset

Se as botas do roteador sem alguns erros, há um problema de configuração que causa o problema. Verifique se a sua configuração é suportada no Cisco IOS Software e pelo hardware. Se é apoiada, use o Bug Toolkit (clientes registrados somente) para identificar todos os Bug de Software que você puder experimentar. Dê a consideração grave a instalar a maioria de versão de manutenção recente do trem de Cisco IOS Software que você está executando atualmente.

Hardware mal encaixado

Se você está experimentando um loop de inicialização da exceção de erro de barramento, pode ser causado pelo hardware mal fixado. Para Plataformas mais baixo da gama tais como o 3600 ou 4000 Router, assente os módulos de rede/processadores de rede.

Para plataformas avançadas tais como os 7200 ou 7500 Router, assente o processador, o VIP, os adaptadores de porta, ou a placa de linha que é recarregar devido a uma exceção de erro de barramento.

Falha do hardware

A informação contida no erro de barramento não ajuda a isolar o hardware. Portanto, é importante remover e reinserir as placas para encontrar o hardware com problema. Estão aqui algumas etapas recomendadas para isolar o problema:

/image/gif/paws/7949/flow1.jpg

**Se o roteador não passar por loop contínuo depois de seguir os passos para Troubleshooting acima, então o problema pode ter sido causado por um módulo de rede mal fixado. É recomendado que você monitore o roteador por 24 horas para certificar-se de que o roteador continua a funcionar sem apresentar o problema novamente.

Informação a serem coletadas se você abre um pedido do serviço

Se você ainda precisa o auxílio após ter seguido os passos de Troubleshooting acima e o quer abrir um caso com Suporte técnico de Cisco, seja certo incluir a informação seguinte para pesquisar defeitos um erro de barramento ou uma exceção de erro de barramento:
  • Troubleshooting executado antes da abertura do caso
  • mostre o Suporte técnico output (se possível, no modo enable)
  • mostrar registro de saída ou capturas de tela do console, se disponível
  • arquivo de informação de travamento (se estiver presente e não tiver sido incluído ainda na saída do show technical-support)
  • mostre a região output (se não já incluído no Suporte técnico da mostra output)
Anexe os dados coletados à sua ocorrência em formato de texto simples descompactado (.txt). Você pode anexar informações para o seu caso, carregando-o com o uso da Case Query Tool (somente clientes registrados). Se você não puder acessar a ferramenta Case Query, você pode anexar informações relevantes para o seu caso, enviando-as para attach@cisco.com com o número de seu caso na linha de assunto de sua mensagem.

Nota: Não recarregue manualmente ou ciclo de energia o roteador antes de recolher a informação acima a menos que exigido para pesquisar defeitos uma exceção de erro de barramento como esta pode fazer com que a informação importante seja perdida que é precisada determinando a causa de raiz do problema.

Discussões relacionadas da comunidade de suporte da Cisco

A Comunidade de Suporte da Cisco é um fórum onde você pode perguntar e responder, oferecer sugestões e colaborar com colegas.


Informações Relacionadas


Document ID: 7949