Roteadores : Roteadores Cisco 12000 Series

Troubleshooting de Hardware para o Cisco 12000 Series Internet Router

12 Agosto 2015 - Tradução por Computador
Outras Versões: Versão em PDFpdf | Inglês (22 Abril 2015) | Feedback


Índice


Introdução

Tempo e recursos valiosos geralmente são gastos substituindo hardwares que, na realidade, funcionam corretamente. Este documento ajuda a pesquisar defeitos problemas de hardware comuns com o Cisco 12000 Series Internet Router e fornece ponteiros identificando mesmo se a falha está no hardware.

Nota: Este documento não inclui falhas relacionadas ao software, exceto para aquelas que geralmente são confundidas como problemas de hardware.

Nota: Adicionalmente, este documento não cobre as etapas do Troubleshooting de hardware para as placas de linha do Cisco 12000 Series (LC). Troubleshooting de Hardware, para as Falhas nas Placas de Linha do Cisco 12000 Series Internet Router, detalha os passos a serem seguidos para analisar um problema de hardware com uma placa de linha e/ou identificar um problema com uma placa de linha, o que pode ser interpretado erroneamente como uma falha de hardware.

Pré-requisitos

Requisitos

Os leitores deste documento devem estar cientes da seguinte informação:

Se você sentir que o problema pode estar relacionado a uma falha do hardware, este documento pode ajudar a identificar a causa da falha.

Componentes Utilizados

As informações neste documento são baseadas nas versões de software e hardware abaixo.

  • Todos os 12000 Series Internet Routers, incluindo 12008, 12012, 12016, 12404, 12406, 12410 e 12416.

  • Todas as versões de software de Cisco IOS� que apoiam o Cisco 12000 Series Internet Router.

As informações neste documento foram criadas a partir de dispositivos em um ambiente de laboratório específico. Todos os dispositivos utilizados neste documento foram iniciados com uma configuração (padrão) inicial. Se você estiver trabalhando em uma rede ativa, certifique-se de que entende o impacto potencial de qualquer comando antes de utilizá-lo.

Compatibilidade de hardware-software e requisitos de memória

Sempre que você instala uma nova placa de linha, um módulo, ou uma imagem do software de Cisco IOS�, é importante verificar que o roteador tem bastante memória, e que o hardware e software é compatível com as características você deseja se usar.

Execute os seguintes passos recomendados para verificar a compatibilidade de hardware e de software e os requisitos de memória:

  1. Utilize a ferramenta Software Advisor (somente clientes registrados) para escolher o software para o seu dispositivo de rede.

    Dicas:

    • O suporte de software para a seção do hardware ajuda-o a verificar se os módulos e placa instalados no roteador estão apoiados pela versão de Cisco IOS Software desejada.

    • O suporte de software para a seção das características ajuda-o a determinar a imagem do Cisco IOS Software necessária escolhendo os tipos de características que você deseja executar.

  2. Use a área do software da transferência para verificar a quantidade mínima de memória (RAM e flash) exigida pelo Cisco IOS Software, e/ou transfira a imagem do Cisco IOS Software. Para determinar a quantidade de memória (RAM e Flash) instalada em seu roteador, consulte a seção Requisitos de memória sobre Como Escolher Um Cisco IOS Software Release.

    Dicas:

  3. Se você determinar que uma atualização do Cisco IOS Software é necessária, siga o procedimento de instalação e atualização de software do Cisco 12000 Series Router.

    Dica: Para obter informações sobre como recuperar um Cisco 12000 Series Router preso em ROMmon (rommon # > prompt), consulte o Procedimento para Recuperação de ROMmon para o Cisco 12000.

Convenções

Para obter mais informações sobre convenções de documento, consulte as Convenções de dicas técnicas Cisco.

Componentes do Cisco 12000

Os componentes que fazem parte do chassi do Cisco 12000 Series Internet Router incluem:

  • Chassi

  • SFCs (placas de tela do Switch)

  • Clock Scheduler Cards (CSCs)

  • MBUS (Barramento de Manutenção)

  • Fontes de alimentação

  • Ventiladores - conjunto de ventiladores

  • Placas de alarme

O próprio chassi não tem componentes eletrônicos, portanto muito raramente ele é a causa de problemas relacionados a hardware a menos que alguns conectores de backplane estejam tortos ou quebrados. Fontes de energia, SFCs, CSCs, placa de alarme e conjunto de ventilador possuem componentes eletrônicos, de forma que podem ser afetados por problemas de hardware. Em geral, os problemas de hardware com esses componentes resultam em mensagens de erro ou falhas de funcionamento de roteador. Para obter uma explicação detalhada de todos esses componentes e como eles interagem em conjunto, consulte Cisco 12000 Series Internet Router Architecture (Arquitetura do Cisco 12000 Series Internet Router).

Identificando o problema

Lendo as informações abaixo e seguindo as etapas de Troubleshooting, é possível determinar se os problemas que estão ocorrendo com o roteador são relacionados a hardware.

Capturação de informações

A primeira coisa que precisa ser feita é identificar a causa do travamento do roteador ou os erros do console que estão sendo exibidos. Para ver que parte possivelmente está defeituosa, é essencial que a saída dos seguintes comandos seja obtida:

  • show context summary

  • show logging

Juntamente com esses comandos show específicos, você também deve coletar as seguintes informações:

  • Registros de console e/ou informações de Syslog: Esses podem ser essenciais para determinar a questão de origem em caso de ocorrência de sintomas múltiplos. Se o roteador se estabelece para enviar logs a um servidor de SYSLOG, você pode ver alguma informação no que aconteceu. Nos registros de console, o ideal é ser conectado diretamente ao roteador na porta do console usando o registro ativado.

  • Show technical-support: O comando show technical-support é uma compilação de vários comandos diferentes, incluindo show version, show running-config e show stacks. Quando um roteador enfrenta problemas, geralmente o coordenador do Centro de Assistência Técnica da Cisco (TAC) pede essa informação. É importante coletar o show technical-support antes de fazer uma recarga ou desligar e religar, já que essas ações podem fazer com que todas as informações sobre o problema sejam perdidas.

Sintomas enganadores

Há algumas edições que podem ser interpretadas mal como problemas de hardware, quando, de facto, não são. Alguns dos problemas mais comuns são ocasiões em que o roteador pára de responder ou “trava”. Outro é uma falha após uma nova instalação de hardware. É pouco comum que qualquer desses sintomas seja causado por um componente do chassi. A tabela abaixo relaciona as etapas de sintomas, explicações e Troubleshooting dessas questões normalmente mal interpretadas:

Sintoma Explicação/Troubleshooting
O Cisco 12000 trava durante a operação normal Normalmente, a causa é um problema no software, mas também pode ser o hardware. Veja que roteador do Troubleshooting pendura para esta edição.
Uma nova placa de linha não foi reconhecida Utilize a ferramenta Software Advisor (somente para clientes registrados) para determinar se a nova placa é compatível com a versão atual do Cisco IOS Software. Se a LC for suportada, então configure o comando service upgrade all, salve a configuração com o comando copy run start e desligue e religue o roteador. Às vezes uma recarga não é suficiente, mas um ciclo de potência corrige o problema. Se a nova placa não for suportada em sua versão atual do Cisco IOS Software, verifique se você possui memória de roteador suficiente instalada na placa de linha antes de atualizar a versão do Cisco IOS Software. Para o Release 12.0(21)S, são necessários 256 MB de memória de roteamento, especialmente se o Border Gateway Protocol (BGP) estiver configurado com muitos correspondentes e muitas rotas.
A utilização CPU está sendo executado muito altamente Embora existam problemas de hardware que possam causar isso, é muito mais provável que o roteador esteja mal configurado ou que algo na rede esteja causando o problema. Consulte Troubleshooting de Alta Utilização da CPU em Cisco Routers para solucionar esse problema.
Erros de alocação de memória vistos no GRP (Gigabit Route Processor) Erros de alocamento de memória quase nunca são causados por problemas de hardware. Dicas para solução de problemas de erros de alocação de memória encontram-se na página Troubleshooting Memory Problems (Solucionando problemas de memória).
Um número crescente de quedas de entrada pode ser visto na saída do comando show interfaces Isso nunca ocorre devido a um problema de hardware com o roteador. Consulte Troubleshooting Input Drops on the Cisco 12000 Series Internet Router (Troubleshooting de Quedas de Entrada no Cisco 12000 Series Internet Router) para fazer Troubleshooting deste problema.
Um número de aumento de mensagens ignoradas é visto na saída do comando show interfaces É muito provável que uma das placas de ingresso esteja sobrecarregada. Não siga as etapas detalhadas em erros ignorados do Troubleshooting e nenhuma gota da memória no Cisco 12000 Series Internet Router.
Os Mensagens de Erro do banco de informação de encaminhamento (FIB) são considerados no GRP Use a Ferramenta do Decodificador de Mensagens de Erro da Cisco (apenas para clientes registrados) para encontrar informações sobre o significado desta mensagem de erro. Alguns deles ponto a um problema de hardware na placa de linha ou em uma placa switch fabric (SFC ou CSC); outro indicam um Bug do Software da Cisco IOS ou um problema de hardware em outro parte do roteador. Alguns MENTEM e as mensagens CEF-relacionadas são explicadas em pesquisar defeitos Mensagens de Erro relacionados ao CEF.
As mensagens relacionadas à Comunicação entre Processos (IPC) são visualizadas no GRP. É possível usar a ferramenta Cisco Error Message Decoder (somente clientes registrados) para encontrar informações sobre o significado dessa mensagem de erro. Alguns deles ponto a um problema de hardware na placa de linha ou em uma placa switch fabric (SFC ou CSC); outro indicam um Bug do Software da Cisco IOS ou um problema de hardware em outro parte do roteador. Algumas mensagens relacionados ao IPC são explicadas no Cisco 12000, em 10000, em 7600, e em 7500 Series Router: Pesquisando defeitos mensagens IPC-3-NOBUFF.
As mensagens de erro a seguir são vistas no GRP:
%GRP-3-FABRIC_UNI: Unicast send timed out (1)
%GRP-3-COREDUMP: Core dump incident on slot 1, 
error: Fabric ping failure
As falhas de ping de construção ocorrem quando uma placa de linha ou o GRP secundário não respondem a uma requisição de ping de construção do GRP preliminar sobre o Switch Fabric. Essas falhas são um sintoma de um problema que deve ser investigado. Você pode encontrar mais informações sobre este problema em Troubleshooting de Intervalos de e Falhas de Fabric Ping no Cisco 12000 Series Internet Router.
A seguinte mensagem de erro é vista no GRP:
%GRP-3-UCODEFAIL: Download failed to slot 5
A imagem transferida por download para a placa de linha foi rejeitada por essa placa. Você pode tentar recarregar o microcódigo, usando o comando de configuração de recarga de microcódigo. Se a mensagem de erro for exibida novamente, tente atualizar a ROM do MBUS Agent, a RAM do MBUS Agent e o Fabric-downloader usando o comando upgrade all slot, conforme explicado em Upgrading Line Card Firmware on a Cisco 12000 Series Internet Router (Atualizando o firmware da placa de linha em um Cisco12000 Series Internet Router). Você também pode consultar o sintoma “A new line card is not recognized” nesta tabela.

Troubleshooting Passo a Passo

Troubleshooting do Switch Fabric (CSC e SFC)

O GRP e as placas de ingresso são conectados por meio do Switch Fabric de barras cruzadas, que fornecerá um caminho físico de alta velocidade para a maior parte da comunicação entre placas. Entre as mensagens passadas entre o GRP e as placas de linha sobre o Switch Fabric são os pacotes reais incluídos que estão sendo distribuídos e recebidos, informação de encaminhamento, estatísticas de tráfego, e a maioria Gerenciamento e de informação de controle. Portanto, é importante para o GRP assegurar-se de que este caminho esteja operando corretamente.

Sintomas de tela de Switch

Você sempre deverá suspeitar do Switch Fabric de entrada para a saída de dados caso veja mensagens de erro semelhantes relacionadas a essa estrutura nos logs:

%FABRIC-3-CRC: Switch card 18

ou

%FABRIC-3-PARITYERR: To Fabric parity error was detected. Grant parity error Data = 0x2.
SLOT 1:%FABRIC-3-PARITYERR: To Fabric parity error was detected. 
Grant parity error Data = 0x1

As mensagens a seguir podem ou não ser devidas a um problema de hardware com o Switch Fabric:

05:21:11: %GRP-3-FABRIC_UNI: Unicast send timed out (2)
05:21:16: %GRP-3-FABRIC_UNI: Unicast send timed out (2)

Essas falhas são um sintoma de um problema que deve ser investigado. Mais informações sobre esse problema estão localizadas em Troubleshooting de Falhas de Tempos Limites e Falhas de Ping de Fabric no Cisco 12000 Series Internet Router.

Troubleshooting de Switch Fabric

Se uma falha do Switch Fabric é suspeitada, siga as etapas abaixo:

  1. Colete os dados.

    Lembre-se de que, ao conectar o LC, você deve fazer isso pelos MBUs, utilizando o comando attach. O comando execute-on depende do IPC (Inter-Process Communication) que vai sobre o Switch Fabric. Se você está tendo problemas com IPC (problemas de estrutura, Bug de Software, e assim por diante), os comandos que são executado remotamente através do Switch Fabric podem cronometrar para fora. Normalmente, para os comandos que geram uma quantidade razoável de saída, recomendamos anexar ao LC para executar o comando. O comando attach <slot #> sempre vai além de MBUS.

    • show controllers fia (no GRP)

    • attach <no. slot>, em seguida, show controllers fia e digite exit (repita para cada LC e para o GRP secundário)

    • mostre a controladores o pulso de disparo (no GRP)

    • mostre o log (procure eventos do Online Insertion and Removal (OIR) para explicar a alteração principal de CSC; procure erros relacionados à tela)

    • exibir resumo de log (procurar erros relacionados à tela)

    • show log slot <slot #>

  2. Analise dados

    Problemas de tela podem ocorrer devido a falhas em qualquer componente a seguir:

    • Plano do controle - GRP

    • Plano dos dados

    • Hardware Tofab LC

    • Placa mãe

    • CSCs/SFCs

    • Hardware do frfab LC

    Ao Troubleshoot de erros de tela, inicie procurando por padrões relacionados a quais componentes estão relatando tais erros. Por exemplo, combine a saída show controllers fia de todos os GRPs e LCs para verificar se há um padrão.

    Nota: Para o restante deste documento, quando nós dizemos o LC, isto refere todo o LC ou GRP.

Aumentando o número de CRC

Se você vê crc16s na saída do comando show controllers fia, é importante verificar se este número está incrementando. É muito importante correlacionar os dados do GRP principal e dos outros GRP/LCs. Se um LC ou uma placa switch fabric (CSC e/ou SFC) foram OIRed, você pode esperar ver alguns mensagens de erro de tela e algum crc16s. Porém, este número não deve ser aumentado posteriormente. Se o número estiver aumentando, será necessário substituir algumas peças por defeito de hardware.

Na saída abaixo, é possível ver o status do GRP principal e do LC no slot 2:

Router#show controllers fia 
Fabric configuration: Full bandwidth, redundant fabric
Master Scheduler: Slot 17  Backup Scheduler: Slot 16
From Fabric FIA Errors
-----------------------
redund fifo parity 0    redund overflow 0      cell drops 0         
crc32 lkup parity  0    cell parity     0      crc32      0         
Switch cards present    0x001F    Slots  16 17 18 19 20
Switch cards monitored  0x001F    Slots  16 17 18 19 20
Slot:     16         17         18         19         20
Name:    csc0       csc1       sfc0       sfc1       sfc2
       --------   --------   --------   --------   --------
los    0          0          0          0          0          
state  Off        Off        Off        Off        Off       
crc16  0          0          0          1345       0
To Fabric FIA Errors
-----------------------
sca not pres 0          req error     0          uni FIFO overflow 0         
grant parity 0          multi req     0          uni FIFO undrflow 0         
cntrl parity 0          uni req       0          crc32 lkup parity 0         
multi FIFO   0          empty dst req 0          handshake error   0         
cell parity  0
Router#attach 2
Entering Console for 4 port ATM Over SONET OC-3c/STM-1 in Slot: 2
Type "exit" to end this session
Press RETURN to get started!
LC-Slot2>
LC-Slot2>enable
LC-Slot2#show controllers fia
From Fabric FIA Errors
-----------------------
redund FIFO parity 0          redund overflow 0          cell drops 0         
crc32 lkup parity  0          cell parity     0          crc32      0         
Switch cards present    0x001F    Slots  16 17 18 19 20 
Switch cards monitored  0x001F    Slots  16 17 18 19 20 
Slot:     16         17         18         19         20
Name:    csc0       csc1       sfc0       sfc1       sfc2
       --------   --------   --------   --------   --------
Los    0          0          0          0          0          
state  Off        Off        Off        Off        Off       
crc16  0          0          0          1345       0
To Fabric FIA Errors
-----------------------
sca not pres 0          req error     0          uni fifo overflow 0         
grant parity 0          multi req     0          uni fifo undrflow 0         
cntrl parity 0          uni req       0          crc32 lkup parity 0         
multi fifo   0          empty DST req 0          handshake error   0         
cell parity  0
LC-Slot2#exit
Disconnecting from slot 2.
Connection Duration: 00:00:21
Router#
... 

Depois de ter analisado todos os comandos show, você pode gravar uma tabela semelhante:

hwts_12000_22281a.gif

Essa tabela indica que mais de uma placa de linha está relatando erros provenientes deste SFC1. Portanto, a primeira etapa seria alterar esse SFC. Os padrões de falha comuns e as ações recomendadas são as seguintes (uma etapa por vez até que o problema seja eliminado):

Dica: Sempre que uma substituição é recomendada, verifique primeiramente que o cartão está assentado corretamente (veja abaixo). Você SEMPRE deve recolocar a placa correspondente para ter certeza de que ela corretamente encaixada. Se, após a reinstalação da lâmina, os CRCs ainda produzirem incrementos, vá em frente e substitua peça.

  • Erros Frfab em mais de um LC na mesma placa de tela:

    1. Substitua a placa de tela no slot correspondente aos erros

    2. Substituir todas as placas de estrutura

    3. Substitua a placa-mãe

  • Erros Frfab de mais de uma placa de tela em um LC:

    1. Substituir LC

    2. Se os erros estão incrementando, substitua o mestre atual CSC

    3. Se os erros não estiverem sendo incrementados e o mestre atual for CSC0, substitua CSC1

Assentando as placas switch fabric

As placas switch fabric nos 12016 e nos 12416 não são fáceis de introduzir, e podem exigir um pouco da força. Se um dos CSCs for encaixado de forma incorreta, você pode ver a seguinte mensagem de erro:

%MBUS-0-NOCSC: Must have at least 1 CSC card in slot 16 or 17 
%MBUS-0-FABINIT: Failed to initialize switch fabric infrastructure

Você também pode receber esta mensagem de erro se há CSCs e SFCs assentados suficientes apenas para configurações de largura de banda de um quarto. Nesse caso, nem o Mecanismo 1 nem os LCs baseados em mecanismo maior serão inicializados.

Uma maneira segura de dizer se as placas estão adequadamente assentadas é verificar se há quatro luzes acesas no CSC/SFC. Se esse não for o caso, então a placa não está colocada corretamente.

Quando houver problemas relacionados à tela e os LCs não inicializarem, é importante verificar se todos os CSCs e SFCs necessários estão ajustados corretamente e ativados. Por exemplo, são necessários três SFCs e dois CSCs em um 12016 para se obter um sistema redundante de largura de banda total. Esses SFCs e apenas um CSC são necessários para obter-se um sistema não-redundante de largura de banda completo.

A saída dos comandos show version e show controllers fia informa qual configuração de hardware está atualmente sendo executada na caixa.

Router#show version 
Cisco Internetwork Operating System Software 
IOS (tm) GS Software (GSR-P-M), Experimental Version 12.0(20010505:112551)
Copyright (c) 1986-2001 by cisco Systems, Inc. 
Compiled Mon 14-May-01 19:25 by tmcclure 
Image text-base: 0x60010950, data-base: 0x61BE6000

ROM: System Bootstrap, Version 11.2(17)GS2, [htseng 180] 
EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) 
BOOTFLASH: GS Software (GSR-BOOT-M), Version 12.0(15.6)S, 
EARLY DEPLOYMENT MAINTENANCE INTERIM SOFTWARE

Router uptime is 17 hours, 53 minutes 
System returned to ROM by reload at 23:59:40 MET Mon Jul 2 2001 
System restarted at 00:01:30 MET Tue Jul 3 2001 
System image file is "tftp://172.17.247.195/gsr-p-mz.15S2plus-FT-14-May-2001"

cisco 12016/GRP (R5000) processor (revision 0x01) with 262144K bytes of memory. 
R5000 CPU at 200Mhz, Implementation 35, Rev 2.1, 512KB L2 Cache 
Last reset from power-on

2 Route Processor Cards 
1 Clock Scheduler Card 
3 Switch Fabric Cards 
1 8-port OC3 POS controller (8 POs). 
1 OC12 POS controller (1 POs). 
1 OC48 POS E.D. controller (1 POs). 
7 OC48 POS controllers (7 POs). 
1 Ethernet/IEEE 802.3 interface(s) 
17 Packet over SONET network interface(s) 
507K bytes of non-volatile configuration memory.

20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K). 
8192K bytes of Flash internal SIMM (Sector size 256K).
...
Router#show controller fia 
Fabric configuration: Full bandwidth nonredundant
Master Scheduler: Slot 17
...

Nós recomendamos que você lê a arquitetura do Cisco 12000 Series Internet Router: Switch Fabric para mais informação detalhada.

Erros de concessão de paridade e de solicitação

Você pôde experimentar os seguintes tipos de erros:

  • Dos logs do console ou da saída do comando show log:

    %FABRIC-3-PARITYERR: To Fabric parity error was detected. 
    Grant parity error Data = 0x2.
    SLOT 1:%FABRIC-3-PARITYERR: To Fabric parity error was detected. 
    Grant parity error Data = 0x1
    
  • A partir da saída do comando show controllers fia:

    Router#show controllers fia
    Fabric configuration: Full bandwidth, redundant fabric
    Master Scheduler: Slot 17     Backup Scheduler: Slot 16
    
    !-- Here you can see which CSC is the master CSC. 
    By default CSC1 in slot 17 is the master
     
    
    From Fabric FIA Errors
    -----------------------
    redund FIFO parity 0   redund overflow 0   cell drops 76
    
    !-- You may see some cell drops as well
    
    
    crc32 lkup parity  0    cell parity 0   crc32 0
    Switch cards present    0x001F    Slots  16 17 18 19 20
    Switch cards monitored  0x001F    Slots  16 17 18 19 20
    Slot:     16         17         18         19         20
    Name:    csc0       csc1       sfc0       sfc1       sfc2
           --------   --------   --------   --------   --------
    Los    0          0          0          0          0
    state  Off        Off        Off        Off        Off
    crc16  876        257        876        876        876
    
    !-- You will see some crc16
    
    
    To Fabric FIA Errors
    -----------------------
    sca not pres 0          req error     1          uni fifo overflow 0
    grant parity 1          multi req     0          uni fifo undrflow 0
    
    !-- Grant parity and/or Request error counter not 0
    
    
    cntrl parity 0          uni req       0          crc32 lkup parity 0
    multi fifo   0          empty DST req 0          handshake error   0
    cell parity  0
    

O Fabric Interface ASIC (FIA) reside no Gigabit Route Processor (GRP) e nas placas de linha (LC). Ele oferece uma interface entre o GRP/LC e placas de Switch Fabric (CSC/SFC), enquanto o Scheduler Control ASIC (SCA) reside apenas no CSC. Toma dos pedidos da transmissão das placas de linha e as edições concedem para alcançar a tela.

Erros de solicitação de hardware

  • erro do req - O SCA detectou um erro de paridade nas linhas do req

  • grant parity – O FIA detectou um erro de paridade nas linhas de concessão

A saída do comando show controllers fia pode ser usada para determinar se várias placas de ingresso estão relatando esses erros e se houve um switchover de CSC. Para obter essa saída de uma placa de linha específica, digite attach <nº do slot> e, em seguida, execute o comando show controller fia após o prompt LC-Slot aparecer.

Nota: Como explicado acima, o comando execute-on slot <slot -> show controllers fia não deve ser usado, desde que, caso o Cisco IOS Software for incapaz de segurar este erro, este comando falhará.

  • Erros de concessão em mais de um LC

    1. Substitua o CSC (veja a observação a seguir para saber qual deles deve ser trocado)

    2. Substitua a placa-mãe

  • Erros de concessão em um LC

    1. Substituir LC

    2. Substitua o CSC (veja a observação a seguir para saber qual deles deve ser trocado)

    3. Substitua a placa-mãe

Nota: Se as placas de linha múltiplas estão relatando que paridade da concessão ou erros de solicitação e a caixa ainda está funcionando, a seguir um CSC Switchover ocorreu. O CSC falho é o que atualmente é o CSC de backup (não o que está listado como "Master Scheduler" na saída show controller fia). Se “parado” é ao lado do título “dos erros de construção de FIA” ou “aos erros de construção de FIA”, ou se o roteador é já não tráfego de encaminhamento, a seguir um CSC Switchover não ocorreu e o failing CSC é esse alistado como o “agendador mestre”. À revelia, o CSC no SLOT 17 é o preliminar e o CSC no slot 16 é o backup.

No Roteadores que executa um Cisco IOS Software Release sem o reparo ao Bug de Software CSCdw10748 (clientes registrados somente), os erros de paridade da concessão podem conduzir a uma falha do nível de sistema. Com a correção para CSCdw10748, um roteador com CSCs redundantes não experimentará uma interrupção de nível de sistema se essa falha de hardware ocorrer. Será executado um failover no CSC de backup (caso haja um).

A correção do CSCdw10748 foi implementada nos Cisco IOS Software Releases 12.0(17)ST4, 12.0(21)S, 12.0(21)ST, 12.0(19)ST02, 12.0(19)S02, 12.0(17)S04, 12.0(18)S04 e 12.0(16)S07.

Outros Erros

Há outros erros que são menos frequentes e podem ser considerados na saída do comando show controllers fia:

Erros de FIA da tela

  • Erros de primeiro a entrar primeiro a sair (FIFO): Erro de excesso de dados redundantes. Isso ocorre se a pressão de retorno é interrompida, isto é, se o From Fab exercer uma pressão de retorno e o ASIC de SCA (Controle do programador) continuar fornecendo mais dados. Isso pode ser um problema com o CSC (Placa do Agendador de Relógio). Tentativa que assenta o cartão; se isso não trabalha, tente trocá-lo.

  • Erros do enlace serial: Isso é causado pela perda de sincronização por From Fab FIA com um dos SFCs (Placas de Tela de Switch) ou CSCs (Placas Escalonadoras de Relógio) (este erro não é gerado para uma placa retirada). O FIA possui um mecanismo integrado para aguardar antes de interromper o FIA por um determinado número de períodos de célula. Há um contador de perdas para cada placa. Segundo a informação recolhida de todos os GRP/LC, você deve poder determinar que parte é defeituosa.

Para erros de FIA da tela

  • Erros FIFO

    • uni FIFO overflow - excesso de fluxo FIFO unicast provocado por um problema entre o ASIC de gerenciamento de buffer (BMA)/Segmentação e remontagem de células (SAR) da Cisco e o FIA.

    • uni FIFO underflow - underflow de FIFO unicast causado pela concessão de SCA sem receber uma requisição do FIA.

    Nos erros de FIFO, é difícil determinar se o problema está na placa de linha ou na placa escalonadora (CSC). Se muitas placas apresentarem erros, o CSC deve ser o responsável.

  • Erro de Estrutura: sca not pre – O ASIC de controle do programador (SCA) foi perdido. A solução para esse erro é não fazer nada e aguardar até que as camadas superiores detectem que ocorreu um problema. A razão para não automaticamente comutar ao CSC redundante é que, neste nível, você não sabe mesmo se os dois SCA estão na sincronização. Se um cartão CSC foi obstruído dentro após a potência inicial sobre, as microplaquetas SCA não estão indo estar na sincronização. O Fabric Interface ASIC (FIA) reside no Gigabit Route Processor (GRP) e nas placas de linha (LC). Ele oferece uma interface entre o GRP/LC e placas de Switch Fabric (CSC/SFC), enquanto o Scheduler Control ASIC (SCA) reside apenas no CSC. Toma dos pedidos da transmissão das placas de linha e as edições concedem para alcançar a tela.

    ou

    %FIA-3-PARITYERR: To Fabric parity error was detected.
    %FIA-3-HALT: To Fabric Request parity error interrupt = 0x4

    A saída do comando show controllers fia pode ser usada para determinar se as placas de linha múltiplas relatam estes erros e se um CSC Switchover ocorreu. A fim obter esta saída de uma placa de linha específica, datilografe o entalhe do anexo nenhum: , e execute o comando show controller fia depois que a alerta do LC-entalhe aparece.

  • Erro de handshake BMA/CSAR: Isto deve ser acompanhado de um erro de paridade que deva indicar a razão do problema.

  • Erros de solicitação de software: Há outros erros no FIA que não fazem com que se torne parado ou se cause uma interrupção. Eles são chamados seletivamente uma vez por segundo e contados. No ao lado da tela, estes erros são erros de solicitação de software. Os seguintes erros são detectados:

    • req multi – destino único em uma solicitação de transmissão múltipla. O FIA envia esta célula para o destino. Não esqueça o defeito CSCdw05067 - show controller fia mostra várias requisições em ATM LCs com multicast. As placas de linha do Mecanismo ATM 0 (1xOC12 e 4x0C3) pode registrar alguns erros de "multissolicitação" da saída de comando show controller fia das placas de linha afetadas, em execução no tráfego distribuído de transmissão múltipla. Isso acontece com todo pacote multicast distribuído e comutado para uma única placa de linha de destino. É meramente superficial e não há perdas. A ação alternativa é desabilitar o interruptor da transmissão múltipla distribuída.

    • req. uni - múltiplos destinos em uma requisição unicast. O FIA cai nesta célula.

    • empty DST req – solicitação de destino vazia. O FIA cai nesta célula.

Troubleshooting do Maintenance BUS (MBUS)

Na inicialização inicial, o GRP preliminar usa o MBUS para instruir os módulos mbus nas placas de linha e nas placas de switch para pôr sobre seus cartões. O download de uma imagem construída à mão é feito para as placas de linha pelo MBUS. O MBUS também é usado para coletar números de revisão, informações ambientais e informações gerais de manutenção. Além disso, os GRPs trocam mensagens de redundância sobre MBUS, que reporta os resultados da arbitragem de GRP.

Os seguintes mensagens são inofensivos e esperados sob condições do roteador normal. Se você observar essas mensagens incompletas, não precisará tomar nenhuma medida.

%MBUS-6-GRP_STATUS: GRP in Slot 0 Mode = MBUS Secondary

ou

%MBUS-6-FIA_CONFIG: Switch Cards 0x1F (bit mask); Primary Clock CSC_1

Use a Ferramenta de decodificação de mensagem de erro (apenas para clientes registrados) para determinar se uma mensagem e esperada ou não e se alguma ação é necessária.

Se visualizar uma mensagem de "aviso de atualização" semelhante a:

%MBUS-0-DOWNREV: Fabric Downloader in slot 2; use 
"upgrade fabric-downloader" command to update the image

Certifique-se de que a versão do Downloader de Estrutura da placa de ingresso está sincronizada com a versão do software Cisco IOS atual, em execução no GRP principal. Você pode configurar toda a atualização do serviço, salvá-la e recarregar o roteador para sincronizar a RAM do agente MBUS, o Downloader Fab etc. Às vezes, uma recarga não é o bastante, mas o processo de reinicialização sempre funciona. Certifique-se de você ter bastante memória de rota na placa de linha para apoiar seu Cisco IOS Software Release.

Você pode encontrar mais informação em promover o firmware da placa de linha em um Cisco 12000 Series Router.

Para mais explicações sobre a finalidade do MBUS e de alguns Mensagens de Erro MBUS-relacionados, veja a arquitetura do Cisco 12000 Series Internet Router: Barramento de manutenção, fontes de alimentação e ventoinha, e placas de alarme.

Troubleshooting de Fontes de Alimentação e Ventiladores

O Cisco 12000 Series Router está disponível em um AC ou em uma configuração DC. Todas as fontes de alimentação têm compartilhamento de carga e são trocados ou removidos em operação.

Há alguns erros que reportaram baixa tensão e não deveria ser assim. Seja certo executar a imagem a mais atrasada do Cisco IOS Software Release que está disponível na área do software da transferência para obter livrada de todos os Bug de Software tensão-relacionados conhecidos que têm sido fixados entretanto.

Você pode encontrar alguns links interessantes para os tipos diferentes de chassis na arquitetura do Cisco 12000 Series Internet Router: Barramento de manutenção, fontes de alimentação e ventoinha, e placas de alarme.

Troubleshooting as Placas de Alarme

Há tipos diferentes de placas de alarme, dependendo do tipo de chassi do 12000. No Cisco 12008 e no 12016/12416, as placas de alarme alimentam os LCs; portanto, verifique se há pelo menos uma placa de alarme presente. O 12008 precisa de uma placa de alarme já que ela é integrada à placa escalonadora de relógio (CSC). O 12016 e o 12416 possuem slots para duas placas de alarme (para redundância). As duas placas de alarme não possuem zonas de serviço segmentadas como a fonte de alimentação DC em um 12016.

O Cisco 12404 suporta um Consolidated Switch Fabric Card que inclui o Switch Fabric, o alarme, e as funções do pulso de disparo e da programação em uma placa.

Você pode encontrar alguns links interessantes para os tipos diferentes de chassis no Cisco 12000 Series Internet Router: Placas de alarme.

Troubleshooting de Placas de Linha

O Troubleshooting de hardware para o documento do Line Card Failures do Cisco 12000 Series Internet Router explica as etapas para identificar e pesquisar defeitos as falhas da placa de linha. Pesquisar defeitos ruídos da placa no Cisco 12000 Series Internet Router fornece a informação de Troubleshooting para ruídos da placa.

Troubleshooting com as Mensagens de Erro de Paridade

O documento Cisco 12000 Series Internet Router Parity Error Fault Tree (Árvore de falha de erro de paridade do Cisco 12000 Series Internet Router) explica os passos para solucionar o problema e isolar uma parte ou componente com falha do Cisco 12000 Series Internet Router após você encontrar uma variedade de mensagens de erro de paridade.

Informações a serem coletadas se você abrir um pedido de serviço de TAC

Se você ainda precisa o auxílio após ter seguido os passos de Troubleshooting acima e o quer abrir um pedido do serviço (clientes registrados somente) com o tac Cisco, seja certo incluir a informação seguinte para pesquisando defeitos problemas de hardware no Cisco 12000 Series Internet Router:
  • saída de show log ou capturas de console mostrando os passos de Troubleshooting seguidos e a seqüência de inicialização durante cada passo
  • Troubleshooting de logs
  • Saída a partir do comando show technical-support
Anexe os dados coletados para o seu caso em um formato não compactado e texto simples (.txt). Você pode anexar a informação a seu caso transferindo arquivos pela rede o que usa a ferramenta do pedido do serviço (clientes registrados somente). Se você não pode alcançar a ferramenta do pedido do serviço, você pode enviar a informação em um anexo de Email a attach@cisco.com com seu número de caso na linha de assunto de sua mensagem para anexar a informação relevante para seu caso.

Nota: Não recarregue manualmente ou execute ciclo de força do roteador antes de coletar as informações acima, a menos que isso seja necessário, porque esse procedimento pode causar a perda de informações importantes necessárias para a determinação da causa raiz do problema.

Discussões relacionadas da comunidade de suporte da Cisco

A Comunidade de Suporte da Cisco é um fórum onde você pode perguntar e responder, oferecer sugestões e colaborar com colegas.


Informações Relacionadas


Document ID: 22281