Roteadores : Roteadores Cisco 7200 Series

Erros de Paridade de Memória de Processador (PMPEs)

22 Maio 2008 - Tradução Manual
Outras Versões: Versão em PDFpdf | Tradução por Computador (29 Julho 2013) | Inglês (31 Janeiro 2006) | Feedback


Interativo: Este documento oferece uma análise personalizada do seu dispositivo Cisco.


Índice

Introdução
Pré-requisitos
     Requisitos
     Componentes Usados
     Convenções
Identificação de Erro de Paridade
Erro Crítico de Paridade de Software versus de Hardware
Isole o Problema
     Plataformas Cisco 4500 e 4700
     Plataformas Route/Switch Processor (RSP), Network Processing Engine (NPE) e Route Processor (RP)
     Processador de Interface Versátil
Ações Recomendadas
Informações a Serem Coletadas se uma Solicitação de Serviço da TAC for Aberta
Discussões relacionadas da comunidade de suporte da Cisco
Informações Relacionadas para mais elementos sobre os erros de paridade de sofware.

  • Erros de paridade de hardware

    Estes erros ocorrem quando aparecem dados corrompidos por causa de um chip ou placa com defeito. Nesse caso, será necessário encaixar novamente ou substituir o componente afetado, em geral implica em trocar o chip de memória ou a placa. Existe um erro de paridade de hardware quando vários erros de paridade ocorrem no mesmo endereço. Existem casos mais complicados e de identificação mais difícil. De uma forma geral, mais de um erro de paridade em uma região específica da memória em um período de tempo relativamente curto pode ser considerado um erro de paridade.

  • Existem estudos mostrando que os erros de software são 10 a 100 vezes mais freqüentes do que os erros de hardware. Portanto, a Cisco recomenda enfaticamente aguardar a ocorrência de um segundo erro de paridade antes de providenciar substituições. Isso reduz fortemente o impacto em sua rede.

    Isole o Problema

    Um roteador tem memória em locais diferentes. Teoricamente, qualquer local da memória pode ser afetado pelo erro de paridade, mas a maioria dos problemas de memória ocorre na memória RAM dinâmica (DRAM) ou na RAM compartilhada (SRAM). Dependendo da plataforma, a seguir se explica como é possível descobrir qual local da memória foi afetado e, caso tenha sido um erro de paridade de hardware, qual parte deve ser substituída.

    Plataformas Cisco 4500 e 4700

    Nas plataformas Cisco 4500 e 4700, o arquivo de informação de travamento não se encontra disponível para versões anteriores a do Cisco IOS® Software Release 12.2(10) e 12.2(10)T.

    Uma maneira de descobrir onde ocorreu o erro é observar a “razão da reinicialização” nos registros do console e na saída do comando show version:

    • Erro de paridade em DRAM

      Se você não recarregou manualmente o roteador após o travamento, a saída show version terá a seguinte aparência:

      System restarted by processor memory parity error at PC 0x601799C4,
       address 0x0
      System image file is "flash:c4500-inr-mz.111-14.bin", booted via flash 

      Se o arquivo de informações de travamento for disponível, ou se os registros do console tiverem sido capturados, será possível ver alguma coisa parecida com o aviso seguinte:

      *** Cache Error Exception ***
       Cache Err Reg = 0xa0255c61
       data reference, primary cache, data field error , error on SysAD Bus
       PC = 0xbfc0edc0, Cause = 0xb800, Status Reg = 0x34408007 

      a repetida ocorrência de erros de paridade na DRAM indica que a DRAM ou o chassis têm defeitos. Se o chassis foi removido recentemente, ou se tiver havido alguma mudança de configuração no hardware, instale novamente os chips da DRAM para resolver o problema. Caso contrário, substitua a DRAM como primeira providência. Isto deve resolver muitos erros de paridade. Se o roteador ainda assim travar, substitua o chassis.

    • Erro de paridade em SRAM

      Se você não recarregou manualmente o roteador após o travamento, a show version saída do comando terá a aparência seguinte:

      System  restarted by shared memory parity error at PC 0x60130F40
      System image file is "flash:c4500-inr-mz.111-14.bin", booted via flash

      Se o arquivo de informações de travamento for disponível, ou se os registros do console tiverem sido capturados, será possível ver alguma coisa parecida com o aviso seguinte:

      *** Shared Memory Parity Error ***
      shared memory control register= 0xffe3
      error(s) reported for: CPU on byte(s): 0/1 

      ou

      %PAR-1-FATAL: Shared memory parity error
      shared memory status register= 0xFFEF
      error(s) reported for: CPU on byte(s): 0/1 2/3 

      ou

      *** Shared Memory Parity Error ***
      shared memory control register= 0xffdf
      error(s) reported for: NIM1 on byte(s): 0/1  2/3

    Observação:

    • Se o erro for relatado como sendo da CPU, substitua a SRAM.

    • Se o erro for relatado como sendo da NIM(x), substituao módulo de rede no slot (x). A SRAM alocada ao slot (x) pode também ser afetada. Neste caso, substitua a SRAM.

      A ocorrência repetida de erros de paridade na SRAM indica que os chips da SRAM têm defeito, ou que um módulo da rede escreveu uma paridade inválida na SRAM. Se o chassis for removido recentemente, ou se tiver havido alguma mudança de configuração no hardware, instale novamente os módulos da rede e os chips da SRAM para resolver o problema. Caso contrário, verifique onde o erro é relatado nos registros do console (veja a saída do exemplo acima).

    Plataformas Route/Switch Processor (RSP), Network Processing Engine (NPE) e Route Processor (RP)

    Assim como a série Cisco 4000, o problema pode ser devido a defeito na DRAM ou SRAM para essas plataformas. O problema pode também estar ocorrendo por causa de um processador com defeito (RP, RSP ou NPE). O Cisco 7000 e 7500 também podem relatar erros de paridade gerados por um processador de interface (legado de xIP ou VIP) defeituoso/mal-encaixado.

    Verifique se alguma das mensagens de erro sobre informações de travamento ou registros de console é:

    erro de paridade em DRAM ou SRAM (MEMD).

    Para RP, RSP e NPE geralmente aparecerá alguma coisa como:

    Error: primary data cache, fields: data, (SysAD)
    virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000
    endereço virtual correspondente a main:data,, cache word 0

    ou simplesmente:

    Error: primary data cache, fields: data, SysAD
    phy21:3 0x201880, va14:12 0x1000, addr 63E01880
             

    o que indica um problema no RSP propriamente dito. Se o problema ocorrer apenas uma vez, provavelmente trata-se de uma ocorrência transitória.

    Erro de Paridade Proveniente de SRAM

    Para o RSP a mensagem pode ter a seguinte aparência:

    %RSP-3-ERROR: MD error 0000008000000200
    %RSP-3-ERROR: QA parity error (bytes 0:3) 02
    %RSP-3-ERROR: MEMD parity error condition
    %RSP-2-QAERROR: reused or zero link error, write at addr 0100 (QA)
        log 22010000, data 00000000 00000000
    %RSP-3-RESTART: cbus complex 

    ou

    %RSP-3-ERROR: CyBus error 01
    %RSP-3-ERROR: read data parity
    %RSP-3-ERROR: read parity error (bytes 0:7) 20
    %RSP-3-ERROR: physical address (bits 20:15) 000000 

    Se não houver indicação de outro processador de interface que escreva uma paridade inválida na SRAM (por exemplo, mensagens de erro VIP2-1-MSG), o motivo mais provável para o erro de paridade será a própria SRAM. Neste caso, substitua o RSP.

    Se outras mensagens de erro indicarem que um processador de interface escreve paridade inválida, o problema poderá ser uma placa defeituosa ou instalada incorretamente.

    Processador de Interface Versátil

    Se aparecer o aviso "%VIP2-1-MSG: slot(x)" nos logs ou nos arquivos de informação de travamento, consulte Solução de problemas de travamento VIP.

    Ações Recomendadas

    Na primeira ocorrência de um erro de paridade, não será possível diferenciar entre um erro de paridade temporário ou permanente. Com base na experiência a maioria dos erros de paridade são erros de paridade de software e podem usualmente ser desprezados. Se recentemente algum hardware foi mudado ou alguma caixa tiver sido movida, tente reinstalar a parte afetada (DRAM, SRAM, NPE, RP, RSP ou VIP). Ocorrências de paridade múltipla freqüentes significam hardware com defeito. Substitua as partes afetadas (DRAM, RSP, VIP ou placa-mãe) com ajuda das instruções mencionadas nesse instrumento.

    Informações a Serem Coletadas se uma Solicitação de Serviço da TAC for Aberta

    Se você ainda precisar de assistência depois de seguir as etapas de solução de problemas acima e quiser criar uma solicitação de serviço com o TAC Cisco, certifique-se de incluir as informações a seguir:

    • Solução de problemas executada antes que a solicitação de serviço seja aberta.

    • comando show technical-support de saída (no modo enable, se possível);

    • comando show log de captura de saída ou do console, se disponíveis;

    • arquivo de informações de travamento (se estiver presente e não tiver sido incluído no comando show technical-support de saída, existindo arquivos de múltiplos travamentos, inclua todos).

    • Número de recargas devido a erros de paridade de memória de processador que você tenha visto e quando eles ocorreram.

    Gentileza anexar os dados coletados sobre seu caso em formato de texto simples, não zipado (.txt). Faça o upload das informações na solicitação do serviço por meio da Ferramenta de Solicitação de Serviço do TAC (clientes registrados somente) . Se não for possível acessar a Ferramenta de Solicitação de Serviço, anexe as informações à sua solicitação de serviço, enviando-a para attach@cisco.com, com o número da solicitação de serviço na linha de assunto de sua mensagem.

    Observação: Não recarregue nem ligue-desligue manualmente o roteador antes de coletar as informações acima, a menos que seja necessário solucionar o erro de paridade de memória de processador, porque isso pode causar a perda de informações importantes e necessárias para a determinação da raiz do problema.


    Discussões relacionadas da comunidade de suporte da Cisco

    A Comunidade de Suporte da Cisco é um fórum onde você pode perguntar e responder, oferecer sugestões e colaborar com colegas.


    Document ID: 6345