Roteadores : Roteadores Cisco 7200 Series

Erros de paridade de memória de processador (PMPEs)

16 Janeiro 2016 - Tradução por Computador
Outras Versões: Versão em PDFpdf | Tradução Manual (22 Maio 2008) | Inglês (31 Dezembro 2015) | Feedback


Interativo: Este documento oferece análise personalizada do seu dispositivo Cisco.


Índice


Introdução

Este documento explica as causas de erros de paridade em roteadores Cisco e como resolvê-los.

Pré-requisitos

Requisitos

Cisco recomenda que você tem o conhecimento de como pesquisar defeitos ruídos elétricos de roteador.

Refira pesquisando defeitos ruídos elétricos de roteador para mais informação.

Componentes Utilizados

Este documento não se restringe a versões de software e hardware específicas.

As informações neste documento foram criadas a partir de dispositivos em um ambiente de laboratório específico. Todos os dispositivos utilizados neste documento foram iniciados com uma configuração (padrão) inicial. Se a sua rede estiver ativa, certifique-se de que entende o impacto potencial de qualquer comando.

Convenções

Consulte as Convenções de Dicas Técnicas da Cisco para obter mais informações sobre convenções de documentos.

Identifique um erro de paridade

Os erros de paridade de memória ocorrem no processador de interface de multicanal (MIPS) - Produtos baseado do processador como:

  • Series Router do Cisco 4500/4700

  • Cisco 7500 Series Router (RSP1, RSP2, RSP4, RSP8, VIP2-10, VIP2-15, VIP2-20, VIP2-40, VIP2-50)

  • Cisco 7000 Series Router (RSP7000)

  • Cisco 7200 Series Router (NPE-100, NPE-150, NPE-175, NPE-200, NPE-225, NPE-300)

  • Cisco 12000 Series Internet Router

Estão aqui algumas mensagens, que todas são relacionadas à detecção de paridade inválida em algum lugar no sistema (a lista não é exaustiva, mas contém a maioria de mensagens comuns):

  • No comando show version output:

    System restarted by processor memory parity error at PC 0x6014F7C0,
     address 0x0

    ou

    System restarted by shared memory parity error at PC 0x60130F40

    Se você tem a saída de um comando show version de seu dispositivo Cisco, você pode usar-se para indicar problemas potenciais e reparos. A fim usar-se , você deve ser um cliente registrado, ser entrado, e ter o Javascript permitido.

  • Nos console logs ou nos arquivos de informação de travamento:

    -  *** Cache Error Exception ***
       Cache Err Reg = 0xa401a65a
       data reference, primary cache, data field error , error on SysAD Bus
       PC = 0xbfc17950, Cause = 0x0, Status Reg = 0x3040d007
    
    
    -  Error: primary data cache, fields: data,
       virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000
       virtual address corresponds to main:data, cache word 0
                                      
                    Low Data   High Data  Par    Low Data   High Data  Par
       L1 Data  : 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89
                  2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8  
                                            
                    Low Data   High Data  Par    Low Data   High Data  Par
       Mem Data : 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89
                  2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8
    
    
    -  *** Shared Memory Parity Error ***
       shared memory control register= 0xffe3
       error(s) reported for: CPU on byte(s): 0/1
    
    -  %PAR-1-FATAL: Shared memory parity error
       shared memory status register= 0xFFEF
       error(s) reported for: CPU on byte(s): 0/1 2/3
    
    
    -  %RSP-3-ERROR: MD error 0000008000000200
       %RSP-3-ERROR: QA parity error (bytes 0:3) 02
       %RSP-3-ERROR: MEMD parity error condition
       %RSP-2-QAERROR: reused or zero link error, write at addr 0100 (QA) 
           log 22010000, data 00000000 00000000
       %RSP-3-RESTART: cbus complex
    
    
    -  %RSP-3-ERROR: CyBus error 01
       %RSP-3-ERROR: read data parity
       %RSP-3-ERROR: read parity error (bytes 0:7) 20
       %RSP-3-ERROR: physical address (bits 20:15) 000000
    
    -  %RSP-3-ERROR: MD error 00800080C000C000
       %RSP-3-ERROR: SRAM parity error (bytes 0:7) F0
       %RSP-3-RESTART: cbus complex

Erros de paridade de software x hardware

Há dois tipos dos erros de paridade:

  • Erros de paridade de software

    Estes erros ocorrem quando um nível de energia dentro das mudanças da microplaqueta (por exemplo, essa ou um zero). Quando providos pelo CPU, tais erros causam o sistema ou ao impacto (se o erro está em uma área que não seja recuperável) ou recuperam outros sistemas (por exemplo, um complexo CyBus reinicia se o erro estava na memória de pacotes (MEMD)). No caso de um erro de paridade suave, não há necessidade de trocar a placa ou qualquer um dos componentes. Veja a seção Informação Relacionada para obter informações adicionais sobre dos erros de paridade de software.

  • Erros de paridade difíciis

    Estes erros ocorrem quando há uma microplaqueta ou uma falha do placa que corrompam dados. Neste caso, você precisa de assentar ou substituir o componente afetado, que envolve geralmente umas trocas de chip de memória ou umas trocas de tabulero. Há um erro de paridade difícil quando os erros de paridade múltiplos ocorrem no mesmo endereço. Há mais casos complicados que são mais duros de identificar. Geralmente, se você vê mais de um erro de paridade em uma região específica de memória relativamente em um período curto, você pode considerá-la para ser um erro de paridade difícil.

Estudos mostram que os erros de paridade suave são de 10 a 100 vezes mais freqüentes que os erros de paridade difícil. Consequentemente, recomenda-o Cisco altamente esperar um segundo erro de paridade antes que você substitua qualquer coisa. Isto reduz extremamente o impacto em sua rede.

Isole o problema

Um roteador tem memória em locais diferentes. Teoricamente, qualquer local da memória pode ser afetado pelo erro de paridade, mas a maioria dos problemas de memória ocorre na memória RAM dinâmica (DRAM) ou na RAM compartilhada (SRAM). É baseado na plataforma, aqui como você pode encontrar que local de memória foi afetado, e, se despeja ser um erro de paridade difícil, que parte você deve substituir:

Plataformas Cisco 4500 e 4700

Nas plataformas 4500 e 4700 Cisco, o arquivo crashinfo (informaçoes de travamento) não está disponível nas versões mais cedo do que o Software Release 12.2(10) e 12.2(10)T de Cisco IOS�.

Uma maneira de encontrar onde o erro ocorreu é olhar do “a razão reinício” nos logs do console, e na saída do comando show version:

  • Erro de paridade no DRAM:

    Se você não recarregou manualmente o roteador depois que o impacto, as saídas de versão da mostra olha como este:

    System restarted by processor memory parity error at PC 0x601799C4,
     address 0x0 
    System image file is "flash:c4500-inr-mz.111-14.bin", booted via flash

    Se um arquivo crashinfo (informaçoes de travamento) está disponível, ou se os logs do console estiveram capturados, você pode igualmente ver qualquer outra coisa semelhante:

    *** Cache Error Exception *** 
     Cache Err Reg = 0xa0255c61 
     data reference, primary cache, data field error , error on SysAD Bus 
     PC = 0xbfc0edc0, Cause = 0xb800, Status Reg = 0x34408007

    A ocorrência repetida dos erros de paridade no DRAM indica que o DRAM ou o chassi são defeituoso. Se você removeu recentemente o chassi, ou se você executou quaisquer mudanças de configuração de hardware, assente os chip DRAM para resolver o problema. Caso contrário, substitua DRAM como um primeiro passo. Isto deve impedir os erros de paridade. Se o roteador ainda causa um crash, substitua o chassi.

  • Erro de paridade no SRAM:

    Se você não recarregou manualmente o roteador depois que o impacto, a saída do comando show version olha como este:

    System  restarted by shared memory parity error at PC 0x60130F40 
    System image file is "flash:c4500-inr-mz.111-14.bin", booted via flash

    Se um arquivo crashinfo (informaçoes de travamento) está disponível, ou se os logs do console estiveram capturados, você pode igualmente ver qualquer outra coisa semelhante:

    *** Shared Memory Parity Error *** 
    shared memory control register= 0xffe3 
    error(s) reported for: CPU on byte(s): 0/1

    ou

    %PAR-1-FATAL: Shared memory parity error 
    shared memory status register= 0xFFEF 
    error(s) reported for: CPU on byte(s): 0/1 2/3

    ou

    *** Shared Memory Parity Error *** 
    shared memory control register= 0xffdf 
    error(s) reported for: NIM1 on byte(s): 0/1  2/3

Nota:

  • Se o erro é relatado para o CPU, substitua o SRAM.

  • Se o erro for relatado para NIM(x), substitua o módulo da rede no slot (x). O SRAM atribuído ao slot(x) pode igualmente ser afetado. Neste caso, substitua o SRAM.

    Os erros de paridade repetida no SRAM indicam chip sram defeituosos, ou um módulo de rede defeituoso que escreva a paridade inválida no SRAM. Se você removeu o chassi recentemente, ou se você fez quaisquer mudanças de configuração de hardware, assente os módulos de rede e os chip sram para resolver o problema. Se não, verifique onde o erro é relatado nos logs do console (veja o exemplo de emissor acima).

Plataformas RSP (processador de rota/Switch), NPE (Network Processing Engine) e RP (processador de rota)

Como com o Cisco 4000 Series, o problema pode ser devido ao DRAM defeituoso ou ao SRAM para estas Plataformas. O problema pode igualmente ser devido a uma placa de processador defeituosa (RP, RSP ou NPE). O Cisco 7000 e os 7500 podem igualmente relatar os erros de paridade gerados por um processador de interface defeituoso ou ruim assentado (legado xIP ou VIP).

Verifique o arquivo crashinfo (informaçoes de travamento) e os logs do console para ver se há um destes Mensagens de Erro:

Erro de paridade em DRAM ou SRAM (MEMD)

Para o RP, o RSP e o NPE, você vê geralmente qualquer outra coisa semelhante:

Error: primary data cache, fields: data, (SysAD) 
virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000 
virtual address corresponds to main:data, cache word 0

ou simplesmente:

Error: primary data cache, fields: data, SysAD
phy21:3 0x201880, va14:12 0x1000, addr 63E01880

Isto indica um problema no RSP próprio. Se o problema ocorre somente uma vez, é o mais provavelmente uma edição transiente.

Erro de Paridade Proveniente de SRAM

Para o RSP, a mensagem pode olhar como esta:

%RSP-3-ERROR: MD error 0000008000000200 
%RSP-3-ERROR: QA parity error (bytes 0:3) 02 
%RSP-3-ERROR: MEMD parity error condition 
%RSP-2-QAERROR: reused or zero link error, write at addr 0100 (QA) 
    log 22010000, data 00000000 00000000 
%RSP-3-RESTART: cbus complex

ou

%RSP-3-ERROR: CyBus error 01 
%RSP-3-ERROR: read data parity 
%RSP-3-ERROR: read parity error (bytes 0:7) 20 
%RSP-3-ERROR: physical address (bits 20:15) 000000

Se não há nenhuma indicação de um outro processador de interface que escreva a paridade inválida no SRAM (por exemplo, Mensagens de Erro VIP2-1-MSG), a razão mais provável para o erro de paridade é o SRAM próprio. Neste caso, substitua o RSP.

Se outros Mensagens de Erro indicam que um processador de interface escreve a paridade inválida, pode ser um defeituoso ou uma placa mal encaixada.

Processador de interface versatile

Se você recebe o %VIP2-1-MSG: as mensagens do slot(x) nos logs ou no arquivo crashinfo (informaçoes de travamento), referem pesquisar defeitos travamentos de VIP.

Ações recomendadas

Na primeira ocorrência de um erro de paridade, não será possível diferenciar entre um erro de paridade temporário ou permanente. De experiência, a maioria de ocorrências de paridade são erros de paridade de software, e você pode geralmente demiti-las. Se você tem mudado algum hardware ou tem movido recentemente a caixa, tente assentar a parte afetada (DRAM, SRAM, NPE, RP, RSP, ou VIP). As ocorrências frequentes da paridade múltipla significam o hardware defeituoso. Substitua a parte afetada (DRAM, RSP, VIP, ou cartão-matriz) com a ajuda das instruções mencionadas neste documento.

Informações a serem coletadas se você abrir um pedido de serviço de TAC

Se você ainda precisa o auxílio depois que você segue os passos de Troubleshooting acima e os quer abrir um pedido do serviço com o tac Cisco, seja certo incluir esta informação:
  • Troubleshooting executado antes que você abrir o pedido do serviço.
  • saída do comando show technical-support (no modo enable se possível).
  • comando show log output ou capturas de console se disponível.
  • arquivo crashinfo (informaçoes de travamento) (se esta presente, e não já incluído na saída do comando show technical-support. Se os arquivos crashinfo (informaçoes de travamento) múltiplos existem, inclua todo).
  • Número de reloads devido aos erros de paridade de memória de processador que você viu e quando ocorrerem.
Anexe os dados coletados para o seu caso em um formato não compactado e texto simples (.txt). A fim anexar a informação a seu pedido do serviço, transfira-o arquivos pela rede através da ferramenta do pedido do serviço TAC (clientes registrados somente). Se você não pode alcançar a ferramenta do pedido do serviço, anexar a informação relevante a seu pedido do serviço, e a enviar a attach@cisco.com com seu número do pedido do serviço na linha de assunto de sua mensagem.

Nota: Não recarregue manualmente ou ciclo de energia o roteador antes que você recolha a informação acima a menos que exigido para pesquisar defeitos um erro de paridade de memória de processador, porque este pode fazer com que a informação importante esteja perdida que é precisada de determinar a causa de raiz do problema.

Discussões relacionadas da comunidade de suporte da Cisco

A Comunidade de Suporte da Cisco é um fórum onde você pode perguntar e responder, oferecer sugestões e colaborar com colegas.


Informações Relacionadas


Document ID: 6345