Cisco Interfaces and Modules : Cisco Gigabit Ethernet Interface Processors

Troubleshooting de Travamentos no Versatile Interface Processor (VIP)

14 Outubro 2016 - Tradução por Computador
Outras Versões: Versão em PDFpdf | Inglês (22 Agosto 2015) | Feedback


Interativo: Este documento oferece análise personalizada do seu dispositivo Cisco.


Índice


Introdução

Este documento contém informações para resolver problemas de travamento no processador versátil de interface (VIP).

Pré-requisitos

Requisitos

Cisco recomenda que você tem o conhecimento dos Field Notice do 7500 Series Router.

Componentes Utilizados

As informações neste documento são baseadas nestas versões de software e hardware:

  • VIP1

  • VIP2-10

  • VIP2-15

  • VIP2-20

  • VIP2-40

  • VIP2-50

  • FEIP2

  • GEIP

  • GEIP+

  • VIP4-50

  • VIP4-80

  • VIP6-80

As informações neste documento foram criadas a partir de dispositivos em um ambiente de laboratório específico. Todos os dispositivos utilizados neste documento foram iniciados com uma configuração (padrão) inicial. Se a sua rede estiver ativa, certifique-se de que entende o impacto potencial de qualquer comando.

Convenções

Consulte as Convenções de Dicas Técnicas da Cisco para obter mais informações sobre convenções de documentos.

Arquitetura de VIP

A fim interpretar um travamento de VIP, é importante para primeiramente compreende a arquitetura básica do VIP. A figura nesta seção mostra o diagrama de bloco funcional do VIP2, que inclui estes componentes:

  • Computação do conjunto de instruções reduzida (RISC) CPU de Orion e circuitos associados, que incluem o ram dinâmica (DRAM), o esconderijo L2, os circuitos integrados do aplicativo específicos RENO (ASIC), e a ROM da bota.

  • CyBus ASIC — O componente que controla e transfere pacotes entre o VIP2 Static RAM (SRAM) e a memória de pacote de sistema (MEMD) através dos CyBus ou do CxBus.

  • Memória de pacotes ASIC — Responsável para pacotes moventes entre adaptadores de porta e SRAM.

  • Barramentos da interconexão de componente periférico (PCI) — Trajetos de dados entre os adaptadores de porta e o VIP2 SRAM.

  • Pontes — Responsável para isolar os barramentos individuais PCI dos adaptadores de porta.

vip_crash1.gif

O microcódigo VIP2 (firmware) é uma imagem que forneça instruções de software cartão-específicas. Um dispositivo da memória programável para somente leitura (PROM) no VIP2 contém uma imagem de boot do microcódigo padrão que ajude ao sistema em encontrar e em carregar a imagem de microcódigo do pacote do software do ½ do ¿  de Cisco IOSï ou da memória Flash. A imagem de inicialização do microcódigo no PROM inicializa o VIP2 e, em seguida, auxilia o download da imagem de microcódigo do VIP2. Todas as interfaces do mesmo tipo carregam a mesma imagem de microcódigo, seja a partir do pacote de software Cisco IOS ou a partir da memória Flash. Embora a memória Flash possa armazenar várias versões de microcódigo para um tipo de interface específico, apenas uma imagem pode carregar na inicialização.

O comando show controllers cbus indica a versão do microcódigo atualmente carregada e sendo executado para cada processador de interface e o VIP2. O comando show startup-config mostra as instruções do sistema atuais para carregamento de microcódigo na inicialização.

Quando você pesquisa defeitos, você pode usar a figura nesta seção como guia para ler a informação de um arquivo de informação de travamento de VIP ou do Syslog. Como um exemplo, o olhar nestas saídas de SYSLOG que mostram a paridade inválida é encontrado quando lido do VIP SRAM:

Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6    Packet Memory Read Parity error 

!--- Bad parity is found when read from the VIP SRAM.

Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6   PCI master address = 0460000
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x00): cfid   = 0x00011011
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x04): cfcs   = 0x02800147
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x08): cfccid = 0x06040002
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x0C): cfpmlt = 0x00010000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x18): cfsmlt = 0x00010100 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x1C): cfsis  = 0x02807020 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x20): cfmla  = 0x01F00000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x24): cfpmla = 0x0000FE00 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x3C): cfbc   = 0x00030000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x40): cfseed = 0x00000000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x44): cfstwt = 0x00000000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x48): cfswac = 0x00FFFFFF 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x4C): cfpwac = 0x00FFFFFF 
Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error

Como você vê das recomendações na próxima seção, o VIP nesta saída deve ser monitorado, e o SRAM ou o VIP devem ser substituídos se os impactos similares reoccur.

Como identificar seu VIP

Você pode verificar os índices do endereço 0x21 no EEPROM no comando show diag output a fim verificar o modelo de um VIP. Os valores que correspondem a cada tipo VIP são mostrados nesta tabela:

Valor VIP Tipo de controlador
0x14 VIP1 Controlador VIP
0x15 VIP2 (VIP2-10, VIP2-15, VIP2-20, VIP2-40) controlador VIP2
0x1E VIP2-50 Controlador VIP2 R5K
0x20 FEIP2 Controlador de FEIP2
0x21 GEIP Controlador GEIP
0x40 GEIP +* Controlador GEIP+
0x22 VIP4-80 Controlador VIP4-80 RM7000
0x31 VIP4-50 Controlador VIP4-50 RM5271
0x4E VIP6-80 Controlador VIP6-80 RM7000B

Nota: O GEIP+ é baseado no VIP4-80. Toda a informação adicional neste documento sobre o VIP4-80 igualmente se aplica ao GEIP+.

Aqui está um exemplo:

Router#show diag 10 
     Slot 10: 
             Physical slot 10, ~physical slot 0x5, logical slot 10, CBus 0 
             Microcode Status 0x4 
             Master Enable, LED, WCS Loaded 
             Board is analyzed 
             Pending I/O Status: None 
             EEPROM format version 1 
             VIP2 R5K controller, HW rev 2.02, board revision D0 
             Serial number: 17090200  Part number: 73-2167-05 
             Test history: 0x00        RMA number: 00-00-00 
             Flags: cisco 7000 board; 7500 compatible 

             EEPROM contents (hex): 
               0x20: 01 1E 02 02 01 04 C6 98 49 08 77 05 00 00 00 00 
               0x30: 68 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 

             Slot database information: 
             Flags: 0x4      Insertion time: 0x18C0 (00:29:13 ago) 

             Controller Memory Size: 32 MBytes DRAM, 4096 KBytes SRAM

Nessa saída, você pode ver se esse VIP é um VIP2-50.

A diferença entre um VIP2-10, um VIP2-15, um VIP2-20 e um VIP2-40 é a quantidade de DRAM e SRAM em cada um. Os vários VIP2 (se não foram promovidos) podem ser distinguidos no comando show diag output pelas configurações de memória mostradas nesta tabela:

Memória VIP
DRAM de 8 MB/SRAM de 512 KB VIP2-10
8 MB DRAM/1 MB SRAM VIP2-15
DRAM de 16 MB/SRAM de 1 MB VIP2-20
32 MB DRAM/2 MB SRAM VIP2-40

Obtenha um arquivo de informação de travamento de VIP

A informação contida no arquivo crashinfo (informaçoes de travamento) pode provar ser inestimável quando você tenta resolver questões de software ou tentar diagnosticar a causa subjacente dos travamentos de sistema. O arquivo crashinfo não contém apenas informações de registro e um rastreamento de pilha para o VIP, contém também informações de memória extensiva e de contexto. Toda vez que o VIP trava, ele tenta gravar um arquivo de informações de travamento para o bootflash do RSP. Os arquivos crashinfo (informaçoes de travamento) são armazenados neste formato:

crashinfo_vip_<slot#>_<data>_<time>

Você pode emitir o comando dir a fim encontrar como mostrado arquivos de informação de travamento de VIP aqui:

7500a#dir bootflash: 
     Directory of bootflash:/ 

       1  -rw-     3951876   Jan 01 2000 00:01:22  rsp-boot-mz.111-22.CA 
       2  -rw-      162641   Jun 21 2000 12:53:40  crashinfo_vip_0_20000621-125340 
       3  -rw-      162778   Jun 21 2000 13:00:10  crashinfo_vip_0_20000621-130010 

     7602176 bytes total (3324492 bytes free) 
     7500a#

Este bootflash do roteador contém dois arquivos de informação de travamento de VIP. Emita os comandos show file ou more a fim ver e capturar os índices destes arquivos do acordo a este procedimento:

  1. Comece fazendo o logon no seu programa terminal.

  2. Emita o comando term length 0.

  3. Emita mais bootflash: nome de arquivo > comando do <crashinfo.

  4. Salve a saída em um arquivo.

Refira a recuperação da informação do arquivo crashinfo (informaçoes de travamento) para obter mais informações sobre de como trabalhar com arquivos crashinfo (informaçoes de travamento).

Se você tem a saída de um comando do Suporte técnico da mostra (do modo enable) de seu dispositivo Cisco, você pode usar-se a fim indicar problemas potenciais e reparos. Você deve ser um cliente registrado, para ser entrado, e ter o Javascript permitido a fim usar-se .

Tipos de travamento

Os travamentos de VIP são classificados em diversas categorias baseadas na causa do impacto. Quando um erro não recuperável é encontrado, os travamentos de VIP. Estes erros podem ser o resultado dos erros de paridade, software ou o hardware a que cause um mensagem de reconhecimento negativa (NACK) esta presente nos CyBus, ou em problemas de software. Esta seção fornece a informação em cada um destes tipos de erro.

Se você tem a saída de um comando do Suporte técnico da mostra (do modo enable) de seu dispositivo Cisco, você pode usar-se para indicar problemas potenciais e reparos. Você deve ser um cliente registrado, para ser entrado, e ter o Javascript permitido a fim usar-se .

Erros de paridade

Detecção de erro de paridade VIP2

Erros de paridade ocorrem em um VIP quando o hardware tenta verificar a validade dos dados comparando os valores de paridade calculados com os valores anteriores de paridade para os mesmos dados. Uma única inversão de bit nos dados pode resultar em erro de paridade. Quando você diagnostica erros de paridade em um VIP, é importante compreender cada lugar em que a paridade é verificada e em no que erros de paridade podem potencialmente ocorrer. Este descrições de diagrama esta informação. Além, refira a análise da árvore de falha de VIP do Cisco 7500 para obter mais informações sobre dos erros de paridade.

/image/gif/paws/12811/vip_crash2.gif

Segundo as indicações deste diagrama, há sete tipos diferentes de erros de paridade que podem ocorrer em um VIP. Note que os erros podem ser recebidos de uma outra fonte e não puderam ter originado dentro do VIP próprio. A fonte do erro de paridade pode ser da rota/processador de switch (RSP), de um outro VIP, ou do assentado deficientemente ou adaptadores defeituosos de porta. A fim compreender corretamente um travamento de VIP, é importante diagnosticar a fonte do impacto.

É igualmente importante compreender que os dados com paridade inválida podem ser relatados por diversos dos dispositivos da verificação de paridade no VIP e do Cisco 7500 Series Router para única lida ou escrever a operação. Por exemplo, se o VIP lê um pacote em um transmitir fila no RSP em seu próprio SRAM, e há um erro de paridade no SRAM do RSP, a seguir você vê Mensagens de Erro do MD ASIC no RSP, no CYA ASIC no VIP, e igualmente no ASIC de memória PCI/packet no VIP.

Este diagrama mostra a análise de árvore de falha para travamentos de VIP:

/image/gif/paws/12811/vip_crash3.gif

Erros de Paridade VIP4 e VIP6 e Detecção ECC

A correção de erro de bit único do uso VIP4-50, VIP4-80, e VIP6-80 e Error Code Correction dobro da detecção de erro de bit (ECC) para a memória do CPU e a memória de pacotes. Ambos são ram dinâmica síncrona (SDRAM). Um erro de bit único no SDRAM é corrigido e o sistema continua a operar-se normalmente.

Os erros de paridade do multibit nos números 2 ou 3 nesta tabela são um evento fatal que fazem com que os erros do multibit ECC ocorram. O cache interno da CPU e os barramentos no sistema usam a detecção de paridade de bits únicos. Como mostrado aqui, a arquitetura do VIP4 e o VIP6 são diferentes do VIP2. Consequentemente, alguns Mensagens de Erro não são considerados e outros Mensagens de Erro são relatados diferentemente do que estão no VIP2. Nesta seção do erro de paridade, as diferenças entre o VIP2, o VIP4, e o VIP6 são denotados e explicados.

/image/gif/paws/12811/vip_crash4.gif

Exceção de erro de paridade de cache

As exceções de erro de paridade de cache ocorrem quando a paridade inválida é descoberta no CPU ou no cache de dados principal. O erro de paridade pôde ter ocorrido no DRAM VIP, o controlador de DRAM, o cache principal, ou no CPU próprio. Erros de paridade descobertos neste local também são referidos como PMPEs (Erros de paridade de memória do processador). Estes erros conduzem a um impacto imediato do VIP e a saída olha similar em VIP e em RSP. Um valor de sig de vinte (sig=20) indica a ocorrência de uma exceção de erro de paridade de cache. O valor sig é exibido nas mensagens de registro do sistema referentes ao travamento.

O código recente igualmente fornece uma linha verboso significativa como mostrado aqui:

Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System reloaded by a Cache Parity Exception 
Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System Reload called from 0x60125C8C, 
context=0x60220930 
Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System exception: sig=20, code=0x20025B69, 
context=0x60220930

Os dados contidos no arquivo de VIP de informação de travamento também apontam para o mesmo local de erro de paridade no cache de dados primário:

Error: primary data cache, fields: data, 
         virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000 
         virtual address corresponds to main:data, cache word 0 

                      Low Data   High Data  Par    Low Data   High Data  Par 
         L1 Data :  0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 
                    2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8 

                       Low Data   High Data  Par    Low Data   High Data  Par 
          Mem Data:  0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 
                     2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8

É possível que um cache principal ou PMPE seja um erro transitório. Se este é o primeiro exemplo de um PMPE, você pode geralmente com segurança ignorá-lo. Entretanto, se o mesmo VIP passar por um segundo PMPE ou um PMPE subseqüente, é necessário substituir o VIP. Às vezes a substituição do DRAM própria pode igualmente resolver a edição.

Nota VIP4 e VIP6 — Os erros de paridade que ocorrem no cache interno CPU e no CyAsic são detectados como exceções de erro de paridade de cache. Erros de paridade de bit único na memória da CPU são corrigidos, e nenhuma ação precisa ser tomada. Os erros de paridade de vários bits na memória do CPU são detectados como um erro de paridade de vários bits CCE do procmem. A memória da CPU no VIP deve ser substituída se um erro de paridade de múltiplos bits procmem ecc for relatado.

Oct 25 09:30:54.708: %VIP4-50 RM5271-1-MSG: slot4 PMA error register1 00000000 
00002000
Oct 25 09:30:54.716: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit error
Oct 25 09:30:54.724: %VIP4-50 RM5271-1-MSG: slot4 PCI1 master address 00000000
Oct 25 09:30:54.732: %VIP4-50 RM5271-1-MSG: slot4 PCI1 slave address 00000000
Oct 25 09:30:54.740: %VIP4-50 RM5271-1-MSG: slot4 Latched Addresses
Oct 25 09:30:54.748: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception 
addr 22220000 025F0860
Oct 25 09:30:54.756: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception 
data 00000000 00000000
Oct 25 09:30:54.764: %VIP4-50 RM5271-1-MSG: slot4 MPU addr exception/WPE address 
00000000 00000000
Oct 25 09:30:54.772: %VIP4-50 RM5271-1-MSG: slot4 MPU WPE addr/WPE data 00000000 
00000000
Oct 25 09:30:54.780: %VIP4-50 RM5271-1-MSG: slot4 ProcMem addr exception 0 0000000
Oct 25 09:30:54.788: %VIP4-50 RM5271-1-MSG: slot4 Pakmem addr exception 00000000
Oct 25 09:31:15.824: %VIP4-50 RM5271-1-MSG: slot4 System reloaded by a fatal 
hardware error
Oct 25 09:31:15.836: %VIP4-50 RM5271-1-MSG: slot4 caller=0x600BCE18
Oct 25 09:31:15.844: %VIP4-50 RM5271-1-MSG: slot4 System exception: sig22, 
code 0x0, context=0x60615F28

Erro de paridade do CyBus

Quando as transferências VIP do MEMD no RSP e destes erros são consideradas, esta indica geralmente que um outro VIP escreveu a paridade inválida ao MEMD, ou o MEMD foi corrompido. Se a fonte é do MEMD e continua, você precisa de substituir o RSP. Inversamente, se a fonte da paridade inválida é um outro VIP, você deve assentar e, caso necessário, substituir o VIP que escreve a paridade inválida.

%VIP2-1-MSG: slot1 Nevada Error Interrupt Register 0x3 
%VIP2-1-MSG: slot1 CYASIC Error Interrupt register 0x2020000C 
%VIP2-1-MSG: slot1 Parity Error internal to CYA 
%VIP2-1-MSG: slot1 Parity Error in data from CyBus 

!--- Bad parity is received by the VIP from the CyBus.

%VIP2-1-MSG: slot1 CYASIC Other Interrupt register 0x200100 
%VIP2-1-MSG: slot1 QE HIGH Priority Interrupt 
%VIP2-1-MSG: slot1 CYBUS Error register 0xD001A02, PKT Bus Error register 0x0 
%VIP2-1-MSG: slot1 PMA error register = 0070000440000000 
%VIP2-1-MSG: slot1 Packet Bus Write Parity error 

!--- The bad parity that was received from the CyBus is written to SRAM.

%VIP2-1-MSG: slot1 PCI master address = 0700004 
%VIP2-1-MSG: slot1 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 
%VIP2-1-MSG: slot1 DEC21050 bridge chip, config=0x0 
%VIP2-1-MSG: slot1 (0x00): cfid = 0x00011011 
%VIP2-1-MSG: slot1 (0x04): cfcs= 0x02800147 
%VIP2-1-MSG: slot1 (0x08):cfccid = 0x06040002 
%VIP2-1-MSG: slot1 (0x0C):cfpmlt = 0x00010000 
%VIP2-1-MSG: slot1 (0x18): cfsmlt = 0x00010100 
%VIP2-1-MSG: slot1 (0x1C): cfsis = 0x22807020 
%VIP2-1-MSG: slot1 Received Master Abort on secondary bus 
%VIP2-1-MSG: slot1 (0x20): cfmla = 0x01F00000

Nota: O VIP4 e o VIP6 mostram os mesmos Mensagens de Erro sobre o erro de paridade dos CyBus, mas o barramento de pacote de informação redige o mensagem de erro de paridade não é indicado.

Controlador de E/S VIP e Erro de paridade de leitura Reno

Os erros de paridade do controlador de DRAM e os erros de paridade do controlador de E/S (entrada/saída) são detectados pelo RENO ASIC. Um erro de paridade que origine no DRAM ou no controlador de DRAM é relatado como uma exceção da paridade de cache. Um erro de paridade detectado pelo controlador de E/S é relatado, segundo as indicações desta saída. Freqüentemente, erros de paridade reportados pelo controlador de E/S originaram-se em outro lugar e são reportados pelo controlador de E/S além das mensagens de outros locais.

Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Reno read parity error - bytes 0 & 1 
Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 PMA error register = 0080004000001000 
Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Packet Memory Read Parity error

Nota: O VIP4 e o VIP6 não mostram essa mensagem de erro.

Erro de paridade de leitura de memória do pacote VIP

O PMA ASIC reporta um erro de paridade de memória lida de pacote sempre que um erro de paridade é lido da memória de pacotes (SRAM) no VIP. Este erro é relatado no log de sistema como mostrado aqui:

Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 Nevada Error Interrupt Register = 0x22 
Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 PCI bus 0 parity error 
Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PMA error register = 4080103C00004000 
Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PCI Transmit Parity error 
Oct 30 05:18:08.120: %VIP2-1-MSG: slot9 Packet Memory Read Parity error

Também é possível perceber a evidência de erro de paridade de memória lida de pacote de informação no arquivo de informação de travamento de VIP:

Nevada Error Interrupt Register = 0x2 
PMA error register = 0046000000001000 
Packet Memory Read Parity error
PCI master address = 0460000

Os erros de paridade de SRAM podem igualmente ser transientes, assim que trate a primeira ocorrência a mesma maneira que erros de paridade DRAM. Se o erro persistir, substitua a SRAM ou o VIP.

Nota VIP4 e VIP6 — Os únicos erros de paridade de bit na memória de pacotes são corrigidos. Os erros de paridade de vários bits na memória de pacotes são detectados como um erro de paridade de vários bits CCE do pakmem. A memória de pacote VIP deverá ser substituída se o erro pakmem ecc multi-bit parity for reportado.

%VIP4-80 RM7000-1-MSG: slot1 PMA error register0 = 0000000000002000
%VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit error
%VIP4-80 RM7000-1-MSG: slot1 PCI0 master address = 00000000
%VIP4-80 RM7000-1-MSG: slot1 PCI0 slave address = 00000000
%VIP4-80 RM7000-1-MSG: slot1 PMA error register1 = 0000000000000000
%VIP4-80 RM7000-1-MSG: slot1 PCI1 master address = 00000000
%VIP4-80 RM7000-1-MSG: slot1 PCI1 slave address = 00000000
%VIP4-80 RM7000-1-MSG: slot1 Latched Addresses
%VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception addr = 00012358 000000CA
%VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception data = 00000000 00040800
%VIP4-80 RM7000-1-MSG: slot1 MPU addr exception/WPE address = 00000000 00000000
%VIP4-80 RM7000-1-MSG: slot1 MPU WPE addr/WPE data = 00000000 00000000
%VIP4-80 RM7000-1-MSG: slot1 ProcMem addr exception = 00000000
%VIP4-80 RM7000-1-MSG: slot1 Pakmem addr exception = 00000000

Erro de paridade de gravação em barramento de pacote VIP

O PMA ASIC informa um erro de paridade de gravação de barramento de pacote sempre que um erro de paridade é gravado na memória de pacotes. Neste exemplo, o VIP é somente o mensageiro e o problema não existe com a memória deste VIP.

May 10 09:22:14.520: %VIP2-1-MSG: slot11 PMA error register = 2080002800800200 
May 10 09:22:15.520: %VIP2-1-MSG: slot11 Packet Bus Write Parity error

Nota: O VIP4 e o VIP6 não mostram essa mensagem de erro.

Erro de paridade no barramento de PCI do VIP

Os erros de paridade podem ser detectados em barramentos de PCI 1 e 2, que fazem a interface diretamente com os adaptadores de porta. Esses barramentos são ligados por um terceiro barramento de PCI, o barramento 0, no qual os erros de paridade também podem ser detectados. Os erros de paridade que originam de alguns dos barramentos PCI são causados o mais geralmente pelo assentado deficientemente ou adaptadores defeituosos de porta. Quando você vê estas mensagens nas saídas de SYSLOG de um travamento de VIP, você precisa de assentar o adaptador de porta a fim resolver a edição.

PCI bus <num> parity error 
PCI bus <num> system error
Detected Parity Error on secondary bus

Se assentar o adaptador de porta não resolve a edição, o problema encontra-se com o adaptador de porta ou o VIP. Mova o adaptador de porta para uma outra baía e introduza um segundo adaptador de porta na baía original a fim pesquisar defeitos. Isto normalmente aponta o hardware defeituoso. Um exemplo é mostrado aqui:

Mar 16 19:34:54: %GEIP-1-MSG: slot9 Nevada Error Interrupt Register = 0x6 
Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI bus 0 system error
Mar 16 19:34:54: %GEIP-1-MSG: slot9 PMA error register = 0080043800100000 
Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI IRDY time-out 
Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI master address = 0800438 
Mar 16 19:34:54: %GEIP-1-MSG: slot9 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0

Nota: Os mesmos erros ocorrem com o VIP4 e o VIP6, mas a mensagem de erro é diferente. É detectado como um erro de paridade do mestre PCI e um erro de paridade do escravo PCI. Execute as mesmas etapas que esboçadas para que os erros de paridade de barramento VIP PCI pesquisem defeitos este problema.

00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register0 = 0000000001800000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Master Parity error
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Slave Parity error
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 master address = 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 slave address = 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register1 = 0000000000000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 master address = 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 slave address = 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Latched Addresses
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU addr exception/WPE address = 
00000000 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU WPE addr/WPE data = 
00000000 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 ProcMem addr exception = 00000000
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Pakmem addr exception = 00000000

Erro de paridade do VIP CyAsic

Os erros de paridade podem igualmente ser detectados pelo VIP nos dados ou no endereço de uma lida ou escrever a operação nos CyBus. Se isto ocorre, você vê as saídas de SYSLOG similares a esta:

CYASIC Error Interrupt register 0x2020000C 
Parity Error internal to CYA 
Parity Error in data from CyBus

Use esta informação conjuntamente com a informação atual nos log de sistema para determinar o origem verdadeira do erro.

Nota: O VIP4 e o VIP6 mostram as mesmas mensagens de erro para erros de paridade de CyBus.

NACK presente no CyBus

Quando o VIP tenta gravar em um endereço inválido no MEMD, o RSP coloca um NACK no CyBus para esse slot. Este é geralmente um problema de software, mas pode igualmente ser um problema de hardware. Por exemplo, nesta saída, o VIP escreve 4 bytes a um endereço inválido, assim o RSP coloca um NACK nos CyBus para esse entalhe.

%RSP-3-ERROR: CyBus0 error 10 
%RSP-3-ERROR: command/address mismatch 
%RSP-3-ERROR: bus command write 4bytes (0xE) 
%RSP-3-ERROR: address offset (bits 3:1) 0 
%RSP-3-ERROR: virtual address (bits 23:17) 000000 
%VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 
%VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20000003 
%VIP2-1-MSG: slot5 Missing ACK on CyBus access 
%VIP2-1-MSG: slot5 NACK present on CyBus access
%VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x0 
%VIP2-1-MSG: slot5 CYBUS Error register 0x8001C48, PKT Bus Error register 0x0 
%VIP2-1-MSG: slot5 System reloaded by a fatal hardware error 
%VIP2-1-MSG: slot5 caller=0x60126C44 
%VIP2-1-MSG: slot5 System exception: sig=22, code=0x0, context=0x60265C68

Contudo, segundo as indicações desta saída, o RSP igualmente coloca um NACK em um VIP para que tentar escreva a paridade inválida ao MEMD.

CYASIC Error Interrupt register 0x1B 
Parity Error in data from Packet Bus 
Parity Error internal to CYA 
Missing ACK on CyBus access 
NACK present on CyBus access

Quando um NACK aparece em todos os entalhes, segundo as indicações desta saída, é um erro de hardware. O intermediário é defeituoso e o gabinete de placa deve ser substituído.

Jan  1 23:55:21: %FEIP2-1-MSG: slot0 Nevada Error Interrupt Register =0x1 
Jan  1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Error Interrupt register0x20000001 
Jan  1 23:55:21: %FEIP2-1-MSG: slot0 NACK present on CyBus access 
Jan  1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Other Interrupt register 0x0 
Jan  1 23:55:21: %FEIP2-1-MSG: slot0 CYBUS Error register 0x8001A00, 
PKTBus Error register 0x0 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 Nevada Error Interrupt Register = 0x1 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Error Interrupt register 0x20000001 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 NACK present on CyBus access
Jan  1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Other Interrupt register 0x0 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 CYBUS Error register 0x800006A, 
PKT Bus Error register 0x0 
Jan  1 23:55:21: %VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 
Jan  1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20200001 
Jan  1 23:55:21: %VIP2-1-MSG: slot5 NACK present on CyBus access 
Jan  1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x200000 
Jan  1 23:55:21: %VIP2-1-MSG: slot5 CYBUS Error register 0x800006C, 
PKT Bus Error register 0x0 
Jan  1 23:55:21: %FEIP2-1-MSG: slot8 Nevada Error Interrupt Register = 0x1 
Jan  1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Error Interrupt register 0x20000001 
Jan  1 23:55:21: %FEIP2-1-MSG: slot8 NACK present on CyBus access
Jan  1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Other Interrupt register 0x0 
Jan  1 23:55:21: %FEIP2-1-MSG: slot8 CYBUS Error register 0x8001B80, 
PKT Bus Error register 0x0 
Jan  1 23:55:21: %FEIP2-1-MSG: slot10 Nevada Error Interrupt Register = 0x1 
Jan  1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Error Interrupt register 0x20000001 
Jan  1 23:55:21: %FEIP2-1-MSG: slot10 NACK present on CyBus access
Jan  1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Other Interrupt register 0x0 
Jan  1 23:55:21: %FEIP2-1-MSG: slot10 CYBUS Error register 0x8001C08,
PKT Bus Error register 0x0 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 System reloaded by a fatal hardware error 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 caller=0x6012640C 
Jan  1 23:55:21: %VIP2-1-MSG: slot2 System exception: sig=22, code=0x0, 
context=0x60265028

Travamentos de VIP devido a software

Os travamentos de VIP não causados por algumas das razões neste documento são o mais geralmente devido às edições do outro software. Essas panes podem ser manifestadas em uma variedade de maneiras. Estas são sugestões gerais para reduzir o risco de travamentos de VIP devido aos problemas de software e a lidar com eles se ocorrem:

  • Certifique-se sempre de que a imagem do Cisco IOS Software apoia o VIP.

  • Sempre mantenha a imagem RSP-BOOT e a principal imagem do software Cisco IOS na mesma versão.

  • Certifique-se de que a configuração de VIP e o adaptador de porta sejam suportados pela versão atual do Cisco IOS Software.

  • Verifique as notas de versão para obter os requisitos corretos de nível e de memória do Cisco IOS Software.

Este é um exemplo de uma saída do log de sistema de um travamento de VIP devido a um problema de software:

Apr 18 17:13:33.884: %VIP2 R5K-1-MSG: slot0 System reloaded by a 
Bus Error exception 
Apr 18 17:13:33.892: %VIP2 R5K-1-MSG: slot0 caller=0x600BC974 
Apr 18 17:13:33.900: %VIP2 R5K-1-MSG: slot0 System exception: 
sig=10, code=0x408, context=0x605B51E0 
Apr 18 17:13:33.912: %VIP2 R5K-1-MSG: slot0 $0 : 00000000, 
AT : 605B0000, v0 : 00000001, v1 : FFFFFFFC, 
Apr 18 17:13:33.924: %VIP2 R5K-1-MSG: slot0 a0 : 00000002, 
a1 : 6042CEE0, a2 : 00000000, a3 : 6112FEC4, 
Apr 18 17:13:33.936: %VIP2 R5K-1-MSG: slot0 t0 : 00000053, 
t1 : 3400FF01, t2 : 00000000, t3 : FFFFFFFF, 
Apr 18 17:13:33.948: %VIP2 R5K-1-MSG: slot0 t4 : 600BC9B0, 
t5 : 000000F8, t6 : 00000000, t7 : 00000002, 
Apr 18 17:13:33.956: %VIP2 R5K-1-MSG: slot0 s0 : 0C58BA24, 
s1 : 00000064, s2 : 6112C7AC, s3 : 60560000, 
Apr 18 17:13:33.964: %VIP2 R5K-1-MSG: slot0 s4 : 60560000, 
s5 : 00000001, s6 : 6041433C, s7 : 60414310, 
Apr 18 17:13:33.972: %VIP2 R5K-1-MSG: slot0 t8 : 00008945, 
t9 : 00000000, k0 : 607F6CA0, k1 : 00000200, 
Apr 18 17:13:33.980: %VIP2 R5K-1-MSG: slot0 gp : 6056AFC0, 
sp : 6112FEC0, s8 : 60414460, ra : 6026EC4C, 
Apr 18 17:13:33.988: %VIP2 R5K-1-MSG: slot0 EPC : 6026EAA0, 
ErrorEPC : 800086B8, SREG : 3400FF03 
Apr 18 17:13:33.996: %VIP2 R5K-1-MSG: slot0 Cause 00000408 (Code 0x2) 
Apr 18 17:13:34.004: %VIP2 R5K-1-MSG: slot0 Traceback= 6026EAA0 
6026E2E8 6009BAF4 6009BAE0 
Apr 18 17:13:35.012: %DBUS-3-DBUSINTERRSWSET: Slot 0, Internal 
Error due to VIP crash

Talvez a informação mais importante a ser obtida no caso de um problema de software seja o arquivo de informação de travamento para o VIP. Veja a obtenção uma seção de arquivo de informação de travamento de VIP para que as instruções capturem esta informação.

exceção de erro de barramento

Os travamentos de VIP muitas vezes e quando você revê o arquivo de informação de travamento, você pôde ver esta mensagem:

00:00:11: %LINK-3-UPDOWN: Interface POS1/0, changed state to up

IOBUS Error Interrupt Status register 0x0


Unexpected exception, CPU signal 10, PC = 0x602A7660


-Traceback= 602A7660 602AB238

O Mensagem de Erro do sinal 10 CPU significa o erro de exceção do barramento. Os erros de barramento podem ser software ou problemas de hardware. A ação alternativa para este problema é assentar o módulo e monitorar o roteador. Se o módulo se mantém causar um crash depois que você assenta o módulo, contacte

Relate travamentos de VIP ao Suporte técnico de Cisco

Antes que você criar um caso de TAC

É uma boa ideia criar um arquivo sumário do travamento de VIP com esta informação antes que você abra um caso. Inclua esta informação no campo de descrição do problema da ferramenta aberta de caso de tac (clientes registrados somente).

  • Descrição do problema

  • Saída do comando show version

  • Saída do comando show diag slot [x]

  • Trecho do arquivo crashinfo (informaçoes de travamento)

  • Resumo Syslog

Então, recolha a informação a serem coletadas se você abre um caso de TAC.

Este é um exemplo de um arquivo resumo de travamento:

******problem description.. 
VIP crashed with parity errors. 
The parity errors are being read by the SRAM, suspect the PA! 

******show version 
Cisco Internetwork Operating System Software 
IOS (tm) GS Software (RSP-PV-M), Version 11.1(29)CC1, EARLY DEPLOYMENT 
RELEASE SOFTWARE (fc1) 
V111_29_CC_THROTTLE_BRANCH Synced to mainline version: 11.1(29)CA 
Copyright (c) 1986-1999 by cisco Systems, Inc. 
Compiled Wed 13-Oct-99 02:21 by sharpd 
Image text-base: 0x60010910, data-base: 0x60832000 

ROM: System Bootstrap, Version 11.1(8)CA1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) 
ROM: GS Software (RSP-BOOT-M), Version 11.1(29)CC1, EARLY DEPLOYMENT 
RELEASE SOFTWARE (fc1) 

attga711c7 uptime is 27 weeks, 11 minutes 
System restarted by reload at 00:49:05 UTC Sun Oct 24 1999 
System image file is "slot0:rsp-pv-mz.111-29.CC1", booted via slot0 
Host configuration file is "cbb/al/ar-2", booted via tftp from 199.37.184.170 

cisco RSP4 (R5000) processor with 262144K/2072K bytes of memory. 
R5000 processor, Implementation 35, Revision 2.1 (512KB Level 2 Cache) 
Last reset from power-on 
G.703/E1 software, Version 1.0. 
G.703/JT2 software, Version 1.0. 
X.25 software, Version 2.0, NET2, BFE and GOSIP compliant. 
Chassis Interface. 
3 VIP2 R5K controllers (3 ATM). 
3 ATM network interfaces. 
123K bytes of non-volatile configuration memory. 

20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K). 
8192K bytes of Flash internal SIMM (Sector size 256K). 


******show diag slot 6 
Slot 6: 
 Physical slot 6, ~physical slot 0x9, logical slot 0, CBus 0 
 Microcode Status 0x4 
 WCS Loaded 
 Board is disabled analyzed wedged 
 Pending I/O Status: None 
 EEPROM format version 1 
 VIP2 R5K controller, HW rev 2.02, board revision C0 
 Serial number: 12639078  Part number: 73-2167-05 
 Test history: 0x00        RMA number: 00-00-00 
 Flags: cisco 7000 board; 7500 compatible 

 EEPROM contents (hex): 
   0x20: 01 1E 02 02 00 C0 DB 66 49 08 77 05 00 00 00 00 
   0x30: 60 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 

 Slot database information: 
 Flags: 0x295 Insertion time: 0x3AA4 (27w0d ago) 

 Controller Memory Size: 128 MBytes DRAM, 8192 KBytes SRAM 

 PA Bay 0 Information: 
  ENHANCED ATM OC3 PA (MM), 1 port 
  EEPROM format version 1 
  HW rev 2.00, Board revision A0 
  Serial number: 12366362  Part number: 73-2430-04 

 1 crash since restart. 
 Last crash context (Apr 29 2000 23:19:26): 
 Nevada Error Interrupt Register = 0x2 
 PMA error interrupt 
 PMA Error Register = 0046000000001000 
     Packet Memory Read Parity error 
     PCI master address = 0460000 
 $0 : 00000000, AT : 60179244, v0 : 601D337C, v1 : 0000AAAA 
 a0 : 604CF3E0, a1 : 604C8180, a2 : 00001182, a3 : 00000050 
 t0 : 00000800, t1 : 4E90424C, t2 : 00000001, t3 : 6014A620 
 t4 : 6016E220, t5 : 000000F8, t6 : 00000000, t7 : 00000000 
 s0 : 321735CC, s1 : 6052B508, s2 : 604C8180, s3 : 604CF3E0 
 s4 : 3226C120, s5 : 604D1440, s6 : 00000002, s7 : 00000CED 
 t8 : 34000000, t9 : 603C9930, k0 : 00000000, k1 : 00000002 
 gp : 60337700, sp : 603C0350, s8 : 00000001, ra : 601476E8 
 EPC : 601D337C, ErrorEPC : 800086B8, SREG : 3400E103 
 Cause 00000000 (Code 0x0): Interrupt exception 
 Traceback= 0x601D337C 0x601476E8 0x6014A674 

******excerpt from crashinfo 
Nevada Error Interrupt Register = 0x2 
PMA error register = 0046000000001000 
    Packet Memory Read Parity error 
    PCI master address = 0460000 

******excerpt from syslog 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6     Packet Memory Read Parity error 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6     PCI master address = 0460000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x00): cfid   = 0x00011011 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x04): cfcs   = 0x02800147 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x08): cfccid = 0x06040002 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x0C): cfpmlt = 0x00010000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x18): cfsmlt = 0x00010100 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x1C): cfsis  = 0x02807020 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x20): cfmla  = 0x01F00000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x24): cfpmla = 0x0000FE00 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x3C): cfbc   = 0x00030000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x40): cfseed = 0x00000000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x44): cfstwt = 0x00000000 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x48): cfswac = 0x00FFFFFF 
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6  (0x4C): cfpwac = 0x00FFFFFF 
Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error

Informações a serem coletadas se você abrir um caso de TAC

Se você ainda precisa o auxílio depois que você executa os passos de Troubleshooting neste documento e os quer abrir um caso com Suporte técnico de Cisco, certifique-se incluir esta informação:
  • O Troubleshooting que você executou antes que você abrisse o caso
  • Saída do comando show technical-support (no modo enable, se possível)
  • Saída do comando show log ou das capturas do console, se possível
  • Arquivo de informação de travamento do VIP.
Anexe os dados coletados à sua ocorrência em formato de texto simples descompactado (.txt). Você pode anexar informações carregando-as com o uso da ferramenta Case Query ( somente para clientes registrados) . Se você não puder acessar a ferramenta Case Query, você pode anexar informações relevantes para o seu caso, enviando-as para attach@cisco.com com o número de seu caso na linha de assunto de sua mensagem.

Nota: Se possível, não recarregue manualmente ou ciclo de energia o roteador antes que você recolha esta informação enquanto esta pode fazer com que a informação importante esteja perdida que está precisada de determinar a causa de raiz do problema.


Informações Relacionadas


Document ID: 12811