Routers : Routers Cisco de la serie 10000

Árbol de fallas de errores de paridad de 10000 ESR PRE2

13 Agosto 2015 - Traducción Automática
Otras Versiones: PDFpdf | Inglés (22 Abril 2015) | Comentarios


Contenido


Introducción

Este documento explica los pasos para resolver problemas y para aislar que el componente de un Edge Services Router de las Cisco 10000 Series (ESR) con el Performance Routing Engine (PRE2) está fallando cuando usted identifica una variedad de mensajes de error de paridad.

prerrequisitos

Requisitos

Quienes lean este documento deben tener conocimiento de lo siguiente:

Componentes Utilizados

La información que contiene este documento se basa en las siguientes versiones de software y hardware.

  • Cisco 10000 Series ESR usando el PRE2

  • ¿Todas las versiones del Cisco IOS?? Software

Nota: Este documento no se aplica a los routers de Internet de la serie Cisco 10720.

La información que contiene este documento se creó a partir de los dispositivos en un ambiente de laboratorio específico. Todos los dispositivos que se utilizan en este documento se pusieron en funcionamiento con una configuración verificada (predeterminada). Si la red está funcionando, asegúrese de haber comprendido el impacto que puede tener cualquier comando.

Convenciones

Para obtener más información sobre las convenciones del documento, consulte las Convenciones de Consejos Técnicos de Cisco.

Análisis del Route Processor Parity Error Fault Tree PRE2

Las Cisco 10000 Series ESR PRE2 consisten en dos placas de circuito: el (RP) y el Forwarding Processor (FP) del Route Processor. El organigrama abajo puede ayudarle a determinar qué componente de un ESR PRE2 es responsable de la paridad o de los mensajes de error del código corrector de error (ECC) en el Route Processor.

/image/gif/paws/44228/esr10000a.gif

Nota: Capture y registre el show tech-support command output y los registros de la consola, y recoja todo el RMtermcode = 3 nfw y archivos del pxf_crashinfo durante la paridad o los eventos de error ECC.

Paridad PRE2 y detección de ECC

El diagrama siguiente describe la porción de la arquitectura PRE2 RP que puede experimentar la paridad o los errores ECC.

esr10000b.gif

El PRE2 RP utiliza la corrección del error de un solo bit (SBE) y el ECC de detección del error de bits múltiples (MBE) a la memoria compartida (SDRAM). Un SBE en SDRAM se corrige automáticamente, y el sistema continúa actuando como normal.

Un MBE en SDRAM es un evento fatal, que causa una excepción de error de memoria caché o error de bus ocurrir. El resto de la memoria y los busses en el sistema utilizan la detección de paridad de un solo bit. Los SBE en 1 y 3 en el diagrama antedicho son fatales y hacen al router reajustar.

Paridad y errores ECC en el Route Processor de las Cisco 10000 Series ESR

Los datos con la paridad incorrecta pueden ser señalados por varios de los dispositivos de la verificación de paridad para ningunos leídos o escribir la operación en Cisco ESR PRE2.

Lo que sigue es una descripción de los diversos mensajes de error RP señalados sobre un ESR con un PRE2 instalado:

Ejemplo 1:

La primera línea del mensaje de error indica la ubicación del error de paridad, y puede ser cualquier ubicación enumerada en la tabla arriba. En este ejemplo, la ubicación es la memoria caché de datos L3.

Error: SysAD, data cache, fields: data, 1st dword
Physical addr(21:3) 0x195BE88,
Virtual address is imprecise.
    Imprecise Data Parity Error
    Imprecise Data Parity Error

Substituya el PRE2 después de una segunda falla.

Ejemplo 2:

La primera línea del mensaje de error indica la ubicación del error de paridad, y puede ser cualquier ubicación enumerada en la tabla arriba. En este ejemplo, la ubicación es el caché de la instrucción L3.

Error: SysAD, instr cache, fields: data, 1st dword
Physical addr(21:3) 0x000000,
virtual addr 0x6040BF60, vAddr(14:12) 0x3000
virtual address corresponds to main:text, cache word 0
 
          Low Data     High Data  Par  Low Data     High Data  Par
L1 Data:  0:0xAE620068 0x8C830000 0x00 1:0x50400001 0xAC600004 0x01
          2:0xAC800000 0x00000000 0x02 3:0x1600000B 0x00000000 0x01
           Low Data     High Data  Par  Low Data     High Data  Par
DRAM Data: 0:0xAE620068 0x8C830000 0x00 1:0x50400001 0xAC600004 0x01
           2:0xAC800000 0x00000000 0x02 3:0x1600000B 0x00000000 0x01

Como en el ejemplo 1, substituya el PRE2 después de una segunda falla.

PRE2 análisis del árbol de fallos del paquete rápido ECC

La placa de circuito FP es la tarjeta superior del ensamblaje PRE2. La tarjeta FP contiene cinco circuitos específicos de la aplicación (Asics), una sola interfaz de backplane ASIC, y la red del Parallel Express Forwarding cuatro (PXF) que procesa Asics. Cada ASIC tiene acceso a los sistemas de la memoria externa.

El diagrama siguiente le ayuda a determinar qué componente de las Cisco 10000 Series ESR PRE2 FP es responsable de los mensajes de error ECC:

/image/gif/paws/44228/esr10000c.gif

Errores DDR FCRAM ECC de ASIC de la interfaz de backplane

La interfaz de backplane ASIC tiene acceso a dos diversas memorias rápidas del RAM del ciclo de la velocidad de datos del doble del ECC protegido (DDR) (FCRAM), a la memoria del paquete externa (EPM) y a la memoria del control externo (ECM).

  • Errores ECC de un solo bit de ASIC DDR FCRAM de la interfaz de backplane

    Se detectan los SBE y se presentan los datos corregidos.

    Los errores EPM de un solo bit están señalados como sigue:

      %C10KEVENTMGR-1-MINOR_FAULT: PXF DMA Single Bit PMC (EPM) Error 
      %C10KEVENTMGR-1-PMC_SBE_DEBUG: Address: 0x0FFE4608, Who: 0x02
      Error taken in: Check bits, bit number: 0, Check byte value = 0x58
      Errant Data:    0x00008F00 80350000
      Corrected Data: 0x00008F00 80350000
    

    Los errores ECM de un solo bit están señalados como sigue:

      %C10KEVENTMGR-1-MINOR_FAULT: PXF DMA Error - Correctable ECM Error 
      %C10KEVENTMGR-1-ECM_SBE_DEBUG: Address: 0x013FD0A8, Who: 0x01
      Error taken in:  Data bits, bit number: 32, Check byte value = 0x67
      Errant Data:    0x67CFFE58 00000000
      Corrected Data: 0x00CFFE59 00000000
    

    Los SBE se cuentan y pueden ser visualizados publicando el comando show pxf dma counters. La acción no se requiere generalmente para los SBE; sin embargo, relanzado o frecuente los casos de estos errores son causa para el reemplazo del PRE2.

  • Errores ECC del multibit de ASIC DDR FCRAM de la interfaz de backplane

    Cuando está detectada, la interfaz de backplane ASIC DDR FCRAM MBE causa la red PXF que procesa el microcódigo para recargar, y también crea un archivo del pxf_crashinfo en el bootflash. La red PXF que procesa la recarga del microcódigo hace la interfaz de backplane ASIC ser reinicializada, con eficacia fregando el MBE del DDR FCRAM.

    Lo que sigue es un ejemplo del mensaje impreso a la consola en respuesta a un error ECC del multibit EPM en la interfaz de backplane ASIC DDR FCRAM:

      %C10KEVENTMGR-1-MAJOR_FAULT: PXF DMA Multi-bit PMC (EPM) Error 
    Downloading Microcode: file=system:pxf/c10k2-11-ucode.106.1.0.0, version=106.1.0.0,
     description=Release Software created Tue 03-Jun-03 00:57
    

    Substituya el PRE2 después de una segunda falla.

    Lo que sigue es un ejemplo del mensaje impreso a la consola en respuesta a un error ECC del multibit ECM en la interfaz de backplane ASIC DDR FCRAM:

      %C10KEVENTMGR-1-MAJOR_FAULT: PXF DMA Error - Uncorrectable ECM Error
    Downloading Microcode: file=system:pxf/c10k2-11-ucode.106.1.0.0, version=106.1.0.0,
     description=Release Software created Tue 03-Jun-03 00:57

    Substituya el PRE2 después de una segunda falla.

Procesamiento de red PXF de errores ECC de la memoria de columna ASIC

La red de cuatro PXF que procesa Asics tiene el acceso a la memoria de columna del ECC protegido DDR FCRAM, o eXternal Column Memory (XCM).

  • Errores ECC de un solo bit del PXF Network Processing ASIC XCM

    Se detectan los SBE y se presentan los datos corregidos. Se cuentan los SBE, y la cuenta del PXF Network Processing ASIC XCM SBE puede ser visualizada publicando el comando show pxf xcm.

    Cuando los abrigos del contador SBE, los SBE están señalados y el RP friega el direccionamiento del primer SBE que fue detectado por el PXF Network Processing ASIC. Lo que sigue es un ejemplo de un mensaje señalado cuando un SBE está señalado:

    %C10KEVENTMGR-1-MINOR_FAULT: T0 XCM1 FCRAM-A: Too many Toaster XCM ECC single bit errors

    El número de la tostadora (PXF Network Processing ASIC) y la interfaz DDR FCRAM en el mensaje precedente reflejan la interfaz XCM donde el SBE del contador envuelto fue detectado. El mensaje de error antedicho indica que el error ocurrió en la tostadora 0, XCM 1, interfaz A. Action no está requerido generalmente para los abrigos del contador SBE; sin embargo, relanzado o frecuente los casos de estos errores son causa para el reemplazo del PRE2.

  • Errores ECC de bits múltiples de la XCM del ASIC de procesamiento de red PXF.

    No se pueden corregir los errores ECC multibit XCM. En los sistemas con los PRE2 redundantes, el XCM MBE causa una caída y a una falla de PRE. En los sistemas con un solo PRE2, la detección de XCM MBE fuerza una recarga del microcódigo del PXF Network Processing ASIC. La recarga del microcódigo reinicializa todas las memorias XCM del PXF Network Processing ASIC, fregando con eficacia el ECC MBE de la memoria. Los siguientes mensajes aparecen en el registro y el RMtermcode = 3 nfw o el archivo del pxf_crashinfo:

      %PXF-2-FAULT: T3 XCM1 FCRAM-D: Multi-bit ECC error on bits [0:31]
    %C10KEVENTMGR-4-PXF_CRASHINFO: Writing PXF debug information to 
     bootflash:pxf_crashinfo_20030729-153845.
      %C10KEVENTMGR-1-MAJOR_FAULT: PXF DMA Toaster Fault, Restarting PXF
    00:08:01: Downloading Microcode: file=system:pxf/c10k2-11-ucode.6.1.0.0,
     version=6.1.0.0, description=Release Software created Mon 21-Jul-03 12:17
    

    Cuando sucede esto, el mensaje de error especifica la tostadora (t0, T1, T2, o T3), el número apropiado XCM (0 o 1), y la interfaz DDR FCRAM (A, B, el C, o D) que encontró el error ECC del multibit. El mensaje de error antedicho indica que el error estaba en la tostadora 2, XCM 1, la interfaz B.

    Substituya el PRE2 después de una segunda falla.

Discusiones relacionadas de la comunidad de soporte de Cisco

La Comunidad de Soporte de Cisco es un foro donde usted puede preguntar y responder, ofrecer sugerencias y colaborar con colegas.


Información Relacionada


Document ID: 44228