Маршрутизаторы : Маршрутизаторы Cisco серии 10000

Дерево отказа, вызванного ошибкой четности, в 10000 ESR PRE2

20 октября 2016 - Машинный перевод
Другие версии: PDF-версия:pdf | Английский (22 апреля 2015) | Отзыв


Содержание


Введение

Этот документ объясняет шаги, чтобы устранить неполадки и изолировать, какой компонент Маршрутизатора периферийных сетевых услуг (ESR) Серии Cisco 10000 с Performance Routing Engine (PRE2) отказывает при определении множества сообщений об ошибках четности.

Предварительные условия

Требования

Ознакомление с этим документом требует наличия следующих знаний:

Используемые компоненты

Сведения, содержащиеся в данном документе, касаются следующих версий программного и аппаратного обеспечения:

  • ESR Серии Cisco 10000 с помощью PRE2

  • Все версии ПО Cisco IOS

Примечание: Этот документ не относится к интернет-маршрутизаторам серии Cisco 10720.

Сведения, представленные в этом документе, были получены от устройств, работающих в специальной лабораторной среде. Все устройства, описанные в этом документе, были запущены с чистой (стандартной) конфигурацией. В рабочей сети необходимо изучить потенциальное воздействие всех команд до их использования.

Условные обозначения

Дополнительные сведения об условных обозначениях см. в документе Технические рекомендации Cisco. Условные обозначения.

Анализ дерева ошибок четности на процессоре маршрута PRE2

PRE2 ESR Серии Cisco 10000 состоит из двух карт модульной конструкции: Процессор маршрута (RP) и Процессор переадресации (FP). Блок-схема ниже может помочь вам определять, какой компонент PRE2 ESR ответственен за паритет или сообщения об ошибках Кода исправления ошибки (ECC) на процессоре маршрута.

/image/gif/paws/44228/esr10000a.gif

Примечание: Перехватите и сделайте запись show tech-support command output и console log, и соберите весь crashinfo (сведения об аварийном отказе) и файлы pxf_crashinfo во время событий ошибки ECC или паритета.

Паритет PRE2 и обнаружение ECC

Следующая схема описывает часть архитектуры RP PRE2, которая может испытать паритет или ошибки ECC.

esr10000b.gif

RP PRE2 использует исправление ошибки в одном разряде (SBE) и код с исправлением ошибок для обнаружения мультибитной ошибки (MBE) к совместно используемой памяти (SDRAM). SBE в SDRAM исправлен автоматически, и система продолжает действовать в качестве обычной.

MBE в SDRAM является фатальным событием, которое заставляет исключение в результате ошибки кэша или ошибку шины происходить. Для остальной части памяти и шин в системе используется одноразрядная схема контроля четности. SBEs в 1 и 3 в схеме выше являются фатальными и заставляют маршрутизатор перезагружать.

Паритет и ошибки ECC в процессоре маршрута ESR серии Cisco 10000

О данных со сбоем при контроле четности могут сообщить несколько из устройств проверки четности для любой операции чтения или операции записи на PRE2 ESR Cisco.

Ниже приводится описание различных сообщений об ошибках RP сообщило относительно ESR с установленным PRE2:

Пример 1:

Первая линия сообщения об ошибках указывает на местоположение ошибки контроля четности и может быть любым местоположением, перечисленным в таблице выше. В данном примере местоположением является Кэш данных L3.

Error: SysAD, data cache, fields: data, 1st dword
Physical addr(21:3) 0x195BE88,
Virtual address is imprecise.
    Imprecise Data Parity Error
    Imprecise Data Parity Error

Замените PRE2 после второго неудачного завершения.

Пример 2:

Первая линия сообщения об ошибках указывает на местоположение ошибки контроля четности и может быть любым местоположением, перечисленным в таблице выше. В данном примере местоположение является Кэшем Инструкции по L3.

Error: SysAD, instr cache, fields: data, 1st dword
Physical addr(21:3) 0x000000,
virtual addr 0x6040BF60, vAddr(14:12) 0x3000
virtual address corresponds to main:text, cache word 0
 
          Low Data     High Data  Par  Low Data     High Data  Par
L1 Data:  0:0xAE620068 0x8C830000 0x00 1:0x50400001 0xAC600004 0x01
          2:0xAC800000 0x00000000 0x02 3:0x1600000B 0x00000000 0x01
           Low Data     High Data  Par  Low Data     High Data  Par
DRAM Data: 0:0xAE620068 0x8C830000 0x00 1:0x50400001 0xAC600004 0x01
           2:0xAC800000 0x00000000 0x02 3:0x1600000B 0x00000000 0x01

Как в Примере 1, замените PRE2 после второго неудачного завершения.

Анализ дерева неисправностей ECC быстрого пакета PRE2

Карта модульной конструкции FP является главной платой блока PRE2. Плата FP содержит пять специализированных интегральных схем (ASIC-схемы), одиночный ASIC Интерфейса объединительной платы и четыре Parallel Express Forwarding (PXF) ASIC-схемы Сетевой обработки. Каждый ASIC имеет доступ к системам внешней памяти.

Следующая схема помогает вам определять, какой компонент FP PRE2 ESR Серии Cisco 10000 ответственен за сообщения ошибки ECC:

/image/gif/paws/44228/esr10000c.gif

ОШИБКИ DDR FCRAM ECC ASIC интерфейса объединительной платы

ASIC Интерфейса объединительной платы имеет доступ к двум другим защищенным ECC Двойным скоростям передачи данных (DDR) Быстрое ОЗУ Цикла (FCRAM) воспоминания, Внешняя пакетная память (EPM) и Память внешнего управления (ECM).

  • FCRAM DDR ASIC интерфейса объединительной платы одноразрядные ошибки ECC

    SBEs обнаружены, и исправленные данные представлены.

    Об одноразрядных ошибках EPM сообщают следующим образом:

      %C10KEVENTMGR-1-MINOR_FAULT: PXF DMA Single Bit PMC (EPM) Error 
      %C10KEVENTMGR-1-PMC_SBE_DEBUG: Address: 0x0FFE4608, Who: 0x02
      Error taken in: Check bits, bit number: 0, Check byte value = 0x58
      Errant Data:    0x00008F00 80350000
      Corrected Data: 0x00008F00 80350000
    

    Об одноразрядных ошибках ECM сообщают следующим образом:

      %C10KEVENTMGR-1-MINOR_FAULT: PXF DMA Error - Correctable ECM Error 
      %C10KEVENTMGR-1-ECM_SBE_DEBUG: Address: 0x013FD0A8, Who: 0x01
      Error taken in:  Data bits, bit number: 32, Check byte value = 0x67
      Errant Data:    0x67CFFE58 00000000
      Corrected Data: 0x00CFFE59 00000000
    

    SBEs посчитаны и могут быть отображены путем запуска команды show pxf dma counters. Действие обычно не требуется для SBEs; однако, повторенные или частые экземпляры этих ошибок являются причиной для замены PRE2.

  • FCRAM DDR ASIC интерфейса объединительной платы мультибитовые ошибки ECC

    Когда обнаружено, FCRAM DDR ASIC Интерфейса объединительной платы MBEs заставляет микрокод Сетевой обработки PXF повторно загружать, и также создавать файл pxf_crashinfo в загрузочной флэш-памяти. Повторная загрузка микрокода Сетевой обработки PXF заставляет ASIC Интерфейса объединительной платы повторно инициализироваться, эффективно вычищая MBE от FCRAM DDR.

    Ниже приводится пример сообщения, распечатанного к консоли в ответ на EPM мультибитовая ошибка ECC в FCRAM DDR ASIC Интерфейса объединительной платы:

      %C10KEVENTMGR-1-MAJOR_FAULT: PXF DMA Multi-bit PMC (EPM) Error 
    Downloading Microcode: file=system:pxf/c10k2-11-ucode.106.1.0.0, version=106.1.0.0,
     description=Release Software created Tue 03-Jun-03 00:57
    

    Замените PRE2 после второго неудачного завершения.

    Ниже приводится пример сообщения, распечатанного к консоли в ответ на мультибитовую ошибку ECC ECM в FCRAM DDR ASIC Интерфейса объединительной платы:

      %C10KEVENTMGR-1-MAJOR_FAULT: PXF DMA Error - Uncorrectable ECM Error
    Downloading Microcode: file=system:pxf/c10k2-11-ucode.106.1.0.0, version=106.1.0.0,
     description=Release Software created Tue 03-Jun-03 00:57

    Замените PRE2 после второго неудачного завершения.

Обработка ошибок ECC в памяти столбца ASIC сетью PXF

Эти четыре PXF Network Processing ASIC имеют доступ к защищенной ECC памяти по столбцам FCRAM DDR или EXternal Column Memory (XCM).

  • Ошибки ECC в одиночных битах XCM на ASIC-микросхемах сетевой обработки PXF

    SBEs обнаружены, и исправленные данные представлены. SBEs посчитаны, и XCM PXF Network Processing ASIC, количество SBE может быть отображено путем запуска команды show pxf xcm.

    Когда обертки счетчика SBE, о SBEs сообщают, и RP вычищает адрес первого SBE, который был обнаружен PXF Network Processing ASIC. Ниже приводится пример сообщения сообщил, когда сообщают о SBE:

    %C10KEVENTMGR-1-MINOR_FAULT: T0 XCM1 FCRAM-A: Too many Toaster XCM ECC single bit errors

    Toaster (PXF Network Processing ASIC), номер и интерфейс FCRAM DDR в предыдущем сообщении отражают интерфейс XCM, где был обнаружен SBE от обернутого счетчика. Сообщение об ошибках выше указывает, что ошибка произошла на Toaster 0, XCM 1, Интерфейс A. Действие обычно не требуется для оберток счетчика SBE; однако, повторенные или частые экземпляры этих ошибок являются причиной для замены PRE2.

  • Сетевая обработка PXF мультибитовых ECC-ошибок ASIC XCM

    Мультибитные ошибки ECC при попытке коррекции XCM нельзя исправить. В системах с избыточными PRE2 XCM MBEs вызывает катастрофический отказ и аварийное переключение PRE. В системах с одиночным PRE2 обнаружением XCM MBEs вызывает повторную загрузку микрокода PXF Network Processing ASIC. Повторная загрузка микрокода повторно инициализирует все памяти XCM PXF Network Processing ASIC, эффективно вычищая ECC MBE из памяти. Следующие сообщения появляются в журнале и файле pxf_crashinfo или crashinfo (сведения об аварийном отказе):

      %PXF-2-FAULT: T3 XCM1 FCRAM-D: Multi-bit ECC error on bits [0:31]
    %C10KEVENTMGR-4-PXF_CRASHINFO: Writing PXF debug information to 
     bootflash:pxf_crashinfo_20030729-153845.
      %C10KEVENTMGR-1-MAJOR_FAULT: PXF DMA Toaster Fault, Restarting PXF
    00:08:01: Downloading Microcode: file=system:pxf/c10k2-11-ucode.6.1.0.0,
     version=6.1.0.0, description=Release Software created Mon 21-Jul-03 12:17
    

    Когда это происходит, сообщение об ошибках задает Toaster (T0, T1, T2 или T3), соответствующий номер XCM (0 или 1), и интерфейс FCRAM DDR (A, B, C, или D), который встретился с мультибитовой ошибкой ECC. Сообщение об ошибках выше указывает, что сбой был на Toaster 2, XCM 1, Интерфейс B.

    Замените PRE2 после второго неудачного завершения.


Дополнительные сведения


Document ID: 44228