Маршрутизаторы : Маршрутизаторы Cisco серии 12000

Устранение неполадок оборудования IP-маршрутизаторов серии Cisco 12000

5 апреля 2016 - Машинный перевод
Другие версии: PDF-версия:pdf | Отзыв


Содержание


Введение

Часто ценное время и ресурсы тратят на замену исправного аппаратного обеспечения. Этот документ помогает диагностировать обычные проблемы оборудования Интернет-маршрутизатора серии Cisco 12000 и содержит указания для того, чтобы установить, является ли оборудование причиной отказа или нет.

Примечание: В данном документе не рассматриваются сбои ПО, за исключением тех, которые часто принимают за сбои аппаратного обеспечения.

Примечание: Кроме того, этот документ не покрывает шаги устранения проблем оборудования для линейных карт Серии Cisco 12000 (LC). Раздел "Устранение неполадок оборудования в случае отказа линейной платы IP-маршрутизатора серии Cisco 12000" содержит подробные процедуры по поиску и устранению проблем с линейной платой, которые можно неверно истолковать как отказ оборудования.

Предварительные условия

Требования

Ознакомление с этим документом требует наличия следующих знаний:

Этот документ может помочь идентифицировать причину сбоя, если проблема связана с аппаратной ошибкой.

Используемые компоненты

Сведения, содержащиеся в данном документе, относятся к следующим версиям программного и аппаратного обеспечения.

  • Все IP-маршрутизаторы серии Cisco 12000, включая 12008, 12012, 12016, 12404, 12406, 12410 и 12416.

  • Все версии программного обеспечения IOS� Cisco, которые поддерживают Интернет-маршрутизатор Cisco 12000 серии.

Сведения, представленные в этом документе, были получены от устройств в специфической лабораторной среде. Все устройства, используемые в этом документе, были запущены с чистой конфигурацией (конфигурацией по умолчанию). При работе с реальной сетью необходимо полностью осознавать возможные результаты использования всех команд.

Требования к памяти и совместимости аппаратного и программного обеспечения

Каждый раз, когда вы устанавливаете карту новой линии, модуль или Cisco образ программного обеспечения IOS�, важно проверить, что маршрутизатор имеет достаточно памяти, и что программное и аппаратное обеспечение совместимо с функциями, которые вы хотите использовать.

Выполните следующие рекомендованные шаги, чтобы проверить совместимость программного обеспечения с оборудованием и требования к памяти:

  1. Чтобы выбрать программное обеспечение для своего сетевого устройства, воспользуйтесь средствами советника по программному обеспечению (только для зарегистрированных клиентов).

    Советы:

    • Поддержка программного обеспечения для Раздела оборудования помогает вам проверять, поддерживаются ли модули и карты, установленные на маршрутизаторе, требуемой версией программного обеспечения Cisco IOS.

    • Раздел программной поддержки функций поможет выбрать образ программного обеспечения Cisco IOS, необходимый для намеченных вами функциональных возможностей.

  2. Используйте область загрузки ПО, чтобы проверить минимальное количество памяти (ОЗУ и Флэш) требуемый программным обеспечением Cisco IOS, и/или загрузить Образ ПОCisco IOS. Сведения об определении размера памяти (RAM и flash-памяти), установленной на маршрутизаторе, см. в разделе "Требования к памяти" документа "Как выбрать версию программного обеспечения Cisco IOS".

    Советы:

  3. Если выявлена необходимость обновления ПО для Cisco IOS, следуйте процедуре установки и обновления ПО для маршрутизатора Cisco серии 12000.

    Совет: За информацией о том, как восстановить маршрутизатор Cisco серии 12000, зависший в ROMmon (rommon # > prompt), обратитесь к разделу "Процедура восстановления ROMmon для Cisco 12000".

Условные обозначения

Дополнительные сведения об условных обозначениях см. в документе Технические рекомендации Cisco. Условные обозначения.

Компоненты Cisco 12000

В состав шасси Интернет-маршрутизатора Cisco серии 12000 входят следующие компоненты:

  • Шасси

  • Платы коммутационной матрицы (SFC)

  • Карты планировщика синхронизации (CSCs)

  • Сервер обслуживания BUS (MBUS)

  • Источники питания

  • Вентиляторы - разветвляющаяся компоновка

  • Платы предупредительной сигнализации

Сам корпус не содержит никаких электронных компонентов, поэтому очень редко является причиной аппаратных проблем; могут лишь погнуться или сломаться разъемы на задней стенке. Блоки питания, SFCs, CSCs, сигнальная карта и вентиляторы в сборе – все они содержат электронные компоненты и потому подвержены аппаратным проблемам. В основном аппаратные сбои данных компонентов приводят к сообщениям об ошибках или отказу маршрутизатора. Подробное описание всех компонентов и параметров взаимодействия между ними см. в документе "Архитектура Интернет-маршрутизатора Cisco серии 12000".

Выявление проблемы

Прочитав информацию, представленную ниже, и следуя инструкциям по устранению неисправностей, можно определить, связана ли ваша проблема маршрутизатора с неисправными техническими средствами.

Данные захвата

Первое, что нужно сделать – это определить причину отказа маршрутизатора и появления ошибок консоли. Чтобы обнаружить, в какой части предположительно произошел сбой, рекомендуется получить выходные данные следующих команд:

  • show context summary (показать сводку контекста)

  • show logging

В дополнение к данным команд show необходимо собрать следующую информацию:

  • Данные журнала консоли и/или системного журнала: Это может быть решающим в определении происхождения проблемы, если проявляется несколько симптомов. Если маршрутизатор установлен для передачи журналов к серверу системного журнала, можно видеть некоторую информацию о том, что произошло. Для создания журналов консоли рекомендуется иметь непосредственное подключение к маршрутизатору через консольный порт с включенной регистрацией.

  • Команда show technical-support: Команда show technical-support представляет собой компиляцию нескольких разных команд, включая show version, show running-config и show stacks. Когда возникают проблемы на маршрутизаторе, инженеры центра технической поддержки Cisco (TAC) обычно просят предоставить подробную информацию. Важно собрать сведения для службы технической поддержки до перезагрузки или выключения компьютера, поскольку эти процессы могут привести к потере всех данных о неполадке.

Признаки, вводящие в заблуждение

Есть несколько проблем, которые неверно могут быть истолкованы как проблемы с оборудованием, в то время как на самом деле они таковыми не являются. Достаточно часто маршрутизатор перестает отвечать на запросы или "зависает". Еще один случай, когда сбой происходит после установки нового оборудования. Крайне редко эти симптомы могут быть вызваны компонентом шасси. В таблице ниже перечислены симптомы, пояснения и шаги устранения проблем, которые часто понимают неправильно:

Признак

Пояснение/Устранение проблем
Cisco 12000 зависает во время обычной работы Как правило, причина заключается в сбое ПО, хотя иногда сбой может быть аппаратным. Посмотрите Зависания маршрутизатора Устранения проблем для этой проблемы.
Новая линейная карта не распознана Используйте средство Software Advisor (только для зарегистрированных пользователей), чтобы определить, поддерживается ли новая карта в текущей версии программного обеспечения Cisco IOS. При поддержке линейной платы конфигурируйте обновление сервиса, сохраните конфигурацию при помощи команды copy run start и энергетический цикл маршрутизатора. Иногда перезагрузка оказывается неэффективной, но при помощи включения и выключения удается исправить ошибку. Если новая карта не поддерживается в текущей версии Cisco IOS, перед выполнением обновления необходимо проверить объем памяти для хранения маршрутов на линейной плате. Для версии 12.0(21)S требуется 256 Мб памяти маршрута, особенно если протокол пограничных шлюзов (BGP) сконфигурирован на много одноранговых узлов и на много маршрутов.
Загрузка ЦПУ работает очень высоко Это может быть вызвано неполадками оборудования, но наиболее вероятная причина - неправильная конфигурация маршрутизатора или проблемы в сети. См. статью "Поиск и устранение причин высокого уровня загрузки процессора на маршрутизаторе Cisco".
На процессоре гигабитного канала маршрутизатора (GRP) появляются ошибки выделения памяти Проблемы аппаратного обеспечения почти никогда не бывают причиной ошибок размещения памяти. Подсказки устранения ошибок выделения памяти располагаются на странице устранения неполадок памяти.
Увеличение числа отброшенных введенных данных видно в выходных сведениях команды show interfaces Эта проблема не является следствием аппаратного сбоя маршрутизатора. Для устранения этой проблемы см. раздел "Устранение неполадок, связанных с потерей входящих данных, на IP-маршрутизаторе Cisco серии 12000".
Растущее число проигнорированных сообщений замечено в выходных данных команды show interfaces Одна из линейных плат, вероятнее всего, перегружена. Выполните действия, детализированные в Устранении проблем Пропущенных ошибок и сброс по причине нехватки памяти на Интернет-маршрутизаторе Cisco 12000 серии.
Сообщения об ошибках Базы данных переадресации (FIB) замечены на GRP Используйте Cisco Error Message Decoder (только для зарегистрированных клиентов), чтобы расшифровать сообщение об ошибках. Некоторые из них указывают к проблеме аппаратных средств или на линейной карте или на карте коммутационной матрицы (SFC или CSC); другие указывают на ошибку программного обеспечения Cisco IOS или проблему аппаратных средств на другой части маршрутизатора. Некоторый FIB и связанные с CEF сообщения объяснены в Устранении проблем связанных с CEF Сообщений об ошибках.
На GRP появляются сообщения, связанные с межпроцессорным взаимодействием (IPC). Декодер сообщений об ошибках Cisco ( только для зарегистрированных клиентов) позволит узнать значение данного сообщении об ошибках. Некоторые из них указывают к проблеме аппаратных средств или на линейной карте или на карте коммутационной матрицы (SFC или CSC); другие указывают на ошибку программного обеспечения Cisco IOS или проблему аппаратных средств на другой части маршрутизатора. Некоторые связанные с IPC сообщения объяснены у Cisco 12000, 10000, 7600, и маршрутизаторы серии "7500": Устранение неполадок сообщений IPC-3-NOBUFF.
На GRP видны следующие сообщения об ошибках:
%GRP-3-FABRIC_UNI: Unicast send timed out (1)
%GRP-3-COREDUMP: Core dump incident on slot 1, 
error: Fabric ping failure
Неудачные завершения команды ping для коммутационной матрицы могут появиться, когда либо линейная карта, либо дополнительный GRP не отвечает на запрос команды ping для коммутационной матрицы от основного GRP через коммутационную матрицу. Возникновение подобных ошибок является признаком проблемы и требует изучения. Дополнительные сведения по данной проблеме доступны в разделе "Устранение неполадок таймаута и ошибок проверки связи на маршрутизаторе Интернета Cisco серии 12000".
На GRP выдано следующее сообщение об ошибках:
%GRP-3-UCODEFAIL: Download failed to slot 5
Загруженный на линейную плату образ отклонен линейной платой. Можно попытаться перезагрузить микропрограмму, используя команду microcode reload configuration. Если сообщение об ошибках появляется снова, попробуйте обновить ROM и RAM агента MBUS, загрузчик коммутатора класса "предприятие" путем обновления всех слотовых команд, как показано в разделе "Обновление микропрограмм линейной платы на Интернет-маршрутизаторах Cisco серии 12000". Кроме того, можно обратиться к симптому в данной таблице "Новая линейная карта не распознается".

Пошаговое устранение неполадок

Устранение неполадок коммутационной матрицы (CSC и SFC)

GRP и карты каналов подключаются через матрицу координатного соединителя, которая предоставляет высокоскоростной маршрут почти для любых видов связи между картами. В число сообщений, передаваемых между GRP и линейными картами по коммутационной матрице, входят пакеты, которые фактически маршрутизируются и получаются, данные пересылки и статистические данные о трафике, а также большая часть данных управления и контроля. Поэтому для GRP важно, чтобы этот путь был правильным.

Признаки неполадок матрицы коммутации

Появление в журналах подобных сообщений об ошибках, скорее всего, указывает на неполадки коммутационной матрицы:

%FABRIC-3-CRC: Switch card 18

или

%FABRIC-3-PARITYERR: To Fabric parity error was detected. Grant parity error Data = 0x2.
SLOT 1:%FABRIC-3-PARITYERR: To Fabric parity error was detected. 
Grant parity error Data = 0x1

Следующие сообщения могут появляться или могут не появляться вследствие технических проблем коммутационной матрицы:

05:21:11: %GRP-3-FABRIC_UNI: Unicast send timed out (2)
05:21:16: %GRP-3-FABRIC_UNI: Unicast send timed out (2)

Возникновение подобных ошибок является признаком проблемы и требует изучения. Дополнительные сведения по данной проблеме содержатся в разделе "Устранение неполадок истечения времени ожидания и ошибок проверки связи на маршрутизаторе Интернета Cisco серии 12000".

Устранение неполадок, связанных с коммутационной матрицей

Если сбой коммутационной матрицы подозревается, выполните действия ниже:

  1. Сбор данных.

    Помните, что подключение к LC необходимо осуществлять через MBUS, используя команду attach. Команда execute-on зависит от механизма IPC (межпроцессорного взаимодействия), использующего коммутационную матрицу. Если у вас есть проблемы с IPC (проблемы с матрицей коммутации, ошибка в программном обеспечении, и т.д.), команды, которые работают удаленно через коммутационную матрицу, могут испытать таймаут. Обычно для команд, генерирующих значительное количество данных, рекомендуется подсоединить к LC для выполнения команды. Команда attach <slot #> всегда передается через шину MBUS.

    • show controllers via (для GRP)

    • attach <slot #>, потом show controllers fia, введите exit (повторите для каждого LC и дополнительного GRP)

    • часы show controllers (на GRP)

    • show log (ищут события Оперативной установки и демонтажа для объяснения Основных изменений CSC; ищите ошибки связанная с матрицей),

    • show log summary (поиск ошибок, связанных с матрицей)

    • show log slot <slot #>

  2. Проанализируйте данные

    Проблемы с коммутирующей матрицей могут возникать из-за следующих компонентов:

    • Уровень управления - GRP

    • Плоскость данных

    • Оборудование Tofab LC

    • Объединительная плата

    • CSC/SFC

    • Аппаратные средства LC frfab

    При диагностике ошибок матрицы начните с поиска шаблонов, по отношению к которым компоненты сообщают об ошибке. Например, объедините выводы команды show controllers fia от всех GRP и LC, чтобы увидеть, есть ли совпадения.

    Примечание: Для оставшейся части этого документа, когда мы говорим LC, это обращается к любому LC или GRP.

Увеличение числа CRC

Если вы видите crc16s в выходных данных команды show controllers fia, важно проверить, инкрементно увеличивается ли это количество. Очень важно коррелировать данные от основной GRP и других GRP/LC. Если один LC или одна карта коммутационной матрицы (CSC и/или SFC) были OIRed, можно ожидать видеть некоторые сообщения об ошибках матрицы и некоторый crc16s. Однако в дальнейшем это число не должно увеличиваться. Если это число увеличивается, необходимо заменить некоторые части из-за того, что оборудование является неисправным.

В приведенном ниже результате можно видеть состояние основного процессора гигабитного канала (GRP) и линейной платы (LC) в слоте 2:

Router#show controllers fia 
Fabric configuration: Full bandwidth, redundant fabric
Master Scheduler: Slot 17  Backup Scheduler: Slot 16
From Fabric FIA Errors
-----------------------
redund fifo parity 0    redund overflow 0      cell drops 0         
crc32 lkup parity  0    cell parity     0      crc32      0         
Switch cards present    0x001F    Slots  16 17 18 19 20
Switch cards monitored  0x001F    Slots  16 17 18 19 20
Slot:     16         17         18         19         20
Name:    csc0       csc1       sfc0       sfc1       sfc2
       --------   --------   --------   --------   --------
los    0          0          0          0          0          
state  Off        Off        Off        Off        Off       
crc16  0          0          0          1345       0
To Fabric FIA Errors
-----------------------
sca not pres 0          req error     0          uni FIFO overflow 0         
grant parity 0          multi req     0          uni FIFO undrflow 0         
cntrl parity 0          uni req       0          crc32 lkup parity 0         
multi FIFO   0          empty dst req 0          handshake error   0         
cell parity  0
Router#attach 2
Entering Console for 4 port ATM Over SONET OC-3c/STM-1 in Slot: 2
Type "exit" to end this session
Press RETURN to get started!
LC-Slot2>
LC-Slot2>enable
LC-Slot2#show controllers fia
From Fabric FIA Errors
-----------------------
redund FIFO parity 0          redund overflow 0          cell drops 0         
crc32 lkup parity  0          cell parity     0          crc32      0         
Switch cards present    0x001F    Slots  16 17 18 19 20 
Switch cards monitored  0x001F    Slots  16 17 18 19 20 
Slot:     16         17         18         19         20
Name:    csc0       csc1       sfc0       sfc1       sfc2
       --------   --------   --------   --------   --------
Los    0          0          0          0          0          
state  Off        Off        Off        Off        Off       
crc16  0          0          0          1345       0
To Fabric FIA Errors
-----------------------
sca not pres 0          req error     0          uni fifo overflow 0         
grant parity 0          multi req     0          uni fifo undrflow 0         
cntrl parity 0          uni req       0          crc32 lkup parity 0         
multi fifo   0          empty DST req 0          handshake error   0         
cell parity  0
LC-Slot2#exit
Disconnecting from slot 2.
Connection Duration: 00:00:21
Router#
... 

Проанализировав все команды show, можно составить похожую таблицу:

hwts_12000_22281a.gif

Данная таблица указывает, что сообщения об ошибках с SFC1 поступают с нескольких линейных плат. Таким образом, первым шагом будет изменение платы SFC. Далее описываются типичные ситуации появления ошибок и рекомендуемые действия (их следует выполнять по одному до устранения неполадок):

Совет: Каждый раз, когда замена рекомендуется, сначала проверьте, что карта правильно усажена (см. ниже). Следует ВСЕГДА переустанавливать соответствующую карту, чтобы быть уверенным, что она правильно установлена. Если после переустановки модуля CRC все еще увеличиваются, следует заменить модуль.

  • Ошибки frfab на одном или нескольких LC, полученные от одной платы матрицы:

    1. Замените матричную плату в гнезде в связи с ошибками

    2. Замените все платы матриц

    3. Замените объединительную плату

  • Ошибки Frfab на одной LC более чем с одной платы матрицы:

    1. Замена линейной платы

    2. Если ошибки инкрементно увеличивают, заменяют текущий основной CSC

    3. Если число ошибок не увеличивается, и в качестве главной используется плата CSC0, замените плату CSC1

Размещение карт коммутационной матрицы

Карты коммутационной матрицы в 12016 и 12416 нелегко вставить, может потребоваться некоторое усилие. Если любой из центров коммутации каналов (CSC) неправильно расположен, выдается следующее сообщение об ошибках:

%MBUS-0-NOCSC: Must have at least 1 CSC card in slot 16 or 17 
%MBUS-0-FABINIT: Failed to initialize switch fabric infrastructure

Данное сообщение об ошибках может быть получено и в том случае, если только малая часть CSCs и SFCs настроена для использования конфигураций четверти полосы пропускания. В этом случае не будет загружаться ни одна из линейных плат на основе механизмов Engine 1 и выше.

Если платы установлены правильно, четыре светодиода на CSC/SFC должны показывать состояние "on" (включено). Это единственный признак правильной установки плат. Если это не так, карта установлена неправильно.

В случае проблем, связанных с матрицей и загрузкой линейных плат, важно проверить, что все CSC и SFC правильно размещены и включены. Например, для создания резервной системы с полной полосой пропускания на 12016 необходимо три SFC и два CSC. Для достижения полной пропускной способности неизбыточной системы необходимы три модуля SFC и только один CSC.

Выходные данные команд show version и show controllers fia сообщают, какая аппаратная конфигурация работает в данный момент в устройстве.

Router#show version 
Cisco Internetwork Operating System Software 
IOS (tm) GS Software (GSR-P-M), Experimental Version 12.0(20010505:112551)
Copyright (c) 1986-2001 by cisco Systems, Inc. 
Compiled Mon 14-May-01 19:25 by tmcclure 
Image text-base: 0x60010950, data-base: 0x61BE6000

ROM: System Bootstrap, Version 11.2(17)GS2, [htseng 180] 
EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) 
BOOTFLASH: GS Software (GSR-BOOT-M), Version 12.0(15.6)S, 
EARLY DEPLOYMENT MAINTENANCE INTERIM SOFTWARE

Router uptime is 17 hours, 53 minutes 
System returned to ROM by reload at 23:59:40 MET Mon Jul 2 2001 
System restarted at 00:01:30 MET Tue Jul 3 2001 
System image file is "tftp://172.17.247.195/gsr-p-mz.15S2plus-FT-14-May-2001"

cisco 12016/GRP (R5000) processor (revision 0x01) with 262144K bytes of memory. 
R5000 CPU at 200Mhz, Implementation 35, Rev 2.1, 512KB L2 Cache 
Last reset from power-on

2 Route Processor Cards 
1 Clock Scheduler Card 
3 Switch Fabric Cards 
1 8-port OC3 POS controller (8 POs). 
1 OC12 POS controller (1 POs). 
1 OC48 POS E.D. controller (1 POs). 
7 OC48 POS controllers (7 POs). 
1 Ethernet/IEEE 802.3 interface(s) 
17 Packet over SONET network interface(s) 
507K bytes of non-volatile configuration memory.

20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K). 
8192K bytes of Flash internal SIMM (Sector size 256K).
...
Router#show controller fia 
Fabric configuration: Full bandwidth nonredundant
Master Scheduler: Slot 17
...

Мы рекомендуем считать Архитектуру Интернет-маршрутизатора Cisco 12000 серии: Коммутационная матрица для более подробной информации.

Ошибки предоставления четности и ошибки запросов

Вы могли бы испытать придерживающиеся типы ошибок:

  • От console log или выходных данных команды show log:

    %FABRIC-3-PARITYERR: To Fabric parity error was detected. 
    Grant parity error Data = 0x2.
    SLOT 1:%FABRIC-3-PARITYERR: To Fabric parity error was detected. 
    Grant parity error Data = 0x1
    
  • Выход команды show controllers fia показывает:

    Router#show controllers fia
    Fabric configuration: Full bandwidth, redundant fabric
    Master Scheduler: Slot 17     Backup Scheduler: Slot 16
    
    !-- Here you can see which CSC is the master CSC. 
    By default CSC1 in slot 17 is the master
     
    
    From Fabric FIA Errors
    -----------------------
    redund FIFO parity 0   redund overflow 0   cell drops 76
    
    !-- You may see some cell drops as well
    
    
    crc32 lkup parity  0    cell parity 0   crc32 0
    Switch cards present    0x001F    Slots  16 17 18 19 20
    Switch cards monitored  0x001F    Slots  16 17 18 19 20
    Slot:     16         17         18         19         20
    Name:    csc0       csc1       sfc0       sfc1       sfc2
           --------   --------   --------   --------   --------
    Los    0          0          0          0          0
    state  Off        Off        Off        Off        Off
    crc16  876        257        876        876        876
    
    !-- You will see some crc16
    
    
    To Fabric FIA Errors
    -----------------------
    sca not pres 0          req error     1          uni fifo overflow 0
    grant parity 1          multi req     0          uni fifo undrflow 0
    
    !-- Grant parity and/or Request error counter not 0
    
    
    cntrl parity 0          uni req       0          crc32 lkup parity 0
    multi fifo   0          empty DST req 0          handshake error   0
    cell parity  0
    

Fabric Interface ASIC (FIA) находится и на Gigabit Route Processor (GRP) и на линейных платах (LC). Он обеспечивает интерфейс между GRP/LC и картами коммутационной матрицы (CSC/SFC), в то время как ASIC управления планировщиком (SCA) расположена только на CSC. Это заботится о запросах передачи от линейных карт, и проблемы предоставляет обращаться к матрице.

Ошибки запроса оборудования

  • ошибка req - SCA обнаружил ошибку контроля четности на линиях req

  • grant parity – платой FIA обнаружена ошибка контроля четности на линиях арбитража

С помощью результатов выполнения команды show controllers fia можно определить, сообщают ли об этих ошибках сразу несколько линейных плат и происходило ли переключение CSC. Чтобы получить этот выход из определенной платы линии введите attach <slot #> и выполните команду show controller fia после того, как появится командная строка LC-Slot.

Примечание: Как объяснено выше, execute-on slot <слот #> команда show controllers fia не должна использоваться, с тех пор, если программное обеспечение Cisco IOS неспособно обработать эту ошибку, эта команда откажет.

  • Ошибки предоставления прав на нескольких LC

    1. Замена CSC (см. примечания ниже, чтобы определить, какой из них должен быть заменен)

    2. Замените объединительную плату

  • Ошибки предоставления на одной LC

    1. Замена линейной платы

    2. Замена CSC (см. примечания ниже, чтобы определить, какой из них должен быть заменен)

    3. Замените объединительную плату

Примечание: Если карты составной строки сообщают о паритете предоставления или ошибках запроса, и коробка все еще функционирует, то переключение CSC произошло. Неисправная карта планировщика (CSC) является резервной (а не картой основного планировщика в выходных данных команды show controller fia). Если "Остановлено" рядом с заголовком "От Ошибок Fabric Fia" или "К Ошибкам Fabric Fia", или если маршрутизатор больше не является перенаправлением трафика, то переключение CSC не произошло, и отказывающий CSC является тем, перечисленным как "Главный планировщик". По умолчанию CSC в SLOT 17 является основным, и CSC в слоте 16 является резервной копией.

На маршрутизаторах, выполняющих Cisco IOS Software Release без исправления к ошибке в программном обеспечении CSCdw10748 (только зарегистрированные клиенты), ошибки контроля четности предоставления могут привести к сбою уровня системы. Благодаря исправлению CSCdw10748 маршрутизатор с избыточными CSC не будет подвержен разрывам уровней сети в случае отказа оборудования. Будет осуществлена передача управления в результате ошибки к резервному CSC (если он существует).

Исправление для CSCdw10748 было включено в программное обеспечение Cisco IOS выпусков 12.0(17)ST4, 12.0(21)S, 12.0(21)ST, 12.0(19)ST02, 12.0(19)S02, 12.0(17)S04, 12.0(18)S04 и 12.0(16)S07.

Другие ошибки

Существуют другие ошибки, которые являются менее частыми и могут быть замечены в выходных данных команды show controllers fia:

Ошибки контроллера FIA при передаче из матрицы

  • Ошибки очереди (FIFO): ошибка переполнения избыточных данных. Это влечет за собой, если противодавление прервано, то From Fab вызывает противодавление и Scheduler Control ASIC (SCA) продолжает давать дополнительные данные для этого. Это может быть вызвано неполадками карты планировщика синхронизации (CSC). Попытайтесь переустановить карту; если это не работает, попытайтесь подкачать его.

  • Ошибки Последовательного соединения: Причина этого в том, что From Fab FIA теряет синхронизацию с одной из плат коммутационной матрицы (SFC) или плат планировщика синхронизации (CSC) (эта ошибка не генерируется для извлекаемой платы). В FIA есть встроенный механизм ожидания перед остановом FIA в течение определенного числа периодов ячеек. Для каждой платы есть счетчик потерь. В зависимости от информации, собранной из всего GRPs/LCs, должна существовать возможность для определения, какая часть неисправна.

Ошибки контроллера FIA при передачи в матрицу

  • Ошибки FIFO

    • uni FIFO overflow – переполнение одноадресной очереди FIFO, вызванное конфликтом между прикладной интегральной схемой управления буфером (BMA)/схемой сегментации и повторной сборки ячеек Cisco (CSAR) и FIA.

    • uni FIFO underflow – недогрузка одноадресного FIFO из-за разрешения SCA без реального получения запроса от FIA.

    Для ошибок FIFO сложно определить, какой компонент является сбойным: линейная карта или карта планировщика (CSC). Если многие платы показывают ошибки, следует подозревать CSC.

  • Ошибка матрицы: sca not pre - главное SCA (Управление планировщиком ASIC) потеряно. Решение этой проблемы состоит в бездействии и ожидании до момента, пока более высокие уровни определят, что имеет место проблема. Причина для того, чтобы не автоматически переключиться к избыточному CSC состоит в том, что на этом уровне вы не знаете, являются ли эти два SCA в синхронизовании. Если карта CSC была включена после исходной мощности на микросхемы SCA не будут в синхронизовании. Fabric Interface ASIC (FIA) находится и на Gigabit Route Processor (GRP) и на линейных платах (LC). Он обеспечивает интерфейс между GRP/LC и картами коммутационной матрицы (CSC/SFC), в то время как ASIC управления планировщиком (SCA) расположена только на CSC. Это заботится о запросах передачи от линейных карт, и проблемы предоставляет обращаться к матрице.

    или

    %FIA-3-PARITYERR: To Fabric parity error was detected.
    %FIA-3-HALT: To Fabric Request parity error interrupt = 0x4

    Выходные данные команды show controllers fia могут использоваться, чтобы определить, сообщают ли карты составной строки об этих ошибках и если переключение CSC имело место. Для получения этих выходных данных от определенной линейной карты введите слот присоединения нет: и выполните команду show controller fia после того, как появится приглашение Слота LC.

  • Ошибка установления связи BMA/CSAR: Это должно сопровождаться ошибкой контроля четности, которая должна указать на причину проблемы.

  • Ошибки запросов программного обеспечения: Существуют другие ошибки на FIA, которые не заставляют его становиться остановленным или вызывать прерывание. Они ежесекундно опрашиваются и подсчитываются. На Оптоволоконной стороне, эти ошибки являются ошибками программного запроса. Ошибки слежения обнаружены:

    • multi req — один адрес назначения в запросе на многоадресное вещание. FIA отправляет эту ячейку к месту назначения. Следует знать, что команда bug CSCdw05067 - show controller fia показывает несколько запросов на ATM LC с многоадресной рассылкой. Линейные платы ATM Engine 0 (1xOC12 и 4x0C3) могут записывать несколько ошибок "множественных запросов" в выходных данных команды show controller fia для соответствующих линейных плат, выполняющих распределение многоадресного трафика. Это бывает с каждым многоадресным пакетом, распределенным коммутатором на линейную плату с единственным назначением. Это чисто внешний эффект, потерь не происходит. Обходной путь должен отключить коммутацию распределенной групповой адресации.

    • uni req — несколько адресов в одноадресном запросе. FIA отбрасывает эту ячейку.

    • empty DST req – пустой запрос назначения. FIA отбрасывает эту ячейку.

Поиск и устранение неисправностей шины обслуживания (MBUS)

На этапе первоначальной загрузки первичный GRP использует MBUS для передачи указаний модулям MBUS на линейных картах и картах коммутации для включения этих карт. Затем в линейные карты по MBUS загружается образ программы самозагрузки. MBUS используется также для сбора сведений о версиях, среде и эксплуатации в целом. Кроме того, GRP обмениваются сообщениями избыточности через MBUS, что выдает отчет о результатах разрешения конфликтов GRP.

Следующие сообщения безопасны и ожидаются при условиях обычного маршрутизатора. При появлении данных не исчерпывающих сообщений выполнение каких-либо действий не требуется:

%MBUS-6-GRP_STATUS: GRP in Slot 0 Mode = MBUS Secondary

или

%MBUS-6-FIA_CONFIG: Switch Cards 0x1F (bit mask); Primary Clock CSC_1

Используйте средство декодирования сообщений об ошибках (только для зарегистрированных пользователей), чтобы определить, является ли сообщение ожидаемым или нет, и необходимо ли вам предпринять какие-то действия.

Если видите предупреждение об обновлении, похожее на это:

%MBUS-0-DOWNREV: Fabric Downloader in slot 2; use 
"upgrade fabric-downloader" command to update the image

Убедитесь, что версия загрузчика матрицы линейной платы синхронизована с одним из текущих выпусков Cisco IOS software release , запущенного на основном GRP. Можно настроить службу для полного обновления, сохранить конфигурацию и перезагрузить маршрутизатор для синхронизации RAM агента MBUS, Fab Downloader и т.д. Иногда перезагрузки недостаточно, однако отключение энергии работает всегда. Удостоверьтесь, что у вас есть достаточно памяти маршрутизатора на линейной карте для поддержки Cisco IOS Software Release.

Можно найти дополнительные сведения при Обновлении Микропрограммного обеспечения Линейной карты на маршрутизаторе Cisco серии 12000.

Для большего количества пояснений о цели Mbus и некоторых связанных с Mbus сообщений об ошибках, посмотрите Архитектуру Интернет-маршрутизатора Cisco 12000 серии: "Шина обслуживания, блоки питания и вентиляторы, аварийные карты".

Поиск и устранение ошибок, связанных с источником питания и системой охлаждения

Cisco 12000 Series Router поддерживает конфигурацию питания AC и DC. Все источники питания поддерживают распределение нагрузки и горячее подключение без перезагрузки.

Некоторые ошибки программного обеспечения связаны с непредусмотренным снижением напряжения. Обязательно выполните последний образ Cisco IOS Software Release, который доступен на области загрузки ПО для избавлений от всех известных связанных с напряжением ошибок в программном обеспечении, которые были исправлены тем временем.

Можно найти некоторые полезные ссылки для различных типов шасси в Архитектуре Интернет-маршрутизатора Cisco 12000 серии: "Шина обслуживания, блоки питания и вентиляторы, аварийные карты".

Устранение неполадок плат аварийной сигнализации

Существует несколько типов сигнальных плат в зависимости от типа шасси 12000. На Cisco 12008 и 12016/12416 платы сигнализации питают линейные платы, поэтому следует убедиться, что используется хотя бы одна карта сигнализации. Для 12008 требуется карта тревоги, поскольку она интегрируется с планировщиком и синхронизатором для карт (CSC). Модели 12016 и 12416 имеют два разъема сигнальных плат (для резервирования). Эти две платы сигнала тревоги не имеют сегментированных зон обслуживания подобно питанию постоянным током на 12016.

Cisco 12404 поддерживает объединенную плату коммутационной матрицы, содержащую коммутационную матрицу, сигнал тревоги и функции синхросигнала и расписания на одной плате.

Можно найти некоторые полезные ссылки для различных типов шасси в Интернет-маршрутизаторе Cisco 12000 серии: Платы предупредительной сигнализации.

Устранение неполадок линейных плат

Устранение проблем оборудования для документа Сбоев Линейной карты Интернет-маршрутизатора Cisco 12000 серии объясняет шаги, чтобы определить и устранить неполадки сбоев линейной карты. Устранение проблем Отказов линейной платы на Интернет-маршрутизаторе Cisco 12000 серии предоставляет сведения об устранении проблем для отказов линейной платы.

Устранение сообщений об ошибках четности

В документе "Дерево неисправностей, связанных с ошибками четности IP-маршрутизатора Cisco серии 12000" описаны этапы устранения неполадок и изолирования неисправных частей или компонентов IP-маршрутизатора Cisco серии 12000 после получения ряда сообщений об ошибках четности.

Информация, обязательная для сбора в случае обращения в центр технической поддержки

Если вы все еще требуете помощи после того, чтобы придерживаться действий по устранению проблем выше и хотите открыть запрос на обслуживание (только зарегистрированные клиенты) с Центром технической поддержки Cisco, несомненно будут включать следующую информацию для устранения проблем неполадок в оборудовании на Интернет-маршрутизаторе Cisco 12000 серии:
  • выходные данные команды show log или снимки консоли, показывающие предпринятые шаги по устранению неполадок и последовательность загрузки на каждом шаге
  • Журналы устранения неполадок
  • Выходные данные команды show technical-support
Присоедините собранные данные к описанию в простом текстовом файле (.txt). Можно подключить информацию к случаю путем загрузки его с помощью Программного средства Запроса на обслуживание (только зарегистрированные клиенты). Если служебная программа Service Request недоступна, необходимые данные можно отправить на адрес электронной почты attach@cisco.com. Чтобы эти данные были добавлены к запросу, в теме сообщения следует указать номер запроса.

Примечание: Не выполняйте ручную перезагрузку или выключение/включение маршрутизатора до сбора указанной информации (если это не требуется), поскольку это может вызвать потерю важной информации, необходимой для определения источника проблемы.

Связанные обсуждения сообщества поддержки Cisco

В рамках сообщества поддержки Cisco можно задавать и отвечать на вопросы, обмениваться рекомендациями и совместно работать со своими коллегами.


Дополнительные сведения