Маршрутизаторы : Сервисные маршрутизаторы агрегации Cisco ASR серии 1000

Устранение причин сбоя маршрутизаторов служб объединения Cisco ASR Cisco 1000

21 октября 2016 - Машинный перевод
Другие версии: PDF-версия:pdf | Английский (22 августа 2015) | Отзыв


Содержание


Введение

Этот документ предоставляет сведения о том, как устранить неполадки сбоев на Cisco� ASR Маршрутизаторы агрегации серии 1000.

Предварительные условия

Требования

Для этого документа отсутствуют особые требования.

Используемые компоненты

Сведения, содержащиеся в данном документе, касаются следующих версий программного обеспечения и оборудования:

  • Все сервисные маршрутизаторы агрегации Cisco ASR серии 1000, включая 1002, 1004, и 1006.

  • Все версии программного обеспечения Cisco IOS XE, которые поддерживают сервисные маршрутизаторы агрегации Cisco ASR серии 1000.

Сведения, представленные в этом документе, были получены от устройств, работающих в специальной лабораторной среде. Все устройства, описанные в этом документе, были запущены с чистой (стандартной) конфигурацией. В рабочей сети необходимо изучить потенциальное воздействие всех команд до их использования.

Условные обозначения

Дополнительные сведения об условных обозначениях см. в документе Условные обозначения технических терминов Cisco.

Сбои сервисных маршрутизаторов агрегации Cisco ASR серии 1000

Типы сбоев

Сервисные маршрутизаторы агрегации Cisco ASR серии 1000 представляют программное обеспечение Cisco IOS XE как свою архитектуру программного обеспечения. На основе программного обеспечения Cisco IOS программное обеспечение Cisco IOS XE является модульной операционной системой, основывался на Ядре Linux на Процессоре маршрута (RP), Процессоре Embedded Services (ESP) или Интерфейсном процессоре SPA (SIP). Демон IOS (IOSD) и другие процессы XE IOS работают на Ядре Linux, таким образом, существует несколько типов сбоев, показанных в Таблице 1 на сервисных маршрутизаторах агрегации Cisco ASR серии 1000.

Таблица 1 – типы сбоев

Типы сбоев Модуль Описание
Катастрофический отказ IOSD RP Программное обеспечение Cisco IOS выполняется как IOSD на Ядре Linux на RP.
Драйвер SPA катастрофический отказ SIP Ограниченное программное обеспечение Cisco IOS выполняется для управления SPA на SIP.
Катастрофический отказ процесса Cisco IOS XE RP ESP SIP Несколько Процессов Cisco IOS XE работают на Ядре Linux. Например, менеджер шасси, передающий менеджер, интерфейсный менеджер, и так далее работает на RP.
Катастрофический отказ микрокода процессора Quantum Flow (QFP) Cisco ESP Микрокод работает на QFP. QFP является пересылкой пакетов ASIC-схемы на ESP.
Катастрофический отказ ядра Linux RP ESP SIP Ядро Linux работает на RP, ESP, и SIP.

Получите информацию о катастрофическом отказе

При обнаружении с неожиданной перезагрузкой модуля необходимо удостовериться, что выходные данные консоли, каталог файла crashinfo и каталог файла разгрузки памяти доступны для устранения проблем. Чтобы выяснить причину, необходимо сначала собрать как можно больше информации о проблеме. Для определения причины сбоя очень важны следующие сведения:

  • Журналы консоли – дополнительную информацию см. в разделе "Применение правильных настроек эмулятора терминала для консольных подключений".

  • Сведения системного журнала — при настраивании маршрутизатора для передачи журналов к серверу системного журнала, вы в состоянии получить информацию о том, что произошло. Дополнительные сведения см. в "Общих сведениях настройки устройств Cisco для Syslog".

  • show platform  — команда show platform позволяет просмотреть состояние RP, ESP, SPA и блоков питания.

  • show tech-support — команда show tech-support объединяет много различных команд, включая show version и show running-config. Когда возникают сбои маршрутизатора, инженеры центра технической поддержки Cisco (TAC) обычно просят предоставить эту информацию для выяснения неисправности оборудования. Необходимо собрать техподдержку показа, прежде чем вы сделаете повторную загрузку или выключите, потому что эти действия могут вызвать потерю информации о проблеме.

    Примечание: Команда show tech-support не включает команды show platform или show logging.

  • Информация о Последовательности загрузки — полная последовательность загрузки, если маршрутизатор испытывает ошибки при загрузке.

  • Файл crashinfo (при наличии) — Видит раздел Файла crashinfo.

  • Файл разгрузки памяти (при наличии) — Видит раздел Файла разгрузки памяти.

  • Файл Tracelog (при наличии) — На сервисных маршрутизаторах агрегации Cisco ASR серии 1000, журналы трассировки процессов Cisco IOS XE генерируются под harddisk:tracelogs (ASR 1006 или ASR 1004) или bootflash:tracelogs (ASR 1002) на активном RP. Когда сбои процессов Cisco IOS XE, специалист службы технической поддержки Cisco обычно просит собирать эту информацию для решения проблемы.

Файл crashinfo

Когда IOSD или драйвер SPA сбои, файл crashinfo генерируется под местоположением, показанным в Таблице 2.

Таблица 2 – местоположение файла crashinfo

Модели Типы сбоев Местоположение файла crashinfo
ASR 1002 Драйвер SPA катастрофического отказа IOSD катастрофический отказ устройство загрузочной флэш-памяти: на RP
ASR 1004 ASR 1006 Катастрофический отказ IOSD устройство загрузочной флэш-памяти: на RP
Драйвер SPA катастрофический отказ жесткий диск: на RP

Таблица 3 отображает названия файла crashinfo.

Таблица 3 – название файла crashinfo

Типы сбоев Название файла crashinfo Пример
Катастрофический отказ IOSD Crashinfo_RP_SlotNumber_00_Date-часовой-пояс crashinfo_RP_00_00_20080807-063430-UTC
Драйвер SPA катастрофический отказ Crashinfo_SIP_SlotNumber_00_Date-часовой-пояс crashinfo_SIP_00_00_20080828-084907-UTC

Файл разгрузки памяти

Когда процесс завершается катастрофическим отказом, можно найти файл разгрузки памяти под местоположением показанным в Таблице 4. Дамп основной памяти является полной копией копии содержимого памяти процесса. Рекомендуется сохранить файлы разгрузки памяти, пока не сделано устранение проблем. Это вызвано тем, что дамп основной памяти включает много дополнительных сведений о проблеме катастрофического отказа, чем файл crashinfo, и это необходимо для глубокого расследования. В случае маршрутизатора Cisco ASR 1002, так как это не имеет жесткого диска: устройство, файл разгрузки памяти генерируется под bootflash:core/.

Таблица 4 – местоположение файла разгрузки памяти

Модели Местоположение файла разгрузки памяти
ASR 1002 устройство загрузочной флэш-памяти: ядро / на RP
ASR 1004 ASR 1006 жесткий диск: ядро / на RP

Не только дамп основной памяти RP, но и дамп основной памяти ESP или процессов SIP генерируются под тем же местоположением. В случае маршрутизатора Cisco ASR 1006 необходимо проверить то же местоположение резервного RP, потому что это был активный RP, когда произошла проблема.

Таблица 5 – название файла разгрузки памяти

Типы сбоев Название файла разгрузки памяти Пример
Катастрофический отказ IOSD hostname_RP_SlotNumber_ppc_linux_iosd-_ ProcessID.core.gz Router_RP_0_ppc_linux_iosd-_ 17407.core.gz
Драйвер SPA катастрофический отказ hostname_SIP_SlotNumber_mcpcc-lc-ms_ProcessID.core.gz Router_SIP_1_mcpcc-lc-ms_6098.core.gz
Катастрофический отказ процесса XE IOS hostname_FRU_SlotNumber_ProcessName_ProcessID.core.gz Router_RP_0_fman_rp_28778.core.gz Router_ESP_1_cpp_cp_svr_4497.core.gz
Cisco катастрофический отказ QFP hostname_ESP_SlotNumber_cpp-mcplo-ucode_ID.core.gz Router_ESP_0_cpp-mcplo-ucode_042308082102.core.gz
Катастрофический отказ ядра Linux hostname_FRU_SlotNumber_kernel.core Router_ESP_0_kernel.core

Катастрофический отказ IOSD

Демон IOS (IOSD) выполняется как его собственный процесс Linux (ppc_linux_iosd-) на RP. На двойном режиме IOS (только маршрутизатор Cisco ASR 1002 и маршрутизатор Cisco ASR 1004), два IOSDs работают на RP.

Для определения катастрофического отказа IOSD найдите выходные данные исключения ниже на консоли. В случае маршрутизатора Cisco ASR 1002 или катастрофического отказа маршрутизатора Cisco ASR 1004 без двойного режима IOS, повторно загружена коробка. В случае маршрутизатора Cisco ASR 1002 или катастрофического отказа маршрутизатора Cisco ASR 1004 с двойным режимом IOS, IOSD переключен на RP. В случае катастрофического отказа маршрутизатора Cisco ASR 1006 переключен RP, и новый резервный RP повторно загружен.

Exception to IOS Thread:
Frame pointer 2C111978, PC = 1029ED60

ASR1000-EXT-SIGNAL: U_SIGSEGV(11), Process = Exec
-Traceback= 1#106b90f504fce8544ce4979667ec2d5d  
   :10000000+29ED60 :10000000+29ECB4 :10000000+2A1A9C 
:10000000+2A1DAC :10000000+492438 :10000000+1C22DC0 
   :10000000+4BBBE0 

Fastpath Thread backtrace: 
-Traceback= 1#106b90f504fce8544ce4979667ec2d5d  
   c:BC16000+C2AF0 c:BC16000+C2AD0 
iosd_unix:BD73000+111DC pthread:BA1B000+5DA0 

Auxiliary Thread backtrace: 
-Traceback= 1#106b90f504fce8544ce4979667ec2d5d  
   pthread:BA1B000+95E4 pthread:BA1B000+95C8 
c:BC16000+D7294 iosd_unix:BD73000+1A83C 
   pthread:BA1B000+5DA0 

PC  = 0x1029ED60  LR  = 0x1029ECB4  MSR = 0x0002D000
CTR = 0x0BD83C2C  XER = 0x20000000
R0  = 0x00000000  R1  = 0x2C111978  R2  = 0x2C057890  R3  = 0x00000034
R4  = 0x000000B4  R5  = 0x0000003C  R6  = 0x2C111700  R7  = 0x00000000
R8  = 0x12B04780  R9  = 0x00000000  R10 = 0x2C05048C  R11 = 0x00000050
R12 = 0x22442082  R13 = 0x13B189AC  R14 = 0x00000000  R15 = 0x00000000
R16 = 0x00000000  R17 = 0x00000001  R18 = 0x00000000  R19 = 0x00000000
R20 = 0x00000000  R21 = 0x00000000  R22 = 0x00000000  R23 = 0x00000001
R24 = 0x00000001  R25 = 0x34409AD4  R26 = 0x00000000  R27 = 0x2CE88448
R28 = 0x00000001  R29 = 0x00000000  R30 = 0x3467A0FC  R31 = 0x2C1119B8

Writing crashinfo to bootflash:crashinfo_RP_00_00_20080904-092940-UTC
Buffered messages: (last 4096 bytes only)
...

Когда IOSD завершается катастрофическим отказом, файл crashinfo и файл разгрузки памяти генерируются на RP.

Router#dir bootflash:
Directory of bootflash:

bootflash:crashinfo_RP_00_00_20080904-092940-UTC


Router#dir harddisk:core
Directory of harddisk:core/

3620877  -rw-    10632280   Sep 4 2008 09:31:00 +00:00  
   Router_RP_0_ppc_linux_iosd-_17407.core.gz

Драйвер SPA катастрофический отказ

Драйверы SPA ограничили функции IOS для контроля за SPA и работали на SIP из-за процесса mcpcc-lc-ms и одного из процессов Cisco IOS XE. Можно определить драйвер SPA катастрофический отказ, если вы находите, что удержан процесс mcpcc-lc-ms. После того, как драйвер SPA завершается катастрофическим отказом, повторные загрузки SPA.

Aug 28 08:52:12.418: %PMAN-3-PROCHOLDDOWN: SIP0: 
   pman.sh:  The process mcpcc-lc-ms has been helddown (rc 142)
Aug 28 08:52:12.425: %ASR1000_OIR-6-REMSPA: 
   SPA removed from subslot 0/0, interfaces disabled
Aug 28 08:52:12.427: %SPA_OIR-6-OFFLINECARD: 
   SPA (SPA-1X10GE-L-V2) offline in subslot 0/0
Aug 28 08:52:13.131: %ASR1000_OIR-6-INSSPA: 
   SPA inserted in subslot 0/0
Aug 28 08:52:19.060: %LINK-3-UPDOWN: SIP0/0: 
   Interface EOBC0/1, changed state to up
Aug 28 08:52:20.064: %SPA_OIR-6-ONLINECARD: 
   SPA (SPA-1X10GE-L-V2) online in subslot 0/0

Когда драйвер SPA завершается катастрофическим отказом, файл crashinfo и файл разгрузки памяти генерируются на RP.

Router#dir harddisk:
Directory of harddisk:/

   14  -rw-      224579  Aug 28 2008 08:52:06 +00:00  
   crashinfo_SIP_00_00_20080828-085206-UTC

Router#dir harddisk:core
Directory of harddisk:/core/

4653060  -rw-     1389762  Aug 28 2008 08:52:12 +00:00  
   Router_SIP_0_mcpcc-lc-ms_6985.core.gz

Катастрофический отказ процесса Cisco IOS XE

Процессы Cisco IOS XE работают на Ядре Linux на RP, ESP, и SIP. Таблица 6 перечисляет их основные процессы. Если катастрофический отказ происходит, повторные загрузки модуля.

Таблица 6 – основные процессы Cisco IOS XE

Title Имя процесса Модуль
Менеджер шасси cmand RP
cman_fp ESP
cmcc SIP
Контроль состояния emd RP, ESP, SIP
Передача менеджера fman_rp RP
fman_fp_image ESP
Менеджер хоста hman RP, ESP, SIP
Интерфейсный менеджер imand RP
imccd SIP
Менеджер Регистрации plogd RP, ESP, SIP
Сменный сервис psd RP
Процесс управления клиента QFP cpp_cr_svr ESP
Драйвер QFP процесс cpp_driver ESP
QFP HA сервер cpp_ha_top_level_server ESP
Процесс сервиса клиента QFP cpp_sp_server ESP
Менеджер Shell smand RP

В случае, если сбои процесса cpp_cp_svr на ESP маршрутизатора Cisco ASR 1006, это сообщение может появиться на консоли.

Jan 24 23:37:06.644 JST: %PMAN-3-PROCHOLDDOWN: 
   F0: pman.sh:  The process cpp_cp_svr has been helddown (rc 134)
Jan 24 23:37:06.727 JST: %PMAN-0-PROCFAILCRIT: F0: pvp.sh:  
   A critical processcpp_cp_svr has failed (rc 134)
Jan 24 23:37:11.539 JST: %ASR1000_OIR-6-OFFLINECARD: 
   Card (fp) offline in slot F0

Можно найти файл разгрузки памяти на harddisk:core/.

Router#dir harddisk:core
Directory of harddisk:/core/

1032194  -rw-    38255956  Jan 24 2009 23:37:06 +09:00  
   Router_ESP_0_cpp_cp_svr_4714.core.gz

tracelog процесса может включать полезные выходные данные.

Router#dir harddisk:tracelogs/cpp_cp*
Directory of harddisk:tracelogs/

4456753  -rwx       24868  Jan 24 2009 23:37:15 +09:00  
   cpp_cp_F0-0.log.4714.20090124233714

Cisco катастрофический отказ микрокода процессора потока Quantum

Cisco разработала Cisco Процессор Потока Quantum как обе архитектуры программного и аппаратного обеспечения. Первое поколение находится на двух кусках кремния; более поздние поколения могут быть однокристальными решениями, которые придерживаются той же архитектуры программного обеспечения, описанной здесь. Термин "Процессор Cisco QuantumFlow" один относится к полной архитектуре программного и аппаратного обеспечения сетевого процессора.

Когда QFP ucode сбои, ESP повторные загрузки. Для определения QFP ucode катастрофический отказ, найдите эти выходные данные на консоли или файле разгрузки памяти cpp-mcplo-ucode:

Dec 17 05:50:26.417 JST: %IOSXE-3-PLATFORM: F0: 
   cpp_cdm: CPP crashed, core file /tmp/corelink/
   Router_ESP_0_cpp-mcplo-ucode_121708055026.core.gz
Dec 17 05:50:28.206 JST: %ASR1000_OIR-6-OFFLINECARD: 
   Card (fp) offline in slot F0

Можно найти файл разгрузки памяти.

Router#dir harddisk:core
Directory of harddisk:core/

3719171  -rw-     1572864  Dec 17 2008 05:50:31 +09:00 
   Router_ESP_0_cpp-mcplo-ucode_121708055026.core.gz

Катастрофический отказ ядра Linux

На ASR Cisco, серии 1000, Ядро Linux работает на RP, ESP, и SIP. Когда Ядро Linux завершается катастрофическим отказом, повторные загрузки модуля без выходных данных катастрофического отказа. После того, как это загружается снова, можно определить катастрофический отказ Ядра Linux при обнаружении файла разгрузки памяти Ядра Linux. Размер ключевого файла ядра может составить больше чем 100 мегабайтов.

Router#dir harddisk:core
Directory of harddisk:/core/

393230  ----   137389415  Dec 19 2008 01:19:40 +09:00  
   Router_RP_0_kernel_20081218161940.core

Информация, обязательная для сбора в случае обращения в центр технической поддержки

При тихой необходимости в помощи после того, как вы выполняете действия выше и хотите открыть запрос на обслуживание с Центром технической поддержки Cisco, несомненно, будут включать эту информацию для устранения проблем отказа маршрутизатора:
  • Устранение проблем, выполненное ранее, перед подачей запроса на обслуживание
  • Выходные данные show platform (если это возможно, в режиме включения)
  • Выходные данные show logging или снимки консоли, при наличии
  • Выходные данные show tech-support (если это возможно, в режиме включения)
  • Файл crashinfo (если есть)
  • Файл разгрузки памяти (если есть)
Подключите собранные данные к своему запросу на обслуживание в неархивированном, открытый текстовый формат (.txt). Можно подключить информацию к запросу на обслуживание при загрузке его с Инструментом запросов службы технической поддержки (TAC) (только зарегистрированные клиенты). Если вы не можете обратиться к программному средству Запроса на обслуживание, можно подключить связанные сведения к запросу на обслуживание при передаче его к attach@cisco.com с номером заявки в строке темы сообщения.

Примечание: Вручную не повторно загружайте или выключайте маршрутизатор перед сбором этой информации, пока вы не обязаны устранять неполадки отказа маршрутизатора, потому что это может заставить важную информацию быть потерянной, который необходим для определения основной причины проблемы.


Дополнительные сведения


Document ID: 109723