Маршрутизаторы : Маршрутизаторы Cisco серии 7500

Общие сведения о программных сбоях

5 апреля 2016 - Машинный перевод
Другие версии: PDF-версия:pdf | Перевод, выполненный профессиональным переводчиком (8 августа 2008) | Английский (31 декабря 2015) | Отзыв


Интерактивно этот документ предлагает анализ конкретного устройства Cisco.


Содержание


Введение

В данном документе освещены наиболее частые причины отказов ПО и перечислены сведения, которые необходимо собрать для устранения неисправности. При обращении в центр технической поддержки для устранения отказа ПО, чтобы решить проблему, понадобится запрашиваемая у вас информация.

Предварительные условия

Требования

Для использования данного документа требуется знание следующих тем:

Используемые компоненты

Настоящий документ не имеет жесткой привязки к каким-либо конкретным версиям программного обеспечения и оборудования.

Сведения, представленные в этом документе, были получены от устройств, работающих в специальной лабораторной среде. Все устройства, описанные в этом документе, были запущены с чистой (стандартной) конфигурацией. В рабочей сети необходимо изучить потенциальное воздействие всех команд до их использования.

Условные обозначения

Дополнительные сведения об условных обозначениях см. в документе Технические рекомендации Cisco. Условные обозначения.

Идентификация сбоя, вызванного программным обеспечением

Вызванный программным обеспечением сбой происходит, когда маршрутизатор обнаруживает серьезную неисправляемую ошибку и перезагружается, чтобы предотвратить передачу поврежденных данных. Большая часть отказов, вызванных программным обеспечением вызвана Cisco ошибки в программном обеспечении IOS�, невзирая на то, что некоторые платформы (такие как старый Cisco 4000) могут сообщить о неполадке в оборудовании как об отказе, вызванном программным обеспечением.

Если маршрутизатор не был выключен и сразу включен, либо перезагружен вручную, то при выполнении команды show version отображаются следующие выходные данные:

Router uptime is 2 days, 21 hours, 30 minutes 
System restarted by error - Software-forced crash, PC 0x316EF90 at 20:22:37 edt 
System image file is "flash:c2500-is-l.112-15a.bin", booted via flash

После получения с устройства Cisco выходных данных команды show version можно использовать инструмент Интерпретатор выходных данных (только для зарегистрированных клиентов), отображающий потенциальные проблемы и способы их устранения.

Возможные причины

В данной таблице приведены возможные причины отказов по причине ПО:

Причина Пояснение
Время ожидания Watchdog Процессор использует таймеры для предотвращения возникновения бесконечного цикла, который приводит к тому, что маршрутизатор перестает отвечать. При нормальной работе ЦП сбрасывает таймеры через определенные интервалы. В противном случае происходит перезагрузка системы. Таймауты устройства контроля Watchdog, которые воспринимаются как отказы ПО, происходят из-за проблем ПО. Дополнительные сведения о таймаутах Watchdog см. в документе Диагностика таймаутов Watchdog. Система зависла перед перезагрузкой. Таким образом, трассировка стека может не принести результатов. Этот тип отказа ПО можно проследить в этих строчках журналов регистрации консоли:
%SYS-2-WATCHDOG: Process aborted on watchdog timeout, process = Exec 

               and  

               *** System received a Software forced crash *** 
               signal = 0x17, code = 0x24, context= 0x60ceca60 
Нехватка памяти Когда маршрутизатору не хватает памяти, он может перегрузиться и сообщить об этом, как об отказе программного обеспечения. В этом случае сообщения об ошибках выделения памяти будут занесены в журналы консоли:
%SYS-2-MALLOCFAIL: Memory allocation of 734 bytes failed from 0x6015EC84, 
               pool Processor, alignment 0 
Поврежденный образ программного обеспечения Если при запуске маршрутизатор обнаружит повреждение образа ПО Cisco IOS, он выдаст сообщение compressed image checksum is incorrect и попытается перезагрузится. В таком случае данное событие будет рассмотрено как отказ ПО.
Error : compressed image checksum is incorrect 0x54B2C70A
        Expected a checksum of 0x04B2C70A


*** System received a Software forced crash ***
signal= 0x17, code= 0x5, context= 0x0
PC = 0x800080d4, Cause = 0x20, Status Reg = 0x3041f003
Это возможно из-за действительного повреждения образа ПО Cisco IOS во время передачи на маршрутизатор. Чтобы решить эту проблему, на маршрутизатор необходимо загрузить новый образ. [Дополнительные сведения о методе восстановления ROMMON см. в документе Процедура восстановления ROMmon для маршрутизаторов Cisco 7200, 7300, 7400, 7500, RSP7000, Catalyst 5500 RSM, uBR7100, uBR7200, uBR10000 и 12000.].] Это может также быть вызвано неисправным оборудованием памяти или ошибкой в программном обеспечении.
Другие проблемы Ошибки, вызывающие сбои, обычно обнаруживаются процессором, который автоматически переключается на выполнение специальной программы обработки ошибок в мониторе ROM. Монитор ROM идентифицирует ошибку, распечатывает сообщение, сохраняет сведения об ошибке и перезагружает систему. Существуют отказы, при которых ничего из вышеперечисленного не происходит (см. Таймауты Watchdog), а бывают отказы, при которых ПО обнаруживает проблему и запускает функцию crashdump. Это реальный отказ, вызванный программным обеспечением. На платформах Power PC при вызове функции crashdump выдачи сообщения "software-forced crash" как причины перезагрузки не происходило, во всяком случае до самого последнего времени. Эти сбои на данных платформах (до Cisco IOS Software Release 12.2(12.7)) называются исключениями SIGTRAP. Во всех остальных случаях SIGTRAP и SFC являются одним и тем же.

Устранение неполадок

Аварийные отказы, вызванные программным обеспечением, обычно возникают в результате ошибок в программах Cisco IOS. Если в журнале появилось сообщение об ошибке распределения памяти, см. документ Устранение неполадок, вызванных ошибками памяти.

Если в журнале нет сообщений об ошибках распределения памяти, и маршрутизатор не был перезагружен вручную после отказа ПО, в этом случае для определения идентификатора ошибки лучшим средством будет Интерпретатор выходных данных (только для зарегистрированных пользователей). Этот инструмент включает и возможности старого средства Stack Decoder.

Пример:

  1. Необходимо записать выходные данные команды show stack маршрутизатора.

  2. Перейдите к Интерпретатору выходных данных (только зарегистрированные клиенты) программное средство.

  3. В раскрывающемся меню выбрать show stack.

  4. Скопировать туда полученные выходные данные.

  5. Щелкните Submit (отправить).

    Если декодированные выходные данные команды show stack совпадут с известной программной ошибкой, будет выведен идентификатор предполагаемой ошибки, вызвавшей отказ ПО.

  6. Нажмите идентификатор, чтобы просмотреть дополнительные сведения об ошибке в Cisco Bug Toolkit (только для зарегистрированных пользователей), чтобы правильно определить идентификатор ошибки.

После определения соответствующего идентификатора ошибки в поле "fixed in" отобразится первая версия ПО Cisco IOS, содержащая исправление этой ошибки.

Если не удалось определить идентификатор ошибки или исправленную версию ПО Cisco IOS, необходимо обновить ПО Cisco IOS последней версией. . Это поможет, так как в последних версиях исправлена большая часть ошибок. Даже если это не помогло решить проблему, процессы составление отчета об ошибках и их устранения в последних версиях происходят намного быстрее и проще.

Если даже после использования Интерпретатора выходных данных не удалось исправить ошибку, необходимо обратиться в центр технической поддержки для получения дополнительных сведений об устранении ошибки и быстрого уведомления об окончательном решении проблемы.

Процедуры конфигурации

При обнаружении программной ошибки специалист центра технической поддержки Cisco TAC может попросить настроить маршрутизатор для получения содержимого памяти. Содержимое памяти иногда требуется для определения действий, необходимых для исправления программной ошибки.

Для сбора полезной информации из содержимого памяти рекомендуется использовать скрытую команду debug sanity. После ее применения каждый буфер подвергается санитарной проверке при распределении и освобождении. Команду debug sanity необходимо выполнять в привилегированном режиме EXEC (режим enable). Она использует некоторое количество ресурсов ЦП, но это не влияет на производительность маршрутизатора. Чтобы отключить санитарную проверку, необходимо в привилегированном режиме EXEC выполнить команду undebug sanity.

Для маршрутизаторов с объемом основной памяти 16 Мбайт и менее, можно использовать простейший протокол передачи файлов (TFTP) для сбора дампа основной памяти. Рекомендуется использовать протокол FTP, если основная память маршрутизатора больше 16 МБ. Можно использовать процедуры настройки, приведенные в данном разделе. Также см. Выгрузка содержимого памяти.

Процедура конфигурации маршрутизатора

Чтобы настроить маршрутизатор, необходимо выполнить следующие действия:

  1. Настроить маршрутизатор с помощью команды configure terminal.

  2. Ввести exception dump n.n.n.n, где "n.n.n.n" – IP-адрес удаленного TFTP-сервера.

  3. Выйдите из режима настройки.

Процедура конфигурации хоста TFTP-сервера

Чтобы настроить TFTP-сервер, необходимо выполнить следующие действия:

  1. Создать файл в каталоге /tftpboot на удаленном хосте, используя любой редактор. Имя файла состоит из имени хоста маршрутизатора Cisco и "-core".

  2. В UNIX-системах, измените режим разрешений файла "hostname-core" для глобальной совместимости (666). Настройки TFTP можно проверить с помощью команды copy running-config tftp для этого файла.

  3. Проверить, что доступно более 16 МБ свободного дискового пространства для каталога /tftpboot.

    В случае сбоя системы выходные данные команды exception dump сохраняются в вышеуказанном файле. Если маршрутизатор имеет более 16 МБ основной памяти, то для выгрузки содержимого памяти следует использовать протокол FTP или RCP. . На маршрутизаторе необходимо настроить следующее:

    exception protocol ftp 
    exception dump n.n.n.n 
    ip ftp username <string> 
    ip ftp password <string> 
    ip ftp source-interface <slot/port/interface> 
    exception core-file <core-filename>
    
    

    После сбора содержимое памяти необходимо выгрузить на ftp://ftp-sj.cisco.com/incoming (в UNIX необходимо ввести pftp ftp-sj.cisco.com, а затем cd incoming) и проинформировать владельца о проблеме и указать имя файла.

Информация, обязательная для сбора в случае обращения в центр технической поддержки

Если после выполнения описанных выше действий решить проблему не удалось и необходимо обращение в Центр технической поддержки Cisco, в запрос должна быть включена следующая информация:
Чтобы прикрепить указанные сведения к запросу на обслуживание, загрузите их через средство подачи запросов на обслуживание (только для зарегистрированных клиентов). Если средство TAC Service Request Tool недоступно, данные можно отправить как вложение в электронное сообщение по адресу attach@cisco.com, указав в теме сообщения номер запроса.

caution  Внимание! Нельзя вручную перезагружать или снимать/подавать питание на маршрутизатор до сбора данных, поскольку это может вызвать потерю важной информации, необходимой для определения источника проблемы.

Связанные обсуждения сообщества поддержки Cisco

В рамках сообщества поддержки Cisco можно задавать и отвечать на вопросы, обмениваться рекомендациями и совместно работать со своими коллегами.


Дополнительные сведения


Document ID: 26145