Маршрутизаторы : Маршрутизаторы Cisco серии 7500

Общие сведения о сбоях, вызванных программным обеспечением

8 августа 2008 - Перевод, выполненный профессиональным переводчиком
Другие версии: PDF-версия:pdf | Машинный перевод (28 июля 2013) | Английский (31 июля 2006) | Отзыв

Интерактивный документ: В данном документе содержится анализ конкретного устройства Cisco.


Содержание

Ведение
Предварительные условия
     Требования
     Используемые компоненты
     Условные обозначения
Идентификация сбоя, вызванного ПО
Возможные причины
Устранение неисправностей
Процедуры настройки
     Процедура настройки маршрутизатора
     Процедура настройки сервера TFTP
Сведения, необходимые при обращении в центр технической поддержки
Связанные обсуждения сообщества поддержки Cisco
Дополнительные сведения

Введение

В данном документе освещены наиболее частые причины отказов ПО и перечислены сведения, которые необходимо собрать для устранения неисправности. При обращении в центр технической поддержки для устранения отказа ПО, чтобы решить проблему, понадобится запрашиваемая у вас информация.

Предварительные условия

Требования

Для использования данного документа необходимо иметь представление о следующем:

Используемые компоненты

Настоящий документ не имеет жесткой привязки к устройству или какой-либо версии ПО.

Данные для документа были получены в специально созданных лабораторных условиях. Все устройства, используемые в этом документе, были запущены в исходной (заданной по умолчанию) конфигурации. Если ваша сеть работает в реальных условиях, убедитесь, что вы понимаете потенциальное воздействие каждой команды.

Условные обозначения

Дополнительную информацию об условных обозначениях в документах см. в разделе Условные обозначения, используемые в технической документации Cisco.

Идентификация сбоя, вызванного программным обеспечением

Вызванный программным обеспечением сбой происходит, когда маршрутизатор обнаруживает серьезную неисправляемую ошибку и перезагружается, чтобы предотвратить передачу поврежденных данных. Большинство отказов ПО вызвано ошибками Cisco IOS®, хотя некоторые платформы (например, старая Cisco 4000) иногда принимают аппаратную ошибку за отказ ПО.

Если маршрутизатор не был выключен и сразу включен, либо перезагружен вручную, то при выполнении команды show version отображаются следующие выходные данные:

Router uptime is 2 days, 21 hours, 30 minutes 
System restarted by error - Software-forced crash, PC 0x316EF90 at 20:22:37 edt 
System image file is "flash:c2500-is-l.112-15a.bin", booted via flash

После получения с устройства Cisco выходных данных команды show version можно использовать инструмент Интерпретатор выходных данных (только для зарегистрированных клиентов), отображающий потенциальные проблемы и способы их устранения.

Возможные причины

В данной таблице приведены возможные причины отказов по причине ПО.

Причина

Пояснение

Таймаут устройства контроля Watchdog

Процессор использует таймеры для предотвращения возникновения бесконечного цикла, который приводит к тому, что маршрутизатор перестает отвечать. При нормальной работе ЦП сбрасывает таймеры через определенные интервалы. В противном случае происходит перезагрузка системы.

Таймауты устройства контроля Watchdog, которые воспринимаются как отказы ПО, происходят из-за проблем ПО. Дополнительные сведения о таймаутах Watchdog см. в документе Диагностика таймаутов Watchdog. Система зависла перед перезагрузкой. Таким образом, трассировка стека может не принести результатов. Этот тип отказа ПО можно проследить в этих строчках журналов регистрации консоли:

%SYS-2-WATCHDOG: Process aborted on watchdog timeout, process = Exec 

               and  

               *** System received a Software forced crash *** 
               signal = 0x17, code = 0x24, context= 0x60ceca60 

Нехватка памяти

Когда маршрутизатору не хватает памяти, он может перегрузиться и сообщить об этом, как об отказе программного обеспечения. В этом случае сообщения об ошибках выделения памяти будут занесены в журналы консоли:

%SYS-2-MALLOCFAIL: Memory allocation of 734 bytes failed from 0x6015EC84, 
               pool Processor, alignment 0 

Поврежденный образ программного обеспечения

Если при запуске маршрутизатор обнаружит повреждение образа ПО Cisco IOS, он выдаст сообщение compressed image checksum is incorrect и попытается перезагрузится. В таком случае данное событие будет рассмотрено как отказ ПО.

Error : compressed image checksum is incorrect 0x54B2C70A
        Expected a checksum of 0x04B2C70A


*** System received a Software forced crash ***
signal= 0x17, code= 0x5, context= 0x0
PC = 0x800080d4, Cause = 0x20, Status Reg = 0x3041f003

Это возможно из-за действительного повреждения образа ПО Cisco IOS во время передачи на маршрутизатор. Чтобы решить эту проблему, на маршрутизатор необходимо загрузить новый образ. [Дополнительные сведения о методе восстановления ROMMON см. в документе Процедура восстановления ROMmon для маршрутизаторов Cisco 7200, 7300, 7400, 7500, RSP7000, Catalyst 5500 RSM, uBR7100, uBR7200, uBR10000 и 12000.]

Данная ситуация также может быть вызвана неисправными модулями памяти или ошибкой программного обеспечения.

Другие проблемы

Ошибки, вызывающие сбои, обычно обнаруживаются процессором, который автоматически переключается на выполнение специальной программы обработки ошибок в мониторе ROM. ROMmon идентифицирует ошибку, выводит сообщение, сохраняет сведения об ошибке и перезагружает систему.

Существуют отказы, при которых ничего из вышеперечисленного не происходит (см. Таймауты Watchdog), а бывают отказы, при которых ПО обнаруживает проблему и запускает функцию crashdump. Это настоящий отказ ПО.

На платформах Power PC при вызове функции crashdump выдачи сообщения "software-forced crash" как причины перезагрузки не происходило, во всяком случае до самого последнего времени. Сбои на данных платформах (до Cisco IOS 12.2(12.7)) называются исключениями "SIGTRAP". Во всех остальных случаях SIGTRAP и SFC являются одним и тем же.

Устранение неисправностей

Отказы программного обеспечения обычно возникают в результате ошибок ПО Cisco IOS. Если в журнале появилось сообщение об ошибке распределения памяти, см. документ Устранение неполадок, вызванных ошибками памяти.

Если в журнале нет сообщений об ошибках распределения памяти, и маршрутизатор не был перезагружен вручную после отказа ПО, в этом случае для определения идентификатора ошибки лучшим средством будет Интерпретатор выходных данных (только для зарегистрированных пользователей). Этот инструмент включает и возможности старого средства Stack Decoder.

Пример:

  1. Необходимо записать выходные данные команды show stack маршрутизатора.

  2. Открыть средство Интерпретатор выходных данных (только для зарегистрированных пользователей).

  3. В раскрывающемся меню выбрать show stack.

  4. Скопировать туда полученные выходные данные.

  5. Нажать кнопку submit.

    Если декодированные выходные данные команды show stack совпадут с известной программной ошибкой, будет выведен идентификатор предполагаемой ошибки, вызвавшей отказ ПО.

  6. Нажмите идентификатор, чтобы просмотреть дополнительные сведения об ошибке в Cisco Bug Toolkit (только для зарегистрированных пользователей), чтобы правильно определить идентификатор ошибки.

После определения соответствующего идентификатора ошибки в поле "fixed in" отобразится первая версия ПО Cisco IOS, содержащая исправление этой ошибки.

Если не удалось определить идентификатор ошибки или исправленную версию ПО Cisco IOS, необходимо обновить ПО Cisco IOS последней версией. Это поможет, так как в последних версиях исправлена большая часть ошибок. Даже если это не помогло решить проблему, процессы составление отчета об ошибках и их устранения в последних версиях происходят намного быстрее и проще.

Если даже после использования Интерпретатора выходных данных не удалось исправить ошибку, необходимо обратиться в центр технической поддержки для получения дополнительных сведений об устранении ошибки и быстрого уведомления об окончательном решении проблемы.

Процедуры настройки

При обнаружении программной ошибки специалист центра технической поддержки Cisco TAC может попросить настроить маршрутизатор для получения содержимого памяти. Содержимое памяти иногда требуется для определения действий, необходимых для исправления программной ошибки.

Для сбора полезной информации из содержимого памяти рекомендуется использовать скрытую команду debug sanity. После ее применения каждый буфер подвергается санитарной проверке при распределении и освобождении. Команду debug sanity необходимо выполнять в привилегированном режиме EXEC (режим enable). Она использует некоторое количество ресурсов ЦП, но это не влияет на производительность маршрутизатора. Чтобы отключить санитарную проверку, необходимо в привилегированном режиме EXEC выполнить команду undebug sanity.

Для маршрутизаторов с объемом основной памяти не более 16 Мбайт можно использовать протокол TFTP для сбора содержимого памяти. Для маршрутизаторов с объемом основной памяти больше 16 МБ рекомендуется использовать протокол FTP. Можно использовать процедуры настройки, приведенные в данном разделе. Также см. Выгрузка содержимого памяти.

Процедура настройки маршрутизатора

Чтобы настроить маршрутизатор, необходимо выполнить следующие действия:

  1. Настроить маршрутизатор с помощью команды configure terminal.

  2. Ввести exception dump n.n.n.n, где "n.n.n.n" – IP-адрес удаленного TFTP-сервера.

  3. Выйти из режима настройки.

Процедура настройки TFTP-сервера

Чтобы настроить TFTP-сервер, необходимо выполнить следующие действия:

  1. Создать файл в каталоге /tftpboot на удаленном хосте, используя любой редактор. Имя файла состоит из имени хоста маршрутизатора Cisco и "-core".

  2. В системах UNIX необходимо изменить режим разрешений файла "hostname-core" для полной совместимости (666). Настройки TFTP можно проверить с помощью команды copy running-config tftp для этого файла.

  3. Проверить, что доступно более 16 МБ свободного дискового пространства для каталога /tftpboot.

    В случае сбоя системы выходные данные команды exception dump сохраняются в вышеуказанном файле. Если маршрутизатор имеет более 16 МБ основной памяти, то для выгрузки содержимого памяти следует использовать протокол FTP или RCP. На маршрутизаторе необходимо настроить следующее:

    exception protocol ftp 
    exception dump n.n.n.n 
    ip ftp username <строка> 
    ip ftp password <строка> 
    ip ftp source-interface <слот/порт/интерфейс> 
    exception core-file <core-имя файла>
    
    

    После сбора содержимое памяти необходимо выгрузить на ftp://ftp-sj.cisco.com/incoming (в UNIX необходимо ввести pftp ftp-sj.cisco.com, а затем cd incoming) и проинформировать владельца о проблеме и указать имя файла.

Сведения, необходимые при обращении в центр технической поддержки

Если после выполнения описанных выше действий проблема осталась не решена, и необходимо обращение в центр технической поддержки Cisco, в запрос должна быть включена следующая информация:

  • Выходные данные команды show technical-support. Выходные данные команды show technical-support отображают информацию о текущем состоянии маршрутизатора, а также основные сведения, сохраненные маршрутизатором перед аварийным отказом.

  • Журнал консоли. В системных журналах, часто сохраняемых на syslog-сервере, записывается важная информация о событиях, произошедших до аварийного отказа маршрутизатора. Эти данные часто являются самыми важными из собранных сведений.

  • crashinfo file (если есть). Для устранения неполадок рекомендуется использовать версии ПО Cisco IOS, поддерживающие функцию crashinfo. Для этого версия ПО должна соответствовать остальным требованиям сети.

    Список версий ПО Cisco IOS, поддерживающих функцию crashinfo, см. в документе Извлечение информации из файла Crashinfo или используйте средство Software Advisor (только для зарегистрированных пользователей).

    Можно обновить старую версию ПО Cisco IOS более новой, поддерживающей эту функцию, в которой, возможно, уже исправлена произошедшая ошибка.

Чтобы прикрепить указанные сведения к запросу на обслуживание, их необходимо загрузить через средство TAC Service Request Tool (только для зарегистрированных пользователей). Если средство TAC Service Request Tool недоступно, данные можно отправить как вложение в электронное сообщение по адресу attach@cisco.com, указав в теме сообщения номер запроса.

Внимание Внимание! Нельзя вручную перезагружать или снимать/подавать питание на маршрутизатор до сбора данных, поскольку это может вызвать потерю важной информации, необходимой для определения источника проблемы.

Связанные обсуждения сообщества поддержки Cisco

В рамках сообщества поддержки Cisco можно задавать и отвечать на вопросы, обмениваться рекомендациями и совместно работать со своими коллегами.


Дополнительные сведения


Document ID: 26145