Универсальные шлюзы и серверы доступа : Оборудование Customer Premises Cisco серии 90

Причина сообщений %SYS-3-CPUHOG?

20 октября 2016 - Машинный перевод
Другие версии: PDF-версия:pdf | Перевод, выполненный профессиональным переводчиком (22 сентября 2010) | Английский (31 декабря 2015) | Отзыв


Содержание


Введение

В этом документе описываются причины сообщений об ошибках %SYS-3-CPUHOG, а также способы их устранения.

Предварительные условия

Требования

Для этого документа отсутствуют особые требования.

Используемые компоненты

Настоящий документ не имеет жесткой привязки к каким-либо конкретным версиям программного обеспечения и оборудования.

Сведения, представленные в этом документе, были получены от устройств, работающих в специальной лабораторной среде. Все устройства, описанные в этом документе, были запущены с чистой (стандартной) конфигурацией. В рабочей сети необходимо изучить потенциальное воздействие всех команд до их использования.

Условные обозначения

Дополнительные сведения об условных обозначениях см. в документе Технические рекомендации Cisco. Условные обозначения.

Общие сведения

Для сокращения влияния безудержных процессов программное обеспечение Cisco IOS₩½ использует контрольный таймер процесса, который позволяет планировщику периодически опрашивать в настоящее время активный процесс. Эта функция отличается от приоритетного прерывания обслуживания. В ней реализован отказоустойчивый механизм предотвращения потери связи с системой или ее полного зависания из-за одного процесса, поглощающего все ресурсы ЦП.

Если возникает предположение, что процесс завис (например, если его выполнение продолжается очень долго), планировщик может принудительно прервать этот процесс.

Всякий раз, когда планировщик разрешает процессу выполняться на данном процессоре, он запускает контрольный таймер для этого процесса. Через заданный промежуток времени, если процесс не прекратился, сторожевым таймером выполняется прерывание и перезапуск маршрутизатора как в случае сбоя, вызванного ошибкой ПО (в трассировке стека в качестве инициатора сбоя указывается процесс сторожевого таймера).

По истечении контрольного времени планировщик выводит предупреждающее сообщение:

%SYS-3-CPUHOG: Task ran for 2148 msec (20/13), Process = IP Input, PC = 3199482    
-Traceback= 314B5E6 319948A

Сообщение указывает на то, что процесс удерживает ресурсы процессора. В данном примере это процесс "IP Input". Обычно это сообщение появляется в переходных состояниях, например при операциях интерактивной вставки и удаления (OIR) в момент загрузки маршрутизатора или при большом объеме трафика. Сообщения "%SYS-3-CPUHOG" не должны появляться в ходе нормальной работы маршрутизатора.

Если маршрутизатор занят на уровне прерывания после того, как был запланирован запуск процесса, продолжительности выполнения процесса может фиксироваться не точно. Это происходит потому, что CPUHOG отслеживает только задачи уровня процессов. Задачи уровня прерываний, которым разрешено прерывание и получение контроля над ЦП, не отслеживаются.

Типичный процесс для запуска на уровне прерываний – коммутация пакетов.

Устранение неполадок

В этом разделе объясняются различные сценарии поиска и устранение неполадок, связанных с сообщениями CPUHOG.

CPUHOG в момент начальной загрузки

Сообщения CPUHOG, возникающие в момент выполнения последовательности загрузки, встречаются достаточно часто. Само по себе сообщение об ошибках означает, что процесс начальной загрузки задержал ЦП немного дольше, чем рассчитывала система, поэтому на консоль было послано сообщение, предупреждающее об этом. В рассматриваемом случае это процесс Boot Load, который указывает, где произошло CPUHOG:

System Bootstrap, Version 11.1(12)XA, EARLY DEPLOYMENT RELEASE SOFTWARE
(fc1)
Copyright (c) 1997 by cisco Systems, Inc.
C1600 processor with 16384 Kbytes of main memory

program load complete, entry point: 0x4018060, size: 0x108968

%SYS-3-CPUHOG: Task ran for 2040 msec (6/6), Process = Boot Load, PC =40B513A
-Traceback= 407EB6E 407F628 407D118 40180E0 40005B0 4015C3E 40152B2 4014ED4
40025B8 4003086 4015636 40021A8 400C616program load complete, entry point:
0x2005000, size: 0x4195b9
Self decompressing the image :
############################################################################
############################################################################
################################################################## [OK]

Такое сообщение можно игнорировать. Во время процесса загрузки программа начальной загрузки использует ЦП в течение 2-4 секунд, не освобождая его. Во время начальной загрузки это не представляет проблемы, поскольку все, что в тот момент должен выполнять ЦП, — это загрузчик операционной системы. В более поздних версиях загрузочных ПЗУ предусмотрено подавление этих сообщений об ошибке.

Кроме того, помощник загрузки будет отправлять сообщение CPUHOG при каждой загрузке крупного образа на маршрутизатор. Это происходит, например, при работе с маршрутизаторами серии Cisco 1600. Для их настройки требуется более 16 Мбайт памяти DRAM.

Эти сообщения выдаются только при загрузке образа и никак не влияют на работу системы или сам процесс загрузки. В любом случае здесь эта проблема носит косметический характер, поскольку она не нарушает работы системы.

CPUHOG при интерактивной вставке и удалении (OIR)

Сообщения CPUHOG часто выдаются во время операций интерактивной вставки и удаления, поскольку при этом маршрутизатору необходимо выполнить целый набор сложных и относительно продолжительных задач. На сообщения CPUHOG, появляющиеся во время операций интерактивной вставки и удаления (OIR), можно не обращать внимания, если вставленная плата функционирует в штатном режиме.

CPUHOG при попытке доступа к флэш-устройству

Сообщение CPUHOG может появляться при попытке доступа к флэш-устройству (например флэш-карте или модулю памяти), если это устройство неисправно или не отвечает на запросы. Если проблема воспроизводится, обратитесь к представителю центра технической поддержки (TAC).

Примечание: Если у вас есть Catalyst 6500, который выполняет программное обеспечение Integrated Cisco IOS (Режим работы в собственной системе команд) или Гибридный режим, и который имеет Сообщения CPUHOG, когда вы форматируете MSFC (RP) загрузочная флэш-память: это может быть проблема, упомянутая в идентификаторе ошибки Cisco CSCdw53175 (только зарегистрированные клиенты), который решен в Cisco IOS Software Release 12.1.11b, 12.1 (12c) E5, or12.1 (13) E и более поздние версии.

Захват CPU из-за процесса "CEF LC Background"

На Интернет-маршрутизаторе серий Cisco 12000 база данных переадресации (FIB) поддерживается на каждой линейной плате для использования в коммутации пакетов. Вследствие особенностей структуры дерева базы данных переадресации для изменяемых маршрутов с короткой маской подсети (между /1 и /4), в журнале консоли могут возникать следующие сообщения:

SLOT 1: %SYS-3-CPUHOG: Task ran for 4024 msec (690/0), 
process = CEF IPC Background, PC = 400B8908. 
-Traceback= 400B8910 408FF588 408FF6F4 408FFE8C 400A404C 400A4038

Если процесс в программном обеспечении Cisco IOS выполняется дольше 2000 мс (2 секунд), то выводится сообщение CPUHOG. В случае обновлений коммутации Cisco Express Forwarding (CEF) для очень коротких масок подсети время, требуемое процессору на выполнение этой операции, может превысить 2000 мс, что вызовет появление данных сообщений. Процесс "CEF IPC Background" является родительским процессом, управляющим добавлением и удалением префиксов из дерева переадресации.

Кроме того, если ЦП будет заблокирован в течение продолжительного периода времени, в линейной плате может произойти сбой из-за ошибки выполнения проверки Ping для коммутационной матрицы, а также может отключиться база данных FIB вследствие истечения времени ожидания для соединений IPC. Дополнительную информацию о решении этих проблем см. в разделе Устранение неполадок при истечении времени ожидания и возникновении сбоев выполнения команды "Fabric Ping" на Интернет-маршрутизаторах Cisco серии 12000.

Обычно обновления маршрутов с масками короче /7 связаны с ошибками или злонамеренными действиями. Поэтому Cisco рекомендует всем пользователям настроить соответствующие фильтры маршрутов, предотвращающие выполнение и распространение таких обновлений. Если необходима помощь при настройке фильтров маршрутов, обратитесь к локальному представителю службы технической поддержки.

Сообщение CPUHOG также может быть инициировано из-за процесса "CEF IPC Background" при очистке протокола пограничных шлюзов (BGP) или таблицы маршрутизации.

CPUHOG во время обычной работы маршрутизатора

В большинстве случаев эти сообщения об ошибках вызваны внутренней программной ошибкой Cisco IOS.

Первым шагом к устранению неполадок, связанных с таким сообщением об ошибках, является поиск известной ошибки. Для выявления аналогичных ошибок можно использовать средство Bug Toolkit (только для зарегистрированных пользователей). На странице Bug Toolkit щелкните Launch Bug Toolkit (Запуск Bug Toolkit), а затем выберите Search for Cisco IOS-related bugs (Поиск связанных ошибок Cisco IOS). Можно сузить диапазон поиска, указав версию программного обеспечения Cisco IOS в первом шаге 1. В третьем шаге можно выполнить поиск по ключевому слову "CPUHOG, <process>", где в качестве process укажите соответствующий процесс, например Virtual Exec или IP Input.

Обновление до последней версии образа программного обеспечения Cisco IOS для используемой группы версий позволит устранить все ранее исправленные ошибки CPUHOG.

Информация, обязательная для сбора в случае обращения в центр технической поддержки

Если после выполнения описанных выше действий по устранению проблем вам по-прежнему нужна помощь и вы планируете обращение в Центр технической поддержки Cisco (только для зарегистрированных пользователей), убедитесь в том, что в запрос включена следующая информация:
Приложите собранные данные к запросу на обслуживание в простом текстовом формате (.txt), не архивируя вложенный файл. Приложить информацию к запросу можно путем ее загрузки с помощью интерфейса TAC Service Request (только для зарегистрированных клиентов). При отсутствии доступа к средству Service Request можно отправить данные приложением электронной почты по адресу attach@cisco.com с номером сервисного запроса в строке "Тема" отправляемого сообщения.

Примечание: Вручную не повторно загружайте или выключайте маршрутизатор прежде, чем собрать вышеупомянутую информацию, пока не требуется для устранения проблем отказа линейной платы на Интернет-маршрутизаторе Cisco 12000 серии, поскольку это может заставить важную информацию быть потерянной, который необходим для определения основной причины проблемы.


Дополнительные сведения


Document ID: 15093