이 문서에서는 %SYS-3-CPUHOG 오류 메시지의 원인을 나열하고 이러한 오류 문제를 해결하는 방법에 대해 설명합니다.
이 문서에 대한 특정 요건이 없습니다.
이 문서는 특정 소프트웨어 및 하드웨어 버전으로 한정되지 않습니다.
이 문서의 정보는 특정 랩 환경의 디바이스를 토대로 작성되었습니다. 이 문서에 사용된 모든 디바이스는 초기화된(기본) 컨피그레이션으로 시작되었습니다. 현재 네트워크가 작동 중인 경우, 모든 명령어의 잠재적인 영향을 미리 숙지하시기 바랍니다.
문서 규칙에 대한 자세한 내용은 Cisco 기술 팁 표기 규칙을 참조하십시오.
Cisco IOS® Software는 프로세스 감시 타이머를 사용하여 스케줄러가 현재 활성 프로세스를 주기적으로 폴링할 수 있습니다. 이 기능은 선점과 다릅니다. 그 대신, 모든 프로세스에서 CPU의 총 소비로 인해 시스템이 응답하지 않거나 완전히 잠기지 않도록 하는 fail-safe 메커니즘입니다.
프로세스가 정지되는 경우(예: 오랫동안 계속 실행되는 경우) 스케줄러가 프로세스를 강제로 종료할 수 있습니다.
스케줄러가 CPU에서 프로세스를 실행할 수 있도록 허용할 때마다 해당 프로세스에 대한 watchdog 타이머가 시작됩니다. 사전 설정된 기간이 지난 후 프로세스가 계속 실행되면 watchdog 프로세스는 인터럽트를 생성하고 "소프트웨어 강제 충돌"에 의해 라우터가 재시작됩니다(스택 추적에는 watchdog 프로세스가 충돌 트리거로 표시됨).
감시장치가 처음 만료되면 스케줄러는 다음과 같은 경고 메시지를 인쇄합니다.
%SYS-3-CPUHOG: Task ran for 2148 msec (20/13), Process = IP Input, PC = 3199482 -Traceback= 314B5E6 319948A
이 메시지는 프로세스가 CPU를 보류했음을 나타냅니다. 여기서는 "IP 입력" 프로세스입니다. 이 메시지는 일반적으로 라우터가 부팅될 때 또는 트래픽이 많은 상태에서 OIR(Online Insertion and Removal)과 같은 일시적인 상황에서 나타납니다. 라우터의 정상적인 작업 중에는 "%SYS-3-CPUHOG" 메시지가 나타나지 않아야 합니다.
프로세스를 실행하도록 예약한 후 라우터가 인터럽트 레벨에서 사용 중인 경우 프로세스가 실행된 기간의 어카운팅이 정확하지 않을 수 있습니다. 이는 CPUHOG가 프로세스 레벨 작업만 추적하기 때문입니다. CPU를 인터럽트하고 제어할 수 있는 인터럽트 수준 작업은 추적하지 않습니다.
인터럽트 레벨에서 실행하는 일반적인 프로세스는 패킷 스위칭입니다.
이 섹션에서는 다양한 시나리오에서 CPUHOG 메시지를 트러블슈팅하는 방법에 대해 설명합니다.
부팅 시퀀스 시 CPUHOG 메시지는 상당히 일반적입니다. 오류 메시지 자체는 부팅 프로세스가 CPU를 시스템이 유지하려고 했던 것보다 조금 더 오래 보유했으며 콘솔 출력에 메시지를 보내 CPU에 대한 정보를 제공했음을 의미합니다. 이 경우 프로세스는 CPUHOG가 발생한 위치를 나타내는 "Boot Load"입니다.
System Bootstrap, Version 11.1(12)XA, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) Copyright (c) 1997 by cisco Systems, Inc. C1600 processor with 16384 Kbytes of main memory program load complete, entry point: 0x4018060, size: 0x108968 %SYS-3-CPUHOG: Task ran for 2040 msec (6/6), Process = Boot Load, PC =40B513A -Traceback= 407EB6E 407F628 407D118 40180E0 40005B0 4015C3E 40152B2 4014ED4 40025B8 4003086 4015636 40021A8 400C616program load complete, entry point: 0x2005000, size: 0x4195b9 Self decompressing the image : ############################################################################ ############################################################################ ################################################################## [OK]
이 오류 메시지는 무시해도 됩니다. 부팅 프로세스 시 부트 로더는 CPU를 2-4초 동안 사용하며 해제하지 않습니다. CPU는 부팅 로더만 실행해야 하므로 부팅 시 문제가 아닙니다. 최신 부트 ROM은 해당 특정 메시지의 인쇄를 억제합니다.
또한 라우터가 큰 이미지를 로드할 때마다(예: Cisco 1600 Series 라우터 사용 시) 부트 헬퍼 이미지에서 CPUHOG 메시지가 나타날 수 있습니다. 이러한 라우터는 16MB 이상의 DRAM으로 구성됩니다.
이 메시지는 이미지를 로드하고 있을 때만 발생하며 시스템 작업 또는 로드 프로세스에 영향을 주지 않습니다. 어떤 경우든, 이는 시스템의 정상적인 작동에 영향을 주지 않기 때문에 외관상의 문제입니다.
라우터가 복잡하고 비교적 긴 작업 집합을 수행해야 하므로 CPUHOG 메시지는 OIR의 경우 일반적입니다. 삽입된 카드가 제대로 나오면 OIR에서 발생하는 CPUHOG 메시지에 대해 걱정할 필요가 없습니다.
CPUHOG 메시지는 디바이스에 결함이 있거나 응답하지 않을 때 플래시 디바이스(예: 플래시 카드 또는 SIMM(Flash single inline memory module))에 액세스하려고 할 때 나타날 수 있습니다. 문제가 다시 발생하면 TAC 담당자에게 문의하십시오.
참고: MSFC(RP) bootflash를 포맷할 때 CPUHOG 메시지가 있는 통합 Cisco IOS 소프트웨어(기본 모드) 또는 하이브리드 모드를 실행하는 Catalyst 6500이 있는 경우: Cisco Bug ID CSC53175(등록된 고객만)에 언급된 문제가 될 수 있으며 Cisco Ios Software 릴리스에서 해결됩니다. 12.1.11b, 12.1(12c)E5 또는 12.1(13)E 이상 버전
Cisco 12000 Series Internet Router에서 FIB(Forwarding Information Base)는 패킷 스위칭에 사용할 수 있도록 각 라인 카드에서 유지됩니다. FIB 트리의 구조로 인해 짧은 서브넷 마스크(/1과 /4 사이)를 사용하여 라우팅 변경을 수행하면 콘솔 로그에 다음과 같은 메시지가 표시될 수 있습니다.
SLOT 1: %SYS-3-CPUHOG: Task ran for 4024 msec (690/0), process = CEF IPC Background, PC = 400B8908. -Traceback= 400B8910 408FF588 408FF6F4 408FFE8C 400A404C 400A4038
Cisco IOS 소프트웨어의 프로세스가 2000ms(2초) 이상 실행되면 CPUHOG 메시지가 표시됩니다. 매우 짧은 서브넷 마스크에 대한 Cisco CEF(Express Forwarding) 업데이트의 경우 필요한 처리 양은 2,000ms를 초과할 수 있으며, 이는 이러한 메시지를 트리거할 수 있습니다. "CEF IPC Background" 프로세스는 전달 트리에서 접두사의 추가 및 제거를 제어하는 상위 프로세스입니다.
또한 CPU가 장기간 잠기면 패브릭 ping 오류로 인해 라인 카드가 충돌하거나 IPC 통신 시간 초과로 인해 FIB를 비활성화할 수 있습니다. 이러한 문제를 해결해야 하는 경우 Cisco 12000 Series 인터넷 라우터의 패브릭 핑 시간 초과 및 오류 문제 해결을 참조하십시오.
일반적으로 마스크가 /7보다 짧은 라우팅 업데이트는 오류 또는 악의적입니다. Cisco는 모든 고객이 그러한 업데이트의 처리 및 전파를 방지하기 위해 적절한 경로 필터링을 구성할 것을 권장합니다. 라우팅 필터를 구성하는 데 도움이 필요한 경우 기술 지원 담당자에게 문의하십시오.
BGP(Border Gateway Protocol) 또는 라우팅 테이블을 지울 때 "CEF IPC Background" 프로세스로 인해 CPUHOG 메시지를 트리거할 수도 있습니다.
대부분의 경우 이러한 오류 메시지는 Cisco IOS Software의 내부 소프트웨어 버그로 인해 발생합니다.
이러한 유형의 오류 메시지를 해결하기 위한 첫 번째 단계는 알려진 버그를 찾는 것입니다. 버그 툴킷(등록된 고객만 해당)을 사용하여 오류와 일치하는 버그를 찾을 수 있습니다. Bug Toolkit 페이지에서 Launch Bug Toolkit을 클릭하고 Search for Cisco IOS-related bug를 선택합니다. 검색 범위를 좁히려면 번호 1에서 Cisco IOS 소프트웨어 버전을 선택할 수 있습니다. 번호 3에서 "CPUHOG, <process>"에 대한 키워드 검색을 수행할 수 있습니다. 여기서 프로세스는 Virtual Exec 또는 IP 입력과 같은 해당 프로세스입니다.
릴리스 교육에서 최신 Cisco IOS Software 이미지로 업그레이드하여 모든 고정 CPUHOG 버그를 제거할 수 있습니다.
위의 트러블슈팅 단계를 거친 후에도 지원이 필요한 경우 Cisco TAC에 서비스 요청(등록된 고객만 해당)을 열려면 다음 정보를 포함해야 합니다. |
---|
참고: Cisco 12000 Series Internet Router에서 라인 카드 충돌 문제를 해결하는 데 필요하지 않은 경우, 문제의 근본 원인을 파악하는 데 필요한 중요한 정보가 손실될 수 있으므로 위의 정보를 수집하기 전에 라우터를 수동으로 다시 로드하거나 전원을 껐다가 다시 켜지 마십시오. |
개정 | 게시 날짜 | 의견 |
---|---|---|
1.0 |
24-Jun-2008 |
최초 릴리스 |