본 제품에 대한 문서 세트는 편견 없는 언어를 사용하기 위해 노력합니다. 본 설명서 세트의 목적상, 편견 없는 언어는 나이, 장애, 성별, 인종 정체성, 민족 정체성, 성적 지향성, 사회 경제적 지위 및 교차성에 기초한 차별을 의미하지 않는 언어로 정의됩니다. 제품 소프트웨어의 사용자 인터페이스에서 하드코딩된 언어, RFP 설명서에 기초한 언어 또는 참조된 서드파티 제품에서 사용하는 언어로 인해 설명서에 예외가 있을 수 있습니다. 시스코에서 어떤 방식으로 포용적인 언어를 사용하고 있는지 자세히 알아보세요.
Cisco는 전 세계 사용자에게 다양한 언어로 지원 콘텐츠를 제공하기 위해 기계 번역 기술과 수작업 번역을 병행하여 이 문서를 번역했습니다. 아무리 품질이 높은 기계 번역이라도 전문 번역가의 번역 결과물만큼 정확하지는 않습니다. Cisco Systems, Inc.는 이 같은 번역에 대해 어떠한 책임도 지지 않으며 항상 원본 영문 문서(링크 제공됨)를 참조할 것을 권장합니다.
이 문서에서는 Cisco 라우터에 있는 프로세서 유형에 따라 버스 오류 충돌을 식별하는 방법과 이러한 충돌을 해결하는 방법에 대해 설명합니다.
Cisco에서는 이 문서를 진행하기 전에 Troubleshooting Router Crash(라우터 충돌 트러블슈팅)를 읽는 것이 좋습니다.
이 문서의 정보는 다음 소프트웨어 및 하드웨어 버전을 기반으로 합니다.
모든 Cisco IOS® 소프트웨어 버전
모든 Cisco 라우터
참고: 이 문서는 Cisco Catalyst 스위치 또는 MGX 플랫폼에는 적용되지 않습니다.
이 문서의 정보는 특정 랩 환경의 디바이스를 토대로 작성되었습니다.이 문서에 사용된 모든 디바이스는 초기화된(기본) 컨피그레이션으로 시작되었습니다.현재 네트워크가 작동 중인 경우, 모든 명령어의 잠재적인 영향을 미리 숙지하시기 바랍니다.
문서 규칙에 대한 자세한 내용은 Cisco 기술 팁 규칙을 참조하십시오.
프로세서가 존재하지 않는 메모리 위치(소프트웨어 오류)나 제대로 응답하지 않는 메모리 위치(하드웨어 문제)에 액세스하려고 하면 시스템에 버스 오류가 발생합니다.버스 오류는 전력 순환이 아니거나 수동으로 다시 로드되지 않은 경우 라우터에서 제공하는 show version 명령의 출력에서 식별할 수 있습니다.
Cisco 디바이스에서 show version 또는 show technical-support 명령(enable 모드에서)의 출력이 있는 경우 이 명령을 사용하여 잠재적인 문제 및 수정 사항을 표시할 수 있습니다.이를 사용하려면 등록된 고객이고 로그인되어 있고 JavaScript를 활성화해야 합니다.
Router uptime is 2 days, 21 hours, 30 minutes System restarted by bus error at PC 0x30EE546, address 0xBB4C4 System image file is "flash:igs-j-l.111-24.bin", booted via flash .........
콘솔 프롬프트에서 이 오류 메시지는 버스 오류 중에 표시될 수도 있습니다.
*** System received a Bus Error exception *** signal= 0xa, code= 0x8, context= 0x608c3a50 PC = 0x60368518, Cause = 0x20, Status Reg = 0x34008002 .........
그런 다음 라우터가 다시 로드됩니다.그러나 어떤 경우에는 라우터가 충돌 및 재로드의 루프에 들어가고 이 루프를 분리하려면 수동 개입이 필요합니다.
또 다른 관련 문제는 VIP(Versatile Interface Processor) 충돌입니다.이 문제가 발생하면 다음과 유사한 오류 메시지가 기록됩니다.
%VIP2 R5K-1-MSG: slot0 System reloaded by a Bus Error exception %VIP2 R5K-1-MSG: slot0 caller=0x600BC974 %VIP2 R5K-1-MSG: slot0 System exception: sig=10, code=0x408, context=0x605B51E0
마지막으로, Cisco 12000 Series 인터넷 라우터에서 라인 카드 충돌이 발생한 버스 오류 충돌 유형입니다.이 문제가 발생하면 이와 유사한 오류 메시지가 show context 출력에 기록됩니다.
Router#show context ... CRASH INFO: Slot 1, Index 1, Crash at 11:27:15 utc Wed May 16 2001 VERSION: GS Software (GLC1-LC-M), Version 12.0(16.5)S, EARLY DEPLOYMENT MAINTENANCE INTERIM SOFTWARE TAC Support: http://www.cisco.com/pcgi-bin/ibld/view.pl?i=support Compiled Thu 29-Mar-01 17:12 by ninahung Card Type: 3 Port Gigabit Ethernet, S/N System exception: SIG=10, code=0x2008, context=0x40D8DF44 System restarted by a Bus Error exception STACK TRACE: -Traceback= 40165800 4038D0FC 4025C7BC 4026287C 4029581C 402EECF8 400C0144 CONTEXT: $0 : 00000000, AT : 00000000, v0 : 00000044, v1 : 0FE00020 a0 : 00000000, a1 : 0FE00000, a2 : 00000000, a3 : 39EC6AAB t0 : 00000030, t1 : 34008D01, t2 : 34008100, t3 : FFFF00FF t4 : 400C01E8, t5 : 00000001, t6 : 00000001, t7 : 00000001 s0 : 40DCDD20, s1 : 0FE00000, s2 : 00000000, s3 : 000005DC s4 : 00000000, s5 : 0FE00020, s6 : 00000004, s7 : 414CF120 t8 : 41680768, t9 : 00000000, k0 : 00000000, k1 : FFFF8DFD gp : 40CB9780, sp : 4105BFE8, s8 : 41652BA0, ra : 4038D0FC EPC : 0x40165800, SREG : 0x34008D03, Cause : 0x00002008 ErrorEPC : 0xBFC22B94 -Process Traceback= No Extra Traceback
자세한 내용은 Cisco 12000 Series 인터넷 라우터의 라인 카드 충돌 문제 해결을 참조하십시오.
Cisco 디바이스에서 show context 명령의 출력이 있는 경우 Cisco CLI Analyzer를 사용하여 잠재적인 문제 및 수정 사항을 표시할 수 있습니다.Cisco CLI Analyzer를 사용하려면 등록된 고객으로 로그인한 상태여야 하고 JavaScript가 활성화되어 있어야 합니다.
첫 번째로 해야 할 일은 버스 오류가 발생했을 때 라우터가 액세스하려고 시도한 메모리 위치("주소" 또는 "주소 피연산자"라고도 함)를 찾는 것입니다.이 정보를 통해 결함이 Cisco IOS 소프트웨어 또는 라우터 하드웨어에 있는지 여부를 알 수 있습니다.이 예에서는 "System restarted by bus error at PC 0x30EE546, address 0xBB4C4"에서 라우터가 액세스하려는 메모리 위치는 0xBB4C4입니다. 위의 PC(프로그램 카운터) 값과 혼동하지 마십시오.
두 번째 작업은 라우터의 프로세서 유형을 확인하는 것입니다.라우터의 메모리 주소 위치는 프로세서 유형에 따라 다릅니다.Cisco 라우터에는 두 가지 주요 유형의 프로세서가 있습니다.
68000 프로세서
이는 라우터에 68000 프로세서가 있음을 나타내는 show version 출력의 일부입니다.
cisco 2500 (68030) processor (revision D) with 8192K/2048K bytes of memory.
68000 프로세서가 장착된 라우터 플랫폼에는 다음이 포함됩니다.
Cisco 1000 Series 라우터
Cisco 1600 Series 라우터
Cisco 2500 Series 라우터
Cisco 4000 Series 라우터
Cisco 7000(RP) Series 라우터의 RP(Route Processor) 모듈
RISC(Reduced Instruction Set Computing) 프로세서
이는 라우터에 RISC 프로세서가 있음을 나타내는 show version 출력의 일부입니다.
cisco 3640 (R4700) processor (revision 0x00) with 49152K/16384K bytes of memory.
R in(R4700)은 RISC 프로세서를 나타냅니다.
RISC 프로세서가 있는 라우터 플랫폼은 다음과 같습니다.
Cisco 3600 Series 라우터
Cisco 4500 Series 라우터
Cisco 4700 Series 라우터
Cisco 7500 Series 및 Cisco 7000(RSP7000) Series 라우터의 RSP(Route Switch Processor) 모듈
Cisco 7200 Series 라우터의 NPE(Network Processor Engine) 모듈
Cisco 7600 Series 라우터 또는 Catalyst 6000 스위치의 MSFC(Multilayer Switch Feature Card)
Cisco 1000 Series 인터넷 라우터의 PRE(Performance Routing Engine) 모듈
Cisco 12000 Series 인터넷 라우터의 GRP(Gigabit Route Processor) Module
주소와 프로세서 유형을 결정한 후에는 더 자세한 트러블슈팅으로 시작할 수 있습니다.
버스 오류가 발생했을 때 라우터에서 액세스하는 주소를 사용하여 show region 명령을 사용하여 주소가 해당하는 메모리 위치를 확인합니다.버스 오류로 보고된 주소가 show region 출력에 표시된 범위 내에 속하지 않으면 라우터가 잘못된 주소에 액세스하려고 시도했음을 의미합니다.이는 Cisco IOS 소프트웨어 문제임을 나타냅니다.Cisco CLI Analyzer(등록된 고객만)를 사용하여 show stacks 명령의 출력을 디코딩하고 버스 오류를 발생시키는 Cisco IOS Software 버그를 식별합니다.
반면, 주소가 show region 출력의 범위 중 하나에 속할 경우 라우터가 유효한 메모리 주소에 액세스했지만 해당 주소에 해당하는 하드웨어가 제대로 응답하지 않음을 의미합니다.하드웨어 문제를 나타냅니다.
다음은 show region 출력의 예입니다.
Router#show region Region Manager: Start End Size(b) Class Media Name 0x00000000 0x007FFFFF 8388608 Local R/W main 0x00001000 0x0001922F 98864 IData R/W main:data 0x00019230 0x000666B3 316548 IBss R/W main:bss 0x000666B4 0x007FEFFF 7965004 Local R/W main:heap 0x007FF000 0x007FFFFF 4096 Local R/W main:flhlog 0x00800000 0x009FFFFF 2097152 Iomem R/W iomem 0x03000000 0x037FFFFF 8388608 Flash R/O flash 0x0304033C 0x037A7D3F 7764484 IText R/O flash:text
참고: 일부 이전 Cisco IOS 소프트웨어 버전에서는 이 명령을 사용할 수 없습니다.show region 출력은 Cisco IOS Software Release 12.0(9)의 show tech-support 출력의 일부입니다.
주소는 16진수 형식으로 표시됩니다."시작" 및 "종료" 범위에 속하는 주소는 유효한 메모리 주소입니다.
주 메모리 또는 동적 RAM(DRAM)에 해당합니다.
iomem은 I/O(Input/Output) 메모리에 해당하며, 이는 서로 다른 플랫폼에 대해 다른 부분을 의미합니다.예를 들어, Cisco 2500용 DRAM, Cisco 4000용 SRAM(공유 RAM)
이전 예를 사용해도 System은 PC 0x30EE546, 주소 0xBB4C4에서 버스 오류로 다시 시작되며, 이 버스 오류 충돌은 show region 출력이 있는 Cisco 2500 라우터에서 발생합니다.주소 0xBB4C4는 0x000BB4C4와 같습니다. show region 출력을 사용하여 이 주소는 "main" 범위 또는 더 구체적으로 "main:heap" 또는 0x0066B4-0x007FFFF 범위에 포함됩니다.앞서 언급했듯이, "main"은 메인 메모리 또는 DRAM에 해당하므로, DRAM 칩을 확인해야 합니다.
새 라우터이거나 라우터가 한 위치에서 다른 위치로 이동된 경우 메모리 칩이 자주 헐거워집니다.메모리 칩을 슬롯에 재장착하거나 단단히 밀어 넣는 것이 좋습니다.대부분의 경우 이러한 유형의 충돌을 해결하기에 충분합니다.
버스 오류가 show region 주소 범위에 속하지 않는 주소와 충돌하려면 Cisco CLI Analyzer를 사용하여 show stacks 명령의 출력을 디코딩하고 버스 오류를 일으키는 Cisco IOS Software 버그를 식별합니다.어떤 버그 ID가 일치할 수 있는지 또는 어떤 Cisco IOS 소프트웨어 버전에 문제 해결 방법이 포함되어 있는지 확실하지 않은 경우, Cisco IOS 소프트웨어를 릴리스 교육에서 최신 버전으로 업그레이드하는 것은 대개 많은 버그에 대한 수정 사항이 포함되어 있으므로 문제를 해결하는 한 가지 옵션입니다.
Cisco 디바이스에서 show stacks 또는 show technical-support (from enable mode) 명령의 출력이 있는 경우 Cisco CLI Analyzer를 사용하여 잠재적인 문제 및 수정 사항을 표시할 수 있습니다.Cisco CLI Analyzer를 사용하려면 등록된 고객으로 로그인한 상태여야 하고 JavaScript가 활성화되어 있어야 합니다.
이 섹션을 진행하기 전에 68000 프로세서 플랫폼에서 버스 오류 충돌 문제 해결 섹션을 읽는 것이 좋습니다.
RISC 프로세서에서 Cisco IOS Software는 가상 주소를 물리적 주소로 변환하는 TLB(Translation Lookaside Buffer)를 사용하여 가상 주소를 사용합니다.따라서 RISC 프로세서에서 버스 오류로 보고된 주소는 68000 프로세서에서 사용하는 물리적 주소와 달리 가상 주소입니다.
show region 명령의 출력을 사용하여 버스 오류로 보고된 주소를 확인해야 합니다.이를 설명하기 위해 다음 예를 살펴보겠습니다.
System was restarted by bus error at PC 0x60104864, address 0xC
아래 show region 명령 출력을 사용하여 0xC가 유효한 가상 주소가 아닌지 확인할 수 있으며, 버스 오류가 소프트웨어 문제로 인해 발생했음을 확인할 수 있습니다.Cisco CLI Analyzer(등록된 고객만)를 사용하여 show stacks 또는 show technical-support(enable mode에서) 명령의 출력을 디코딩하고 버스 오류를 일으키는 Cisco IOS Software 버그를 식별합니다.
show region 명령을 사용할 때의 또 다른 장점은 메모리 매핑이 라우터에 설치된 메모리의 양에 따라 달라진다는 것입니다.예를 들어 64MB의 DRAM(64 x 1024 x 1024 = 6710864바이트 = 0x40000000바이트)이 있는 경우 DRAM 범위는 0x6000000000 - 0x63FFFF입니다.이는 show region 명령을 사용하여 확인됩니다.
Router#show version | i of memory cisco RSP2 (R4700) processor with 65536K/2072K bytes of memory. Router#show region Region Manager: Start End Size(b) Class Media Name 0x40000000 0x40001FFF 8192 Iomem REG qa 0x40002000 0x401FFFFF 2088960 Iomem R/W memd 0x48000000 0x48001FFF 8192 Iomem REG QA:writethru 0x50002000 0x501FFFFF 2088960 Iomem R/W memd:(memd_bitswap) 0x58002000 0x581FFFFF 2088960 Iomem R/W memd:(memd_uncached) 0x60000000 0x63FFFFFF 67108864 Local R/W main 0x60010908 0x60C80B11 13042186 IText R/O main:text 0x60C82000 0x60F5AF1F 2985760 IData R/W main:data 0x60F5AF20 0x610E35FF 1607392 IBss R/W main:BSS 0x610E3600 0x611035FF 131072 Local R/W main:fastheap 0x61103600 0x63FFFFFF 49269248 Local R/W main:heap 0x80000000 0x83FFFFFF 67108864 Local R/W main:(main_k0) 0x88000000 0x88001FFF 8192 Iomem REG QA_k0 0x88002000 0x881FFFFF 2088960 Iomem R/W memd:(memd_k0) 0xA0000000 0xA3FFFFFF 67108864 Local R/W main:(main_k1) 0xA8000000 0xA8001FFF 8192 Iomem REG QA_k1 0xA8002000 0xA81FFFFF 2088960 Iomem R/W memd:(memd_k1)
0x65FFFFFFFF에서 버스 오류가 발생하면 show region 출력은 메모리 양을 고려하여 잘못된 주소(소프트웨어 버그)임을 알려줍니다.
요약:
버스 오류로 표시된 주소가 라우터에서 사용하는 주소 범위 내에 있는지 확인하려면 show region 명령을 사용합니다.
주소가 가상 주소 범위 내에 있으면 이 범위에 해당하는 하드웨어를 교체합니다.
주소가 가상 주소 범위에 속하지 않을 경우 Cisco CLI Analyzer(등록된 고객만)를 사용하여 show stack 또는 show technical-support(from enable mode) 명령의 출력을 디코딩하고 버스 오류를 일으키는 Cisco IOS 소프트웨어 버그를 식별합니다.
현재 실행 중인 Cisco IOS Software Train의 최신 유지 보수 릴리스를 설치하는 것에 대해 신중하게 고려하십시오.
특수한 유형의 버스 오류 충돌은 손상된 PC(프로그램 카운터)로 인해 충돌이 발생한 경우입니다. PC 값은 버스 오류가 발생했을 때 프로세서가 실행 중인 명령의 위치입니다.손상된 PC로 인한 버스 오류가 발생하면 콘솔에 다음 메시지가 나타납니다.
%ALIGN-1-FATAL: Corrupted program counter pc=0x0, ra=0x601860BC, sp=0x60924540, at=0x60224854
이 경우 PC가 주소 0x0(아마 null 포인터 때문일 수 있음)으로 이동했지만 이 위치에서는 명령이 없습니다.소프트웨어 문제이므로 show region 명령을 확인할 필요가 없습니다.
다른 RISC 플랫폼(Cisco 3600, 4500 등)에서는 버스 오류가 아닌 불법 PC로 점프할 때 SegV 예외가 발생합니다.
PC 값이 주소 값과 같을 때 발생하는 버스 오류 충돌의 또 다른 유형이 있습니다.예:
System returned to ROM by bus error at PC 0x606B34F0, address 0x606B34F0
crashinfo 파일에서 다음을 수행합니다.
Unexpected exception, CPU signal 10, PC = 0x606B34F0 $0 : 00000000, AT : A001A24A, v0 : 00000000, v1 : 00000000 a0 : 00000000, a1 : 429CC394, a2 : 00000000, a3 : 62544344 t0 : 6069F424, t1 : 3400FF00, t2 : FFFFFFFB, t3 : 00000000 t4 : 606B8E68, t5 : 80000000, t6 : AA5C1022, t7 : 62FDE9D4 s0 : 62300000, s1 : 6281A1B8, s2 : 80007E20, s3 : 00000001 s4 : 00000001, s5 : 00000000, s6 : 62310000, s7 : 62544344 t8 : 62FDEA1C, t9 : 0D0D0D0D, k0 : 623079C0, k1 : 00000014 gp : 620B9E20, sp : 61E7E300, s8 : 00000000, ra : 606B8E68 EPC : 606B34F0, ErrorEPC : 606B8E68, SREG : 3400FF02 Cause 00004018 (Code 0x6): Instruction Bus Error exception -Traceback= 606B34F0 606B8E68
k1 레지스터 값은 0x14(16진수)로, 10진수 20과 같습니다.캐시 패리티 예외를 가리킵니다.이 경우 패리티 오류가 제대로 처리되지 않고 버스 오류로 인해 마스킹됩니다.캐시 패리티 예외를 처리하는 기능의 소프트웨어 버스 오류로 인해 라우터가 손상되었습니다.
이 충돌을 일반적인 프로세서 메모리 패리티 오류 충돌로 간주하여 PMPE(Processor Memory Parity Errors)에서 제공하는 권장 사항을 따라야 합니다.
또한 Cisco IOS Software 릴리스 12.2(10) 이후 수정된 CSCdv68388에 대한 수정 사항이 있는 버전으로 Cisco IOS Software 릴리스를 업그레이드하는 것도 고려해야 합니다. "캐시 오류 예외 처리기를 crash가 발생하지 않도록 변경"합니다.
이 섹션에서는 버스 오류 예외 부팅 루프에 대한 일반적인 문제 해결 방법에 대해 설명합니다.
로드된 Cisco IOS 소프트웨어는 설치된 하드웨어를 지원하지 않습니다.
소프트웨어 실패
잘못 장착된 하드웨어
하드웨어 장애
모든 네트워크 카드가 Cisco IOS 소프트웨어에서 지원되는지 확인합니다.Software Advisor(등록된 고객만 해당)는 하드웨어에 필요한 최소 버전의 Cisco IOS 소프트웨어를 제공합니다.또한 Cisco 7200 또는 Cisco 7500 Series 라우터와 같은 부팅 이미지를 지원하는 라우터가 있는 경우 bootflash 이미지가 설치된 하드웨어를 지원하는지 확인합니다.
2600 및 3600 라우터에서 라우터의 I/O 메모리는 기본 메모리의 백분율로 구성할 수 있습니다.설치된 네트워크 모듈 또는 WIC(WAN 인터페이스 카드)에 I/O 메모리 설정이 적합하지 않은 경우 2600/3600 플랫폼은 부팅에 문제가 발생할 수 있으며 버스 오류로 인해 충돌할 수 있습니다.
소프트웨어 컨피그레이션이 최근에 변경되었고 라우터가 부팅 루프에 있는 경우 소프트웨어 버그로 인해 이 문제가 발생할 수 있습니다.
라우터를 부팅할 수 없는 경우 컨피그레이션을 우회하여 문제가 발생하는지 여부를 식별할 수 있습니다.다음 단계를 수행합니다.
부팅 후 처음 60초 동안 라우터에 중단 시퀀스를 전송하여 ROMMON으로 전환합니다.
ROM Monitor에서 confreg 명령을 사용하여 컨피그레이션 레지스터를 0x2142와 같은 설정으로 변경하여 라우터의 컨피그레이션을 무시합니다.
rommon 1 > confreg 0x2142 You must reset or power cycle for new config to take effect rommon 2 > reset
라우터가 오류 없이 부팅될 경우 컨피그레이션 문제가 발생하여 문제가 발생합니다.컨피그레이션이 Cisco IOS 소프트웨어 및 하드웨어에서 지원되는지 확인합니다.지원되는 경우, 버그 툴킷(등록된 고객만 해당)을 사용하여 경험할 수 있는 소프트웨어 버그를 식별합니다.현재 실행 중인 Cisco IOS Software Train의 최신 유지 보수 릴리스를 설치하는 것에 대해 신중하게 고려하십시오.
버스 오류 부팅 루프가 발생한 경우 잘못 장착된 하드웨어로 인해 발생할 수 있습니다.3600 또는 4000 라우터와 같은 로우엔드 플랫폼의 경우 네트워크 모듈/네트워크 프로세서를 재장착합니다.
7200 또는 7500 라우터와 같은 고급 플랫폼의 경우 버스 오류 예외로 인해 다시 로드되는 프로세서, VIP, 포트 어댑터 또는 라인 카드를 재장착합니다.
버스 오류에 포함된 정보는 하드웨어를 격리하는 데 도움이 되지 않습니다.따라서 문제 하드웨어를 찾기 위해 카드를 제거하고 다시 삽입하는 것이 중요합니다.다음은 문제를 격리하기 위한 몇 가지 권장 단계입니다.
**위의 문제 해결 단계를 수행한 후에도 라우터에 연속 루프가 발생하지 않으면 네트워크 모듈이 잘못 장착되었기 때문일 수 있습니다.라우터를 24시간 모니터링하여 문제가 다시 발생하지 않고 라우터가 계속 작동하도록 하는 것이 좋습니다.
위의 트러블슈팅 단계를 거친 후에도 지원이 필요한 경우 Cisco Technical Support에서 케이스를 열려면 버스 오류 또는 버스 오류 예외 문제 해결을 위해 다음 정보를 포함해야 합니다. |
---|
참고: 버스 오류 예외를 트러블슈팅하는 데 필요하지 않은 경우 문제의 근본 원인을 파악하는 데 필요한 중요한 정보가 손실될 수 있으므로 위의 정보를 수집하기 전에 라우터를 수동으로 다시 로드하거나 전원을 껐다가 다시 켜지 마십시오. |