소개
이 문서에서는 Cisco 라우터의 패리티 오류를 일으키는 원인 및 문제 해결 방법에 대해 설명합니다.
사전 요구 사항
요구 사항
Cisco에서는 라우터 충돌 문제를 해결하는 방법에 대해 알고 있는 것이 좋습니다.
자세한 내용은 라우터 충돌 문제 해결을 참조하십시오.
사용되는 구성 요소
이 문서는 특정 소프트웨어 및 하드웨어 버전으로 한정되지 않습니다.
이 문서의 정보는 특정 랩 환경의 디바이스를 토대로 작성되었습니다.이 문서에 사용된 모든 디바이스는 초기화된(기본) 컨피그레이션으로 시작되었습니다.현재 네트워크가 작동 중인 경우, 모든 명령어의 잠재적인 영향을 미리 숙지하시기 바랍니다.
표기 규칙
문서 규칙에 대한 자세한 내용은 Cisco 기술 팁 표기 규칙을 참고하십시오.
패리티 오류 식별
메모리 패리티 오류는 다음과 같은 MIPS(MultiChannel Interface Processor) 기반 프로세서 제품에서 발생합니다.
-
Cisco 4500/4700 Series 라우터
-
Cisco 7500 Series 라우터(RSP1, RSP2, RSP4, RSP8, VIP2-10, VIP2-15, VIP2-20, VIP2-40, VIP2-50)
-
Cisco 7000 Series 라우터(RSP 7000)
-
Cisco 7200 Series 라우터(NPE-100, NPE-150, NPE-175, NPE-200, NPE-225, NPE-300)
-
Cisco 12000 Series 인터넷 라우터
다음은 시스템 내의 악성 패리티를 탐지하는 것과 관련된 몇 가지 메시지입니다(목록은 완전하지 않지만 가장 일반적인 메시지를 포함합니다).
-
show version 명령 출력에서 다음을 수행합니다.
System restarted by processor memory parity error at PC 0x6014F7C0,
address 0x0
또는
System restarted by shared memory parity error at PC 0x60130F40
Cisco 디바이스에서 show version 명령의 출력이 있는 경우 Cisco CLI Analyzer를 사용하여 잠재적인 문제 및 수정 사항을 표시할 수 있습니다.Cisco CLI Analyzer를 사용하려면 등록된 고객이어야 하며 로그인되고 JavaScript가 활성화되어 있어야 합니다.
-
콘솔 로그 또는 crashinfo 파일에서 다음을 수행합니다.
- *** Cache Error Exception ***
Cache Err Reg = 0xa401a65a
data reference, primary cache, data field error , error on SysAD Bus
PC = 0xbfc17950, Cause = 0x0, Status Reg = 0x3040d007
- Error: primary data cache, fields: data,
virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000
virtual address corresponds to main:data, cache word 0
Low Data High Data Par Low Data High Data Par
L1 Data : 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89
2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8
Low Data High Data Par Low Data High Data Par
Mem Data : 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89
2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8
- *** Shared Memory Parity Error ***
shared memory control register= 0xffe3
error(s) reported for: CPU on byte(s): 0/1
- %PAR-1-FATAL: Shared memory parity error
shared memory status register= 0xFFEF
error(s) reported for: CPU on byte(s): 0/1 2/3
- %RSP-3-ERROR: MD error 0000008000000200
%RSP-3-ERROR: QA parity error (bytes 0:3) 02
%RSP-3-ERROR: MEMD parity error condition
%RSP-2-QAERROR: reused or zero link error, write at addr 0100 (QA)
log 22010000, data 00000000 00000000
%RSP-3-RESTART: cbus complex
- %RSP-3-ERROR: CyBus error 01
%RSP-3-ERROR: read data parity
%RSP-3-ERROR: read parity error (bytes 0:7) 20
%RSP-3-ERROR: physical address (bits 20:15) 000000
- %RSP-3-ERROR: MD error 00800080C000C000
%RSP-3-ERROR: SRAM parity error (bytes 0:7) F0
%RSP-3-RESTART: cbus complex
소프트 및 하드 패리티 오류
두 가지 유형의 패리티 오류가 있습니다.
연구 결과에 따르면 소프트 패리티 오류는 하드 패리티 오류보다 10~100배 더 자주 발생합니다.따라서 Cisco에서는 사용자가 교체하기 전에 두 번째 패리티 오류를 기다리는 것이 좋습니다.이렇게 하면 네트워크에 미치는 영향이 크게 줄어듭니다.
문제 격리
라우터에 메모리가 여러 위치에 있습니다.이론적으로 모든 메모리 위치는 패리티 오류의 영향을 받을 수 있지만 대부분의 메모리 문제는 동적 RAM(DRAM) 또는 공유 RAM(SRAM)에서 발생합니다. 플랫폼에 따라 어떤 메모리 위치가 영향을 받았는지, 하드 패리티 오류인 경우 어떤 부분을 교체해야 하는지 확인할 수 있습니다.
Cisco 4500 및 4700 플랫폼
Cisco 4500 및 4700 플랫폼에서 crashinfo 파일은 Cisco IOS® Software 릴리스 12.2(10) 및 12.2(10)T 이전 버전에서 사용할 수 없습니다.
오류가 발생한 위치를 확인할 수 있는 한 가지 방법은 콘솔 로그에서 "restart reason"을 확인하고 show version 명령의 출력에서 다음을 확인합니다.
-
DRAM의 패리티 오류:
충돌 후 라우터를 수동으로 다시 로드하지 않은 경우 show version 출력은 다음과 같습니다.
System restarted by processor memory parity error at PC 0x601799C4,
address 0x0
System image file is "flash:c4500-inr-mz.111-14.bin", booted via flash
crashinfo 파일을 사용할 수 있거나 콘솔 로그가 캡처된 경우 다음과 같은 내용을 볼 수 있습니다.
*** Cache Error Exception ***
Cache Err Reg = 0xa0255c61
data reference, primary cache, data field error , error on SysAD Bus
PC = 0xbfc0edc0, Cause = 0xb800, Status Reg = 0x34408007
DRAM에서 패리티 오류가 반복적으로 발생하면 DRAM 또는 섀시에 결함이 있음을 나타냅니다.최근에 섀시를 제거했거나 하드웨어 구성 변경을 수행한 경우 DRAM 칩을 다시 장착하여 문제를 해결하십시오.그렇지 않으면 DRAM을 첫 번째 단계로 교체합니다.이렇게 하면 패리티 오류가 발생하지 않습니다.라우터가 계속 충돌하면 섀시를 교체합니다.
-
SRAM의 패리티 오류:
충돌 후 라우터를 수동으로 다시 로드하지 않은 경우 show version 명령 출력은 다음과 같습니다.
System restarted by shared memory parity error at PC 0x60130F40
System image file is "flash:c4500-inr-mz.111-14.bin", booted via flash
crashinfo 파일을 사용할 수 있거나 콘솔 로그가 캡처된 경우 다음과 같은 내용을 볼 수 있습니다.
*** Shared Memory Parity Error ***
shared memory control register= 0xffe3
error(s) reported for: CPU on byte(s): 0/1
또는
%PAR-1-FATAL: Shared memory parity error
shared memory status register= 0xFFEF
error(s) reported for: CPU on byte(s): 0/1 2/3
또는
*** Shared Memory Parity Error ***
shared memory control register= 0xffdf
error(s) reported for: NIM1 on byte(s): 0/1 2/3
참고:
-
CPU에 대해 오류가 보고되면 SRAM을 교체합니다.
-
NIM(x)에 대해 오류가 보고되면 슬롯(x)에서 네트워크 모듈을 교체합니다. 슬롯(x)에 할당된 SRAM도 영향을 받을 수 있습니다.이 경우 SRAM을 교체합니다.
SRAM의 반복 패리티 오류는 결함이 있는 SRAM 칩 또는 SRAM에 잘못된 패리티를 기록한 결함이 있는 네트워크 모듈을 나타냅니다.최근에 섀시를 제거했거나 하드웨어 컨피그레이션을 변경한 경우 네트워크 모듈과 SRAM 칩을 다시 장착하여 문제를 해결하십시오.그렇지 않으면 콘솔 로그에서 오류가 보고되는 위치를 확인합니다(위의 출력 예 참조).
RSP(Route/Switch Processor), NPE(Network Processing Engine) 및 RP(Route Processor) 플랫폼
Cisco 4000 Series와 마찬가지로, 이러한 플랫폼의 DRAM 또는 SRAM에 결함이 있기 때문일 수 있습니다.또한 결함이 있는 프로세서 카드(RP, RSP 또는 NPE) 때문일 수 있습니다. Cisco 7000 및 7500은 오류 또는 잘못 장착된 인터페이스 프로세서(레거시 xIP 또는 VIP)에 의해 생성된 패리티 오류를 보고할 수도 있습니다.
crashinfo 파일 및 콘솔 로그에서 다음 오류 메시지 중 하나를 확인합니다.
DRAM 또는 SRAM(MEMD)의 패리티 오류
RP, RSP 및 NPE의 경우 일반적으로 다음과 같은 항목이 표시됩니다.
Error: primary data cache, fields: data, (SysAD)
virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000
virtual address corresponds to main:data, cache word 0
또는
Error: primary data cache, fields: data, SysAD
phy21:3 0x201880, va14:12 0x1000, addr 63E01880
이는 RSP 자체에 문제가 있음을 나타냅니다.문제가 한 번만 발생하면 일시적인 문제일 수 있습니다.
SRAM에서 패리티 오류 발생
RSP의 경우 다음과 같은 메시지가 표시될 수 있습니다.
%RSP-3-ERROR: MD error 0000008000000200
%RSP-3-ERROR: QA parity error (bytes 0:3) 02
%RSP-3-ERROR: MEMD parity error condition
%RSP-2-QAERROR: reused or zero link error, write at addr 0100 (QA)
log 22010000, data 00000000 00000000
%RSP-3-RESTART: cbus complex
또는
%RSP-3-ERROR: CyBus error 01
%RSP-3-ERROR: read data parity
%RSP-3-ERROR: read parity error (bytes 0:7) 20
%RSP-3-ERROR: physical address (bits 20:15) 000000
SRAM에 잘못된 패리티를 기록하는 다른 인터페이스 프로세서에 대한 표시가 없는 경우(예: VIP2-1-MSG 오류 메시지) 패리티 오류의 가장 큰 원인은 SRAM 자체입니다.이 경우 RSP를 교체합니다.
다른 오류 메시지가 인터페이스 프로세서가 잘못된 패리티를 기록한다고 표시되면 결함이 있거나 잘못 장착된 카드일 수 있습니다.
다기능 인터페이스 프로세서
%VIP2-1-MSG를 받는 경우:로그 또는 crashinfo 파일의 slot(x) 메시지는 VIP Crash 문제 해결을 참조하십시오.
권장 작업
패리티 오류가 처음 발생할 때 소프트 또는 하드 패리티 오류를 구분할 수 없습니다.대부분의 패리티 오류는 소프트 패리티 오류이며 일반적으로 무시해도 됩니다.최근에 일부 하드웨어를 변경했거나 박스를 이동한 경우 해당 부품(DRAM, SRAM, NPE, RP, RSP 또는 VIP)을 다시 장착해 보십시오. 자주 발생하는 패리티가 하드웨어의 결함을 의미합니다.영향을 받는 부품(DRAM, RSP, VIP 또는 마더보드)을 이 문서에 언급된 지침의 도움말로 교체합니다.
TAC 서비스 요청을 열 경우 수집할 정보
위의 트러블슈팅 단계를 수행한 후에도 지원이 필요한 경우 Cisco TAC에서 서비스 요청을 열려면 다음 정보를 포함해야 합니다. |
- 서비스 요청을 열기 전에 수행된 트러블슈팅.
- show technical-support 명령 출력(가능한 경우 enable 모드)
- show log 명령 출력 또는 콘솔 캡처(사용 가능한 경우)
- crashinfo 파일(있는 경우, 아직 show technical-support 명령 출력에 포함되지 않은 경우)crashinfo 파일이 여러 개 있는 경우 모두 포함하십시오.)
- 확인한 프로세서 메모리 패리티 오류 및 발생한 시점으로 인한 재로드 수입니다.
수집된 데이터를 압축되지 않은 일반 텍스트 형식(.txt)으로 케이스에 첨부하십시오. 서비스 요청에 정보를 첨부하려면 TAC 서비스 요청 툴(등록된 고객만 해당)을 통해 업로드합니다. Service Request Tool에 액세스할 수 없는 경우, 서비스 요청에 관련 정보를 첨부한 다음 메시지의 제목 줄에 서비스 요청 번호를 사용하여 attach@cisco.com으로 전송합니다. 참고: 프로세서 메모리 패리티 오류를 해결하는 데 필요한 경우가 아니면 위 정보를 수집하기 전에 라우터를 수동으로 다시 로드하거나 전원을 껐다가 다시 켜지 마십시오. 이렇게 하면 문제의 근본 원인을 확인하는 데 필요한 중요한 정보가 손실될 수 있습니다. |
관련 정보