이 문서에서는 Cisco NCS XR Platform에서 PSU(Power Supply Unit) 장애를 해결하는 방법에 대해 설명합니다.
다음 주제에 대한 지식을 보유하고 있으면 유용합니다.
참고: Cisco에서는 Cisco IOS XR CLI 및 관리자 CLI에 대한 액세스 권한이 있어야 합니다.
이 문서의 정보는 다음 소프트웨어 및 하드웨어 버전을 기반으로 합니다(이 시리즈에는 이에 국한되지 않음).
이 문서의 정보는 특정 랩 환경의 디바이스를 토대로 작성되었습니다. 이 문서에 사용된 모든 디바이스는 초기화된(기본) 컨피그레이션으로 시작되었습니다. 현재 네트워크가 작동 중인 경우 모든 명령의 잠재적인 영향을 미리 숙지하시기 바랍니다.
Cisco NCS XR 라우터 시리즈는 각기 다른 전원 공급 장치 아키텍처를 갖춘 다양한 활용 사례와 성능 수준에 맞게 설계된 여러 플랫폼으로 구성됩니다.
Cisco NCS 540 시리즈: 이 라우터는 5G NR 백홀, FTTx 및 엔터프라이즈 지사 구축과 같은 100G 이하 대역폭 애플리케이션을 겨냥한 저밀도 XR 라우터입니다. 이 시리즈의 일부 모델은 1+1 AC/DC 이중화 방식의 고정 전원 공급 장치를 활용합니다. 즉, 전원 공급 장치가 섀시에 통합되어 있으며 현장 교체가 불가능합니다. 다른 NCS 540 모델에는 모듈형 전원 공급 장치가 포함될 수 있습니다.
Cisco NCS 560 시리즈: 이 모듈형 시스템에는 AC 및 DC 옵션이 포함된 모듈형 전원 공급 장치가 포함되어 부하 공유 및 보호 체계를 지원합니다. 이러한 전원 공급 장치는 일반적으로 현장 서비스 및 운영중 교체가 가능하므로 시스템 종료 없이 교체할 수 있으며 고가용성을 보장합니다.
Cisco NCS 5500 시리즈: 이 고결함 복원형 모듈형 라우터 플랫폼은 데이터 센터 및 고성능 네트워킹 환경을 위해 설계되었습니다. 또한 모듈형 현장 교체 PSU를 갖추고 있어 서비스 가용성과 이중화를 지원합니다. 이 플랫폼은 모듈형 패키지 및 복원력 기능이 포함된 Cisco IOS XR 소프트웨어를 지원합니다.
Cisco NCS 5700 시리즈: NCS 5500 플랫폼에 구축되는 이 시리즈는 향상된 포워딩 ASIC 설계를 포함하고 있으며 Cisco IOS XR7 OS를 실행합니다. 이 시스템은 현장 교체 가능한 PSU가 장착된 모듈형 시스템으로, 고가용성 및 장애 탄력성을 지원합니다. PSU는 이중화 및 핫 스와핑을 위해 설계되었습니다. Cisco IOS XR7 OS는 시스템 및 결함 관리를 모니터링하는 고급 소프트웨어 기능을 제공합니다.
Cisco NCS XR 라우터의 PM으로 구성된 PSU 또는 PT(Power Tray)는 시스템에 안정적인 전원을 변환 및 제공하는 중요한 하드웨어 구성 요소입니다. PSU/PT는 운영중 교체가 가능하며 이중화 및 부하 공유를 지원하는 경우가 많습니다. 여러 PSU를 설치하여 하나의 모듈에 장애가 발생할 경우 백업 전원을 공급할 수 있으므로 시스템 가용성이 향상되고 다운타임이 최소화됩니다.
장애가 발생하거나 감지되지 않은 PSU로 인해 시스템 오류가 발생하고, 라인 카드가 제대로 부팅되지 않으며, 시스템이 불안정하거나 완전히 종료될 수 있습니다. 이는 라우터의 운영 및 네트워크 서비스 연속성에 심각한 영향을 미칠 수 있습니다. PSU 설계 및 서비스 용이성의 차이로 인해 문제의 성격과 심각도는 플랫폼마다 다릅니다. 고정 PSU가 있는 모델(예: 일부 NCS 540 시리즈)의 경우 일반적으로 고장이 발생하면 전체 장치의 서비스 또는 교체가 필요하므로 다운타임이 길어집니다. 모듈형 시스템(예: NCS 560, 5500, 5700, 540개 모델)은 단일 PSU 장애 시에도 계속 작동하며 시스템 종료 없이 유지 관리가 더욱 용이합니다.
NCS XR 플랫폼의 PSU 오류 해결 절차
NCS XR 플랫폼의 PSU 장애에 대한 트러블슈팅 절차는 일반적으로 일관된 접근 방식을 설명하며, 모델에 고정 PSU를 사용하는지 모듈형 PSU를 사용하는지에 따라 구체적인 물리적 조치가 다릅니다.
Cisco IOS XR CLI에서 라우터에 로그인하고 이러한 명령을 실행하여 PSU의 상태를 확인합니다. 이러한 명령은 Cisco IOS XR을 실행하는 모든 NCS XR 플랫폼에서 공통적으로 사용됩니다.
1.1단계. 플랫폼 상태 확인: 이 명령을 실행하여 PSU 오류인지 확인합니다.
샘플 명령 출력:
RP/0/RP0/CPU0:NCS-540-B-LNT#show platform
Thu Dec 11 10:06:59.917 +0530
Node Type State Config state
--------------------------------------------------------------------------------
0/RP0/CPU0 N540X-16Z4G8Q2C-D(Active) IOS XR RUN NSHUT
0/PM0 N540-PSU-FIXED-D OPERATIONAL NSHUT
0/PM1 N540-PSU-FIXED-D OFFLINE NSHUT
0/FT0 N540-X-BB-FAN OPERATIONAL NSHUT
참고: 모든 전원 모듈(예: `0/PM0`, `0/PM1`)이 'OPERATIONAL' 상태인 경우 전원 공급 장치가 제대로 작동한다고 결론을 내릴 수 있습니다. 그렇지 않으면 전원 모듈이 Non-Operational(작동하지 않음) 상태이거나 장애가 발생한 상태라면 PSU 장애를 의미합니다.
1.2단계. 실패한 전원 모듈 식별: 이 명령을 실행하여 개별 PSU의 상태 및 세부 사항을 확인합니다.
RP/0/RP0/CPU0:NCS-540-B-LNT#show environment power
Thu Dec 11 12:50:16.275 +0530
================================================================================
CHASSIS LEVEL POWER INFO: 0
================================================================================
Total output power capacity : 300W
Total output power required : 175W
Total power input : N/A
Total power output : 97W
================================================================================
Power Supply Status
Module Type
================================================================================
0/PM1 N540-PSU-FIXED-D OFFLINE
0/PM0 N540-PSU-FIXED-D OK
RP/0/RP0/CPU0:KOL_ISK_901_1AC_M_CNCS540R543#
참고: 전원 모듈의 상태가 'FAILED' 또는 'NO POWER'이거나 다른 모듈에 비해 입력/출력 값이 현저히 낮거나 0이면 전원 공급 장치에 장애가 발생했거나 장애가 발생한 것입니다.
1.3단계. 경보에서 전원 모듈 오류를 확인합니다. 이 명령을 실행하여 시스템 알람에서 전원 관련 알람을 확인합니다.
RP/0/RP0/CPU0:NCS-540-B-LNT#show alarms brief
Thu Dec 11 12:50:02.667 +0530
show alarms brief system active
--------------------------------------------------------------------------------
Active Alarms for 0/RP0
--------------------------------------------------------------------------------
Location Severity Group Set Time Description
--------------------------------------------------------------------------------
0/PM1 Major Environ 10/19/2025 12:30:42 +0530 Power Module Generic Fault (PM_GENERIC_FAULT)
0/PM1 Major Environ 10/19/2025 12:30:42 +0530 Power Module Error (PM_I2C_ACCESS_ERROR)
0 Major Environ 10/19/2025 12:30:42 +0530 Power Group redundancy lost
--------------------------------------------------------------------------------
참고: '전원 그룹 이중화 실패' 또는 '전원 모듈 오류'를 나타내는 경보 메시지가 팬 장애를 확인합니다.
환경 요인은 전원 공급 장치 작동 및 전반적인 시스템 안정성에 상당한 영향을 미칠 수 있습니다.
1. 주변 조건
라우터 주변의 주변 온도 및 공기 흐름을 확인하여 작동 제한 범위 내에 있는지 확인합니다. 고온은 전원 공급 장치가 과열되게 하고, 그 효율을 저하시키며, 조기 고장을 초래할 수 있다.
PSU 및 섀시 통풍구 주변의 공기 흐름에 방해가 되는지 확인합니다. 적절한 환기 및 열 배출 경로가 명확한지 확인합니다.
전원(예: AC 콘센트, DC 전원 공급)이 안정적이고 NCS Series 라우터에 대해 지정된 전압 및 전류 범위 내에 있는지 확인합니다.
2. 장애물ㆍ피해에 대한 신체검사
PSU에서 눈에 보이는 이물질, 배선의 느슨함 또는 연결을 방해할 수 있는 방해물이 있는지 검사합니다.
하드웨어 교체를 진행하기 전에 관찰된 전원 모듈 장애가 알려진 소프트웨어 또는 하드웨어 버그와 일치하는지 확인하는 것이 좋습니다.
다음 단계는 NCS XR Series 라우터의 PSU 유형에 따라 달라집니다.
고정 PSU가 있는 모델은 일반적으로 운영중 교체가 불가합니다.
참고: 고정 PS를 교체하려면 라우터의 전원을 꺼야 하므로 계획된 다운타임이 필요합니다.
이러한 플랫폼에는 운영 중 교체 가능한 모듈형 PSU가 있습니다.
1. 재배치(잭 아웃, 잭 인(조지))
문제가 발생하는 전원 모듈에 대해 JOJI 절차를 신중하게 수행합니다. 여기에는 물리적으로 전원 모듈을 제거한 다음 다시 삽입하는 과정이 포함됩니다.
2. 교체 RMA 문제가 PT 또는 전원 모듈로 격리되어 있고 재장착해도 문제가 해결되지 않는 경우 하드웨어 장애가 발생할 수 있습니다. 이러한 경우 고객은 Cisco TAC에 케이스를 제기하여 확인할 수 있습니다. 확인 후 Cisco TAC는 해당 PT 또는 전원 모듈에 대한 RMA를 시작하기 위해 상황을 평가하고 로그를 확인합니다. 또는 서비스 레벨 계약에 직접 또는 자동화된 하드웨어 교체가 포함된 경우, 추가 확인 없이 RMA 프로세스를 자동으로 진행할 수 있습니다.
샘플 로그:
0/RP0/ADMIN0:Nov 26 06:20:32.269 UTC: shelf_mgr[3081]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/PM0, Serial#: DTMXXXXXX
0/RP0/ADMIN0:Nov 26 06:20:32.269 UTC: envmon[3021]: %PKT_INFRA-FM-3-FAULT_MAJOR : ALARM_MAJOR :Power Module Output Disabled :CLEAR :0/PM0: Power module is under HW_OUTPUT_DISABLED condition.
0/RP0/ADMIN0:Nov 26 06:20:32.269 UTC: envmon[3021]: %PKT_INFRA-FM-6-FAULT_INFO : Power Module removal :INFO :0/PM0:
0/RP0/ADMIN0:Nov 26 06:20:59.052 UTC: envmon[3021]: %PKT_INFRA-FM-6-FAULT_INFO : Power Module insertion :INFO :0/PM0:
0/RP0/ADMIN0:Nov 26 06:20:59.053 UTC: shelf_mgr[3081]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/PM0, Serial #:DTMXXXXXX
0/RP0/ADMIN0:Nov 26 06:20:59.053 UTC: envmon[3021]: %PKT_INFRA-FM-3-FAULT_MAJOR : ALARM_MAJOR :Power Module Output Disabled :DECLARE :0/PM0: Power module is under HW_OUTPUT_DISABLED condition.
0/RP0/ADMIN0:Nov 26 06:20:59.053 UTC: shelf_mgr[3081]: %INFRA-SHELF_MGR-6-HW_EVENT : Rcvd HW event HW_EVENT_FAILURE, event_reason_str 'No Input or HW Power Failure' for card 0/PM0
샘플 명령 출력:
Command Syntax:
RP/0/RP0/CPU0:NCS-560-B#show inventory location <location of the failed power module>
Sample command:
RP/0/RP0/CPU0:NCS-560-B#show inventory location 0/PM0
Thu Dec 25 20:41:18.031 KST
NAME: "0/PM0", DESCR: "ASR 900 1200W AC Power Supply"
PID: A900-PWR1200-A , VID: V03 , SN: DCAXXXXXX
RP/0/RP0/CPU0:NCS-560-B#
| 개정 | 게시 날짜 | 의견 |
|---|---|---|
1.0 |
27-Apr-2026
|
최초 릴리스 |