소개
이 문서에서는 NCS XR 플랫폼에서 FAN 모듈 장애를 해결하는 방법에 대해 설명합니다.
사전 요구 사항
요구 사항
다음 주제에 대한 지식을 보유하고 있으면 유용합니다.
참고: Cisco에서는 Cisco IOS® XR CLI 및 관리자 CLI에 액세스할 수 있어야 합니다.
참고: Cisco에서는 Cisco IOS® XR CLI 및 관리자 CLI에 액세스할 수 있어야 합니다.
사용되는 구성 요소
이 문서의 정보는 다음 소프트웨어 및 하드웨어 버전을 기반으로 합니다.
여기에는 다음과 같은 시리즈가 포함되지만 이에 국한되지는 않습니다.
- NCS 540 시리즈
- NCS 560 시리즈
- NCS 5500 시리즈
- NCS 5700 시리즈
이 문서의 정보는 특정 랩 환경의 디바이스를 토대로 작성되었습니다. 이 문서에 사용된 모든 디바이스는 초기화된(기본) 컨피그레이션으로 시작되었습니다. 현재 네트워크가 작동 중인 경우 모든 명령의 잠재적인 영향을 미리 숙지하시기 바랍니다.
배경 정보
Cisco NCS XR 라우터 시리즈에는 각기 다른 팬 모듈 유형 및 시스템 아키텍처를 갖춘 다양한 활용 사례 및 성능 수준을 위해 설계된 여러 플랫폼이 포함되어 있습니다.
· Cisco NCS 540 시리즈: 이 라우터는 5G NR 백홀, FTTx 및 엔터프라이즈 지사 구축과 같은 100G 이하 대역폭 애플리케이션을 겨냥한 저밀도 XR 라우터입니다. 3+1 팬 이중화 설계와 사이드 투 사이드 강제 공기 냉각이 포함된 팬 모듈을 사용합니다. 전원 공급 장치는 1+1 AC/DC 이중화로 고정되며, 시스템은 등각 코팅으로 견고해지고 Class C 타이밍 규정준수를 지원합니다.
· Cisco NCS 560 시리즈: 이 모듈형 시스템에는 작동을 위해 반드시 채워야 하는 3개의 고속 모듈형 팬 트레이가 포함되어 있습니다. 이러한 팬 트레이에는 이중 팬이 포함되어 있으며 현장 서비스가 가능하므로 시스템 종료 없이 교체할 수 있습니다. 시스템은 단일 팬 장애로 작동을 지원하고 주변 온도를 기준으로 팬 트레이 재삽입에 대한 시간 제한을 적용합니다. 공기 흐름을 최적화할 수 있는 먼지 필터도 내장돼 있다. 전원 공급 장치는 AC 및 DC 옵션이 포함된 모듈형 전원 공급 장치이며 부하 공유 및 보호 체계를 지원합니다.
· Cisco NCS 5500 시리즈: 이 고결함 복원형 모듈형 라우터 플랫폼은 데이터 센터 및 고성능 네트워킹 환경을 위해 설계되었습니다. 또한 서비스 가용성 및 이중화를 지원하는 현장 교체 가능한 모듈형 팬 모듈이 포함되어 있습니다. 트러블슈팅에는 시스템 로그 확인, 하드웨어 상태 확인이 포함되며 시스템 안정성을 유지하기 위해 소프트웨어 패키지를 관리합니다. 이 플랫폼은 모듈형 패키지 및 복원력 기능이 포함된 Cisco IOS® XR 소프트웨어를 지원합니다.
· Cisco NCS 5700 시리즈: NCS 5500 플랫폼에 구축된 이 시리즈는 향상된 포워딩 ASIC 설계를 포함하고 있으며 Cisco IOS® XR7 OS를 실행합니다. NCS-57B1-6D24 및 NCS-57B1-5DSE와 같은 변형이 있습니다. 이 시스템은 현장 교체 가능한 팬 트레이와 전원 공급 장치를 갖춘 모듈형 시스템이며, 고가용성 및 장애 복구 기능을 지원합니다. 팬 트레이는 이중화 및 핫 스와핑을 위해 설계되었습니다.Cisco IOS® XR7 OS는 시스템 및 결함 관리를 모니터링하는 고급 소프트웨어 기능을 제공합니다.
문제
Cisco NCS XR 라우터의 팬 장애는 시스템 냉각 및 신뢰성에 영향을 미칩니다. 팬 모듈 설계와 서비스 용이성의 차이로 인해 플랫폼의 특성 및 심각도가 달라집니다. NCS 540 시리즈에는 3+1 이중화 설계의 현장 교체가 불가능한 고정 팬 모듈을 사용하는 몇 가지 모델이 있습니다. 여기서 팬 고장은 일반적으로 서비스 또는 전체 장치의 교체가 필요합니다. 이로 인해 다운타임이 길어지고 트러블슈팅이 더욱 복잡해질 수 있습니다.
NCS 560, 5500, 5700 시리즈와 NCS 540 시리즈의 일부 모델은 이중화 및 핫 스와핑을 위해 설계된 현장 교체 가능한 모듈형 팬 트레이를 사용합니다. 따라서 단일 팬 장애 시에도 계속 작동할 수 있으며 시스템 종료 없이 유지 관리가 더욱 쉬워집니다.
이러한 모듈식 시스템의 팬 고장으로 인해 시스템 경고가 발생하고, 주변 온도 제약 조건을 모니터링해야 하며, 최적의 공기 흐름과 시스템 안정성을 유지하기 위해 팬 트레이를 적시에 다시 삽입해야 합니다. 전반적으로 NCS XR 라우터의 팬 장애로 인해 과열, 성능 저하, 하드웨어 손상 가능성이 있습니다. 따라서 특정 라우터 시리즈 및 팬 아키텍처에 맞게 조정된 적절한 교정 작업과 신속한 탐지, 진단이 필요합니다.
NCS XR 플랫폼의 FAN 모듈 장애 해결 절차
NCS XR 플랫폼의 팬 모듈 장애에 대한 트러블슈팅 절차에서는 일반적으로 일관된 접근 방식을 설명하며, 특정 물리적 동작은 고정 팬 모듈을 사용하는지 아니면 모듈형 팬 트레이를 사용하는지에 따라 다릅니다.
1단계. 초기 CLI 확인
Cisco IOS® XR CLI에서 라우터에 로그인하고 다음 명령을 실행하여 팬 트레이 및 개별 팬의 상태를 확인합니다. 이러한 명령은 Cisco IOS® XR을 실행하는 모든 NCS XR 플랫폼에서 공통적으로 사용됩니다.
1.1단계 플랫폼 상태 확인: 이 명령을 실행하여 FAN Tray(팬 트레이) 오류인지 또는 FAN Tray(팬 트레이)에 하나 이상의 FAN 오류가 있는지 확인합니다.
샘플 명령 출력:
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#show platform
Thu Jul 24 12:33:45.143
Node Type State Config state
--------------------------------------------------------------------------------
0/RP0/CPU0 N540X-12Z16G-SYS-D(Active) IOS XR RUN NSHUT
0/PM0 N540-PSU-FIXED-D OPERATIONAL NSHUT
0/PM1 N540-PSU-FIXED-D OPERATIONAL NSHUT
0/FT0 N540-FAN OPERATIONAL NSHUT
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#
참고: 모든 팬 트레이가 "작동 중"에 있는 경우 팬 트레이가 제대로 작동한다고 결론을 내릴 수 있습니다. 그렇지 않으면 FAN Tray(FAN 트레이)가 Non-Operational(작동하지 않음)이면 FAN Tray is in failed(FAN 트레이가 실패 상태에 있음)를 의미합니다.
1.2단계.실패한 팬 모듈 확인: 이 명령을 실행하여 팬 트레이 내의 개별 팬의 상태와 속도를 확인합니다.
샘플 명령 출력:
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#show environment fan
Thu Jul 24 12:33:09.673
=========================================================================================
Fan speed (rpm)
Location FRU Type FAN_0 FAN_1 FAN_2 FAN_3
-----------------------------------------------------------------------------------------
0/FT0 N540-FAN 25680 0 25440 26130
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#
참고: 값이 '0' 이거나 동일한 트레이의 다른 팬에 비해 RPM 값이 현저히 낮으면 팬의 고장 또는 장애를 나타낼 수 있습니다.
1.3단계 경보에서 팬 모듈 오류 확인: 이 명령을 실행하여 시스템 알람에서 팬 관련 알람을 확인합니다.
샘플 로그:
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#show alarms brief system active
Thu Jul 24 12:33:23.874
------------------------------------------------------------------------------------
Active Alarms
------------------------------------------------------------------------------------
Location Severity Group Set Time Description
------------------------------------------------------------------------------------
0/FT0 Minor Environ 07/24/2025 10:35:44 WIB Fan 1: Out of tolerance
0/FT0 Minor Environ 07/24/2025 10:35:44 WIB Sensor in failed state
0 Minor Environ 07/24/2025 10:35:44 WIB Sensor in failed state
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#
참고: "팬 X: Out of tolerance(허용 한도 초과)" 또는 "Sensor in failed state(센서 실패 상태)"에서 팬 장애를 확인합니다.
참고: "팬 X: Out of tolerance(허용 한도 초과)" 또는 "Sensor in failed state(센서 실패 상태)"에서 팬 장애를 확인합니다.
2단계. 환경 및 물리적 점검
환경 요인은 팬 작동 및 전체 시스템 냉각에 큰 영향을 미칠 수 있습니다.
-
주변 조건:
- 라우터 주변의 주변 온도 및 공기 흐름을 확인하여 작동 제한 범위 내에 있는지 확인합니다. 고온은 팬들로 하여금 더 열심히 일하게 하거나 조기에 고장이 나게 할 수 있다.
- 공기 흐름을 제한하여 막히거나 잘못 설치할 수 있는 먼지 필터 또는 공기 구멍을 확인합니다.
-
장애물/손상 물리적 검사:
- 팬 모듈/트레이에 남아 있는 이물질, 배선이 느슨하거나 팬이 자유롭게 회전하는 것을 방지할 수 있는 장애물이 있는지 확인합니다. 먼지가 쌓이는 것은 팬 문제의 일반적인 원인입니다.
- 모듈형 팬 트레이(예: NCS 560, NCS 5500, NCS 5700, 일부 NCS 540 모델)가 있는 플랫폼의 경우, 안전한 경우 운영 지침 내에서 의심되는 팬 트레이를 신중하게 꺼내는 것을 고려하십시오. 개별 팬에 회전하지 않는 블레이드나 눈에 보이는 손상이 있는지 육안으로 검사합니다. 트레이가 꺼진 상태에서 팬과 섀시 슬롯에 먼지가 쌓여 있는지 확인합니다.
- 고정 팬 모듈이 있는 플랫폼(예: 일부 NCS 540 모델)의 경우, 팬 모듈과 커넥터의 물리적 검사는 제한적이지만 손상이나 장애의 외부 징후가 있을 경우 여전히 수행해야 합니다.
3단계. 알려진 문제 및 버그 확인
하드웨어 교체를 진행하기 전에, 관찰된 팬 고장이 알려진 소프트웨어 또는 하드웨어 버그와 일치하는지 확인하는 것이 좋습니다.
- Cisco Bug Search Tool:디바이스에서 실행되는 "NCS XR fan failure", "NCS [model number] fan" 및 특정 Cisco IOS® XR 버전과 같은 키워드를 사용하여 Cisco BST(Bug Search Tool)를 검색합니다. 팬 오류 보고 또는 실제 오류를 일으킬 수 있는 알려진 문제를 찾습니다.
- Cisco 지원 문서:Cisco 및 커뮤니티 포럼의 지원 문서에서 보고된 유사한 문제와 권장 해결 방법 또는 수정 방법에 대해 검토합니다.
4단계. 시정조치 및 교체
다음 단계는 NCS XR 플랫폼의 팬 모듈 유형에 따라 달라집니다.
고정 팬 모듈이 있는 NCS XR 플랫폼(예: 일부 NCS 540 모델)
고정 팬 모듈이 있는 모델은 일반적으로 핫 스왑이 가능하지 않습니다.
- 전원 주기: 초기 확인 및 환경 조정으로 문제가 해결되지 않으면 라우터의 전원 주기를 수행합니다. 이렇게 하면 일시적인 문제가 해결되고 팬 모듈이 올바르게 다시 초기화되는 경우가 있습니다.
- 교체(RMA): 전원 사이클 후 팬 모듈에 장애가 발생한 것으로 확인되면 일반적으로 전체 유닛 또는 섀시에 대해 RMA(Return Merchandise Authorization)가 필요합니다.
참고: 고정 팬 모듈을 교체하려면 라우터의 전원을 꺼야 하므로 계획된 다운타임이 필요합니다.
모듈형 팬 트레이가 있는 NCS XR 플랫폼(예: 대부분의 NCS 540, NCS 560, NCS 5500, NCS 5700 모델)
이러한 플랫폼에는 운영 중 교체 가능한 모듈형 팬 트레이가 있습니다.
-
재장착(JACK-OUT 및 JACK-IN - JOJI)
- 장애가 발생한 팬 모듈이 들어 있는 팬 트레이에서 JACK-OUT 및 JACK-IN(JOJI) 절차를 신중하게 수행합니다. 팬 트레이를 물리적으로 제거한 다음 다시 삽입해야 합니다.
- 팬 트레이를 빼내는 동안 팬이 회전하지 못하도록 할 수 있는 잔해 또는 느슨한 배선에 대해 정밀한 시각적 검사를 실시합니다. 모든 팬이 다시 삽입 시 회전을 시도하는지 관찰할 수도 있습니다.
- 재장착 후 "show environment fan(환경 팬 표시)"을 사용하여 상태를 다시 확인합니다.
-
교체(RMA): 재장착 후 팬 모듈 중 하나가 고장 상태이거나 팬 트레이가 작동하지 않는 상태로 남아 있으면 팬 트레이에 대한 RMA를 계속 진행합니다.
- 증거 로그 수집:Run "show logging | include FAN"을 다시 사용하면 문서화를 위해 팬 트레이 JOJI와 관련된 로그를 캡처할 수 있습니다.
샘플 로그:
RP/0/RP0/CPU0:N540-24Z8Q2C-SYS# show logging | include FAN
0/RSP0/ADMIN0:Jul 12 01:39:25.215 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#: N/A
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #: N/A
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0 hardware state going to Operational
0/RSP0/ADMIN0:Jul 12 01:42:23.584 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#: N/A
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #:N/A
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0
- PID(Product ID) 및 SN(Serial Number) 수집: RMA 프로세스에 필요한 결함이 있는 팬 트레이의 PID 및 SN을 가져옵니다.
샘플 명령 출력:
Command Syntax:
RP/0/RP0/CPU0:N540-24Z8Q2C-SYS# show inventory location <location of failed FAN tray>
Sample command:
RP/0/RP0/CPU0:N540-24Z8Q2C-SYS# show inventory location 0/FT0
NAME: "0/FT0", DESCR: "NCS 540 Fan"
PID: N540-FAN , VID: N/A, SN: N/A
- RMA 진행: 결함이 있는 팬 트레이에 대해 Cisco와 RMA 프로세스를 시작합니다.