Introduzione
In questo documento viene descritto come risolvere i problemi relativi ai moduli FAN nella piattaforma NCS XR.
Prerequisiti
Requisiti
Cisco raccomanda la conoscenza dei seguenti argomenti:
Nota: Cisco consiglia di accedere alla CLI di Cisco IOS® XR e alla CLI di amministrazione.
Nota: Cisco consiglia di accedere alla CLI di Cisco IOS® XR e alla CLI di amministrazione.
Componenti usati
Le informazioni fornite in questo documento si basano sulle seguenti versioni software e hardware:
Sono incluse, a titolo esemplificativo, le seguenti serie:
- NCS serie 540
- NCS serie 560
- NCS serie 5500
- NCS serie 5700
Le informazioni discusse in questo documento fanno riferimento a dispositivi usati in uno specifico ambiente di emulazione. Su tutti i dispositivi menzionati nel documento la configurazione è stata ripristinata ai valori predefiniti. Se la rete è operativa, valutare attentamente eventuali conseguenze derivanti dall'uso dei comandi.
Premesse
La serie di router Cisco NCS XR include diverse piattaforme progettate per diversi scenari di utilizzo e livelli di prestazioni, ognuna con tipi di moduli ventola e architetture di sistema diversi:
· Cisco NCS serie 540: Si tratta di un router XR a densità ridotta destinato ad applicazioni con larghezza di banda inferiore a 100 GB, come backhaul 5G NR, FTTx e installazioni in filiali aziendali. Utilizza moduli ventola con un design di ridondanza della ventola 3+1 e raffreddamento ad aria forzato side-to-side. Gli alimentatori sono fissati con ridondanza 1+1 AC/DC e il sistema è rinforzato con rivestimento conforme e supporta la conformità della sincronizzazione di Classe C.
· Cisco NCS serie 560: Questo sistema modulare include tre alloggiamenti per ventole modulari ad alta velocità che devono essere popolati per il funzionamento. Questi alloggiamenti per ventole contengono ventole ridondanti e possono essere montati sul campo, consentendo così la sostituzione senza spegnimento del sistema. Il sistema supporta il funzionamento con guasti a una ventola e impone limiti di tempo per il reinserimento dei vassoi delle ventole in base alla temperatura ambiente. È inoltre dotato di un filtro antipolvere integrato per ottimizzare il flusso d'aria. Gli alimentatori sono modulari con opzioni CA e CC e supportano la condivisione del carico e gli schemi di protezione.
· Cisco NCS serie 5500: Questa piattaforma di router modulare ad alta resilienza agli errori è progettata per centri dati e ambienti di rete ad alte prestazioni. Dispone di moduli ventola modulari sostituibili sul campo che supportano la manutenzione e la ridondanza. La risoluzione dei problemi prevede controlli dei registri di sistema, dello stato dell'hardware e la gestione dei pacchetti software per mantenere la stabilità del sistema. La piattaforma supporta il software Cisco IOS® XR con pacchetti modulari e funzionalità di resilienza.
· Cisco NCS serie 5700: Basata sulla piattaforma NCS 5500, questa serie include un design ASIC avanzato per l'inoltro ed esegue il sistema operativo Cisco IOS® XR7. È dotato di varianti come NCS-57B1-6D24 e NCS-57B1-5DSE. Il sistema è modulare con alloggiamenti per ventole e alimentatori sostituibili sul campo e supporta elevata disponibilità e resistenza agli errori. Gli alloggiamenti per ventole sono progettati per la ridondanza e la sostituzione a caldo.Cisco IOS® XR7 OS offre funzionalità software avanzate per il monitoraggio del sistema e la gestione degli errori.
Problema
I guasti alle ventole dei router Cisco NCS XR compromettono il raffreddamento e l'affidabilità del sistema. La natura e la gravità dei problemi variano in base alla piattaforma a causa delle differenze nella progettazione e nella manutenzione dei moduli ventola. La serie NCS 540 include diversi modelli che utilizzano moduli ventola fissi, non sostituibili sul campo, con un design ridondante 3+1. In questo caso, il guasto della ventola richiede in genere l'assistenza o la sostituzione dell'intera unità. Ciò potrebbe comportare tempi di inattività più lunghi e una risoluzione dei problemi più complessa.
Le serie NCS 560, 5500 e 5700 e pochi modelli della serie NCS 540 utilizzano alloggiamenti delle ventole modulari sostituibili sul campo progettati per la ridondanza e la sostituzione a caldo. Ciò consente il funzionamento continuo in caso di guasto di una singola ventola e semplifica la manutenzione senza arrestare il sistema.
I guasti alle ventole in questi sistemi modulari possono attivare allarmi di sistema, richiedere il monitoraggio dei vincoli della temperatura ambiente e richiedere il reinserimento tempestivo del vassoio delle ventole per mantenere il flusso d'aria ottimale e la stabilità del sistema. In generale, un guasto alla ventola nei router NCS XR comporta rischi di surriscaldamento, prestazioni ridotte e potenziali danni all'hardware. Ciò richiede rilevamento, diagnosi e azioni correttive appropriate e personalizzate in base alla serie di router e all'architettura delle ventole.
Procedura per la risoluzione dei guasti del modulo FAN nella piattaforma NCS XR
La procedura di risoluzione dei problemi relativi ai guasti dei moduli ventola nelle piattaforme NCS XR prevede in genere un approccio coerente, con azioni fisiche specifiche diverse a seconda che il modello utilizzi un modulo ventola fisso o un alloggiamento ventola modulare.
Passaggio 1. Verifica CLI iniziale
Accedere al router nella CLI di Cisco IOS® XR ed eseguire questi comandi per identificare lo stato delle alloggiamenti delle ventole e delle singole ventole. Questi comandi sono comuni a tutte le piattaforme NCS XR che eseguono Cisco IOS® XR.
Passaggio 1.1Controllo dello stato della piattaforma: Eseguire questo comando per verificare se si tratta di un guasto del vassoio ventola o di uno o più guasti della ventola in un vassoio.
Output di esempio del comando:
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#show platform
Thu Jul 24 12:33:45.143
Node Type State Config state
--------------------------------------------------------------------------------
0/RP0/CPU0 N540X-12Z16G-SYS-D(Active) IOS XR RUN NSHUT
0/PM0 N540-PSU-FIXED-D OPERATIONAL NSHUT
0/PM1 N540-PSU-FIXED-D OPERATIONAL NSHUT
0/FT0 N540-FAN OPERATIONAL NSHUT
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#
Nota: Se tutti i vassoi delle VENTOLE sono in modalità "OPERATIONAL", il vassoio delle VENTOLE funziona correttamente. Altrimenti, se un vassoio FAN non è operativo, significa che è in stato di errore.
Passaggio 1.2.Identificare i moduli ventola guasti: Eseguire questo comando per controllare lo stato e la velocità delle singole ventole all'interno dell'alloggiamento.
Output di esempio del comando:
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#show environment fan
Thu Jul 24 12:33:09.673
=========================================================================================
Fan speed (rpm)
Location FRU Type FAN_0 FAN_1 FAN_2 FAN_3
-----------------------------------------------------------------------------------------
0/FT0 N540-FAN 25680 0 25440 26130
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#
Nota: Un valore di `0` o un numero significativamente inferiore di RPM rispetto ad altre ventole dello stesso alloggiamento può indicare un guasto o un guasto della ventola.
Passaggio 1.3.Verificare l'errore del modulo ventola in seguito a un allarme: Eseguire questo comando per verificare la presenza di allarmi relativi alle ventole.
Log di esempio:
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#show alarms brief system active
Thu Jul 24 12:33:23.874
------------------------------------------------------------------------------------
Active Alarms
------------------------------------------------------------------------------------
Location Severity Group Set Time Description
------------------------------------------------------------------------------------
0/FT0 Minor Environ 07/24/2025 10:35:44 WIB Fan 1: Out of tolerance
0/FT0 Minor Environ 07/24/2025 10:35:44 WIB Sensor in failed state
0 Minor Environ 07/24/2025 10:35:44 WIB Sensor in failed state
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#
Nota: Messaggi di allarme che indicano "Fan X: Fuori tolleranza" o "Sensore in stato di errore" confermano i guasti delle ventole.
Nota: Messaggi di allarme che indicano "Fan X: Fuori tolleranza" o "Sensore in stato di errore" confermano i guasti delle ventole.
Fase 2. Ispezione ambientale e fisica
I fattori ambientali possono avere un impatto significativo sul funzionamento della ventola e sul raffreddamento generale del sistema.
-
Condizioni ambientali:
- Verificare la temperatura ambiente e il flusso d'aria intorno al router per accertarsi che rientri nei limiti operativi. Le temperature elevate possono causare un funzionamento più intenso delle ventole o un guasto prematuro.
- Verificare la presenza di eventuali filtri per la polvere o di depositi d'aria che possano essere ostruiti o non installati correttamente, limitando il flusso d'aria.
-
Ispezione fisica per individuare eventuali ostruzioni/danni:
- Ispezionare il modulo/vassoio della ventola per individuare eventuali detriti visibili, cavi allentati o ostruzioni che possano impedire alle ventole di girare liberamente. L'accumulo di polvere è una causa comune di problemi alla ventola.
- Per le piattaforme con alloggiamenti ventola modulari (ad esempio, NCS 560, NCS 5500, NCS 5700 e alcuni modelli NCS 540), se si ritiene che ciò sia sicuro e nel rispetto delle linee guida operative, si consiglia di estrarre con attenzione il vassoio ventola sospetto. Controllare visivamente le singole ventole per verificare la presenza di blade non rotanti o danni visibili. Quando il vassoio è spento, verificare che le ventole e lo slot dello chassis non siano eccessivamente polverosi.
- Per le piattaforme con moduli ventola fissi (ad esempio, alcuni modelli NCS 540), l'ispezione fisica del modulo ventola e dei connettori è limitata, ma deve comunque essere effettuata per qualsiasi segnale esterno di danneggiamento o ostruzione.
Passaggio 3. Verifica della presenza di problemi noti e bug
Prima di procedere con la sostituzione dell'hardware, si consiglia di verificare se il guasto della ventola osservato è in linea con eventuali bug noti relativi al software o all'hardware.
- Cisco Bug Search Tool:ricerca in Cisco Bug Search Tool (BST) utilizzando parole chiave quali "Errore ventola NCS XR", "NCS [numero modello] ventola" e la versione Cisco IOS® XR in esecuzione sul dispositivo. Cercare i problemi noti che possono causare segnalazioni errate delle ventole o guasti effettivi.
- Documentazione di supporto Cisco:rivedere la documentazione di supporto dei forum di Cisco e della community per problemi simili segnalati e per soluzioni o correzioni consigliate.
Passaggio 4. Azioni correttive e sostituzione
I passaggi successivi dipendono dal tipo di modulo ventola della piattaforma NCS XR in uso.
Per piattaforme NCS XR con moduli ventola fissi (ad esempio, alcuni modelli NCS 540)
I modelli con moduli ventola fissi non sono in genere sostituibili a caldo.
- Ciclo di alimentazione:se i controlli iniziali e le regolazioni ambientali non risolvono il problema, eseguire un ciclo di alimentazione del router. In alcuni casi questo consente di risolvere i problemi temporanei e di reinizializzare correttamente il modulo ventola.
- Sostituzione (RMA): se il modulo ventola viene confermato guasto dopo un ciclo di alimentazione, in genere richiede un'autorizzazione restituzione merce (RMA) per l'intera unità o chassis.
Nota: La sostituzione di un modulo ventola fisso richiede tempi di inattività pianificati in quanto il router deve essere spento.
Per piattaforme NCS XR con vassoi ventola modulari (ad esempio, la maggior parte dei modelli NCS 540, NCS 560, NCS 5500, NCS 5700)
Queste piattaforme sono dotate di alloggiamenti per ventole modulari sostituibili a caldo.
-
Riposizionamento (JACK-OUT e JACK-IN - JOJI):
- Eseguire con attenzione una procedura JACK-OUT e JACK-IN (JOJI) sull'alloggiamento della ventola che contiene i moduli della ventola guasti. Questo comporta la rimozione fisica dell'alloggiamento della ventola e quindi il reinserimento.
- Mentre il vassoio della ventola viene estratto, eseguire un'accurata ispezione visiva per individuare eventuali detriti o cavi allentati che potrebbero impedire la rotazione delle ventole. Si può anche osservare se tutte le ventole tentano di girare al reinserimento.
- Dopo il riposizionamento, verificare di nuovo lo stato utilizzando "show environment fan".
-
Sostituzione (RMA): se uno dei moduli ventola è ancora in stato di guasto o l'alloggiamento ventola rimane non operativo dopo il riposizionamento, procedere con un RMA per l'alloggiamento ventola.
- Raccogli log delle prove:Esegui "show logging" | includi FAN"per acquisire i log relativi al vassoio della ventola JOJI per scopi di documentazione.
Log di esempio:
RP/0/RP0/CPU0:N540-24Z8Q2C-SYS# show logging | include FAN
0/RSP0/ADMIN0:Jul 12 01:39:25.215 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#: N/A
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #: N/A
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0 hardware state going to Operational
0/RSP0/ADMIN0:Jul 12 01:42:23.584 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#: N/A
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #:N/A
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0
- Raccogli ID prodotto (PID) e numero di serie (SN): Ottenere il PID e il numero di serie del vassoio della ventola difettoso, necessari per il processo RMA.
Output di esempio del comando:
Command Syntax:
RP/0/RP0/CPU0:N540-24Z8Q2C-SYS# show inventory location <location of failed FAN tray>
Sample command:
RP/0/RP0/CPU0:N540-24Z8Q2C-SYS# show inventory location 0/FT0
NAME: "0/FT0", DESCR: "NCS 540 Fan"
PID: N540-FAN , VID: N/A, SN: N/A
- Procedere con RMA: avviare il processo RMA con Cisco per il vassoio della ventola guasto.