Introduzione
In questo documento viene descritto come risolvere i problemi relativi ai moduli FAN in ASR9k.
Prerequisiti
Requisiti
Cisco raccomanda la conoscenza dei seguenti argomenti:
Nota: Cisco consiglia di accedere alla CLI di Cisco IOS® XR e alla CLI di amministrazione.
Componenti usati
Le informazioni fornite in questo documento si basano sulle seguenti versioni software e hardware:
- La serie ASR 9000 comprende una serie di modelli, tra cui ASR 9001, ASR 9006, ASR 9010, ASR 9901, ASR 9906, ASR 9910, ASR 9912 e ASR 9922.
Le informazioni discusse in questo documento fanno riferimento a dispositivi usati in uno specifico ambiente di emulazione. Su tutti i dispositivi menzionati nel documento la configurazione è stata ripristinata ai valori predefiniti. Se la rete è operativa, valutare attentamente eventuali conseguenze derivanti dall'uso dei comandi.
Premesse
Cisco ASR serie 9000 Aggregation Services Router (ASR9k) sono router ad alte prestazioni progettati per le reti dei provider di servizi e offrono scalabilità, affidabilità e funzionalità avanzate per supportare le esigenze degli ambienti di rete. I router ASR9k forniscono un'architettura hardware modulare e consentono una configurazione ed un'espansione flessibili per soddisfare diversi requisiti di rete.
La famiglia di router ASR9k include:
· Design modulare: I router ASR9k sono dotati di componenti modulari quali processori di routing, schede di linea e alloggiamenti per ventole e consentono facili aggiornamenti e manutenzione senza interruzione delle operazioni di rete.
· Sistema di raffreddamento: Ad esempio, il modello ASR 9001 utilizza un unico alloggiamento per ventole accessibile anteriormente contenente ventole ridondanti per garantire un raffreddamento continuo. L'alloggiamento della ventola supporta il flusso d'aria side-to-side e, a partire dalla versione software 4.3.0, consente l'inserimento e la rimozione online (OIR) con determinate limitazioni di temperatura ambiente, migliorando così la facilità di utilizzo.
· Alta disponibilità: La serie ASR9k supporta alimentatori e ventole ridondanti, contribuisce all'elevata disponibilità e riduce al minimo i tempi di inattività.
· Prestazioni e scalabilità: Progettati per gestire l'aggregazione su larga scala e il routing edge, i router ASR9k supportano un elevato throughput e protocolli di routing avanzati adatti alle reti core e edge dei provider di servizi.
· Funzionalità software: I router eseguono il software Cisco IOS® XR, che fornisce affidabilità, modularità e programmabilità di livello carrier per supportare esigenze di rete in evoluzione.
Problema
Un guasto al modulo della ventola o all'alloggiamento della ventola di un router ASR serie 9000 può causare un raffreddamento inadeguato e il surriscaldamento dei componenti hardware critici. Questo surriscaldamento può causare instabilità del sistema, prestazioni ridotte, arresti imprevisti o danni permanenti all'hardware, con un conseguente impatto sulla disponibilità della rete e sull'affidabilità del servizio. Dato il ruolo fondamentale del sistema di raffreddamento nel mantenimento dello stato dei dispositivi, il rilevamento tempestivo e la riduzione dei guasti delle ventole sono essenziali per prevenire interruzioni della rete e mantenere un'elevata disponibilità negli ambienti dei provider di servizi.
Procedura per la risoluzione dei guasti del modulo FAN in ASR9k
La procedura per la risoluzione dei problemi dei moduli ventola nei router ASR serie 9000 in genere delinea un approccio uniforme nei diversi modelli, con azioni fisiche specifiche che variano a seconda che il modello utilizzi un modulo ventola fisso o un alloggiamento ventola modulare.
Passaggio 1. Verifica CLI iniziale
Accedere al router nella CLI di Cisco IOS® XR ed eseguire questi comandi per identificare lo stato delle ventole e delle singole ventole. Questi comandi sono comuni a tutte le piattaforme ASR 9000 con Cisco IOS® XR.
Passaggio 1.1 Controllare lo stato della piattaforma: Eseguire questo comando per verificare se si tratta di un guasto del vassoio ventola o di uno o più guasti della ventola in un vassoio.
Output di esempio del comando:
RP/0/RSP0/CPU0:ASR-9006#show platform
Wed Jul 16 12:16:00.408 IST
Node Type State Config state
--------------------------------------------------------------------------------
0/RSP0/CPU0 A9K-RSP5-SE(Active) IOS XR RUN NSHUT
0/RSP1/CPU0 A9K-RSP5-SE(Standby) IOS XR RUN NSHUT
0/FT0 ASR-9006-FAN-V2 OPERATIONAL NSHUT
0/FT1 ASR-9006-FAN-V2 OPERATIONAL NSHUT
0/0/CPU0 A9K-MOD200-SE IOS XR RUN NSHUT
0/0/0 A9K-MPA-20X1GE OK
0/1/CPU0 A9K-8X100GE-SE IOS XR RUN NSHUT
0/2/CPU0 A9K-MOD200-SE IOS XR RUN NSHUT
0/2/0 A9K-MPA-20X10GE OK
0/PT0 A9K-DC-PEM-V2 OPERATIONAL NSHUT
RP/0/RSP0/CPU0:ASR-9006#
Nota: Se tutti i vassoi delle VENTOLE sono in modalità "OPERATIONAL", il vassoio delle VENTOLE funziona correttamente. Altrimenti, se un vassoio FAN non è operativo, significa che è in stato di errore.
Passaggio 1.2. Identificazione dei moduli ventola guasti: Eseguire questo comando per controllare lo stato e la velocità delle singole ventole all'interno dell'alloggiamento.
Output di esempio del comando:
RP/0/RSP0/CPU0:ASR-9006#admin show environment fan
Wed Jul 16 12:16:09.843 IST
=============================================================================
Fan speed (rpm)
Location FRU Type FAN_0 FAN_1 FAN_2 FAN_3 FAN_4 FAN_5
-----------------------------------------------------------------------------
0/FT0 ASR-9006-FAN-V2 - 7710 7590 8970 7500 7530
0/FT1 ASR-9006-FAN-V2 7590 7560 7590 7590 7560 7560
0/PT0-PM0 PWR-2KW-DC-V2 8022 8559
0/PT0-PM1 PWR-2KW-DC-V2 6280 6237
0/PT0-PM2 PWR-2KW-DC-V2 7914 8559
0/PT0-PM3 PWR-2KW-DC-V2 7978 8516
RP/0/RSP0/CPU0:ASR-9006#
Nota: Un trattino (`-`) o valori RPM notevolmente inferiori rispetto ad altre ventole dello stesso alloggiamento possono indicare un guasto o un guasto della ventola.
Passaggio 1.3. Verifica degli errori del modulo ventola dai log: Eseguire questo comando per controllare i registri di sistema per gli allarmi relativi alle ventole.
Log di esempio:
RP/0/RSP0/CPU0:ASR-9006# show logging | include FAN
0/RSP0/ADMIN0:2025 Jul 10 07:52:41.797 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
0/RSP0/ADMIN0:2025 Jul 10 07:53:42.798 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
0/RSP0/ADMIN0:2025 Jul 10 07:54:43.800 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
0/RSP0/ADMIN0:2025 Jul 10 07:55:44.799 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
Fase 2. Ispezione ambientale e fisica
I fattori ambientali possono avere un impatto significativo sul funzionamento della ventola e sul raffreddamento generale del sistema.
-
Condizioni ambientali:
- Verificare la temperatura ambiente e il flusso d'aria intorno al router per accertarsi che rientri nei limiti operativi. Le temperature elevate possono causare un funzionamento più intenso delle ventole o un guasto prematuro.
- Verificare la presenza di eventuali filtri per la polvere o di depositi d'aria che possano essere ostruiti o non installati correttamente, limitando il flusso d'aria.
-
Ispezione fisica per individuare eventuali ostruzioni/danni:
- Ispezionare il modulo/vassoio della ventola per individuare eventuali detriti visibili, cavi allentati o ostruzioni che possano impedire alle ventole di girare liberamente. L'accumulo di polvere è una causa comune di problemi alla ventola.
- Per i modelli dotati di alloggiamenti per ventole modulari (ad esempio, ASR 9006, 9010, ASR 99xx), se lo si desidera con sicurezza e nel rispetto delle linee guida operative, estrarre con attenzione il vassoio per ventole sospetto. Controllare visivamente le singole ventole per verificare la presenza di blade non rotanti o danni visibili. Quando il vassoio è spento, verificare che le ventole e lo slot dello chassis non siano eccessivamente polverosi.
- Per i modelli con moduli ventola fissi (ad esempio, ASR 9001), l'ispezione fisica del modulo ventola e dei connettori è limitata, ma deve comunque essere eseguita per eventuali segni esterni di danneggiamento o ostruzione.
Passaggio 3. Verifica della presenza di problemi noti e bug
Prima di procedere con la sostituzione dell'hardware, si consiglia di verificare se il guasto della ventola osservato è in linea con eventuali bug noti relativi al software o all'hardware.
- Cisco Bug Search Tool:eseguire una ricerca in Cisco Bug Search Tool (BST) utilizzando parole chiave quali "errore ventola ASR 9000", "ASR [numero modello] ventola" e la versione Cisco IOS® XR in esecuzione sul dispositivo. Cercare i problemi noti che possono causare segnalazioni errate delle ventole o guasti effettivi.
- Documentazione di supporto Cisco:per informazioni su problemi simili segnalati e soluzioni o correzioni consigliate, consultare la documentazione di supporto Cisco e i forum della community.
Passaggio 4. Azioni correttive e sostituzione
I passaggi successivi dipendono dal tipo di modulo della ventola del router ASR serie 9000.
Per ASR serie 9000 con moduli ventola fissi (ad esempio, ASR 9001):
Modelli come ASR 9001 hanno un modulo di ventola fisso non sostituibile a caldo.
- Ciclo di alimentazione:se i controlli iniziali e le regolazioni ambientali non risolvono il problema, eseguire un ciclo di alimentazione del router. In alcuni casi questo consente di risolvere i problemi temporanei e di reinizializzare correttamente il modulo ventola.
- Sostituzione (RMA): se il modulo ventola viene confermato guasto dopo un ciclo di alimentazione, in genere richiede un'autorizzazione restituzione merce (RMA) per l'intero chassis.
Nota: La sostituzione di un modulo ventola fisso richiede tempi di inattività pianificati in quanto il router deve essere spento.
Per ASR serie 9000 con vassoi ventola modulari (ad esempio, modelli ASR 9006, ASR 9010, ASR 99xx)
Questi modelli sono dotati di alloggiamenti per ventole modulari sostituibili a caldo.
-
Riposizionamento (JACK-OUT e JACK-IN - JOJI):
- Eseguire con attenzione una procedura JACK-OUT e JACK-IN (JOJI) sull'alloggiamento della ventola che contiene i moduli della ventola guasti. Questo comporta la rimozione fisica dell'alloggiamento della ventola e quindi il reinserimento.
- Mentre il vassoio della ventola viene estratto, eseguire un'accurata ispezione visiva per individuare eventuali detriti o cavi allentati che potrebbero impedire la rotazione delle ventole. Si può anche osservare se tutte le ventole tentano di girare al reinserimento.
- Dopo il riposizionamento, verificare nuovamente lo stato utilizzando "admin show environment fan".
-
Sostituzione (RMA): se i moduli ventola sono ancora in stato di errore o l'alloggiamento ventola rimane non operativo dopo il riposizionamento, procedere con un'RMA per l'alloggiamento ventola.
- Raccogli log delle prove:Esegui " show logging | includere nuovamente FAN " per acquisire i log relativi all'alloggiamento della ventola JOJI a scopo di documentazione.
Log di esempio:
RP/0/RSP0/CPU0:ASR-9006# show logging | include FAN
0/RSP0/ADMIN0:Jul 12 01:39:25.215 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0 hardware state going to Operational
0/RSP0/ADMIN0:Jul 12 01:42:23.584 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0
- Raccogli ID prodotto (PID) e numero di serie (SN): ottenere il PID e il numero di serie del vassoio delle ventole guasto, necessari per il processo RMA.
Output di esempio del comando:
Command Syntax:
RP/0/RSP0/CPU0:ASR-9006# show inventory location <location of failed FAN tray>
Sample command:
RP/0/RSP0/CPU0:ASR-9006# show inventory location 0/FT0
NAME: "0/FT0", DESCR: "ASR-9006 Fan Tray V2"
PID: ASR-9006-FAN-V2 , VID: V02, SN: FOC222XXX
- Procedere con RMA: avviare il processo RMA con Cisco per il vassoio della ventola guasto.