Introduction
Ce document décrit comment dépanner une défaillance du module de ventilation dans la plate-forme NCS XR.
Conditions préalables
Exigences
Cisco vous recommande de prendre connaissance des rubriques suivantes :
Remarque : Cisco recommande que vous ayez accès à l'interface de ligne de commande Cisco IOS® XR et à l'interface d'administration.
Remarque : Cisco recommande que vous ayez accès à l'interface de ligne de commande Cisco IOS® XR et à l'interface d'administration.
Composants utilisés
Les informations contenues dans ce document sont basées sur les versions de matériel et de logiciel suivantes :
Cela inclut, sans s'y limiter, les séries suivantes :
- Gamme NCS 540
- Gamme NCS 560
- Gamme NCS 5500
- Gamme NCS 5700
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. Si votre réseau est en ligne, assurez-vous de bien comprendre l’incidence possible des commandes.
Informations générales
La gamme de routeurs Cisco NCS XR comprend plusieurs plates-formes conçues pour différents cas d'utilisation et niveaux de performances, chacune avec des types de modules de ventilation et des architectures système distincts :
· Gamme Cisco NCS 540 : Il s'agit d'un routeur XR à faible densité destiné aux applications à bande passante inférieure à 100 G, telles que la liaison NR 5G, FTTx et les déploiements de filiales d'entreprise. Il utilise des modules de ventilation avec une conception redondante 3+1 et un refroidissement par air forcé côte à côte. Les alimentations sont fixées avec une redondance 1+1 CA/CC, et le système est renforcé avec un revêtement conforme et prend en charge la conformité de synchronisation de classe C.
· Gamme Cisco NCS 560 : Ce système modulaire comprend trois unités de ventilation modulaires à grande vitesse qui doivent être remplies pour fonctionner. Ces unités de ventilation contiennent des ventilateurs redondants et peuvent être réparées sur site, ce qui permet leur remplacement sans arrêt du système. Le système prend en charge le fonctionnement avec des pannes de ventilateur uniques et impose des limites de temps pour la réinsertion des plateaux de ventilateur en fonction de la température ambiante. Il dispose également d'un filtre à poussière intégré pour optimiser la circulation de l'air. Les alimentations sont modulaires avec des options CA et CC, prenant en charge le partage de charge et les schémas de protection.
· Gamme Cisco NCS 5500 : Cette plate-forme de routage modulaire à haute résilience est conçue pour les environnements de data center et de réseau hautes performances. Il est doté de modules de ventilation modulaires remplaçables sur site qui facilitent la maintenance et la redondance. Le dépannage implique des vérifications des journaux système, de l'état du matériel et gère les packages logiciels pour maintenir la stabilité du système. La plate-forme prend en charge le logiciel Cisco IOS® XR avec des packages modulaires et des fonctionnalités de résilience.
· Gamme Cisco NCS 5700 : Basée sur la plate-forme NCS 5500, cette gamme inclut une conception ASIC de transfert améliorée et exécute le système d'exploitation Cisco IOS® XR7. Il possède des variantes telles que NCS-57B1-6D24 et NCS-57B1-5DSE. Le système est modulaire avec des unités de ventilation et des blocs d'alimentation remplaçables sur site, et prend en charge la haute disponibilité et la résilience aux pannes. Les unités de ventilation sont conçues pour la redondance et le remplacement à chaud.Le système d'exploitation Cisco IOS® XR7 fournit des fonctionnalités logicielles avancées qui surveillent la gestion du système et des pannes.
Problème
Les pannes de ventilateur des routeurs Cisco NCS XR ont un impact sur le refroidissement et la fiabilité du système. La nature et la gravité des problèmes varient selon la plate-forme en raison des différences de conception et de facilité de maintenance des modules de ventilation. Il existe plusieurs modèles de la gamme NCS 540 qui utilisent des modules de ventilation fixes non remplaçables sur site avec une conception de redondance 3+1. Dans ce cas, une panne du ventilateur nécessite généralement l'entretien ou le remplacement de l'ensemble de l'unité. Cela peut entraîner des temps d'arrêt plus longs et un dépannage plus complexe.
Les gammes NCS 560, 5500 et 5700 et quelques modèles de la gamme NCS 540 utilisent des unités de ventilation modulaires remplaçables sur site, conçues pour la redondance et le remplacement à chaud. Cela permet un fonctionnement continu en cas de panne d'un seul ventilateur et facilite la maintenance sans arrêt du système.
Les pannes de ventilateur dans ces systèmes modulaires peuvent déclencher des alertes système, nécessiter la surveillance des contraintes de température ambiante et nécessiter la réinsertion rapide de l'unité de ventilation afin de maintenir un flux d'air optimal et une stabilité du système. Dans l'ensemble, la défaillance du ventilateur des routeurs NCS XR présente des risques de surchauffe, de dégradation des performances et de dommages matériels potentiels. Cela nécessite une détection rapide, un diagnostic et des mesures correctives adaptées à la gamme de routeurs et à l'architecture de ventilateur spécifiques.
Procédure de résolution de la défaillance du module de ventilation sur la plate-forme NCS XR
La procédure de dépannage des pannes de modules de ventilation sur les plates-formes NCS XR présente généralement une approche cohérente, avec des actions physiques spécifiques différentes selon que le modèle utilise un module de ventilation fixe ou un plateau de ventilation modulaire.
Étape 1. Vérification initiale de la CLI
Connectez-vous au routeur dans l'interface de ligne de commande Cisco IOS® XR et exécutez ces commandes pour identifier l'état des unités de ventilation et des ventilateurs individuels. Ces commandes sont communes à toutes les plates-formes NCS XR exécutant Cisco IOS® XR.
Étape 1.1Vérification de l’état de la plate-forme : Exécutez cette commande pour déterminer s'il s'agit d'une défaillance du FAN ou d'une ou plusieurs défaillances du FAN dans un FAN.
Exemple de sortie de commande :
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#show platform
Thu Jul 24 12:33:45.143
Node Type State Config state
--------------------------------------------------------------------------------
0/RP0/CPU0 N540X-12Z16G-SYS-D(Active) IOS XR RUN NSHUT
0/PM0 N540-PSU-FIXED-D OPERATIONAL NSHUT
0/PM1 N540-PSU-FIXED-D OPERATIONAL NSHUT
0/FT0 N540-FAN OPERATIONAL NSHUT
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#
Remarque : Si tous les plateaux de VENTILATION sont en mode « OPÉRATIONNEL » , vous pouvez conclure que le plateau de VENTILATION fonctionne correctement. Sinon, si un plateau de ventilation n'est pas opérationnel, cela signifie qu'il est en état d'échec.
Étape 1.2. Identification des modules de ventilation défaillants : Exécutez cette commande pour vérifier l'état et la vitesse de chaque ventilateur d'un plateau de ventilation.
Exemple de sortie de commande :
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#show environment fan
Thu Jul 24 12:33:09.673
=========================================================================================
Fan speed (rpm)
Location FRU Type FAN_0 FAN_1 FAN_2 FAN_3
-----------------------------------------------------------------------------------------
0/FT0 N540-FAN 25680 0 25440 26130
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#
Remarque : Une valeur de 0 ou des valeurs de RPM nettement inférieures à celles des autres ventilateurs du même plateau peuvent indiquer un ventilateur défaillant ou défaillant.
Étape 1.3. Vérification de la défaillance du module de ventilation à partir des alarmes : Exécutez cette commande pour vérifier si les alarmes du système sont associées aux ventilateurs.
Exemples de journaux :
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#show alarms brief system active
Thu Jul 24 12:33:23.874
------------------------------------------------------------------------------------
Active Alarms
------------------------------------------------------------------------------------
Location Severity Group Set Time Description
------------------------------------------------------------------------------------
0/FT0 Minor Environ 07/24/2025 10:35:44 WIB Fan 1: Out of tolerance
0/FT0 Minor Environ 07/24/2025 10:35:44 WIB Sensor in failed state
0 Minor Environ 07/24/2025 10:35:44 WIB Sensor in failed state
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#
Remarque : Messages d'alarme indiquant « Fan X : "Out of tolerance" ou "Sensor in failed state" confirment les pannes du ventilateur.
Remarque : Messages d'alarme indiquant « Fan X : "Out of tolerance" ou "Sensor in failed state" confirment les pannes du ventilateur.
Étape 2. Inspection environnementale et physique
Les facteurs environnementaux peuvent avoir un impact significatif sur le fonctionnement du ventilateur et le refroidissement global du système.
-
Conditions ambiantes :
- Vérifiez la température ambiante et la circulation de l'air autour du routeur pour vous assurer qu'il est dans les limites opérationnelles. Les températures élevées peuvent rendre les ventilateurs plus sollicités ou provoquer des pannes prématurées.
- Vérifiez si des filtres à poussière ou des collecteurs d'air peuvent être obstrués ou mal installés, ce qui limite la circulation de l'air.
-
Inspection physique des obstacles/dommages :
- Vérifiez que le module/plateau de ventilation ne présente pas de débris visibles, de câbles mal branchés ou d'obstructions susceptibles d'empêcher les ventilateurs de tourner librement. L'accumulation de poussière est une cause fréquente de problèmes de ventilateur.
- Pour les plates-formes dotées de plateaux de ventilation modulaires (par exemple, les modèles NCS 560, NCS 5500, NCS 5700 et certains modèles NCS 540), si vous pouvez le faire en toute sécurité et dans le respect des directives opérationnelles, pensez à retirer soigneusement le plateau de ventilation suspecté. Inspectez visuellement les ventilateurs individuels pour détecter la présence de pales qui ne tournent pas ou des dommages visibles. Lorsque le plateau est ouvert, vérifiez que les ventilateurs et le logement du châssis ne sont pas recouverts de poussière.
- Pour les plates-formes dotées de modules de ventilation fixes (par exemple, certains modèles NCS 540), une inspection physique du module de ventilation et des connecteurs est limitée, mais doit néanmoins être effectuée pour détecter tout signe externe de dommage ou d'obstruction.
Étape 3. Recherche des problèmes connus et des bogues
Avant de procéder au remplacement du matériel, il est conseillé de vérifier si la défaillance du ventilateur observée correspond à des bogues logiciels ou matériels connus.
- Outil de recherche de bogues Cisco : recherchez l'outil de recherche de bogues Cisco (BST) à l'aide de mots clés tels que « NCS XR fan failure », « NCS [numéro de modèle] fan » et la version de Cisco IOS® XR spécifique exécutée sur votre périphérique. Recherchez les problèmes connus pouvant entraîner des erreurs de signalement de ventilateur ou des pannes réelles.
- Documentation d'assistance Cisco : consultez la documentation d'assistance de Cisco et des forums de la communauté pour rechercher les problèmes signalés similaires et les solutions de contournement ou correctifs recommandés.
Étape 4. Mesures correctives et remplacement
Les étapes suivantes dépendent du type de module de ventilation de votre plate-forme NCS XR.
Pour les plates-formes NCS XR avec modules de ventilation fixes (par exemple, certains modèles NCS 540)
Les modèles équipés de modules de ventilation fixes ne sont généralement pas remplaçables à chaud.
- Power Cycle : si les vérifications initiales et les réglages environnementaux ne résolvent pas le problème, effectuez un cycle d'alimentation du routeur. Cela permet parfois d'éliminer les problèmes transitoires et de réinitialiser correctement le module de ventilation.
- Remplacement (RMA) : si la défaillance du module de ventilation est confirmée après un cycle d'alimentation, une autorisation de retour de marchandises (RMA) est généralement requise pour l'ensemble de l'unité ou du châssis.
Remarque : Le remplacement d'un module de ventilation fixe nécessite une interruption planifiée, car le routeur doit être mis hors tension.
Pour les plates-formes NCS XR avec plateaux de ventilation modulaires (par exemple, la plupart des modèles NCS 540, NCS 560, NCS 5500 et NCS 5700)
Ces plates-formes sont équipées de plateaux de ventilation modulaires remplaçables à chaud.
-
Réinstallation (JACK-OUT et JACK-IN - JOJI) :
- Exécutez soigneusement une procédure JACK-OUT et JACK-IN (JOJI) sur l'unité de ventilation contenant le ou les modules de ventilation défaillants. Cela implique le retrait physique de l'unité de ventilation, puis sa réinsertion.
- Lorsque le plateau de ventilation est retiré, effectuez une inspection visuelle approfondie afin de détecter tout débris ou câble desserré susceptible d'empêcher les ventilateurs de tourner. Vous pouvez également observer si tous les ventilateurs tentent de tourner lors de la réinsertion.
- Après la réinstallation, vérifiez à nouveau l'état à l'aide de la commande show environment fan.
-
Remplacement (RMA) : si l'un des modules de ventilation est toujours défaillant ou si l'unité de ventilation reste hors service après sa réinstallation, poursuivez avec une RMA pour l'unité de ventilation.
- Collecter les journaux de preuves : Exécuter « show logging » | incluez à nouveau « FAN » pour capturer les journaux associés à JOJI de l'unité de ventilation à des fins de documentation.
Exemples de journaux :
RP/0/RP0/CPU0:N540-24Z8Q2C-SYS# show logging | include FAN
0/RSP0/ADMIN0:Jul 12 01:39:25.215 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#: N/A
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #: N/A
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0 hardware state going to Operational
0/RSP0/ADMIN0:Jul 12 01:42:23.584 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#: N/A
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #:N/A
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0
- Collecter l'ID de produit (PID) et le numéro de série (SN) : Procurez-vous le PID et le numéro de série du plateau de ventilation défectueux, nécessaires au processus RMA.
Exemple de sortie de commande :
Command Syntax:
RP/0/RP0/CPU0:N540-24Z8Q2C-SYS# show inventory location <location of failed FAN tray>
Sample command:
RP/0/RP0/CPU0:N540-24Z8Q2C-SYS# show inventory location 0/FT0
NAME: "0/FT0", DESCR: "NCS 540 Fan"
PID: N540-FAN , VID: N/A, SN: N/A
- Continuer avec RMA : lancez le processus RMA avec Cisco pour le plateau de ventilation défectueux.