Introduction
Ce document décrit comment dépanner une défaillance du module de ventilation dans ASR9k.
Conditions préalables
Exigences
Cisco vous recommande de prendre connaissance des rubriques suivantes :
Remarque : Cisco recommande que vous ayez accès à l'interface de ligne de commande Cisco IOS® XR et à l'interface d'administration.
Composants utilisés
Les informations contenues dans ce document sont basées sur les versions de matériel et de logiciel suivantes :
- La gamme ASR 9000 comprend une gamme de modèles, notamment les ASR 9001, ASR 9006, ASR 9010, ASR 9901, ASR 9906, ASR 9910, ASR 9912 et ASR 9922.
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. Si votre réseau est en ligne, assurez-vous de bien comprendre l’incidence possible des commandes.
Informations générales
Les routeurs à services d'agrégation de la gamme Cisco ASR 9000 (ASR9k) sont des routeurs hautes performances conçus pour les réseaux des fournisseurs de services. Ils offrent évolutivité, fiabilité et fonctionnalités avancées pour répondre aux exigences des environnements réseau. Les routeurs ASR9k offrent une architecture matérielle modulaire et permettent une configuration et une extension flexibles pour répondre aux divers besoins du réseau.
La gamme de routeurs ASR9k comprend :
· Conception modulaire : Les routeurs ASR9k intègrent des composants modulaires tels que des processeurs de routage, des cartes de ligne et des unités de ventilation, et permettent des mises à niveau et une maintenance faciles sans interruption du fonctionnement du réseau.
· Système de refroidissement : Par exemple, le modèle ASR 9001 utilise un plateau de ventilation unique accessible par l'avant et contenant des ventilateurs redondants pour assurer un refroidissement continu. L'unité de ventilation prend en charge la circulation d'air côte à côte et, à partir de la version logicielle 4.3.0, permet l'insertion et le retrait en ligne (OIR) avec certaines restrictions de température ambiante, améliorant ainsi la facilité de maintenance.
•Haute disponibilité: La gamme ASR9k prend en charge les alimentations et les ventilateurs redondants, contribue à la haute disponibilité et réduit les temps d'arrêt.
· Performances et évolutivité : Conçus pour gérer l'agrégation à grande échelle et le routage de périphérie, les routeurs ASR9k prennent en charge des protocoles de routage avancés et à haut débit adaptés aux réseaux centraux et de périphérie des fournisseurs de services.
· Fonctionnalités logicielles : Les routeurs exécutent le logiciel Cisco IOS® XR, qui offre une fiabilité, une modularité et une programmabilité de niveau opérateur pour prendre en charge les demandes réseau en constante évolution.
Problème
Une défaillance du module de ventilation ou de l'unité de ventilation d'un routeur de la gamme ASR 9000 peut entraîner un refroidissement inadéquat, entraînant une surchauffe des composants matériels critiques. Cette surchauffe peut entraîner une instabilité du système, une dégradation des performances, des arrêts inattendus ou des dommages matériels permanents, affectant ainsi la disponibilité du réseau et la fiabilité du service. Étant donné le rôle essentiel du système de refroidissement dans le maintien de l'intégrité du périphérique, la détection et la réduction rapides des pannes de ventilateur sont essentielles pour éviter les interruptions du réseau et maintenir une disponibilité élevée dans les environnements des fournisseurs de services.
Procédure de résolution de la défaillance du module FAN dans ASR9k
La procédure de dépannage des défaillances des modules de ventilation dans les routeurs de la gamme ASR 9000 décrit généralement une approche cohérente entre les modèles, avec des actions physiques spécifiques différentes selon que le modèle utilise un module de ventilation fixe ou un plateau de ventilation modulaire.
Étape 1. Vérification initiale de la CLI
Connectez-vous au routeur dans l'interface de ligne de commande Cisco IOS® XR et exécutez ces commandes pour identifier l'état des unités de ventilation et des ventilateurs individuels. Ces commandes sont communes à toutes les plates-formes ASR 9000 exécutant Cisco IOS® XR.
Étape 1.1 Vérification de l’état de la plate-forme : Exécutez cette commande pour déterminer s'il s'agit d'une défaillance du FAN ou d'une ou plusieurs défaillances du FAN dans un FAN.
Exemple de sortie de commande :
RP/0/RSP0/CPU0:ASR-9006#show platform
Wed Jul 16 12:16:00.408 IST
Node Type State Config state
--------------------------------------------------------------------------------
0/RSP0/CPU0 A9K-RSP5-SE(Active) IOS XR RUN NSHUT
0/RSP1/CPU0 A9K-RSP5-SE(Standby) IOS XR RUN NSHUT
0/FT0 ASR-9006-FAN-V2 OPERATIONAL NSHUT
0/FT1 ASR-9006-FAN-V2 OPERATIONAL NSHUT
0/0/CPU0 A9K-MOD200-SE IOS XR RUN NSHUT
0/0/0 A9K-MPA-20X1GE OK
0/1/CPU0 A9K-8X100GE-SE IOS XR RUN NSHUT
0/2/CPU0 A9K-MOD200-SE IOS XR RUN NSHUT
0/2/0 A9K-MPA-20X10GE OK
0/PT0 A9K-DC-PEM-V2 OPERATIONAL NSHUT
RP/0/RSP0/CPU0:ASR-9006#
Remarque : Si tous les plateaux de VENTILATION sont en mode « OPÉRATIONNEL » , vous pouvez conclure que le plateau de VENTILATION fonctionne correctement. Sinon, si un plateau de ventilation n'est pas opérationnel, cela signifie qu'il est en état d'échec.
Étape 1.2. Identification des modules de ventilation défaillants : Exécutez cette commande pour vérifier l'état et la vitesse de chaque ventilateur d'un plateau de ventilation.
Exemple de sortie de commande :
RP/0/RSP0/CPU0:ASR-9006#admin show environment fan
Wed Jul 16 12:16:09.843 IST
=============================================================================
Fan speed (rpm)
Location FRU Type FAN_0 FAN_1 FAN_2 FAN_3 FAN_4 FAN_5
-----------------------------------------------------------------------------
0/FT0 ASR-9006-FAN-V2 - 7710 7590 8970 7500 7530
0/FT1 ASR-9006-FAN-V2 7590 7560 7590 7590 7560 7560
0/PT0-PM0 PWR-2KW-DC-V2 8022 8559
0/PT0-PM1 PWR-2KW-DC-V2 6280 6237
0/PT0-PM2 PWR-2KW-DC-V2 7914 8559
0/PT0-PM3 PWR-2KW-DC-V2 7978 8516
RP/0/RSP0/CPU0:ASR-9006#
Remarque : Un tiret (`-`) ou des valeurs de RPM nettement inférieures par rapport aux autres ventilateurs du même plateau peuvent indiquer un ventilateur défaillant ou défaillant.
Étape 1.3. Vérification de la défaillance du module de ventilation à partir des journaux : Exécutez cette commande pour rechercher les alarmes liées aux ventilateurs dans les journaux système.
Exemples de journaux :
RP/0/RSP0/CPU0:ASR-9006# show logging | include FAN
0/RSP0/ADMIN0:2025 Jul 10 07:52:41.797 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
0/RSP0/ADMIN0:2025 Jul 10 07:53:42.798 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
0/RSP0/ADMIN0:2025 Jul 10 07:54:43.800 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
0/RSP0/ADMIN0:2025 Jul 10 07:55:44.799 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
Étape 2. Inspection environnementale et physique
Les facteurs environnementaux peuvent avoir un impact significatif sur le fonctionnement du ventilateur et le refroidissement global du système.
-
Conditions ambiantes :
- Vérifiez la température ambiante et la circulation de l'air autour du routeur pour vous assurer qu'il est dans les limites opérationnelles. Les températures élevées peuvent rendre les ventilateurs plus sollicités ou provoquer des pannes prématurées.
- Vérifiez si des filtres à poussière ou des collecteurs d'air peuvent être obstrués ou mal installés, ce qui limite la circulation de l'air.
-
Inspection physique des obstacles/dommages :
- Vérifiez que le module/plateau de ventilation ne présente pas de débris visibles, de câbles mal branchés ou d'obstructions susceptibles d'empêcher les ventilateurs de tourner librement. L'accumulation de poussière est une cause fréquente de problèmes de ventilateur.
- Pour les modèles équipés de plateaux de ventilation modulaires (par exemple, ASR 9006, 9010, ASR 99xx), si vous pouvez le faire en toute sécurité et conformément aux consignes de fonctionnement, retirez soigneusement le plateau de ventilation suspecté. Inspectez visuellement les ventilateurs individuels pour détecter la présence de pales qui ne tournent pas ou des dommages visibles. Lorsque le plateau est ouvert, vérifiez que les ventilateurs et le logement du châssis ne sont pas recouverts de poussière.
- Pour les modèles équipés de modules de ventilation fixes (par exemple, ASR 9001), une inspection physique du module de ventilation et des connecteurs est limitée, mais doit toujours être effectuée pour détecter tout signe externe d'endommagement ou d'obstruction.
Étape 3. Recherche des problèmes connus et des bogues
Avant de procéder au remplacement du matériel, il est conseillé de vérifier si la défaillance du ventilateur observée correspond à des bogues logiciels ou matériels connus.
- Outil de recherche de bogues Cisco : recherchez l'outil de recherche de bogues Cisco (BST) à l'aide de mots clés tels que « panne du ventilateur ASR 9000 », « ventilateur ASR [numéro de modèle] » et la version spécifique de Cisco IOS® XR exécutée sur votre périphérique. Recherchez les problèmes connus pouvant entraîner des erreurs de signalement de ventilateur ou des pannes réelles.
- Documentation d'assistance Cisco : consultez la documentation d'assistance Cisco et les forums de la communauté pour obtenir des informations sur les problèmes similaires signalés et les solutions de contournement ou correctifs recommandés.
Étape 4. Mesures correctives et remplacement
Les étapes suivantes dépendent du type de module de ventilation de votre routeur ASR 9000.
Pour la gamme ASR 9000 avec modules de ventilation fixes (par exemple, ASR 9001) :
Les modèles tels que l'ASR 9001 sont équipés d'un module de ventilation fixe qui n'est pas remplaçable à chaud.
- Power Cycle : si les vérifications initiales et les réglages environnementaux ne résolvent pas le problème, effectuez un cycle d'alimentation du routeur. Cela permet parfois d'éliminer les problèmes transitoires et de réinitialiser correctement le module de ventilation.
- Remplacement (RMA) : si la défaillance du module de ventilation est confirmée après un cycle d'alimentation, une autorisation de retour de marchandises (RMA) est généralement requise pour l'ensemble du châssis.
Remarque : Le remplacement d'un module de ventilation fixe nécessite une interruption planifiée, car le routeur doit être mis hors tension.
Pour la gamme ASR 9000 avec plateaux de ventilation modulaires (par exemple, modèles ASR 9006, ASR 9010 et ASR 99xx)
Ces modèles sont équipés de plateaux de ventilation modulaires remplaçables à chaud.
-
Réinstallation (JACK-OUT et JACK-IN - JOJI) :
- Exécutez soigneusement une procédure JACK-OUT et JACK-IN (JOJI) sur l'unité de ventilation contenant le ou les modules de ventilation défaillants. Cela implique le retrait physique de l'unité de ventilation, puis sa réinsertion.
- Lorsque le plateau de ventilation est retiré, effectuez une inspection visuelle approfondie afin de détecter tout débris ou câble desserré susceptible d'empêcher les ventilateurs de tourner. Vous pouvez également observer si tous les ventilateurs tentent de tourner lors de la réinsertion.
- Après la réinstallation, vérifiez à nouveau l'état à l'aide de « admin show environment fan ».
-
Remplacement (RMA) : si le ou les modules de ventilation sont toujours en panne ou si l'unité de ventilation reste hors service après la réinstallation, poursuivez avec une RMA pour l'unité de ventilation.
- Collecter les journaux de preuves : Exécuter « show logging » | incluez à nouveau « FAN » pour capturer les journaux associés à l'unité de ventilation JOJI à des fins de documentation.
Exemples de journaux :
RP/0/RSP0/CPU0:ASR-9006# show logging | include FAN
0/RSP0/ADMIN0:Jul 12 01:39:25.215 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0 hardware state going to Operational
0/RSP0/ADMIN0:Jul 12 01:42:23.584 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0
- Collecter l'ID de produit (PID) et le numéro de série (SN) : obtenez le PID et le numéro de série de l'unité de ventilation défectueuse, qui sont requis pour le processus RMA.
Exemple de sortie de commande :
Command Syntax:
RP/0/RSP0/CPU0:ASR-9006# show inventory location <location of failed FAN tray>
Sample command:
RP/0/RSP0/CPU0:ASR-9006# show inventory location 0/FT0
NAME: "0/FT0", DESCR: "ASR-9006 Fan Tray V2"
PID: ASR-9006-FAN-V2 , VID: V02, SN: FOC222XXX
- Continuer avec RMA : lancez le processus RMA avec Cisco pour le plateau de ventilation défectueux.