Einleitung
In diesem Dokument wird die Fehlerbehebung bei Ausfall des Lüftermoduls in ASR9k beschrieben.
Voraussetzungen
Anforderungen
Cisco empfiehlt, dass Sie über Kenntnisse in folgenden Bereichen verfügen:
Anmerkung: Cisco empfiehlt den Zugriff auf die CLI von Cisco IOS® XR und die Admin-CLI.
Verwendete Komponenten
Die Informationen in diesem Dokument basierend auf folgenden Software- und Hardware-Versionen:
- Die ASR Serie 9000 umfasst eine Reihe von Modellen, darunter ASR 9001, ASR 9006, ASR 9010, ASR 9901, ASR 9906, ASR 9910, ASR 9912 und ASR 9922, unter anderem.
Die Informationen in diesem Dokument beziehen sich auf Geräte in einer speziell eingerichteten Testumgebung. Alle Geräte, die in diesem Dokument benutzt wurden, begannen mit einer gelöschten (Nichterfüllungs) Konfiguration. Wenn Ihr Netzwerk in Betrieb ist, stellen Sie sicher, dass Sie die möglichen Auswirkungen aller Befehle kennen.
Hintergrundinformationen
Die Cisco Aggregation Services Router der Serie ASR 9000 (ASR9k) sind Hochleistungsrouter und wurden für Service Provider-Netzwerke entwickelt. Sie zeichnen sich durch ihre Skalierbarkeit, Zuverlässigkeit und erweiterten Funktionen aus, die den Anforderungen von Netzwerkumgebungen gerecht werden. Die ASR9k Router bieten eine modulare Hardware-Architektur und ermöglichen eine flexible Konfiguration und Erweiterung, um die unterschiedlichen Netzwerkanforderungen zu erfüllen.
Zu den ASR9k-Routern gehören:
・ Modulares Design: ASR9k-Router verfügen über modulare Komponenten wie Routingprozessoren, Linecards und Lüftereinschübe und ermöglichen problemlose Upgrades und Wartung ohne Unterbrechungen des Netzwerkbetriebs.
・ Kühlsystem: Beispielsweise verwendet das ASR 9001-Modell einen einzigen, von vorne zugänglichen Lüftereinschub mit redundanten Lüftern, um eine kontinuierliche Kühlung sicherzustellen. Der Lüftereinschub unterstützt die Luftstromführung von der Seite zur Seite und ermöglicht ab Softwareversion 4.3.0 das Online Insertion and Removal (OIR) mit bestimmten Umgebungstemperaturbeschränkungen. Auf diese Weise wird die Benutzerfreundlichkeit verbessert.
・ Hohe Verfügbarkeit: Die Serie ASR9k unterstützt redundante Netzteile und Lüfter, trägt zu hoher Verfügbarkeit bei und minimiert Ausfallzeiten.
・ Leistung und Skalierbarkeit: ASR9k-Router sind für die Verarbeitung umfangreicher Aggregations- und Edge-Routings konzipiert und unterstützen einen hohen Durchsatz sowie erweiterte Routingprotokolle, die für Core- und Edge-Netzwerke von Service Providern geeignet sind.
・ Softwarefunktionen: Auf den Routern wird die Cisco IOS® XR-Software ausgeführt, die für Zuverlässigkeit, Modularität und Programmierbarkeit der Carrier-Klasse sorgt und so die wachsenden Netzwerkanforderungen unterstützt.
Problem
Ein Ausfall eines Lüftermoduls oder Lüftereinschubs in einem Router der Serie ASR 9000 kann zu einer unzureichenden Kühlung führen, die zur Überhitzung wichtiger Hardwarekomponenten führt. Diese Überhitzung kann zu Instabilität des Systems, Leistungseinbußen, unerwarteten Abschaltungen oder dauerhaften Schäden an der Hardware führen und sich letztendlich auf die Netzwerkverfügbarkeit und die Zuverlässigkeit der Services auswirken. Angesichts der entscheidenden Rolle des Kühlsystems bei der Aufrechterhaltung des Gerätezustands sind eine rechtzeitige Erkennung und Behebung von Lüfterausfällen unerlässlich, um Netzwerkstörungen zu verhindern und eine hohe Verfügbarkeit in Service Provider-Umgebungen aufrechtzuerhalten.
Verfahren zur Behebung von FAN-Modulfehlern in ASR9k
Das Verfahren zur Fehlerbehebung bei Ausfällen von Lüftermodulen bei Routern der Serie ASR 9000 bietet einen konsistenten Ansatz für verschiedene Modelle, wobei spezifische physische Aktionen unterschiedlich ausfallen, je nachdem, ob das Modell ein festes Lüftermodul oder einen modularen Lüftereinschub verwendet.
Schritt 1. Erste CLI-Verifizierung
Melden Sie sich in der Cisco IOS® XR CLI beim Router an, und führen Sie diese Befehle aus, um den Status der Lüftereinschübe und einzelner Lüfter zu identifizieren. Diese Befehle gelten für alle ASR 9000-Plattformen mit Cisco IOS® XR.
Schritt 1.1 Überprüfen des Plattformstatus: Führen Sie diesen Befehl aus, um festzustellen, ob es sich um einen Lüftereinschubausfall oder um einen oder mehrere Lüfterausfälle in einem Lüftereinschub handelt.
Beispielausgabe für Befehle:
RP/0/RSP0/CPU0:ASR-9006#show platform
Wed Jul 16 12:16:00.408 IST
Node Type State Config state
--------------------------------------------------------------------------------
0/RSP0/CPU0 A9K-RSP5-SE(Active) IOS XR RUN NSHUT
0/RSP1/CPU0 A9K-RSP5-SE(Standby) IOS XR RUN NSHUT
0/FT0 ASR-9006-FAN-V2 OPERATIONAL NSHUT
0/FT1 ASR-9006-FAN-V2 OPERATIONAL NSHUT
0/0/CPU0 A9K-MOD200-SE IOS XR RUN NSHUT
0/0/0 A9K-MPA-20X1GE OK
0/1/CPU0 A9K-8X100GE-SE IOS XR RUN NSHUT
0/2/CPU0 A9K-MOD200-SE IOS XR RUN NSHUT
0/2/0 A9K-MPA-20X10GE OK
0/PT0 A9K-DC-PEM-V2 OPERATIONAL NSHUT
RP/0/RSP0/CPU0:ASR-9006#
Anmerkung: Wenn alle Lüftereinschübe "BETRIEBLICH" lauten, können Sie abschließen, dass der Lüftereinschub einwandfrei funktioniert. Andernfalls, wenn ein Lüftereinschub nicht betriebsbereit ist, bedeutet dies, dass der Lüftereinschub ausgefallen ist.
Schritt 1.2: Identifizieren ausgefallener Lüftermodule: Führen Sie diesen Befehl aus, um den Status und die Geschwindigkeit einzelner Lüfter in einem Lüftereinschub zu überprüfen.
Beispielausgabe für Befehle:
RP/0/RSP0/CPU0:ASR-9006#admin show environment fan
Wed Jul 16 12:16:09.843 IST
=============================================================================
Fan speed (rpm)
Location FRU Type FAN_0 FAN_1 FAN_2 FAN_3 FAN_4 FAN_5
-----------------------------------------------------------------------------
0/FT0 ASR-9006-FAN-V2 - 7710 7590 8970 7500 7530
0/FT1 ASR-9006-FAN-V2 7590 7560 7590 7590 7560 7560
0/PT0-PM0 PWR-2KW-DC-V2 8022 8559
0/PT0-PM1 PWR-2KW-DC-V2 6280 6237
0/PT0-PM2 PWR-2KW-DC-V2 7914 8559
0/PT0-PM3 PWR-2KW-DC-V2 7978 8516
RP/0/RSP0/CPU0:ASR-9006#
Anmerkung: Ein Bindestrich (`-`) oder deutlich niedrigere Drehzahlwerte im Vergleich zu anderen Lüftern im gleichen Fach können auf einen ausgefallenen oder ausgefallenen Lüfter hinweisen.
Schritt 1.3: Überprüfen des Lüftermodulausfalls in den Protokollen: Führen Sie diesen Befehl aus, um Systemprotokolle auf lüfterbezogene Alarme zu überprüfen.
Beispielprotokolle:
RP/0/RSP0/CPU0:ASR-9006# show logging | include FAN
0/RSP0/ADMIN0:2025 Jul 10 07:52:41.797 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
0/RSP0/ADMIN0:2025 Jul 10 07:53:42.798 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
0/RSP0/ADMIN0:2025 Jul 10 07:54:43.800 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
0/RSP0/ADMIN0:2025 Jul 10 07:55:44.799 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
Schritt 2. Umwelt- und physische Inspektion
Umgebungsfaktoren können sich erheblich auf den Lüfterbetrieb und die Systemkühlung insgesamt auswirken.
-
Umgebungsbedingungen:
- Überprüfen Sie die Umgebungstemperatur und den Luftstrom um den Router, um sicherzustellen, dass er innerhalb der Betriebsgrenzen liegt. Hohe Temperaturen können dazu führen, dass Lüfter härter arbeiten oder vorzeitig ausfallen.
- Überprüfen Sie, ob Staubfilter oder Luftschächte vorhanden sind, die verstopft oder falsch installiert sein können, wodurch der Luftstrom eingeschränkt wird.
-
Physische Prüfung auf Fremdkörper/Beschädigungen:
- Untersuchen Sie das Lüftermodul bzw. den Lüftereinschub auf sichtbare Verschmutzungen, lose Kabel oder Hindernisse, die eine freie Lüfterdrehung verhindern können. Staubansammlungen sind eine häufige Ursache für Lüfterprobleme.
- Bei Modellen mit modularen Lüftereinschüben (z. B. ASR 9006, 9010, ASR 99xx) sollten Sie den verdächtigen Lüftereinschub vorsichtig herausziehen, wenn dies sicher ist und die Betriebsrichtlinien eingehalten werden. Untersuchen Sie die einzelnen Lüfter visuell auf nicht rotierende Klingen oder sichtbare Beschädigungen. Überprüfen Sie, ob sich Staub an den Lüftern und im Chassis-Steckplatz ansammelt, während das Fach geöffnet ist.
- Bei Modellen mit fest eingebauten Lüftermodulen (z. B. ASR 9001) ist die physische Inspektion des Lüftermoduls und der Anschlüsse beschränkt, muss jedoch weiterhin auf äußere Zeichen von Beschädigungen oder Behinderungen hin durchgeführt werden.
Schritt 3: Überprüfen auf bekannte Probleme und Fehler
Bevor Sie mit dem Hardware-Ersatz fortfahren, sollten Sie überprüfen, ob der festgestellte Lüfterausfall auf bekannte Software- oder Hardware-Fehler zurückzuführen ist.
- Cisco Bug Search Tool:Suchen Sie im Cisco Bug Search Tool (BST) nach Schlüsselwörtern wie "ASR 9000 fan failure" (Lüfterausfall), "ASR [Modellnummer] fan" (ASR-Lüfter) und der spezifischen Cisco IOS® XR-Version, die auf Ihrem Gerät ausgeführt wird. Achten Sie auf bekannte Probleme, die zu Lüfterfehlmeldungen oder -ausfällen führen können.
- Cisco Support-Dokumentation: Lesen Sie die Cisco Support-Dokumentation und die Community-Foren, um ähnliche gemeldete Probleme und empfohlene Problemumgehungen oder Bugfixes zu finden.
Schritt 4: Korrekturmaßnahmen und Ersatz
Die nächsten Schritte hängen vom Typ des Lüftermoduls in Ihrem Router der Serie ASR 9000 ab.
Für die Serie ASR 9000 mit fest konfigurierten Lüftermodulen (z. B. ASR 9001):
Modelle wie der ASR 9001 verfügen über ein fest eingebautes Lüftermodul, das nicht Hot-Swap-fähig ist.
- Ein-/Ausschalten: Wenn das Problem durch die anfänglichen Prüfungen und Umgebungsanpassungen nicht behoben wird, führen Sie einen Ein-/Ausschaltzyklus des Routers durch. Dadurch können vorübergehende Probleme behoben und eine ordnungsgemäße Neuinitialisierung des Lüftermoduls ermöglicht werden.
- Austausch (RMA):Wenn das Lüftermodul nach dem Aus- und Einschalten als ausgefallen bestätigt wird, ist in der Regel eine Retourengenehmigung (Return Merchandise Authorization, RMA) für das gesamte Chassis erforderlich.
Anmerkung: Der Austausch eines festen Lüftermoduls erfordert geplante Ausfallzeiten, da der Router ausgeschaltet werden muss.
Für die Serie ASR 9000 mit modularen Lüftereinschüben (z. B. Modelle ASR 9006, ASR 9010, ASR 99xx)
Diese Modelle verfügen über Hot-Swap-fähige modulare Lüftereinschübe.
-
Wiedereinsetzen (JACK-OUT und JACK-IN - JOJI):
- Führen Sie einen JACK-OUT- und JACK-IN-Vorgang (JOJI) am Lüftereinschub aus, der die fehlerhaften Lüftermodule enthält. Dazu muss der Lüftereinschub physisch entfernt und dann wieder eingesetzt werden.
- Führen Sie während des Herausziehens des Lüftereinschubs eine gründliche Sichtprüfung auf Verschmutzungen oder lockere Kabel durch, die das Drehen der Lüfter verhindern können. Sie können auch beobachten, wenn alle Lüfter beim Wiedereinsetzen versuchen, sich zu drehen.
- Überprüfen Sie nach dem erneuten Einsetzen den Status mithilfe von "admin show environment fan" erneut.
-
Austausch (RMA):Wenn das/die Lüftermodul(e) nach dem erneuten Einsetzen weiterhin defekt ist/sind oder der Lüftereinschub nach dem erneuten Einsetzen nicht funktioniert, fahren Sie mit der RMA für den Lüftereinschub fort.
- Nachweisprotokolle sammeln:Ausführen " Protokoll anzeigen | FAN einschließen " wieder zu erfassen Protokolle in Bezug auf den Lüftereinschub JOJI für Dokumentationszwecke.
Beispielprotokolle:
RP/0/RSP0/CPU0:ASR-9006# show logging | include FAN
0/RSP0/ADMIN0:Jul 12 01:39:25.215 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0 hardware state going to Operational
0/RSP0/ADMIN0:Jul 12 01:42:23.584 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0
- Produkt-ID (PID) und Seriennummer (SN) erfassen: Ermitteln Sie die PID und SN des fehlerhaften Lüftereinschubs, die für den RMA-Prozess erforderlich sind.
Beispielausgabe für Befehle:
Command Syntax:
RP/0/RSP0/CPU0:ASR-9006# show inventory location <location of failed FAN tray>
Sample command:
RP/0/RSP0/CPU0:ASR-9006# show inventory location 0/FT0
NAME: "0/FT0", DESCR: "ASR-9006 Fan Tray V2"
PID: ASR-9006-FAN-V2 , VID: V02, SN: FOC222XXX
- Mit RMA fortfahren: Vereinbaren Sie eine RMA mit Cisco für das fehlerhafte Lüfterfach.