In diesem Dokument wird die Fehlerbehebung bei Netzteilausfällen auf der Cisco NCS XR-Plattform beschrieben.
Cisco empfiehlt, dass Sie über Kenntnisse in folgenden Bereichen verfügen:
Anmerkung: Cisco empfiehlt den Zugriff auf die CLI von Cisco IOS XR und die Admin-CLI.
Die Informationen in diesem Dokument basieren auf den folgenden Software- und Hardware-Versionen (diese schließen unter anderem die folgenden Serien ein, sind jedoch nicht darauf beschränkt):
Die Informationen in diesem Dokument beziehen sich auf Geräte in einer speziell eingerichteten Testumgebung. Alle Geräte, die in diesem Dokument benutzt wurden, begannen mit einer gelöschten (Nichterfüllungs) Konfiguration. Wenn Ihr Netzwerk in Betrieb ist, stellen Sie sicher, dass Sie die möglichen Auswirkungen aller Befehle kennen.
Die Cisco NCS XR-Router-Serie umfasst mehrere Plattformen, die für unterschiedliche Anwendungsfälle und Leistungsstufen entwickelt wurden und jeweils über unterschiedliche Netzteilarchitekturen verfügen:
Cisco NCS 540-Serie: Hierbei handelt es sich um einen XR-Router mit geringer Dichte, der für Bandbreitenanwendungen mit weniger als 100 Gbit/s ausgelegt ist, z. B. für 5G-NR-Backhaul, FTTx und Bereitstellungen in Zweigstellen. Einige Modelle dieser Serie verwenden feste Netzteile mit 1+1 Wechselstrom-/Gleichstrom-Redundanz, d. h. die Netzteile sind in das Gehäuse integriert und können nicht vor Ort ausgetauscht werden. Andere NCS 540-Modelle können mit modularen Netzteilen ausgestattet sein.
Cisco NCS 560-Serie: Das modulare System umfasst modulare Netzteile mit Wechsel- und Gleichspannungsoptionen, die Lastverteilung und Schutzmechanismen unterstützen. Diese Netzteile sind in der Regel vor Ort wartungsfähig und können während des Betriebs ausgetauscht werden, sodass das System nicht heruntergefahren werden muss und eine hohe Verfügbarkeit gewährleistet ist.
Cisco NCS 5500-Serie: Diese modulare Router-Plattform mit hoher Ausfallsicherheit wurde für Rechenzentren und Hochleistungs-Netzwerkumgebungen entwickelt. Es verfügt über modulare, vor Ort austauschbare Netzteile, die Betriebsfähigkeit und Redundanz unterstützen. Die Plattform unterstützt die Cisco IOS XR-Software mit modularen Paketen und Ausfallsicherheitsfunktionen.
Cisco NCS 5700-Serie: Aufbauend auf der NCS 5500-Plattform umfasst diese Serie ein erweitertes ASIC-Weiterleitungsdesign und führt das Cisco IOS XR7-Betriebssystem aus. Das System ist modular mit vor Ort austauschbaren Netzteilen aufgebaut und unterstützt hohe Verfügbarkeit und Ausfallsicherheit. Die Netzteile sind auf Redundanz und Hot-Swap ausgelegt. Das Cisco IOS XR7 Betriebssystem bietet erweiterte Softwarefunktionen zur Überwachung des System- und Fehlermanagements.
Das Netzteil oder Power Tray (PT), das bzw. die aus PMs in Cisco NCS XR-Routern besteht, ist eine wichtige Hardwarekomponente für die Umwandlung und Bereitstellung einer stabilen Stromversorgung für das System. PSUs/PTs sind häufig Hot-Swap-fähig und unterstützen Redundanz und Lastverteilung. Es können mehrere Netzteile installiert werden, um bei Ausfall eines Moduls eine Notstromversorgung bereitzustellen. Dies erhöht die Systemverfügbarkeit und minimiert Ausfallzeiten.
Ein ausgefallenes oder unerkanntes Netzteil kann zu Systemfehlern führen, das ordnungsgemäße Booten von Line Cards verhindern und zu einer Instabilität des Systems oder zum vollständigen Herunterfahren des Systems führen. Dies kann den Betrieb und die Kontinuität der Netzwerkservices des Routers erheblich beeinträchtigen. Art und Schweregrad der Probleme variieren je nach Plattform aufgrund von Unterschieden beim Design und der Benutzerfreundlichkeit der Netzteile. Bei Modellen mit festen Netzteilen (z. B. einigen NCS 540-Serien) erfordert ein Ausfall in der Regel den Service oder den Austausch der gesamten Einheit, was zu längeren Ausfallzeiten führt. Modulare Systeme (z. B. NCS 560, 5500, 5700 und einige 540-Modelle) ermöglichen einen unterbrechungsfreien Betrieb bei Ausfall eines Netzteils und eine einfachere Wartung ohne Systemabschaltung.
Verfahren zur Behebung von Stromversorgungsausfällen auf der NCS XR-Plattform
Das Fehlerbehebungsverfahren für Netzteilausfälle auf NCS XR-Plattformen bietet im Allgemeinen einen konsistenten Ansatz, wobei spezifische physische Aktionen unterschiedlich ausfallen, je nachdem, ob das Modell ein festes Netzteil oder ein modulares Netzteil verwendet.
Melden Sie sich in der Cisco IOS XR CLI beim Router an, und führen Sie diese Befehle aus, um den Status der Netzteile zu identifizieren. Diese Befehle gelten für alle NCS XR-Plattformen mit Cisco IOS XR.
Schritt 1.1. Überprüfen Sie den Plattformstatus: Führen Sie diesen Befehl aus, um festzustellen, ob es sich um einen Netzteilfehler handelt.
Beispielausgabe für Befehle:
RP/0/RP0/CPU0:NCS-540-B-LNT#show platform
Thu Dec 11 10:06:59.917 +0530
Node Type State Config state
--------------------------------------------------------------------------------
0/RP0/CPU0 N540X-16Z4G8Q2C-D(Active) IOS XR RUN NSHUT
0/PM0 N540-PSU-FIXED-D OPERATIONAL NSHUT
0/PM1 N540-PSU-FIXED-D OFFLINE NSHUT
0/FT0 N540-X-BB-FAN OPERATIONAL NSHUT
Anmerkung: Wenn alle Netzteilmodule (z. B. '0/PM0', '0/PM1') den Status 'BETRIEB' aufweisen, können Sie abschließen, dass das Netzteil einwandfrei funktioniert. Andernfalls liegt, wenn ein Netzteilmodul nicht betriebsbereit ist oder ausgefallen ist, ein Ausfall des Netzteils vor.
Schritt 1.2: Identifizieren defekter Netzteilmodule: Führen Sie diesen Befehl aus, um den Status und die Details einzelner Netzteile zu überprüfen.
RP/0/RP0/CPU0:NCS-540-B-LNT#show environment power
Thu Dec 11 12:50:16.275 +0530
================================================================================
CHASSIS LEVEL POWER INFO: 0
================================================================================
Total output power capacity : 300W
Total output power required : 175W
Total power input : N/A
Total power output : 97W
================================================================================
Power Supply Status
Module Type
================================================================================
0/PM1 N540-PSU-FIXED-D OFFLINE
0/PM0 N540-PSU-FIXED-D OK
RP/0/RP0/CPU0:KOL_ISK_901_1AC_M_CNCS540R543#
Anmerkung: Der Status "FAILED" (Ausgefallen) oder "NO POWER" (Kein Strom) für ein Netzteilmodul oder ein im Vergleich zu anderen Modulen sehr niedriger Eingangs-/Ausgangswert bzw. ein niedriger Wert weisen auf ein ausgefallenes oder ausgefallenes Netzteil hin.
Schritt 1.3. Überprüfung des Strommodulausfalls anhand von Alarmen: Führen Sie diesen Befehl aus, um Systemalarme auf strombedingte Alarme zu überprüfen.
RP/0/RP0/CPU0:NCS-540-B-LNT#show alarms brief
Thu Dec 11 12:50:02.667 +0530
show alarms brief system active
--------------------------------------------------------------------------------
Active Alarms for 0/RP0
--------------------------------------------------------------------------------
Location Severity Group Set Time Description
--------------------------------------------------------------------------------
0/PM1 Major Environ 10/19/2025 12:30:42 +0530 Power Module Generic Fault (PM_GENERIC_FAULT)
0/PM1 Major Environ 10/19/2025 12:30:42 +0530 Power Module Error (PM_I2C_ACCESS_ERROR)
0 Major Environ 10/19/2025 12:30:42 +0530 Power Group redundancy lost
--------------------------------------------------------------------------------
Anmerkung: Alarmmeldungen mit der Angabe "Redundanz der Stromgruppe unterbrochen" oder "Strommodulfehler" bestätigen Lüfterausfälle.
Umgebungsfaktoren können sich erheblich auf den Betrieb des Netzteils und die Stabilität des Gesamtsystems auswirken.
1. Umgebungsbedingungen:
Überprüfen Sie die Umgebungstemperatur und den Luftstrom um den Router, um sicherzustellen, dass er innerhalb der Betriebsgrenzen liegt. Hohe Temperaturen können dazu führen, dass Netzteile überhitzen, ihre Effizienz sinkt und vorzeitigen Ausfall verursachen.
Prüfen Sie, ob die Lüftung der Netzteile und der Gehäuselüfter behindert wird. Sorgen Sie dafür, dass die richtigen Lüftungs- und Wärmeableitwege frei sind.
Vergewissern Sie sich, dass die Stromquelle (z. B. Wechselstromsteckdose, Gleichstromzufuhr) stabil ist und innerhalb der für den Router der NCS-Serie festgelegten Spannungs- und Strombereiche liegt.
2. Physische Untersuchung auf Fremdkörper/Beschädigungen:
Untersuchen Sie die Netzteile auf sichtbare Verschmutzungen, lose Kabel oder Hindernisse, die die Konnektivität beeinträchtigen können.
Bevor Sie mit dem Hardware-Ersatz fortfahren, ist es ratsam, zu überprüfen, ob der beobachtete Ausfall des Netzteilmoduls auf bekannte Software- oder Hardware-Fehler zurückzuführen ist.
Die nächsten Schritte hängen vom Netzteiltyp in Ihrem NCS-Router der XR-Serie ab.
Modelle mit festen Netzteilen sind in der Regel nicht Hot-Swap-fähig.
Anmerkung: Der Austausch eines fest installierten Netzteils erfordert geplante Ausfallzeiten, da der Router ausgeschaltet werden muss.
Diese Plattformen verfügen über Hot-Swap-fähige modulare Netzteile.
1. Wiedereinsetzen (JACK-OUT und JACK-IN (JOJI)):
Führen Sie ein JOJI-Verfahren am Netzteilmodul sorgfältig durch, bei dem Probleme auftreten. Dazu muss das Netzteilmodul physisch entfernt und dann wieder eingesetzt werden.
2. Ersatz-RMA: Wenn das Problem auf den PT oder das Netzteilmodul beschränkt ist und das Problem durch Wiedereinsetzen nicht behoben werden kann, weist es wahrscheinlich auf einen Hardwarefehler hin. In solchen Fällen kann der Kunde ein Ticket beim Cisco TAC zur Verifizierung erstellen. Nach der Bestätigung bewertet das Cisco TAC die Situation und überprüft die Protokolle, um eine RMA für die betroffene PT oder das betroffene Netzteilmodul zu initiieren. Wenn Ihr Service Level Agreement einen direkten oder automatisierten Hardware-Ersatz vorsieht, kann der RMA-Prozess automatisch und ohne zusätzliche Verifizierung fortgesetzt werden.
Beispielprotokolle:
0/RP0/ADMIN0:Nov 26 06:20:32.269 UTC: shelf_mgr[3081]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/PM0, Serial#: DTMXXXXXX
0/RP0/ADMIN0:Nov 26 06:20:32.269 UTC: envmon[3021]: %PKT_INFRA-FM-3-FAULT_MAJOR : ALARM_MAJOR :Power Module Output Disabled :CLEAR :0/PM0: Power module is under HW_OUTPUT_DISABLED condition.
0/RP0/ADMIN0:Nov 26 06:20:32.269 UTC: envmon[3021]: %PKT_INFRA-FM-6-FAULT_INFO : Power Module removal :INFO :0/PM0:
0/RP0/ADMIN0:Nov 26 06:20:59.052 UTC: envmon[3021]: %PKT_INFRA-FM-6-FAULT_INFO : Power Module insertion :INFO :0/PM0:
0/RP0/ADMIN0:Nov 26 06:20:59.053 UTC: shelf_mgr[3081]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/PM0, Serial #:DTMXXXXXX
0/RP0/ADMIN0:Nov 26 06:20:59.053 UTC: envmon[3021]: %PKT_INFRA-FM-3-FAULT_MAJOR : ALARM_MAJOR :Power Module Output Disabled :DECLARE :0/PM0: Power module is under HW_OUTPUT_DISABLED condition.
0/RP0/ADMIN0:Nov 26 06:20:59.053 UTC: shelf_mgr[3081]: %INFRA-SHELF_MGR-6-HW_EVENT : Rcvd HW event HW_EVENT_FAILURE, event_reason_str 'No Input or HW Power Failure' for card 0/PM0
Beispielausgabe für Befehle:
Command Syntax:
RP/0/RP0/CPU0:NCS-560-B#show inventory location <location of the failed power module>
Sample command:
RP/0/RP0/CPU0:NCS-560-B#show inventory location 0/PM0
Thu Dec 25 20:41:18.031 KST
NAME: "0/PM0", DESCR: "ASR 900 1200W AC Power Supply"
PID: A900-PWR1200-A , VID: V03 , SN: DCAXXXXXX
RP/0/RP0/CPU0:NCS-560-B#
| Überarbeitung | Veröffentlichungsdatum | Kommentare |
|---|---|---|
1.0 |
27-Apr-2026
|
Erstveröffentlichung |