このドキュメントでは、Cisco NCS XRプラットフォームの電源ユニット(PSU)の障害をトラブルシューティングする方法について説明します。
次の項目に関する知識があることが推奨されます。
注:Cisco IOS XR CLIおよびadmin CLIへのアクセス権が必要であることを推奨します。
このドキュメントの情報は、次のソフトウェアとハードウェアのバージョンに基づいています(これらのシリーズに限定されません)。
このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されたものです。このドキュメントで使用するすべてのデバイスは、クリアな(デフォルト)設定で作業を開始しています。対象のネットワークが実稼働中である場合には、どのような作業についても、その潜在的な影響について確実に理解しておく必要があります。
Cisco NCS XRルータシリーズには、さまざまなユースケースとパフォーマンスレベル向けに設計された複数のプラットフォームが含まれており、各プラットフォームには個別の電源アーキテクチャがあります。
Cisco NCS 540シリーズ:これは、5G NRバックホール、FTTx、およびエンタープライズブランチ展開などの100G未満の帯域幅のアプリケーションを対象とした低密度のXRルータです。このシリーズの一部のモデルは、1+1のAC/DC冗長性を備えた固定電源を使用します。つまり、電源ユニットはシャーシに統合されており、現場交換はできません。その他のNCS 540モデルには、モジュール型の電源を搭載できます。
Cisco NCS 560シリーズ:このモジュラシステムには、ACおよびDCオプション付きのモジュラ電源が含まれ、ロードシェアリングと保護スキームをサポートします。これらの電源装置は、通常は現場でのメンテナンスとホットスワップが可能なため、システムをシャットダウンすることなく交換でき、高可用性を確保できます。
Cisco NCS 5500シリーズ:この耐障害性に優れたモジュラルータプラットフォームは、データセンターおよび高性能ネットワーキング環境向けに設計されています。保守性と冗長性をサポートするモジュラ型の現場交換可能なPSUを備えています。このプラットフォームは、モジュラパッケージと復元機能を備えたCisco IOS XRソフトウェアをサポートします。
Cisco NCS 5700シリーズ:NCS 5500プラットフォームを基盤とし、拡張フォワーディングASIC設計を採用し、Cisco IOS XR7 OSを実行します。このシステムはモジュラ式で現場交換可能なPSUを備え、高可用性と耐障害性をサポートしています。PSUは、冗長性とホットスワップに対応した設計になっています。Cisco IOS XR7 OSは、システムおよび障害管理を監視する高度なソフトウェア機能を提供します。
Cisco NCS XRルータのPMで構成されるPSUまたは電源トレイ(PT)は、システムへの安定した電力の変換と供給を行う重要なハードウェアコンポーネントです。PSU/PTは通常、ホットスワップ可能で、冗長性とロードシェアリングをサポートします。複数のPSUを取り付けて、1つのモジュールに障害が発生した場合にバックアップ電源を供給できるため、システムの可用性が向上し、ダウンタイムを最小限に抑えることができます。
PSUの障害または未検出は、システムエラーを引き起こし、ラインカードが正常に起動せず、システムが不安定になったり、完全にシャットダウンしたりする原因となります。これは、ルータの動作とネットワークサービスの継続性に重大な影響を与える可能性があります。問題の性質と重大度は、PSUの設計とサービサビリティの違いにより、プラットフォームによって異なります。PSUが固定されているモデル(一部のNCS 540シリーズなど)では、障害が発生すると、通常はユニット全体の修理または交換が必要となり、ダウンタイムが長くなります。モジュラシステム(NCS 560、5500、5700、一部の540モデルなど)により、1台のPSUの障害時にも運用を継続でき、システムをシャットダウンせずにメンテナンスを容易に行えます。
NCS XRプラットフォームのPSU障害を解決する手順
NCS XRプラットフォームにおけるPSU障害のトラブルシューティング手順は、一般に一貫したアプローチの概要を示しており、モデルが固定PSUを使用しているか、モジュラPSUを使用しているかによって、特定の物理的なアクションが異なります。
Cisco IOS XR CLIでルータにログインし、次のコマンドを実行してPSUのステータスを特定します。これらのコマンドは、Cisco IOS XRを実行するすべてのNCS XRプラットフォームで共通です。
ステップ 1.1:プラットフォームの状態のチェック:このコマンドを実行して、PSUの障害かどうかを確認します。
コマンド出力例:
RP/0/RP0/CPU0:NCS-540-B-LNT#show platform
Thu Dec 11 10:06:59.917 +0530
Node Type State Config state
--------------------------------------------------------------------------------
0/RP0/CPU0 N540X-16Z4G8Q2C-D(Active) IOS XR RUN NSHUT
0/PM0 N540-PSU-FIXED-D OPERATIONAL NSHUT
0/PM1 N540-PSU-FIXED-D OFFLINE NSHUT
0/FT0 N540-X-BB-FAN OPERATIONAL NSHUT
注:すべての電源モジュール(「0/PM0」、「0/PM1」など)が「OPERATIONAL」状態の場合は、電源モジュールが正常に動作していると判断できます。あるいは、いずれかの電源モジュールが非稼働状態または障害状態の場合は、PSUの障害を示します。
ステップ 1.2:障害が発生した電源モジュールを特定する:このコマンドを実行して、個々のPSUのステータスと詳細を確認します。
RP/0/RP0/CPU0:NCS-540-B-LNT#show environment power
Thu Dec 11 12:50:16.275 +0530
================================================================================
CHASSIS LEVEL POWER INFO: 0
================================================================================
Total output power capacity : 300W
Total output power required : 175W
Total power input : N/A
Total power output : 97W
================================================================================
Power Supply Status
Module Type
================================================================================
0/PM1 N540-PSU-FIXED-D OFFLINE
0/PM0 N540-PSU-FIXED-D OK
RP/0/RP0/CPU0:KOL_ISK_901_1AC_M_CNCS540R543#
注:電源モジュールのステータスが「FAILED」または「NO POWER」であるか、または他のモジュールと比較して入出力の値が著しく低い、またはゼロの場合は、電源モジュールの障害または障害が発生しています。
ステップ 1.3: アラームからの電源モジュール障害の確認:このコマンドを実行して、電源関連のアラームがないかシステムアラームをチェックします。
RP/0/RP0/CPU0:NCS-540-B-LNT#show alarms brief
Thu Dec 11 12:50:02.667 +0530
show alarms brief system active
--------------------------------------------------------------------------------
Active Alarms for 0/RP0
--------------------------------------------------------------------------------
Location Severity Group Set Time Description
--------------------------------------------------------------------------------
0/PM1 Major Environ 10/19/2025 12:30:42 +0530 Power Module Generic Fault (PM_GENERIC_FAULT)
0/PM1 Major Environ 10/19/2025 12:30:42 +0530 Power Module Error (PM_I2C_ACCESS_ERROR)
0 Major Environ 10/19/2025 12:30:42 +0530 Power Group redundancy lost
--------------------------------------------------------------------------------
注:「Power Group Redundancy Lost」または「Power Module Error」を示すアラームメッセージにより、ファンの障害が確認されます。
環境要因は、電源の動作とシステム全体の安定性に大きく影響する可能性があります。
1. 周囲条件:
ルータの周囲の温度とエアーフローを確認し、動作制限内にあることを確認します。高温になると、電源が過熱し、効率が低下し、早期故障につながる可能性があります。
PSUとシャーシの通気口の周囲に空気の流れが妨げられていないか確認します。適切な通気および熱放散経路が明確であることを確認する。
電源(ACコンセント、DC給電など)が安定しており、NCSシリーズルータに指定された電圧と電流の範囲内にあることを確認します。
2. 障害物・破損の目視検査
PSUに、目に見える汚れ、配線の緩み、または接続を妨げる可能性のある障害物がないかどうかを確認します。
ハードウェアの交換に進む前に、確認された電源モジュールの障害が、ソフトウェアまたはハードウェアの既知の不具合と一致するかどうかを確認することを推奨します。
次の手順は、NCS XRシリーズルータのPSUのタイプによって異なります。
固定PSUのモデルは、通常はホットスワップ可能ではありません。
注:固定PSを交換するには、ルータの電源をオフにする必要があるため、計画的なダウンタイムが必要です。
これらのプラットフォームには、ホットスワップ可能なモジュラPSUが搭載されています。
1. 再装着(JACK-OUT、JACK-IN(JOJI)):
問題が発生している電源モジュールでJOJI手順を慎重に実行します。これには、電源モジュールを物理的に取り外してから再度挿入する作業が含まれます。
2. 交換RMA:問題がPTまたは電源モジュールに切り分けられており、取り付け直しても問題が解決しない場合、ハードウェアの障害である可能性が高いです。このような場合、お客様はCisco TACにケースを提出して検証を依頼できます。確認後、Cisco TACは状況を評価し、該当するPTまたは電源モジュールのRMAを開始するためにログを検証します。また、サービスレベル契約にハードウェアの直接交換または自動交換が含まれている場合は、追加の検証を行わずにRMAプロセスを自動的に進めることができます。
ログの例を次に示します。
0/RP0/ADMIN0:Nov 26 06:20:32.269 UTC: shelf_mgr[3081]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/PM0, Serial#: DTMXXXXXX
0/RP0/ADMIN0:Nov 26 06:20:32.269 UTC: envmon[3021]: %PKT_INFRA-FM-3-FAULT_MAJOR : ALARM_MAJOR :Power Module Output Disabled :CLEAR :0/PM0: Power module is under HW_OUTPUT_DISABLED condition.
0/RP0/ADMIN0:Nov 26 06:20:32.269 UTC: envmon[3021]: %PKT_INFRA-FM-6-FAULT_INFO : Power Module removal :INFO :0/PM0:
0/RP0/ADMIN0:Nov 26 06:20:59.052 UTC: envmon[3021]: %PKT_INFRA-FM-6-FAULT_INFO : Power Module insertion :INFO :0/PM0:
0/RP0/ADMIN0:Nov 26 06:20:59.053 UTC: shelf_mgr[3081]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/PM0, Serial #:DTMXXXXXX
0/RP0/ADMIN0:Nov 26 06:20:59.053 UTC: envmon[3021]: %PKT_INFRA-FM-3-FAULT_MAJOR : ALARM_MAJOR :Power Module Output Disabled :DECLARE :0/PM0: Power module is under HW_OUTPUT_DISABLED condition.
0/RP0/ADMIN0:Nov 26 06:20:59.053 UTC: shelf_mgr[3081]: %INFRA-SHELF_MGR-6-HW_EVENT : Rcvd HW event HW_EVENT_FAILURE, event_reason_str 'No Input or HW Power Failure' for card 0/PM0
コマンド出力例:
Command Syntax:
RP/0/RP0/CPU0:NCS-560-B#show inventory location <location of the failed power module>
Sample command:
RP/0/RP0/CPU0:NCS-560-B#show inventory location 0/PM0
Thu Dec 25 20:41:18.031 KST
NAME: "0/PM0", DESCR: "ASR 900 1200W AC Power Supply"
PID: A900-PWR1200-A , VID: V03 , SN: DCAXXXXXX
RP/0/RP0/CPU0:NCS-560-B#
| 改定 | 発行日 | コメント |
|---|---|---|
1.0 |
27-Apr-2026
|
初版 |