Este documento descreve como solucionar problemas de falha da unidade de fonte de alimentação (PSU) na plataforma Cisco NCS XR.
A Cisco recomenda que você tenha conhecimento destes tópicos:
Note: A Cisco recomenda que você tenha acesso ao Cisco IOS XR CLI e ao admin CLI.
As informações neste documento são baseadas nestas versões de software e hardware (isso inclui, mas não se limita a, estas séries):
As informações neste documento foram criadas a partir de dispositivos em um ambiente de laboratório específico. Todos os dispositivos utilizados neste documento foram iniciados com uma configuração (padrão) inicial. Se a rede estiver ativa, certifique-se de que você entenda o impacto potencial de qualquer comando.
A série de roteadores Cisco NCS XR inclui várias plataformas projetadas para diferentes casos de uso e níveis de desempenho, cada uma com arquiteturas de fonte de alimentação distintas:
Cisco NCS série 540: Este é um roteador XR de densidade pequena voltado para aplicações de largura de banda abaixo de 100G, como backhaul 5G NR, FTTx e implantações de filiais corporativas. Alguns modelos desta série utilizam fontes de alimentação fixas com redundância 1+1 AC/DC, o que significa que as unidades de fonte de alimentação estão integradas no chassi e não são substituíveis em campo. Outros modelos NCS 540 podem apresentar fontes de alimentação modulares.
Cisco NCS série 560: Este sistema modular inclui fontes de alimentação modulares com opções AC e DC, suportando esquemas de compartilhamento de carga e proteção. Essas fontes de alimentação geralmente têm manutenção em campo e podem ser trocadas e removidas em operação, permitindo a substituição sem desligar o sistema e garantindo alta disponibilidade.
Cisco NCS série 5500: Essa plataforma de roteador modular resiliente a falhas foi projetada para ambientes de data center e de rede de alto desempenho. Ele apresenta PSUs modulares substituíveis em campo que oferecem suporte à capacidade de serviço e redundância. A plataforma suporta o software Cisco IOS XR com pacotes modulares e recursos de resiliência.
Cisco NCS série 5700: Baseada na plataforma NCS 5500, essa série inclui design ASIC de encaminhamento avançado e executa o sistema operacional Cisco IOS XR7. O sistema é modular com PSUs substituíveis em campo e suporta alta disponibilidade e resiliência a falhas. As PSUs foram projetadas para redundância e troca imediata. O sistema operacional Cisco IOS XR7 fornece recursos de software avançados que monitoram o gerenciamento de sistema e falhas.
A PSU ou a bandeja de alimentação (PT) que consiste em PMs nos roteadores Cisco NCS XR é um componente de hardware crítico responsável por converter e fornecer energia elétrica estável ao sistema. As PSUs/PTs geralmente podem ser trocadas e removidas em operação e oferecem suporte à redundância e ao compartilhamento de carga. Várias PSUs podem ser instaladas para fornecer energia de reserva em caso de falha de um módulo, aumentando assim a disponibilidade do sistema e minimizando o tempo de inatividade.
Uma PSU com falha ou não detectada pode causar erros de sistema, impedir que as placas de linha sejam inicializadas corretamente e levar à instabilidade do sistema ou ao desligamento completo. Isso pode afetar seriamente a operação e a continuidade do serviço de rede do roteador. A natureza e a gravidade dos problemas variam de acordo com a plataforma devido às diferenças no design e na manutenção da PSU. Para modelos com PSUs fixas (por exemplo, alguns NCS 540 Series), uma falha normalmente exige serviço ou substituição de toda a unidade, levando a um maior tempo de inatividade. Os sistemas modulares (por exemplo, os modelos NCS 560, 5500, 5700 e alguns modelos 540) permitem a operação contínua durante falhas de uma única PSU e permitem uma manutenção mais fácil sem desligar o sistema.
Procedimento para resolver falha de PSU na plataforma NCS XR
O procedimento de solução de problemas para falhas de PSU em plataformas NCS XR geralmente descreve uma abordagem consistente, com ações físicas específicas que diferem dependendo se o modelo usa uma PSU fixa ou modular.
Faça login no roteador na CLI do Cisco IOS XR e execute esses comandos para identificar o status das PSUs. Esses comandos são comuns em todas as plataformas NCS XR executando o Cisco IOS XR.
Etapa 1.1. Verificar o status da plataforma: Execute este comando para identificar se é uma falha de PSU.
Exemplo de saída do comando:
RP/0/RP0/CPU0:NCS-540-B-LNT#show platform
Thu Dec 11 10:06:59.917 +0530
Node Type State Config state
--------------------------------------------------------------------------------
0/RP0/CPU0 N540X-16Z4G8Q2C-D(Active) IOS XR RUN NSHUT
0/PM0 N540-PSU-FIXED-D OPERATIONAL NSHUT
0/PM1 N540-PSU-FIXED-D OFFLINE NSHUT
0/FT0 N540-X-BB-FAN OPERATIONAL NSHUT
Note: Se todos os módulos de alimentação (por exemplo, `0/PM0`, `0/PM1`) estiverem no estado 'OPERACIONAL', você poderá concluir que a fonte de alimentação funciona bem. Caso contrário, se algum módulo de alimentação estiver no estado Non-Operational (Não operacional) ou no estado de falha, isso implica uma falha da PSU.
Etapa 1.2. Identificar módulos de alimentação com falha: execute este comando para verificar o status e os detalhes de cada PSU.
RP/0/RP0/CPU0:NCS-540-B-LNT#show environment power
Thu Dec 11 12:50:16.275 +0530
================================================================================
CHASSIS LEVEL POWER INFO: 0
================================================================================
Total output power capacity : 300W
Total output power required : 175W
Total power input : N/A
Total power output : 97W
================================================================================
Power Supply Status
Module Type
================================================================================
0/PM1 N540-PSU-FIXED-D OFFLINE
0/PM0 N540-PSU-FIXED-D OK
RP/0/RP0/CPU0:KOL_ISK_901_1AC_M_CNCS540R543#
Note: Um status de 'FALHA' ou 'SEM ENERGIA' para um módulo de alimentação, ou valores de entrada/saída significativamente baixos/zero em comparação com outros módulos, indica uma fonte de alimentação com falha ou com falha.
Etapa 1.3. Verificar a falha do módulo de alimentação dos alarmes: Execute este comando para verificar se há alarmes relacionados à energia nos alarmes do sistema.
RP/0/RP0/CPU0:NCS-540-B-LNT#show alarms brief
Thu Dec 11 12:50:02.667 +0530
show alarms brief system active
--------------------------------------------------------------------------------
Active Alarms for 0/RP0
--------------------------------------------------------------------------------
Location Severity Group Set Time Description
--------------------------------------------------------------------------------
0/PM1 Major Environ 10/19/2025 12:30:42 +0530 Power Module Generic Fault (PM_GENERIC_FAULT)
0/PM1 Major Environ 10/19/2025 12:30:42 +0530 Power Module Error (PM_I2C_ACCESS_ERROR)
0 Major Environ 10/19/2025 12:30:42 +0530 Power Group redundancy lost
--------------------------------------------------------------------------------
Note: Mensagens de alarme que indicam 'Perda de redundância do grupo de energia' ou 'Erro do módulo de energia' confirmam falhas no ventilador.
Os fatores ambientais podem afetar significativamente a operação da fonte de alimentação e a estabilidade geral do sistema.
1. Condições ambientes:
Verifique a temperatura ambiente e o fluxo de ar ao redor do roteador para garantir que ele esteja dentro dos limites operacionais. Temperaturas altas podem causar superaquecimento nas fontes de alimentação, reduzir sua eficiência e levar a falhas prematuras.
Verifique se há obstruções no fluxo de ar ao redor das PSUs e das aberturas do chassi. Verifique se os caminhos apropriados de ventilação e dissipação de calor estão desobstruídos.
Confirme se a fonte de alimentação (por exemplo, tomada CA, alimentação CC) está estável e dentro dos intervalos de tensão e corrente especificados para o roteador série NCS.
2. Inspeção física de obstruções/danos:
Inspecione as PSUs para verificar se há algum resíduo visível, fiação solta ou obstruções que possam impedir a conectividade.
Antes de prosseguir com a substituição de hardware, é aconselhável verificar se a falha observada no módulo de alimentação está alinhada com qualquer bug de software ou hardware conhecido.
As próximas etapas dependem do tipo de PSU em seu roteador NCS XR Series.
Os modelos com PSUs fixas normalmente não podem ser trocados e removidos em operação.
Note: A substituição de uma fonte de alimentação fixa requer um tempo de inatividade planejado, pois o roteador precisa ser desligado.
Essas plataformas apresentam PSUs modulares que podem ser trocadas em operação.
1. Recolocação (JACK-OUT e JACK-IN (JOJI)):
Execute cuidadosamente um procedimento JOJI no módulo de alimentação que está apresentando problemas. Isso envolve a remoção física do módulo de alimentação e a sua reinserção.
2. RMA de substituição: Se o problema estiver isolado no PT ou no módulo de alimentação e a recolocação não resolver o problema, é provável que indique uma falha de hardware. Nesses casos, os clientes podem apresentar um caso ao TAC da Cisco para verificação. Após a confirmação, o TAC da Cisco avaliará a situação e verificará os registros para iniciar uma RMA para o PT ou módulo de alimentação afetado. Como alternativa, se o seu contrato de nível de serviço incluir substituição direta ou automatizada de hardware, o processo de RMA poderá prosseguir automaticamente sem verificação adicional.
Exemplos de logs:
0/RP0/ADMIN0:Nov 26 06:20:32.269 UTC: shelf_mgr[3081]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/PM0, Serial#: DTMXXXXXX
0/RP0/ADMIN0:Nov 26 06:20:32.269 UTC: envmon[3021]: %PKT_INFRA-FM-3-FAULT_MAJOR : ALARM_MAJOR :Power Module Output Disabled :CLEAR :0/PM0: Power module is under HW_OUTPUT_DISABLED condition.
0/RP0/ADMIN0:Nov 26 06:20:32.269 UTC: envmon[3021]: %PKT_INFRA-FM-6-FAULT_INFO : Power Module removal :INFO :0/PM0:
0/RP0/ADMIN0:Nov 26 06:20:59.052 UTC: envmon[3021]: %PKT_INFRA-FM-6-FAULT_INFO : Power Module insertion :INFO :0/PM0:
0/RP0/ADMIN0:Nov 26 06:20:59.053 UTC: shelf_mgr[3081]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/PM0, Serial #:DTMXXXXXX
0/RP0/ADMIN0:Nov 26 06:20:59.053 UTC: envmon[3021]: %PKT_INFRA-FM-3-FAULT_MAJOR : ALARM_MAJOR :Power Module Output Disabled :DECLARE :0/PM0: Power module is under HW_OUTPUT_DISABLED condition.
0/RP0/ADMIN0:Nov 26 06:20:59.053 UTC: shelf_mgr[3081]: %INFRA-SHELF_MGR-6-HW_EVENT : Rcvd HW event HW_EVENT_FAILURE, event_reason_str 'No Input or HW Power Failure' for card 0/PM0
Exemplo de saída do comando:
Command Syntax:
RP/0/RP0/CPU0:NCS-560-B#show inventory location <location of the failed power module>
Sample command:
RP/0/RP0/CPU0:NCS-560-B#show inventory location 0/PM0
Thu Dec 25 20:41:18.031 KST
NAME: "0/PM0", DESCR: "ASR 900 1200W AC Power Supply"
PID: A900-PWR1200-A , VID: V03 , SN: DCAXXXXXX
RP/0/RP0/CPU0:NCS-560-B#
| Revisão | Data de publicação | Comentários |
|---|---|---|
1.0 |
27-Apr-2026
|
Versão inicial |