Introducción
Este documento describe cómo resolver problemas de falla del módulo FAN en la plataforma NCS XR.
Prerequisites
Requirements
Cisco recomienda que tenga conocimiento sobre estos temas:
Nota: Cisco recomienda que tenga acceso a Cisco IOS® XR CLI y a la CLI de administración.
Nota: Cisco recomienda que tenga acceso a Cisco IOS® XR CLI y a la CLI de administración.
Componentes Utilizados
La información que contiene este documento se basa en las siguientes versiones de software y hardware.
Esto incluye, pero no se limita a, estas series:
- Serie NCS 540
- Serie NCS 560
- Serie NCS 5500
- Serie NCS 5700
La información que contiene este documento se creó a partir de los dispositivos en un ambiente de laboratorio específico. Todos los dispositivos que se utilizan en este documento se pusieron en funcionamiento con una configuración verificada (predeterminada). Si tiene una red en vivo, asegúrese de entender el posible impacto de cualquier comando.
Antecedentes
La serie de routers Cisco NCS XR incluye varias plataformas diseñadas para diferentes escenarios de uso y niveles de rendimiento, cada una con distintos tipos de módulos de ventilación y arquitecturas de sistema:
· Cisco NCS serie 540: Se trata de un router XR de pequeña densidad destinado a aplicaciones de ancho de banda inferior a 100 G, como la red de retorno NR 5G, FTTx e implementaciones de sucursales empresariales. Utiliza módulos de ventilación con un diseño de redundancia de ventilador 3+1 y refrigeración por aire forzada de lado a lado. Las fuentes de alimentación se fijan con redundancia CA/CC 1+1 y el sistema es reforzado con un revestimiento conforme y admite la compatibilidad con la sincronización de clase C.
· Cisco NCS serie 560: Este sistema modular incluye tres bandejas de ventilador modulares de alta velocidad que deben rellenarse para su funcionamiento. Estas bandejas de ventilador contienen ventiladores redundantes y se pueden reparar in situ, lo que permite la sustitución sin el apagado del sistema. El sistema admite el funcionamiento con fallos de un solo ventilador y aplica límites de tiempo para la reinserción de bandejas de ventilador en función de la temperatura ambiente. También incorpora un filtro de polvo para optimizar el flujo de aire. Las fuentes de alimentación son modulares con opciones de CA y CC, y admiten esquemas de protección y uso compartido de la carga.
· Cisco NCS serie 5500: Esta plataforma de router modular de alta resistencia a fallos está diseñada para entornos de Data Center y de red de alto rendimiento. Incorpora módulos de ventilación modulares que se pueden sustituir in situ y que admiten facilidad de mantenimiento y redundancia. La resolución de problemas implica comprobaciones de los registros del sistema, el estado del hardware y la gestión de paquetes de software para mantener la estabilidad del sistema. La plataforma admite el software Cisco IOS® XR con paquetes modulares y funciones de resistencia.
· Cisco NCS serie 5700: Esta serie, basada en la plataforma NCS 5500, incluye un diseño ASIC de reenvío mejorado y ejecuta el sistema operativo Cisco IOS® XR7. Tiene variantes como NCS-57B1-6D24 y NCS-57B1-5DSE. El sistema es modular con bandejas de ventilador y fuentes de alimentación reemplazables in situ, y admite una alta disponibilidad y resistencia a fallos. Las bandejas de ventiladores están diseñadas para redundancia e intercambio en caliente.El SO Cisco IOS® XR7 ofrece funciones de software avanzadas que supervisan la administración de fallos y del sistema.
Problema
Los fallos de los ventiladores de los routers Cisco NCS XR afectan a la refrigeración y la fiabilidad del sistema. La naturaleza y la gravedad de los problemas varían según la plataforma debido a las diferencias en el diseño y la facilidad de mantenimiento del módulo de ventilación. Existen varios modelos de la serie NCS 540 que utilizan módulos de ventilación fijos no reemplazables sobre el terreno con un diseño de redundancia 3+1. En este caso, la avería del ventilador requiere normalmente el servicio o la sustitución de toda la unidad. Esto puede provocar tiempos de inactividad más largos y problemas más complejos.
Las series NCS 560, 5500 y 5700 y algunos modelos de la serie NCS 540 emplean bandejas de ventilador modulares que se pueden sustituir in situ y que están diseñadas para redundancia e intercambio en caliente. Esto permite un funcionamiento continuo durante los fallos de un solo ventilador y permite un mantenimiento más sencillo sin el apagado del sistema.
Los fallos del ventilador en estos sistemas modulares pueden activar alertas del sistema, requerir la supervisión de las restricciones de temperatura ambiente y requerir la reinserción oportuna de la bandeja del ventilador para mantener un flujo de aire óptimo y la estabilidad del sistema. En general, los fallos del ventilador en los routers NCS XR plantean riesgos de sobrecalentamiento, disminución del rendimiento y posibles daños al hardware. Para ello, es necesario detectar y diagnosticar rápidamente los problemas y tomar las medidas correctivas adecuadas, adaptadas a la serie de routers y la arquitectura de ventiladores específicos.
Procedimiento para resolver el fallo del módulo FAN en la plataforma NCS XR
El procedimiento de solución de problemas para fallos del módulo de ventilación en las plataformas NCS XR generalmente describe un enfoque coherente, con acciones físicas específicas que difieren en función de si el modelo utiliza un módulo de ventilación fijo o una bandeja de ventilador modular.
Paso 1. Verificación inicial de CLI
Inicie sesión en el router en la CLI de Cisco IOS® XR y ejecute estos comandos para identificar el estado de las bandejas de ventilador y los ventiladores individuales. Estos comandos son comunes en todas las plataformas NCS XR que ejecutan Cisco IOS® XR.
Paso 1.1Comprobación del estado de la plataforma: Ejecute este comando para identificar si se trata de una falla de FAN Tray o ,una o más fallas de FAN en una FAN Tray.
Salida del Comando de Ejemplo:
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#show platform
Thu Jul 24 12:33:45.143
Node Type State Config state
--------------------------------------------------------------------------------
0/RP0/CPU0 N540X-12Z16G-SYS-D(Active) IOS XR RUN NSHUT
0/PM0 N540-PSU-FIXED-D OPERATIONAL NSHUT
0/PM1 N540-PSU-FIXED-D OPERATIONAL NSHUT
0/FT0 N540-FAN OPERATIONAL NSHUT
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#
Nota: Si todas las bandejas de ventilador están en "OPERATIVO" , puede concluir que la bandeja de ventilador funciona correctamente. De lo contrario, si alguna bandeja de ventilador no está operativa, implica que la bandeja de ventilador está en estado fallido.
Paso 1.2.Identificar módulos de ventilación fallidos: Ejecute este comando para verificar el estado y la velocidad de los ventiladores individuales dentro de una bandeja de ventilador.
Salida del Comando de Ejemplo:
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#show environment fan
Thu Jul 24 12:33:09.673
=========================================================================================
Fan speed (rpm)
Location FRU Type FAN_0 FAN_1 FAN_2 FAN_3
-----------------------------------------------------------------------------------------
0/FT0 N540-FAN 25680 0 25440 26130
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#
Nota: Un valor de `0` o valores de RPM significativamente más bajos en comparación con otros ventiladores de la misma bandeja pueden indicar un ventilador defectuoso.
Paso 1.3.Verificación de la Falla del Módulo de Ventilador desde las Alarmas: Ejecute este comando para verificar las alarmas del sistema en busca de alarmas relacionadas con el ventilador.
Registros de ejemplo:
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#show alarms brief system active
Thu Jul 24 12:33:23.874
------------------------------------------------------------------------------------
Active Alarms
------------------------------------------------------------------------------------
Location Severity Group Set Time Description
------------------------------------------------------------------------------------
0/FT0 Minor Environ 07/24/2025 10:35:44 WIB Fan 1: Out of tolerance
0/FT0 Minor Environ 07/24/2025 10:35:44 WIB Sensor in failed state
0 Minor Environ 07/24/2025 10:35:44 WIB Sensor in failed state
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#
Nota: Mensajes de alarma que indican "Fan X: "Fuera de tolerancia" o "Sensor en estado fallido" confirman las fallas del ventilador.
Nota: Mensajes de alarma que indican "Fan X: "Fuera de tolerancia" o "Sensor en estado fallido" confirman las fallas del ventilador.
Paso 2. Inspección ambiental y física
Los factores ambientales pueden afectar significativamente el funcionamiento del ventilador y la refrigeración general del sistema.
-
Condiciones ambientales:
- Verifique la temperatura ambiente y el flujo de aire alrededor del router para asegurarse de que se encuentra dentro de los límites operativos. Las altas temperaturas pueden hacer que los ventiladores trabajen más duro o fallen prematuramente.
- Compruebe la existencia de filtros de polvo o de cámaras de aire que puedan obstruirse o montarse de forma incorrecta, restringiendo el flujo de aire.
-
Inspección física de obstrucciones/daños:
- Revise el módulo/bandeja del ventilador en busca de restos visibles, cableado suelto u obstrucciones que puedan impedir que los ventiladores giren libremente. La acumulación de polvo es una causa común de los problemas de los ventiladores.
- En el caso de plataformas con bandejas de ventilador modulares (por ejemplo, NCS 560, NCS 5500, NCS 5700 y algunos modelos de NCS 540), si es seguro hacerlo y dentro de las directrices operativas, considere la posibilidad de retirar cuidadosamente la bandeja de ventilador sospechosa. Inspeccione visualmente los ventiladores individuales en busca de cuchillas que no giran o de daños visibles. Mientras la bandeja está fuera, compruebe si hay acumulación de polvo en los ventiladores y dentro de la ranura del chasis.
- Para plataformas con módulos de ventilación fijos (por ejemplo, algunos modelos de NCS 540), la inspección física del módulo de ventilación y los conectores es limitada, pero debe realizarse para detectar cualquier signo externo de daño u obstrucción.
Paso 3. Comprobar si hay problemas y errores conocidos
Antes de proceder a la sustitución del hardware, se recomienda comprobar si la avería del ventilador observada coincide con algún fallo conocido del software o del hardware.
- Herramienta de búsqueda de errores de Cisco:busque en la herramienta Cisco Bug Search Tool (BST) mediante palabras clave como "NCS XR fan failure", "NCS [número de modelo] fan" y la versión específica de Cisco IOS® XR que se ejecuta en su dispositivo. Busque problemas conocidos que puedan causar errores en los informes de los ventiladores o fallas reales.
- Documentación de soporte de Cisco: revise la documentación de soporte de Cisco y los foros de la comunidad para ver problemas similares notificados y soluciones o soluciones recomendadas.
Paso 4. Acciones correctivas y reemplazo
Los siguientes pasos dependen del tipo de módulo de ventilación de la plataforma NCS XR.
Para plataformas NCS XR con módulos de ventilación fijos (por ejemplo, algunos modelos NCS 540)
Los modelos con módulos de ventilación fijos no suelen ser intercambiables en caliente.
- Ciclo de alimentación: Si las comprobaciones iniciales y los ajustes ambientales no resuelven el problema, realice un ciclo de alimentación del router. Esto a veces puede resolver problemas transitorios y permitir que el módulo del ventilador se reinicialice correctamente.
- Sustitución (RMA):Si se confirma que el módulo del ventilador ha fallado después de un ciclo de alimentación, normalmente se requiere una autorización de devolución de mercancía (RMA) para toda la unidad o el chasis.
Nota: La sustitución de un módulo de ventilación fijo requiere un tiempo de inactividad planificado, ya que el router debe estar apagado.
Para plataformas NCS XR con bandejas de ventilador modulares (por ejemplo, la mayoría de los modelos NCS 540, NCS 560, NCS 5500 y NCS 5700)
Estas plataformas cuentan con bandejas de ventilador modulares intercambiables en caliente.
-
Reinstalación (JACK-OUT y JACK-IN - JOJI):
- Realice cuidadosamente un procedimiento JACK-OUT y JACK-IN (JOJI) en la bandeja del ventilador que contiene los módulos del ventilador defectuosos. Esto implica extraer físicamente la bandeja del ventilador y volver a insertarla.
- Mientras se extrae la bandeja del ventilador, realice una inspección visual exhaustiva de cualquier residuo o cableado suelto que pueda impedir que los ventiladores giren. También puede observar si todos los ventiladores intentan girar al volver a insertarse.
- Después de volver a instalar, verifique el estado nuevamente usando "show environment fan".
-
Sustitución (RMA):Si alguno de los módulos del ventilador sigue fallando o la bandeja del ventilador sigue en estado No operativo después de volver a colocarla, continúe con una RMA para la bandeja del ventilador.
- Recopilar registros de pruebas:ejecutar "show logging" | incluir FAN"de nuevo para capturar los registros relacionados con la bandeja de ventilador JOJI para fines de documentación.
Registros de ejemplo:
RP/0/RP0/CPU0:N540-24Z8Q2C-SYS# show logging | include FAN
0/RSP0/ADMIN0:Jul 12 01:39:25.215 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#: N/A
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #: N/A
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0 hardware state going to Operational
0/RSP0/ADMIN0:Jul 12 01:42:23.584 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#: N/A
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #:N/A
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0
- Recopile la ID del producto (PID) y el número de serie (SN): Obtenga la PID y el SN de la bandeja del ventilador defectuosa, necesarios para el proceso de RMA.
Salida del Comando de Ejemplo:
Command Syntax:
RP/0/RP0/CPU0:N540-24Z8Q2C-SYS# show inventory location <location of failed FAN tray>
Sample command:
RP/0/RP0/CPU0:N540-24Z8Q2C-SYS# show inventory location 0/FT0
NAME: "0/FT0", DESCR: "NCS 540 Fan"
PID: N540-FAN , VID: N/A, SN: N/A
- Continúe con la RMA:Inicie el proceso de RMA con Cisco para la bandeja de ventilador defectuosa.