Introducción
Este documento describe cómo resolver problemas de falla del módulo FAN en ASR9k.
Prerequisites
Requirements
Cisco recomienda que tenga conocimiento sobre estos temas:
Nota: Cisco recomienda que tenga acceso a Cisco IOS® XR CLI y a la CLI de administración.
Componentes Utilizados
La información que contiene este documento se basa en las siguientes versiones de software y hardware.
- La serie ASR 9000 abarca una gama de modelos, incluidos ASR 9001, ASR 9006, ASR 9010, ASR 9901, ASR 9906, ASR 9910, ASR 9912 y ASR 9922, entre otros.
La información que contiene este documento se creó a partir de los dispositivos en un ambiente de laboratorio específico. Todos los dispositivos que se utilizan en este documento se pusieron en funcionamiento con una configuración verificada (predeterminada). Si tiene una red en vivo, asegúrese de entender el posible impacto de cualquier comando.
Antecedentes
Los routers de servicios de agregación (ASR9k) de la serie ASR 9000 de Cisco son routers de alto rendimiento diseñados para redes de proveedores de servicios, que ofrecen escalabilidad, fiabilidad y funciones avanzadas para satisfacer las demandas de los entornos de red. Los routers ASR9k proporcionan una arquitectura de hardware modular y permiten una configuración y expansión flexibles para satisfacer los diversos requisitos de red.
La familia de routers ASR9k incluye:
· Diseño modular: Los routers ASR9k cuentan con componentes modulares como procesadores de routing, tarjetas de línea y bandejas de ventilador, y permiten actualizaciones y mantenimiento sencillos sin interrupciones en las operaciones de red.
· Sistema de refrigeración: Por ejemplo, el modelo ASR 9001 utiliza una sola bandeja de ventilador frontal que contiene ventiladores redundantes para garantizar una refrigeración continua. La bandeja del ventilador admite el flujo de aire de lado a lado y, a partir de la versión 4.3.0 del software en adelante, permite la inserción y extracción en línea (OIR) con ciertas restricciones de temperatura ambiente, lo que mejora la facilidad de mantenimiento.
•Alta disponibilidad: La serie ASR9k admite ventiladores y fuentes de alimentación redundantes, contribuye a una alta disponibilidad y minimiza el tiempo de inactividad.
· Rendimiento y escalabilidad: Diseñados para gestionar agregación y routing de extremo a gran escala, los routers ASR9k admiten un alto rendimiento y protocolos de routing avanzados adecuados para redes de núcleo y extremo de proveedores de servicios.
· Características de software: Los routers ejecutan el software Cisco IOS® XR, que proporciona fiabilidad de nivel de operador, modularidad y capacidad de programación para satisfacer las cambiantes demandas de la red.
Problema
Un fallo del módulo de ventilación o de la bandeja de ventilador en un router de la serie ASR 9000 puede provocar una refrigeración inadecuada, lo que se traduce en un sobrecalentamiento de los componentes de hardware críticos. Este sobrecalentamiento puede provocar inestabilidad en el sistema, un rendimiento disminuido, apagones inesperados o daños permanentes en el hardware, lo que, en última instancia, afecta a la disponibilidad de la red y a la fiabilidad del servicio. Dada la función crítica del sistema de refrigeración para mantener el estado de los dispositivos, la detección oportuna y la mitigación de los fallos de los ventiladores son esenciales para evitar interrupciones en la red y mantener una alta disponibilidad en los entornos de los proveedores de servicios.
Procedimiento para resolver el fallo del módulo FAN en ASR9k
El procedimiento para resolver problemas de fallos del módulo de ventilación en los routers de la serie ASR 9000 generalmente describe un enfoque coherente en todos los modelos, con acciones físicas específicas que difieren en función de si el modelo utiliza un módulo de ventilación fijo o una bandeja de ventilador modular.
Paso 1. Verificación inicial de CLI
Inicie sesión en el router en la CLI de Cisco IOS® XR y ejecute estos comandos para identificar el estado de las bandejas de ventilador y los ventiladores individuales. Estos comandos son comunes en todas las plataformas ASR 9000 que ejecutan Cisco IOS® XR.
Paso 1.1 Comprobar estado de la plataforma: Ejecute este comando para identificar si se trata de una falla de FAN Tray o ,una o más fallas de FAN en una FAN Tray.
Salida del Comando de Ejemplo:
RP/0/RSP0/CPU0:ASR-9006#show platform
Wed Jul 16 12:16:00.408 IST
Node Type State Config state
--------------------------------------------------------------------------------
0/RSP0/CPU0 A9K-RSP5-SE(Active) IOS XR RUN NSHUT
0/RSP1/CPU0 A9K-RSP5-SE(Standby) IOS XR RUN NSHUT
0/FT0 ASR-9006-FAN-V2 OPERATIONAL NSHUT
0/FT1 ASR-9006-FAN-V2 OPERATIONAL NSHUT
0/0/CPU0 A9K-MOD200-SE IOS XR RUN NSHUT
0/0/0 A9K-MPA-20X1GE OK
0/1/CPU0 A9K-8X100GE-SE IOS XR RUN NSHUT
0/2/CPU0 A9K-MOD200-SE IOS XR RUN NSHUT
0/2/0 A9K-MPA-20X10GE OK
0/PT0 A9K-DC-PEM-V2 OPERATIONAL NSHUT
RP/0/RSP0/CPU0:ASR-9006#
Nota: Si todas las bandejas de ventilador están en "OPERATIVO" , puede concluir que la bandeja de ventilador funciona correctamente. De lo contrario, si alguna bandeja de ventilador no está operativa, implica que la bandeja de ventilador está en estado fallido.
Paso 1.2. Identificación de módulos de ventilador fallidos: Ejecute este comando para verificar el estado y la velocidad de los ventiladores individuales dentro de una bandeja de ventilador.
Salida del Comando de Ejemplo:
RP/0/RSP0/CPU0:ASR-9006#admin show environment fan
Wed Jul 16 12:16:09.843 IST
=============================================================================
Fan speed (rpm)
Location FRU Type FAN_0 FAN_1 FAN_2 FAN_3 FAN_4 FAN_5
-----------------------------------------------------------------------------
0/FT0 ASR-9006-FAN-V2 - 7710 7590 8970 7500 7530
0/FT1 ASR-9006-FAN-V2 7590 7560 7590 7590 7560 7560
0/PT0-PM0 PWR-2KW-DC-V2 8022 8559
0/PT0-PM1 PWR-2KW-DC-V2 6280 6237
0/PT0-PM2 PWR-2KW-DC-V2 7914 8559
0/PT0-PM3 PWR-2KW-DC-V2 7978 8516
RP/0/RSP0/CPU0:ASR-9006#
Nota: Un guion (`-`) o valores de RPM significativamente más bajos en comparación con otros ventiladores de la misma bandeja pueden indicar un ventilador defectuoso.
Paso 1.3. Verificación de la Falla del Módulo de Ventilador desde los Registros: Ejecute este comando para verificar los registros del sistema en busca de alarmas relacionadas con el ventilador.
Registros de ejemplo:
RP/0/RSP0/CPU0:ASR-9006# show logging | include FAN
0/RSP0/ADMIN0:2025 Jul 10 07:52:41.797 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
0/RSP0/ADMIN0:2025 Jul 10 07:53:42.798 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
0/RSP0/ADMIN0:2025 Jul 10 07:54:43.800 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
0/RSP0/ADMIN0:2025 Jul 10 07:55:44.799 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
Paso 2. Inspección ambiental y física
Los factores ambientales pueden afectar significativamente el funcionamiento del ventilador y la refrigeración general del sistema.
-
Condiciones ambientales:
- Verifique la temperatura ambiente y el flujo de aire alrededor del router para asegurarse de que se encuentra dentro de los límites operativos. Las altas temperaturas pueden hacer que los ventiladores trabajen más duro o fallen prematuramente.
- Compruebe la existencia de filtros de polvo o de cámaras de aire que puedan obstruirse o montarse de forma incorrecta, restringiendo el flujo de aire.
-
Inspección física de obstrucciones/daños:
- Revise el módulo/bandeja del ventilador en busca de restos visibles, cableado suelto u obstrucciones que puedan impedir que los ventiladores giren libremente. La acumulación de polvo es una causa común de los problemas de los ventiladores.
- En el caso de los modelos con bandejas de ventilador modulares (por ejemplo, ASR 9006, 9010, ASR 99xx), si es seguro hacerlo y dentro de las directrices de funcionamiento, extraiga con cuidado la bandeja de ventilador sospechosa. Inspeccione visualmente los ventiladores individuales en busca de cuchillas que no giran o de daños visibles. Mientras la bandeja está fuera, compruebe si hay acumulación de polvo en los ventiladores y dentro de la ranura del chasis.
- Para los modelos con módulos de ventilación fijos (por ejemplo, ASR 9001), la inspección física del módulo de ventilación y los conectores es limitada, pero debe realizarse para detectar cualquier signo externo de daño u obstrucción.
Paso 3. Comprobar si hay problemas y errores conocidos
Antes de proceder a la sustitución del hardware, se recomienda comprobar si la avería del ventilador observada coincide con algún fallo conocido del software o del hardware.
- Herramienta de búsqueda de errores de Cisco:busque en la herramienta de búsqueda de errores de Cisco (BST) mediante palabras clave como "fallo del ventilador ASR 9000", "ventilador ASR [número de modelo]" y la versión específica de Cisco IOS® XR que se ejecuta en el dispositivo. Busque problemas conocidos que puedan causar errores en los informes de los ventiladores o fallas reales.
- Documentación de soporte de Cisco: revise la documentación de soporte de Cisco y los foros de la comunidad para ver problemas similares notificados y soluciones o soluciones recomendadas.
Paso 4. Acciones correctivas y reemplazo
Los siguientes pasos dependen del tipo de módulo de ventilación del router de la serie ASR 9000.
Para la serie ASR 9000 con módulos de ventilación fijos (por ejemplo, ASR 9001):
Los modelos como el ASR 9001 tienen un módulo de ventilación fijo que no es intercambiable en caliente.
- Ciclo de alimentación: Si las comprobaciones iniciales y los ajustes ambientales no resuelven el problema, realice un ciclo de alimentación del router. Esto a veces puede resolver problemas transitorios y permitir que el módulo del ventilador se reinicialice correctamente.
- Sustitución (RMA):Si se confirma que el módulo del ventilador ha fallado después de un ciclo de alimentación, normalmente se requiere una autorización de devolución de mercancía (RMA) para todo el chasis.
Nota: La sustitución de un módulo de ventilación fijo requiere un tiempo de inactividad planificado, ya que el router debe estar apagado.
Para la serie ASR 9000 con bandejas de ventilador modulares (por ejemplo, modelos ASR 9006, ASR 9010, ASR 99xx)
Estos modelos cuentan con bandejas de ventilador modulares intercambiables en caliente.
-
Reinstalación (JACK-OUT y JACK-IN - JOJI):
- Realice cuidadosamente un procedimiento JACK-OUT y JACK-IN (JOJI) en la bandeja del ventilador que contiene los módulos del ventilador defectuosos. Esto implica extraer físicamente la bandeja del ventilador y volver a insertarla.
- Mientras se extrae la bandeja del ventilador, realice una inspección visual exhaustiva de cualquier residuo o cableado suelto que pueda impedir que los ventiladores giren. También puede observar si todos los ventiladores intentan girar al volver a insertarse.
- Después de volver a instalar, verifique el estado nuevamente usando "admin show environment fan".
-
Sustitución (RMA):Si el módulo o módulos del ventilador siguen en estado de fallo o la bandeja del ventilador sigue en estado No operativo después de volver a colocarla, continúe con una RMA para la bandeja del ventilador.
- Recopilar registros de pruebas:Ejecutar " mostrar registro | include FAN " de nuevo para capturar registros relacionados con la bandeja de ventilador JOJI para fines de documentación.
Registros de ejemplo:
RP/0/RSP0/CPU0:ASR-9006# show logging | include FAN
0/RSP0/ADMIN0:Jul 12 01:39:25.215 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0 hardware state going to Operational
0/RSP0/ADMIN0:Jul 12 01:42:23.584 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0
- Recopile la ID del producto (PID) y el número de serie (SN): obtenga la PID y el SN de la bandeja del ventilador defectuosa, que son necesarios para el proceso de RMA.
Salida del Comando de Ejemplo:
Command Syntax:
RP/0/RSP0/CPU0:ASR-9006# show inventory location <location of failed FAN tray>
Sample command:
RP/0/RSP0/CPU0:ASR-9006# show inventory location 0/FT0
NAME: "0/FT0", DESCR: "ASR-9006 Fan Tray V2"
PID: ASR-9006-FAN-V2 , VID: V02, SN: FOC222XXX
- Continúe con la RMA:Inicie el proceso de RMA con Cisco para la bandeja de ventilador defectuosa.