Inleiding
In dit document wordt beschreven hoe u problemen met de FAN-module in NCS XR Platform kunt oplossen.
Voorwaarden
Vereisten
Cisco raadt kennis van de volgende onderwerpen aan:
Opmerking: Cisco raadt aan dat u toegang moet hebben tot Cisco IOS® XR CLI en admin CLI.
Opmerking: Cisco raadt aan dat u toegang moet hebben tot Cisco IOS® XR CLI en admin CLI.
Gebruikte componenten
De informatie in dit document is gebaseerd op de volgende software- en hardware-versies:
Dit omvat, maar is niet beperkt tot, deze series:
- NCS 540-reeks
- NCS 560-reeks
- NCS 5500-reeks
- NCS 5700-reeks
De informatie in dit document is gebaseerd op de apparaten in een specifieke laboratoriumomgeving. Alle apparaten die in dit document worden beschreven, hadden een opgeschoonde (standaard)configuratie. Als uw netwerk live is, moet u zorgen dat u de potentiële impact van elke opdracht begrijpt.
Achtergrondinformatie
De Cisco NCS XR-routerserie bevat verschillende platforms die zijn ontworpen voor verschillende gebruikssituaties en prestatieniveaus, elk met verschillende typen ventilatormodules en systeemarchitecturen:
· Cisco NCS 540-reeks: dit is een XR-router met kleine dichtheid die is gericht op sub-100G-bandbreedtetoepassingen zoals 5G NR backhaul, FTTx en implementaties in bedrijfstakken. Het maakt gebruik van ventilatormodules met een 3 + 1-ventilatorredundantieontwerp en side-to-side geforceerde luchtkoeling. De voedingen zijn vast met 1+1 AC/DC-redundantie en het systeem is robuust met een conforme coating en ondersteunt de naleving van de timing van klasse C.
· Cisco NCS 560-reeks: dit modulaire systeem bevat drie modulaire ventilatorladen met hoge snelheid die moeten worden gevuld voor gebruik. Deze ventilatorladen bevatten redundante ventilatoren en zijn geschikt voor gebruik in het veld, waardoor vervanging mogelijk is zonder het systeem uit te schakelen. Het systeem ondersteunt de werking bij storingen van één ventilator en handhaaft tijdslimieten voor het opnieuw plaatsen van ventilatorladen op basis van de omgevingstemperatuur. Het beschikt ook over een ingebouwd stoffilter om de luchtstroom te optimaliseren. De voedingen zijn modulair met wisselstroom- en gelijkstroomopties en ondersteunen load-sharing en beveiligingsschema's.
· Cisco NCS 5500-reeks: dit modulaire routerplatform met hoge foutbestendigheid is ontworpen voor datacenters en krachtige netwerkomgevingen. Het beschikt over modulaire, in het veld vervangbare ventilatormodules die onderhoudsgemak en redundantie ondersteunen. Problemen oplossen omvat systeemlogboekcontroles, hardwarestatus en het beheer van softwarepakketten om de stabiliteit van het systeem te handhaven. Het platform ondersteunt Cisco IOS® XR-software met modulaire pakketten en veerkrachtfuncties.
· Cisco NCS 5700-reeks: deze reeks bouwt voort op het NCS 5500-platform en bevat een verbeterd ASIC-ontwerp voor doorsturen en draait op Cisco IOS® XR7 OS. Het heeft varianten zoals NCS-57B1-6D24 en NCS-57B1-5DSE. Het systeem is modulair met in het veld vervangbare ventilatorladen en voedingen en ondersteunt hoge beschikbaarheid en foutbestendigheid. Ventilatorladen zijn ontworpen voor redundantie en hot-swapping.Cisco IOS® XR7 OS biedt geavanceerde softwarefuncties voor het bewaken van systeem- en storingsbeheer.
Probleem
Fan-fouten in Cisco NCS XR-routers hebben invloed op de koeling en betrouwbaarheid van het systeem. De aard en ernst van de problemen verschillen per platform als gevolg van verschillen in het ontwerp en de onderhoudsmogelijkheden van de ventilatormodule. Er zijn verschillende modellen in de NCS 540-serie die vaste, niet-veldvervangbare ventilatormodules gebruiken met een 3 + 1 redundantieontwerp. Bij een storing van de ventilator is meestal onderhoud of vervanging van het gehele apparaat vereist. Dit leidt mogelijk tot langere downtime en complexere probleemoplossing.
De NCS 560-, 5500- en 5700-serie en enkele modellen in de NCS 540-serie maken gebruik van modulaire, in het veld vervangbare ventilatorladen die zijn ontworpen voor redundantie en hot-swapping. Hierdoor kan de ventilator tijdens storingen aan één ventilator blijven werken en is onderhoud eenvoudiger zonder het systeem uit te schakelen.
Fan-storingen in deze modulaire systemen kunnen leiden tot systeemwaarschuwingen, vereisen bewaking van omgevingstemperatuurbeperkingen en vereisen tijdige herplaatsing van de ventilatorlade om een optimale luchtstroom en systeemstabiliteit te behouden. Over het algemeen vormt het falen van de ventilator in NCS XR-routers het risico van oververhitting, verminderde prestaties en potentiële hardwareschade. Dit vereist snelle detectie, diagnose en passende corrigerende acties die zijn afgestemd op de specifieke routerserie en ventilatorarchitectuur.
Procedure voor het oplossen van een storing in de FAN-module in het NCS XR-platform
De procedure voor het oplossen van problemen met ventilatormodules in NCS XR-platforms schetst over het algemeen een consistente aanpak, waarbij specifieke fysieke acties verschillen op basis van het feit of het model een vaste ventilatormodule of een modulaire ventilatorlade gebruikt.
Stap 1. Eerste CLI-verificatie
Meld u aan bij de router in Cisco IOS® XR CLI en voer deze opdrachten uit om de status van ventilatorladen en afzonderlijke ventilatoren te identificeren. Deze opdrachten zijn gebruikelijk op alle NCS XR-platforms waarop Cisco IOS® XR wordt uitgevoerd.
Stap 1.1Platformstatus controleren: Voer deze opdracht uit om te bepalen of het een FAN Tray-fout is of een of meer FAN-fouten in een FAN-lade.
Voorbeeld opdrachtuitvoer:
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#show platform
Thu Jul 24 12:33:45.143
Node Type State Config state
--------------------------------------------------------------------------------
0/RP0/CPU0 N540X-12Z16G-SYS-D(Active) IOS XR RUN NSHUT
0/PM0 N540-PSU-FIXED-D OPERATIONAL NSHUT
0/PM1 N540-PSU-FIXED-D OPERATIONAL NSHUT
0/FT0 N540-FAN OPERATIONAL NSHUT
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#
Opmerking: als alle ventilatorladen in "OPERATIONEEL" staan, kunt u concluderen dat de ventilatorlade goed werkt. Anders als een ventilatorlade niet-operationeel is, betekent dit dat de ventilatorlade in mislukte staat is.
Stap 1.2.Mislukte ventilatormodules identificeren: Voer deze opdracht uit om de status en snelheid van afzonderlijke ventilatoren in een ventilatorlade te controleren.
Voorbeeld opdrachtuitvoer:
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#show environment fan
Thu Jul 24 12:33:09.673
=========================================================================================
Fan speed (rpm)
Location FRU Type FAN_0 FAN_1 FAN_2 FAN_3
-----------------------------------------------------------------------------------------
0/FT0 N540-FAN 25680 0 25440 26130
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#
Opmerking: een waarde van '0' of aanzienlijk lagere RPM-waarden in vergelijking met andere ventilatoren in dezelfde lade kan wijzen op een defecte of defecte ventilator.
Stap 1.3.Fan Module Failure van Alarms verifiëren: Voer deze opdracht uit om systeemalarmen te controleren op ventilatorgerelateerde alarmen.
Voorbeeldlogs:
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#show alarms brief system active
Thu Jul 24 12:33:23.874
------------------------------------------------------------------------------------
Active Alarms
------------------------------------------------------------------------------------
Location Severity Group Set Time Description
------------------------------------------------------------------------------------
0/FT0 Minor Environ 07/24/2025 10:35:44 WIB Fan 1: Out of tolerance
0/FT0 Minor Environ 07/24/2025 10:35:44 WIB Sensor in failed state
0 Minor Environ 07/24/2025 10:35:44 WIB Sensor in failed state
RP/0/RP0/CPU0:N540X-12Z16G-SYS-D#
Opmerking: Alarmberichten met de melding "Fan X: Out of tolerance" of "Sensor in failed state" bevestigen het falen van de ventilator.
Opmerking: Alarmberichten met de melding "Fan X: Out of tolerance" of "Sensor in failed state" bevestigen defecte ventilatoren.
Stap 2. Milieu- en fysieke inspectie
Omgevingsfactoren kunnen de werking van de ventilator en de algehele koeling van het systeem aanzienlijk beïnvloeden.
-
Omgevingsomstandigheden:
- Controleer de omgevingstemperatuur en luchtstroom rond de router om ervoor te zorgen dat deze binnen de operationele grenzen valt. Hoge temperaturen kunnen ervoor zorgen dat ventilatoren harder werken of voortijdig uitvallen.
- Controleer of er stoffilters of luchtplenums zijn die verstopt of onjuist kunnen worden geïnstalleerd, waardoor de luchtstroom wordt beperkt.
-
Fysieke inspectie voor obstakels/schade:
- Inspecteer de ventilatormodule/lade op zichtbare resten, losse bedrading of obstakels die kunnen voorkomen dat ventilatoren vrij kunnen draaien. Stofophoping is een veel voorkomende oorzaak van ventilatorproblemen.
- Voor platforms met modulaire ventilatorladen (bijvoorbeeld NCS 560, NCS 5500, NCS 5700 en sommige NCS 540-modellen), indien dit veilig is en binnen de operationele richtlijnen, overweeg dan zorgvuldig de vermoedelijke ventilatorlade uit te trekken. Inspecteer de afzonderlijke ventilatoren visueel op niet-draaiende bladen of zichtbare schade. Als de lade leeg is, controleert u of er zich stof ophoopt op de ventilatoren en in de sleuf van het chassis.
- Voor platforms met vaste ventilatormodules (bijvoorbeeld sommige NCS 540-modellen) is een fysieke inspectie van de ventilatormodule en connectoren beperkt, maar moet nog steeds worden uitgevoerd op externe tekenen van schade of obstructie.
Stap 3. Controleren op bekende problemen en bugs
Voordat u doorgaat met het vervangen van de hardware, is het raadzaam om te controleren of de waargenomen ventilatorfout overeenkomt met bekende software- of hardwarefouten.
- Cisco Bug Search Tool: Zoek in de Cisco Bug Search Tool (BST) met behulp van trefwoorden zoals "NCS XR fan failure", "NCS [modelnummer] fan" en de specifieke Cisco IOS® XR versie die op uw apparaat wordt uitgevoerd. Zoek naar bekende problemen die kunnen leiden tot foutieve rapportage van ventilatoren of daadwerkelijke storingen.
- Cisco-ondersteuningsdocumentatie: controleer de ondersteuningsdocumentatie van Cisco en communityforums voor vergelijkbare gerapporteerde problemen en aanbevolen oplossingen of oplossingen.
Stap 4. Remediërende acties en vervanging
De volgende stappen zijn afhankelijk van het type ventilatormodule in uw NCS XR-platform.
Voor NCS XR-platforms met vaste ventilatormodules (bijvoorbeeld sommige NCS 540-modellen)
Modellen met vaste ventilatormodules zijn doorgaans niet hot-swappable.
- Energiecyclus: als het probleem niet is opgelost door de eerste controles en omgevingsaanpassingen, voert u een energiecyclus van de router uit. Dit kan soms tijdelijke problemen oplossen en ervoor zorgen dat de ventilatormodule opnieuw correct kan worden geïnitialiseerd.
- Vervanging (RMA): als wordt bevestigd dat de ventilatormodule is uitgevallen na een energiecyclus, is doorgaans een Return Merchandise Authorization (RMA) voor de gehele eenheid of het chassis vereist.
Opmerking: voor vervanging van een vaste ventilatormodule is geplande downtime nodig, omdat de router moet worden uitgeschakeld.
Voor NCS XR-platforms met modulaire ventilatorladen (bijvoorbeeld de meeste NCS 540-, NCS 560-, NCS 5500- en NCS 5700-modellen)
Deze platforms zijn voorzien van hot-swappable modulaire ventilatorladen.
-
Opnieuw instellen (JACK-OUT en JACK-IN - JOJI):
- Voer voorzichtig een JACK-OUT- en JACK-IN (JOJI)-procedure uit op de ventilatorlade die de defecte ventilatormodule(s) bevat. Dit houdt in dat de ventilatorlade fysiek wordt verwijderd en vervolgens opnieuw wordt ingebracht.
- Terwijl de ventilatorlade wordt uitgetrokken, voert u een grondige visuele inspectie uit voor vuil of losse bedrading die kan voorkomen dat ventilatoren draaien. U kunt ook observeren of alle fans proberen te draaien bij het opnieuw inbrengen.
- Controleer na het opnieuw instellen de status opnieuw met behulp van "omgevingsventilator weergeven".
-
Vervanging (RMA): als een van de ventilatormodules nog steeds in een defecte toestand verkeert of als de ventilatorlade na het opnieuw instellen niet operationeel blijft, gaat u verder met een RMA voor de ventilatorlade.
- Bewijslogboeken verzamelen: voer "show logging | include FAN" opnieuw uit om logboeken met betrekking tot de ventilatorlade JOJI vast te leggen voor documentatiedoeleinden.
Voorbeeldlogs:
RP/0/RP0/CPU0:N540-24Z8Q2C-SYS# show logging | include FAN
0/RSP0/ADMIN0:Jul 12 01:39:25.215 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#: N/A
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #: N/A
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0 hardware state going to Operational
0/RSP0/ADMIN0:Jul 12 01:42:23.584 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#: N/A
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #:N/A
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0
- Product-ID (PID) en serienummer (SN) verzamelen: verkrijg de PID en SN van de defecte ventilatorlade, die vereist zijn voor het RMA-proces.
Voorbeeld opdrachtuitvoer:
Command Syntax:
RP/0/RP0/CPU0:N540-24Z8Q2C-SYS# show inventory location <location of failed FAN tray>
Sample command:
RP/0/RP0/CPU0:N540-24Z8Q2C-SYS# show inventory location 0/FT0
NAME: "0/FT0", DESCR: "NCS 540 Fan"
PID: N540-FAN , VID: N/A, SN: N/A
- Ga verder met RMA: start het RMA-proces met Cisco voor de defecte ventilatorlade.