Inleiding
In dit document wordt beschreven hoe problemen met FAN-modulefouten in ASR9k kunnen worden opgelost.
Voorwaarden
Vereisten
Cisco raadt kennis van de volgende onderwerpen aan:
Opmerking: Cisco raadt aan dat u toegang moet hebben tot Cisco IOS® XR CLI en admin CLI.
Gebruikte componenten
De informatie in dit document is gebaseerd op de volgende software- en hardware-versies:
- De ASR 9000-serie omvat een reeks modellen, waaronder de ASR 9001, ASR 9006, ASR 9010, ASR 9901, ASR 9906, ASR 9910, ASR 9912 en ASR 9922.
De informatie in dit document is gebaseerd op de apparaten in een specifieke laboratoriumomgeving. Alle apparaten die in dit document worden beschreven, hadden een opgeschoonde (standaard)configuratie. Als uw netwerk live is, moet u zorgen dat u de potentiële impact van elke opdracht begrijpt.
Achtergrondinformatie
De ASR 9000 Series Aggregation Services Routers (ASR9k) van Cisco zijn krachtige routers die zijn ontworpen voor netwerken van serviceproviders en die schaalbaarheid, betrouwbaarheid en geavanceerde functies bieden om de eisen van netwerkomgevingen te ondersteunen. De ASR9k-routers bieden modulaire hardwarearchitectuur en maken flexibele configuratie en uitbreiding mogelijk om aan verschillende netwerkvereisten te voldoen.
De ASR9k-routerfamilie omvat:
· Modulair ontwerp: ASR9k-routers zijn uitgerust met modulaire componenten zoals routeprocessors, lijnkaarten en ventilatorladen en maken eenvoudige upgrades en onderhoud mogelijk zonder onderbrekingen van de netwerkactiviteiten.
· Koelsysteem: het ASR 9001-model maakt bijvoorbeeld gebruik van een enkele ventilatorlade met redundante ventilatoren aan de voorzijde om continue koeling te garanderen. De ventilatorlade ondersteunt zijdelingse luchtstroom en maakt vanaf softwarerelease 4.3.0 online invoegen en verwijderen (OIR) mogelijk met bepaalde omgevingstemperatuurbeperkingen, waardoor de onderhoudsvriendelijkheid wordt verbeterd.
· Hoge beschikbaarheid: de ASR9k-serie ondersteunt redundante voedingen en ventilatoren, draagt bij aan hoge beschikbaarheid en minimaliseert downtime.
· Prestaties en schaalbaarheid: ASR9k-routers zijn ontworpen om grootschalige aggregatie en edge-routering aan te kunnen en ondersteunen hoge doorvoer en geavanceerde routeringsprotocollen die geschikt zijn voor core- en edge-netwerken van serviceproviders.
· Softwarefuncties: De routers werken met Cisco IOS® XR-software, die betrouwbaarheid, modulariteit en programmeerbaarheid van carrier-grade biedt om evoluerende netwerkvereisten te ondersteunen.
Probleem
Een storing in een ventilatormodule of ventilatorlade in een router uit de ASR 9000-reeks kan leiden tot onvoldoende koeling, waardoor kritieke hardwarecomponenten oververhit raken. Deze oververhitting kan leiden tot instabiliteit van het systeem, slechtere prestaties, onverwachte uitval of permanente hardwareschade, wat uiteindelijk van invloed is op de beschikbaarheid van het netwerk en de betrouwbaarheid van de service. Gezien de cruciale rol van het koelsysteem bij het handhaven van de gezondheid van het apparaat, zijn tijdige detectie en beperking van ventilatorstoringen essentieel om netwerkverstoringen te voorkomen en een hoge beschikbaarheid in serviceprovideromgevingen te behouden.
Procedure voor het oplossen van een storing in de FAN-module in ASR9k
De procedure voor het oplossen van problemen met ventilatormodules in ASR 9000 Series-routers schetst over het algemeen een consistente aanpak voor verschillende modellen, waarbij specifieke fysieke acties verschillen op basis van het feit of het model een vaste ventilatormodule of een modulaire ventilatorlade gebruikt.
Stap 1. Eerste CLI-verificatie
Meld u aan bij de router in Cisco IOS® XR CLI en voer deze opdrachten uit om de status van ventilatorladen en afzonderlijke ventilatoren te identificeren. Deze opdrachten zijn gebruikelijk op alle ASR 9000-platforms waarop Cisco IOS® XR wordt uitgevoerd.
Stap 1.1 Platformstatus controleren: Voer deze opdracht uit om te bepalen of het een FAN Tray-fout is of een of meer FAN-fouten in een FAN-lade.
Voorbeeld opdrachtuitvoer:
RP/0/RSP0/CPU0:ASR-9006#show platform
Wed Jul 16 12:16:00.408 IST
Node Type State Config state
--------------------------------------------------------------------------------
0/RSP0/CPU0 A9K-RSP5-SE(Active) IOS XR RUN NSHUT
0/RSP1/CPU0 A9K-RSP5-SE(Standby) IOS XR RUN NSHUT
0/FT0 ASR-9006-FAN-V2 OPERATIONAL NSHUT
0/FT1 ASR-9006-FAN-V2 OPERATIONAL NSHUT
0/0/CPU0 A9K-MOD200-SE IOS XR RUN NSHUT
0/0/0 A9K-MPA-20X1GE OK
0/1/CPU0 A9K-8X100GE-SE IOS XR RUN NSHUT
0/2/CPU0 A9K-MOD200-SE IOS XR RUN NSHUT
0/2/0 A9K-MPA-20X10GE OK
0/PT0 A9K-DC-PEM-V2 OPERATIONAL NSHUT
RP/0/RSP0/CPU0:ASR-9006#
Opmerking: als alle ventilatorladen in "OPERATIONEEL" staan, kunt u concluderen dat de ventilatorlade goed werkt. Anders als een ventilatorlade niet-operationeel is, betekent dit dat de ventilatorlade in mislukte staat is.
Stap 1.2. Mislukte ventilatormodules identificeren: Voer deze opdracht uit om de status en snelheid van afzonderlijke ventilatoren in een ventilatorlade te controleren.
Voorbeeld opdrachtuitvoer:
RP/0/RSP0/CPU0:ASR-9006#admin show environment fan
Wed Jul 16 12:16:09.843 IST
=============================================================================
Fan speed (rpm)
Location FRU Type FAN_0 FAN_1 FAN_2 FAN_3 FAN_4 FAN_5
-----------------------------------------------------------------------------
0/FT0 ASR-9006-FAN-V2 - 7710 7590 8970 7500 7530
0/FT1 ASR-9006-FAN-V2 7590 7560 7590 7590 7560 7560
0/PT0-PM0 PWR-2KW-DC-V2 8022 8559
0/PT0-PM1 PWR-2KW-DC-V2 6280 6237
0/PT0-PM2 PWR-2KW-DC-V2 7914 8559
0/PT0-PM3 PWR-2KW-DC-V2 7978 8516
RP/0/RSP0/CPU0:ASR-9006#
Opmerking: Een streepje (`-`) of aanzienlijk lagere RPM-waarden in vergelijking met andere ventilatoren in dezelfde lade kan wijzen op een defecte of falende ventilator.
Stap 1.3. Fan Module Failure van logs verifiëren: Voer deze opdracht uit om systeemlogs te controleren op fan-gerelateerde alarmen.
Voorbeeldlogs:
RP/0/RSP0/CPU0:ASR-9006# show logging | include FAN
0/RSP0/ADMIN0:2025 Jul 10 07:52:41.797 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
0/RSP0/ADMIN0:2025 Jul 10 07:53:42.798 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
0/RSP0/ADMIN0:2025 Jul 10 07:54:43.800 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
0/RSP0/ADMIN0:2025 Jul 10 07:55:44.799 IST: canbus_driver[4134]: %PLATFORM-CANB_SERVER-3-ALARM_INDICATION : Raise alarm from CBC0 in slot 0/FT0, alarm code CBC_ALRM_AT_LEAST_ONE_FAN_FAILED
Stap 2. Milieu- en fysieke inspectie
Omgevingsfactoren kunnen de werking van de ventilator en de algehele koeling van het systeem aanzienlijk beïnvloeden.
-
Omgevingsomstandigheden:
- Controleer de omgevingstemperatuur en luchtstroom rond de router om ervoor te zorgen dat deze binnen de operationele grenzen valt. Hoge temperaturen kunnen ervoor zorgen dat ventilatoren harder werken of voortijdig uitvallen.
- Controleer of er stoffilters of luchtplenums zijn die verstopt of onjuist kunnen worden geïnstalleerd, waardoor de luchtstroom wordt beperkt.
-
Fysieke inspectie voor obstakels/schade:
- Inspecteer de ventilatormodule/lade op zichtbare resten, losse bedrading of obstakels die kunnen voorkomen dat ventilatoren vrij kunnen draaien. Stofophoping is een veel voorkomende oorzaak van ventilatorproblemen.
- Voor modellen met modulaire ventilatorlades (bijvoorbeeld ASR 9006, 9010, ASR 99xx), indien dit veilig is en binnen de operationele richtlijnen, voorzichtig de vermoedelijke ventilatorlade uittrekken. Inspecteer de afzonderlijke ventilatoren visueel op niet-draaiende bladen of zichtbare schade. Als de lade leeg is, controleert u of er zich stof ophoopt op de ventilatoren en in de sleuf van het chassis.
- Voor modellen met vaste ventilatormodules (bijvoorbeeld ASR 9001) is een fysieke inspectie van de ventilatormodule en connectoren beperkt, maar moet deze nog steeds worden uitgevoerd op externe tekenen van schade of obstructie.
Stap 3. Controleren op bekende problemen en bugs
Voordat u doorgaat met het vervangen van de hardware, is het raadzaam om te controleren of de waargenomen ventilatorfout overeenkomt met bekende software- of hardwarefouten.
- Cisco Bug Search Tool: Zoek in de Cisco Bug Search Tool (BST) met behulp van trefwoorden zoals "ASR 9000 fan failure", "ASR [modelnummer] fan" en de specifieke Cisco IOS® XR versie die op uw apparaat wordt uitgevoerd. Zoek naar bekende problemen die kunnen leiden tot foutieve rapportage van ventilatoren of daadwerkelijke storingen.
- Cisco-ondersteuningsdocumentatie: controleer de ondersteuningsdocumentatie en communityforums van Cisco voor vergelijkbare gemelde problemen en aanbevolen oplossingen of oplossingen.
Stap 4. Remediërende acties en vervanging
De volgende stappen zijn afhankelijk van het type ventilatormodule in uw ASR 9000-router.
Voor ASR 9000-serie met vaste ventilatormodules (bijvoorbeeld ASR 9001):
Modellen zoals de ASR 9001 hebben een vaste ventilatormodule die niet hot-swappable is.
- Energiecyclus: als het probleem niet is opgelost door de eerste controles en omgevingsaanpassingen, voert u een energiecyclus van de router uit. Dit kan soms tijdelijke problemen oplossen en ervoor zorgen dat de ventilatormodule opnieuw correct kan worden geïnitialiseerd.
- Vervanging (RMA): als wordt bevestigd dat de ventilatormodule is mislukt na een energiecyclus, is meestal een Return Merchandise Authorization (RMA) voor het hele chassis vereist.
Opmerking: voor vervanging van een vaste ventilatormodule is geplande downtime nodig, omdat de router moet worden uitgeschakeld.
Voor ASR 9000-serie met modulaire ventilatorladen (bijvoorbeeld ASR 9006, ASR 9010, ASR 99xx-modellen)
Deze modellen zijn voorzien van hot-swappable modulaire ventilatorladen.
-
Opnieuw instellen (JACK-OUT en JACK-IN - JOJI):
- Voer voorzichtig een JACK-OUT- en JACK-IN (JOJI)-procedure uit op de ventilatorlade die de defecte ventilatormodule(s) bevat. Dit houdt in dat de ventilatorlade fysiek wordt verwijderd en vervolgens opnieuw wordt ingebracht.
- Terwijl de ventilatorlade wordt uitgetrokken, voert u een grondige visuele inspectie uit voor vuil of losse bedrading die kan voorkomen dat ventilatoren draaien. U kunt ook observeren of alle fans proberen te draaien bij het opnieuw inbrengen.
- Controleer na het opnieuw instellen de status opnieuw met behulp van "admin show environment fan".
-
Vervanging (RMA): Als de ventilatormodule(s) nog steeds in de uitgevallen toestand is (zijn) of als de ventilatorlade na het opnieuw instellen niet operationeel blijft, gaat u verder met een RMA voor de ventilatorlade.
- Bewijslogboeken verzamelen: "Toon logboekregistratie | voeg FAN toe" opnieuw om logboeken met betrekking tot de ventilatorlade JOJI vast te leggen voor documentatiedoeleinden.
Voorbeeldlogs:
RP/0/RSP0/CPU0:ASR-9006# show logging | include FAN
0/RSP0/ADMIN0:Jul 12 01:39:25.215 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:39:26.522 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0 hardware state going to Operational
0/RSP0/ADMIN0:Jul 12 01:42:23.584 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_REMOVAL : Location: 0/FT0, Serial#:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-5-CARD_INSERTION : Location: 0/FT0, Serial #:FOC222XXX
0/RSP0/ADMIN0:Jul 12 01:44:40.495 : shelf_mgr[4169]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/FT0
- Product-ID (PID) en serienummer (SN) verzamelen: verkrijg de PID en SN van de defecte ventilatorlade, die vereist zijn voor het RMA-proces.
Voorbeeld opdrachtuitvoer:
Command Syntax:
RP/0/RSP0/CPU0:ASR-9006# show inventory location <location of failed FAN tray>
Sample command:
RP/0/RSP0/CPU0:ASR-9006# show inventory location 0/FT0
NAME: "0/FT0", DESCR: "ASR-9006 Fan Tray V2"
PID: ASR-9006-FAN-V2 , VID: V02, SN: FOC222XXX
- Ga verder met RMA: start het RMA-proces met Cisco voor de defecte ventilatorlade.