De documentatie van dit product is waar mogelijk geschreven met inclusief taalgebruik. Inclusief taalgebruik wordt in deze documentatie gedefinieerd als taal die geen discriminatie op basis van leeftijd, handicap, gender, etniciteit, seksuele oriëntatie, sociaaleconomische status of combinaties hiervan weerspiegelt. In deze documentatie kunnen uitzonderingen voorkomen vanwege bewoordingen die in de gebruikersinterfaces van de productsoftware zijn gecodeerd, die op het taalgebruik in de RFP-documentatie zijn gebaseerd of die worden gebruikt in een product van een externe partij waarnaar wordt verwezen. Lees meer over hoe Cisco gebruikmaakt van inclusief taalgebruik.
Cisco heeft dit document vertaald via een combinatie van machine- en menselijke technologie om onze gebruikers wereldwijd ondersteuningscontent te bieden in hun eigen taal. Houd er rekening mee dat zelfs de beste machinevertaling niet net zo nauwkeurig is als die van een professionele vertaler. Cisco Systems, Inc. is niet aansprakelijk voor de nauwkeurigheid van deze vertalingen en raadt aan altijd het oorspronkelijke Engelstalige document (link) te raadplegen.
Dit document geeft informatie over hoe u de lijnkaartcrashes van de Cisco 12000 Series Internet Router van de oplossing kunt oplossen.
Er zijn geen specifieke vereisten van toepassing op dit document.
De informatie in dit document is gebaseerd op de volgende software- en hardware-versies:
Alle Cisco 12000 Series internetrouters, inclusief de 12008, 12012, 12016, 12404, 12406, 12410 en 12416.
Alle Cisco IOS®-softwareversies die de Cisco 12000 Series Internet Router ondersteunen.
De informatie in dit document is gebaseerd op de apparaten in een specifieke laboratoriumomgeving. Alle apparaten die in dit document worden beschreven, hadden een opgeschoonde (standaard)configuratie. Als uw netwerk live is, moet u de potentiële impact van elke opdracht begrijpen.
Deze paragraaf geeft achtergrondinformatie over het identificeren van een lijnkaartcrash.
Om een lijnkaartcrash snel te identificeren, gebruik de show context summiere opdracht:
Router#show context summary CRASH INFO SUMMARY Slot 0 : 0 crashes Slot 1 : 0 crashes Slot 2 : 0 crashes Slot 3 : 0 crashes Slot 4 : 1 crashes 1 - crash at 04:28:56 EDT Tue Apr 20 1999 Slot 5 : 0 crashes Slot 6 : 0 crashes Slot 7 : 0 crashes Slot 8 : 0 crashes Slot 9 : 0 crashes Slot 10: 0 crashes Slot 11: 0 crashes
Als de crash de router zelf beïnvloedt (en niet alleen de lijnkaart), raadpleeg de routercrashes voor probleemoplossing.
Gebruik de opdrachten in tabel 1 om de relevante gegevens over het ongeluk te verzamelen.
Tabel 1 - Opdrachten om gegevens over de ramp te verzamelenOpdracht | Beschrijving |
---|---|
show version | Bevat algemene informatie over de hardware- en softwareconfiguraties van het systeem. |
demonstreren | Toont de algemene logbestanden van de router. |
Zie diag [sleuf #] | Bevat specifieke informatie over een bepaalde sleuf: type motor, hardware revisies, geheugenconfiguratie enzovoort. |
Toon contextsleuf [sleuf #] | Hier vindt u contextinformatie over de recente crash(s). Dit is vaak de meest nuttige opdracht voor het oplossen van lijnkaartcrashes. |
stortplaats | Een kernstop van een lijnkaart is de volledige inhoud van zijn geheugen ten tijde van de crash. Deze gegevens zijn normaal niet nodig voor een eerste probleemoplossing. Deze taak kan later nodig zijn als het probleem een nieuw softwarebug blijkt te zijn. Raadpleeg in dat geval het configureren van een coredump op een GSR lijnkaart. |
Als u de uitvoer hebt van een show tech-support (vanaf Enable mode) van uw Cisco-apparaat, kunt u gebruik maken mogelijke problemen en oplossingen weer te geven . Om te gebruiken , u moet een geregistreerde klant zijn, inloggen en JavaScript hebben ingeschakeld.
Controleer de waarde van het sig= veld in de show contextsleuf [sleuf#] uitvoer:
Router#show context slot 4 CRASH INFO: Slot 4, Index 1, Crash at 04:28:56 EDT Tue Apr 20 1999 VERSION: GS Software (GLC1-LC-M), Version 11.2(15)GS1a, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) Compiled Mon 28-Dec-98 14:53 by tamb Card Type: 1 Port Packet Over SONET OC-12c/STM-4c, S/N CAB020500AL System exception: SIG=20, code=0xA414EF5A, context=0x40337424 Traceback Using RA STACK TRACE: traceback 4014CFC0 40141AB8 40143944 4014607C 4014A7EC 401499D4 40149BB4 40149FD4 40080118 40080104 CONTEXT: $0 : 00000000, AT : 40330000, v0 : 00000000, v1 : 00000038 a0 : 4094EF58, a1 : 00000120, a2 : 00000002, a3 : 00000001 t0 : 00000010, t1 : 3400BF01, t2 : 34008D00, t3 : FFFF00FF t4 : 400A1410, t5 : 00000002, t6 : 00000000, t7 : 4041783C s0 : 4093F980, s1 : 4093F980, s2 : 4094EEF0, s3 : 4094EF00 s4 : 00000000, s5 : 00000001, s6 : 00000000, s7 : 00000000 t8 : 34008000, t9 : 00000000, k0 : 404D1860, k1 : 400A2F68 gp : 402F3070, sp : 4082BFB0, s8 : 00000000, ra : 400826FC EPC : 0x40098824, SREG : 0x3400BF04, Cause : 0x00000000 ErrorEPC : 0x4015B7E4
Zie Tabel 2 om uit te vinden welke foutreden overeenkomt met de SIG-waarde die u hebt geregistreerd.
Tabel 2 - Vind de fout die overeenkomt met de SIG-waardeSIG-waarde | SIG-naam | Foutenreden |
---|---|---|
2 | SIGINT | Onverwachte hardware onderbreken. |
3 | SIGQUIT | Afbreken vanwege reekscode. |
4 | SIGILL | Onwettige code uitzondering |
5 | SIGTRAP | Afbreken vanwege breekpunt of een rekenkundige uitzondering. |
8 | GROOTTE | Vloerpunteenheid (FPU) uitzondering |
9 | SIGKILL | Voorbehouden uitzondering |
10 | SIGBUS | Uitzondering op bus-fouten. |
11 | SIGSEGV | Uitzondering voor SegV. |
20 | SIGCACHE | Scheepheid uitzondering. |
21 | SIGWBERR | Schrijf een busfout onderbreken. |
22 | SIGERROR | Fatale hardwarefout. |
23 | SIGRELAAD | Softwaregedwongen crash. |
Opmerking: Cache Parity Exception (SIG=20), bus error Exception (SIG=10) en software-forced crashes (SIG=23) nemen meer dan 95% van de lijnkaartcrashes voor hun rekening.
Cisco 12000 Series ondersteunt de diag [sleuf#]-opdracht voor het testen van de verschillende bordonderdelen. Deze opdracht is handig om problemen op te lossen met hardware-gerelateerde crashes en om het foutrapbord te identificeren.
De breedband optie veroorzaakt de router om de lijst van tests weer te geven terwijl deze worden uitgevoerd. Anders geeft het simpelweg een "GEPASEERD" of "FALEN" bericht weer.
Opmerking: door deze diagnostische test uit te voeren worden alle activiteiten van de lijnkaart gestopt gedurende de tests (gewoonlijk ongeveer vijf minuten).
Om te beginnen met Cisco IOS-softwarerelease 12.0(22)S, heeft Cisco de Cisco 12000 Series diagnostische lijnkaartafbeelding voor internetrouter van het Cisco IOS-softwarebeeld ontbundeld. In eerdere versies kan de diagnostiek vanaf de opdrachtregel worden gestart en wordt het ingesloten beeld gestart. Om klanten met 20 MB Flash-geheugenkaarten te kunnen ontvangen, worden de diagnostiek van het lijnkaartveld nu opgeslagen en onderhouden als een afzonderlijk beeld dat beschikbaar moet zijn op een Flash-geheugenkaart of een TFTP-laarsserver (Trial File Transfer Protocol) voordat de opdrachten voor de diagnose van het veld kunnen worden gebruikt. De diagnostiek van routerprocessors en switches van de fabric blijft gebundeld en hoeft niet vanaf een afzonderlijk beeld te worden gelanceerd. U kunt meer informatie bij Velddiagnostiek vinden voor Cisco 12000 Series Internet Router.
Hier is een voorbeeld van een diag opdrachtoutput [sleuf#]:
Router#diag 3 verbose Running DIAG config check Running Diags will halt ALL activity on the requested slot. [confirm] CR1.LND10# Launching a Field Diagnostic for slot 3 Downloading diagnostic tests to slot 3 (timeout set to 400 sec.) Field Diag download COMPLETE for slot 3 FD 3> ***************************************************** FD 3> GSR Field Diagnostics V3.0 FD 3> Compiled by award on Tue Aug 3 15:58:13 PDT 1999 FD 3> view: award-bfr_112.FieldDiagRelease FD 3> ***************************************************** FD 3> BFR_CARD_TYPE_OC48_1P_POS testing... FD 3> running in slot 3 (128 tests) Executing all diagnostic tests in slot 3 (total/indiv. timeout set to 600/200 sec.) FD 3> Verbosity now (0x00000001) TESTSDISP FDIAG_STAT_IN_PROGRESS: test #1 R5K Internal Cache FDIAG_STAT_IN_PROGRESS: test #2 Burst Operations FDIAG_STAT_IN_PROGRESS: test #3 Subblock Ordering FDIAG_STAT_IN_PROGRESS: test #4 Dram Marching Pattern FDIAG_STAT_DONE_FAIL test_num 4, error_code 6 Field Diagnostic: ****TEST FAILURE**** slot 3: last test run 4, Dram Marching Pattern, error 6 Field Diag eeprom values: run 2 fail mode 1 (TEST FAILURE) slot 3 last test failed was 4, error code 6 Shutting down diags in slot 3 slot 3 done, will not reload automatically
Afhankelijk van de aangetroffen fout, kan de sleuf al dan niet automatisch opnieuw worden geladen. Als dit niet het geval is, kan dit in een vastgelopen of inconsistente toestand zijn (controleer met de show [sleuf #] opdracht) totdat deze handmatig wordt herladen. Dit is normaal. Gebruik de opdracht opnieuw laden van de kaart om de kaart handmatig te herladen, door de sleuf [sleuf#] te gebruiken.
U kunt uitzonderingen op cacheparity identificeren door SIG=20 in de show context [sleuf #] uitvoer.
Als u de uitvoer hebt van een show tech-support (vanaf Enable mode) van uw Cisco-apparaat, kunt u gebruik maken mogelijke problemen en oplossingen weer te geven . Om te gebruiken , u moet een geregistreerde klant zijn, inloggen en JavaScript hebben ingeschakeld.
Er zijn twee verschillende soorten pariteitsfouten:
Zachte pariteitsfouten — Deze doen zich voor wanneer een energieniveau binnen de chip (bijvoorbeeld een één of een nul) verandert. In geval van een "soft parity"-fout is het niet nodig de raad van bestuur of een van de componenten te ruilen.
Harde pariteitsfouten— Deze doen zich voor wanneer er een chip of board storing is waardoor gegevens beschadigd worden. In dat geval moet u de aangetaste component, meestal een geheugenchip-ruil of een board-swap, opnieuw plaatsen of vervangen. Er is een harde pariteitsfout wanneer meerdere pariteitsfouten op hetzelfde adres worden gezien. Er zijn ingewikkelder gevallen die moeilijker te identificeren zijn, maar in het algemeen kan dit, wanneer in een bepaald geheugengebied in een relatief korte periode (weken tot maanden) meer dan één pariteitsfout wordt waargenomen, als een harde pariteitsfout worden beschouwd.
Studies hebben aangetoond dat fouten van zachte pariteit 10 tot 100 keer frequenter zijn dan harde pariteitsfouten.
Om deze fouten te verhelpen, vindt u een onderhoudsvenster om de opdracht diag voor die sleuf uit te voeren.
Als de diagnose resulteert in een storing, vervangt u de lijnkaart.
Als er geen sprake is van een storing, zal dit waarschijnlijk een fout van de zachte pariteit zijn, en hoeft de lijnkaart niet te worden vervangen (tenzij de lijnkaart een tweede keer met pariteitsfout na een korte periode crasht).
U kunt de uitzonderingen op busfouten door SIG=10 identificeren in de show context [sleuf #] uitvoer.
Als u de uitvoer hebt van een show tech-support (vanaf Enable mode) van uw Cisco-apparaat, kunt u gebruik maken mogelijke problemen en oplossingen weer te geven . Om te gebruiken , u moet een geregistreerde klant zijn, inloggen en JavaScript hebben ingeschakeld.
Dit type crash is normaal met de software te maken, maar als je om de een of andere reden (bijvoorbeeld het is een splinternieuwe kaart, of de crashes beginnen na een stroomuitval) denkt dat het probleem hardware-gerelateerd kan zijn, voer dan de diag opdracht voor die sleuf uit.
Opmerking: Van sommige softwarebugs is bekend dat ze de diag opdracht fouten laten rapporteren, ook al is er geen probleem met de hardware. Als een kaart al is vervangen, maar nog steeds niet aan dezelfde test in de diagnose voldoet, kan dit probleem u beïnvloeden. In dat geval, behandel de crash als een softwareprobleem.
Door te uploaden naar de nieuwste versie van uw Cisco IOS-softwarerelease worden alle vaste telefoons uitgeschakeld die lijnkaartbusfouten veroorzaken. Als het neerstorten nog steeds aanwezig is na de upgrade, verzamel de relevante informatie (zie Informatie verzamelen over het crashen), samen met een show-tech-ondersteuning, en alle informatie die u nuttig acht (zoals recente topologie of een nieuwe functie die onlangs is geïmplementeerd) en neem contact op met uw Cisco-ondersteuningsvertegenwoordiger.
U kunt door de SIG=23 geforceerde crashes herkennen in de showcontext [sleuf #]. Ondanks de naam zijn deze crashes niet altijd met software verbonden.
Als u de uitvoer hebt van een show tech-support (vanaf Enable mode) van uw Cisco-apparaat, kunt u gebruik maken mogelijke problemen en oplossingen weer te geven . Om te gebruiken , u moet een geregistreerde klant zijn, inloggen en JavaScript hebben ingeschakeld.
De meest voorkomende reden voor software-geforceerde crashes is de "Fabric Ping Time-out". Tijdens normaal routergebruik pingelt de routeprocessor (RP) voortdurend de lijnkaarten. Als een lijnkaart geen antwoord geeft, beslist de routeprocessor om het opnieuw in te stellen. Dit resulteert in een software-geforceerde krach (SIG=23) van de getroffen lijnkaart, en u zou deze fouten in de logboeken van de router moeten zien:
Mar 12 00:42:48: %GRP-3-FABRIC_UNI: Unicast send timed out (4) Mar 12 00:42:50: %GRP-3-COREDUMP: Core dump incident on slot 4, error: Fabric ping failure
Om problemen op te lossen met tijdelijke instellingen moet u uitzoeken waarom de lijnkaart niet op de ping heeft gereageerd. Er kunnen meerdere oorzaken zijn:
De lijnkaart ervaart een hoog CPU-gebruik—dit kan worden geverifieerd met behulp van de uitvoersleuf [sleuf #] die de opdracht proc cpu toont. Als de CPU’s werkelijk hoog zijn (meer dan 95%), raadpleegt u het gebruik van hoge CPU’s voor probleemoplossing op Cisco-routers.
Er zijn softwarebugs in Interproces Communication (IPC) of de lijnkaart raakt op IPC-buffers. Het grootste deel van de tijd worden deze software-gedwongen herladingen veroorzaakt door software-afslagen.
Door te uploaden naar de nieuwste versie van uw Cisco IOS-softwarerelease worden alle vaste insecten uitgeschakeld die fungeertijden veroorzaken. Als het neerstorten nog steeds aanwezig is na de upgrade, verzamel de relevante informatie (zie Informatie verkrijgen over de ramp), samen met een show-tech-ondersteuning, een show-ipc-status, en alle informatie die u nuttig acht (zoals recente topologie-verandering of een nieuwe functie die onlangs is geïmplementeerd) en neem contact op met uw Cisco-ondersteuningsvertegenwoordiger.
Hardware defect: Als de kaart lange tijd leeg is en er geen recente topologie, software of functiewijzigingen hebben plaatsgevonden, of als de problemen zijn begonnen na een verplaatsing of een stroomuitval, kan defecte hardware de oorzaak zijn. Start de opdracht Diag op de betreffende lijnkaart. Vervang de lijnkaart indien deze niet voldoet. Als meerdere lijnkaarten worden aangetast of de diag is fijn, vervang de stof.
TXECCERR/RXECCERR fout treedt op wanneer RxFIFO of TxFIFO onherstelbare ECC fout onderbreekt in MAC meer dan de drempelwaarde binnen het tijdsinterval. Onherstelbare ECC-fouten kunnen niet worden gecorrigeerd door de ECC-logica. Wanneer er een niet-terugwinnbare fout optreedt tijdens het lezen van RxFIFO, wordt het pakket waartoe de gegevens behoren, gemarkeerd met EOP/Abort op de SPI4-interface en weggegooid door de bovenste lagen.
Dit is te danken aan de hardware en wordt gecorrigeerd nadat we de SIP/SPA opnieuw hebben geladen. De permanente oplossing is de SIP/SPA te vervangen om de fouten te voorkomen.
Andere crashtypes komen veel minder vaak voor dan de twee bovengenoemde. In de meeste gevallen dient de diag opdracht aan te geven of de kaart al dan niet moet worden vervangen. Als de kaart de diagnostische test goed doorgeeft, denk dan aan het verbeteren van de software.
Als u nog steeds assistentie nodig hebt na het volgen van de bovenstaande stappen voor probleemoplossing en u een serviceaanvraag wilt openen (alleen geregistreerde klanten) bij de Cisco TAC, zorg er dan voor dat u de volgende informatie bevat: |
---|
Opmerking: Stel de router niet handmatig opnieuw in of op basis van een stroomcyclus voordat u de bovenstaande informatie verzamelt, tenzij dit nodig is om een Line Card-crash op de Cisco 12000 Series Internet-router te melden, omdat dit belangrijke informatie kan veroorzaken om verloren te gaan die nodig is voor het bepalen van de oorzaak van het probleem. |
Revisie | Publicatiedatum | Opmerkingen |
---|---|---|
1.0 |
23-Apr-2007 |
Eerste vrijgave |