De documentatie van dit product is waar mogelijk geschreven met inclusief taalgebruik. Inclusief taalgebruik wordt in deze documentatie gedefinieerd als taal die geen discriminatie op basis van leeftijd, handicap, gender, etniciteit, seksuele oriëntatie, sociaaleconomische status of combinaties hiervan weerspiegelt. In deze documentatie kunnen uitzonderingen voorkomen vanwege bewoordingen die in de gebruikersinterfaces van de productsoftware zijn gecodeerd, die op het taalgebruik in de RFP-documentatie zijn gebaseerd of die worden gebruikt in een product van een externe partij waarnaar wordt verwezen. Lees meer over hoe Cisco gebruikmaakt van inclusief taalgebruik.
Cisco heeft dit document vertaald via een combinatie van machine- en menselijke technologie om onze gebruikers wereldwijd ondersteuningscontent te bieden in hun eigen taal. Houd er rekening mee dat zelfs de beste machinevertaling niet net zo nauwkeurig is als die van een professionele vertaler. Cisco Systems, Inc. is niet aansprakelijk voor de nauwkeurigheid van deze vertalingen en raadt aan altijd het oorspronkelijke Engelstalige document (link) te raadplegen.
Dit document legt uit wat pariteitsfouten op Cisco-routers veroorzaakt en hoe u deze problemen kunt oplossen.
Cisco raadt u aan om kennis te hebben van hoe u routercrashes kunt oplossen.
Raadpleeg Routercrashes voor probleemoplossing voor meer informatie.
Dit document is niet beperkt tot specifieke software- en hardware-versies.
De informatie in dit document is gebaseerd op de apparaten in een specifieke laboratoriumomgeving. Alle apparaten die in dit document worden beschreven, hadden een opgeschoonde (standaard)configuratie. Als uw netwerk live is, moet u de potentiële impact van elke opdracht begrijpen.
Geheugenpariteitsfouten doen zich voor in MIPS-processorproducten (Multi-Channel Interface Processor), zoals:
Cisco 4500/4700 Series routers
Cisco 7500 Series routers (RSP1, RSP2, RSP4, RSP8, VIP2-10, VIP2-15, VIP2-20, VIP2-40, VIP2-50)
Cisco 7000 Series routers (RSP 7000)
Cisco 7200 Series routers (NPE-100, NPE-150, NPE-175, NPE-200, NPE-225, NPE-300)
Cisco 12000 Series internet-router
Hier zijn een paar berichten die allemaal te maken hebben met de detectie van slechte pariteit ergens in het systeem (de lijst is niet uitputtend, maar bevat de meest voorkomende berichten):
In de opdrachtoutput van de show versie:
System restarted by processor memory parity error at PC 0x6014F7C0, address 0x0
of
System restarted by shared memory parity error at PC 0x60130F40
Als u de uitvoer hebt van een opdracht show versie van uw Cisco-apparaat, kunt u Cisco CLI Analyzer gebruiken om potentiële problemen en oplossingen weer te geven. Om Cisco CLI Analyzer te gebruiken, moet u een geregistreerde klant zijn, inloggen zijn en JavaScript hebben ingeschakeld.
In de console logt of in de crashinfo-bestanden:
- *** Cache Error Exception *** Cache Err Reg = 0xa401a65a data reference, primary cache, data field error , error on SysAD Bus PC = 0xbfc17950, Cause = 0x0, Status Reg = 0x3040d007 - Error: primary data cache, fields: data, virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000 virtual address corresponds to main:data, cache word 0 Low Data High Data Par Low Data High Data Par L1 Data : 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8 Low Data High Data Par Low Data High Data Par Mem Data : 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8 - *** Shared Memory Parity Error *** shared memory control register= 0xffe3 error(s) reported for: CPU on byte(s): 0/1 - %PAR-1-FATAL: Shared memory parity error shared memory status register= 0xFFEF error(s) reported for: CPU on byte(s): 0/1 2/3 - %RSP-3-ERROR: MD error 0000008000000200 %RSP-3-ERROR: QA parity error (bytes 0:3) 02 %RSP-3-ERROR: MEMD parity error condition %RSP-2-QAERROR: reused or zero link error, write at addr 0100 (QA) log 22010000, data 00000000 00000000 %RSP-3-RESTART: cbus complex - %RSP-3-ERROR: CyBus error 01 %RSP-3-ERROR: read data parity %RSP-3-ERROR: read parity error (bytes 0:7) 20 %RSP-3-ERROR: physical address (bits 20:15) 000000 - %RSP-3-ERROR: MD error 00800080C000C000 %RSP-3-ERROR: SRAM parity error (bytes 0:7) F0 %RSP-3-RESTART: cbus complex
Er zijn twee soorten pariteitsfouten:
Zachte pariteitsfouten
Deze fouten doen zich voor wanneer een energieniveau binnen de chip (bijvoorbeeld een één of een nul) verandert. Wanneer de CPU hierop is gericht, veroorzaken dergelijke fouten het systeem een storing (als de fout zich in een gebied bevindt dat niet kan worden hersteld) of bij het herstellen van andere systemen (bijvoorbeeld wanneer een CyBus-complex opnieuw start wanneer de fout in het pakketgeheugen (MEMD) was). In geval van een "soft parity"-fout is het niet nodig de raad van bestuur of een van de componenten te ruilen. Zie het gedeelte Gerelateerde informatie voor meer informatie over fouten van zachte pariteit.
Harde paringsfouten
Deze fouten doen zich voor wanneer er een chip of bord is die gegevens corrumpeert. In dit geval moet je opnieuw gaan zitten of de aangedane component vervangen, wat meestal een geheugenchip-ruil of een board-swap is. Er is een harde pariteitsfout wanneer meerdere pariteitsfouten op hetzelfde adres voorkomen. Er zijn ingewikkelder zaken die moeilijker te identificeren zijn. In het algemeen, als u meer dan één pariteitsfout in een bepaald geheugengebied in een relatief korte periode ziet, kunt u dit als een harde pariteitsfout beschouwen.
Studies hebben aangetoond dat fouten van zachte pariteit 10 tot 100 keer frequenter zijn dan harde pariteitsfouten. Daarom raadt Cisco u sterk aan om op een tweede pariteitsfout te wachten voordat u iets vervangt. Dit vermindert enorm de impact op uw netwerk.
Een router heeft geheugen op verschillende locaties. Theoretisch kan elke geheugenlocatie worden beïnvloed door de pariteitsfout, maar de meeste geheugenproblemen doen zich voor in dynamisch RAM (DRAM) of gedeeld RAM (SRAM). Gebaseerd op het platform is hier hoe je kunt ontdekken welke geheugenlocatie is beïnvloed en, als het een harde pariteitsfout blijkt te zijn, welk deel je moet vervangen:
Op de Cisco 4500- en 4700-platforms is het crashinformatie-bestand niet beschikbaar in versies eerder dan Cisco IOS® softwarerelease 12.2(10)T en 12.2(10)T.
Eén manier om te weten te komen waar de fout optrad is de "reden voor het opnieuw opstarten" in de console-logbestanden te bekijken en in de uitvoer van de opdracht van de show-versie:
Pariteitsfout in DRAM:
Als u de router na de crash niet handmatig opnieuw hebt geladen, ziet de uitvoer van de show versie er zo uit:
System restarted by processor memory parity error at PC 0x601799C4, address 0x0 System image file is "flash:c4500-inr-mz.111-14.bin", booted via flash
Als er een crashinfo-bestand beschikbaar is of als er consolloglogs zijn opgenomen, dan kunt u ook zoiets zien:
*** Cache Error Exception *** Cache Err Reg = 0xa0255c61 data reference, primary cache, data field error , error on SysAD Bus PC = 0xbfc0edc0, Cause = 0xb800, Status Reg = 0x34408007
Herhaaldelijk optreden van pariteitsfouten in de DRAM geeft aan dat de DRAM of het chassis defect is. Als u onlangs het chassis heeft verwijderd of als u hardwareconfiguratie heeft gewijzigd, plaats de DRAM-chips opnieuw om het probleem op te lossen. Vervang de DRAM anders als eerste stap. Dit moet pariteitsfouten voorkomen. Als de router nog steeds crasht, vervangt u het chassis.
Pariteitsfout in SRAM:
Als u de router na de crash niet handmatig opnieuw hebt geladen, ziet de opdrachtoutput van de show versie er zo uit:
System restarted by shared memory parity error at PC 0x60130F40 System image file is "flash:c4500-inr-mz.111-14.bin", booted via flash
Als er een crashinfo-bestand beschikbaar is of als er consolloglogs zijn opgenomen, dan kunt u ook zoiets zien:
*** Shared Memory Parity Error *** shared memory control register= 0xffe3 error(s) reported for: CPU on byte(s): 0/1
of
%PAR-1-FATAL: Shared memory parity error shared memory status register= 0xFFEF error(s) reported for: CPU on byte(s): 0/1 2/3
of
*** Shared Memory Parity Error *** shared memory control register= 0xffdf error(s) reported for: NIM1 on byte(s): 0/1 2/3
Opmerking:
Als de fout voor de CPU is gerapporteerd, vervangt u het schema.
Als de fout is gerapporteerd voor NIM(x), vervang de netwerkmodule in sleuf (x). Ook het aan sleuf (x) toegewezen SRAM kan worden beïnvloed. Vervang in dit geval de SRAM.
Herhaalde pariteitsfouten in SRAM wijzen op defecte SRAM-chips of op een gebrekkige netwerkmodule met een slechte pariteit in SRAM. Als u het chassis onlangs heeft verwijderd, of als u de hardwareconfiguratie heeft gewijzigd, plaats dan de netwerkmodules en de SRAM-chips opnieuw om het probleem op te lossen. Controleer anders waar de fout in de console-logbestanden wordt gemeld (zie het uitvoervoorbeeld hierboven).
Zoals met Cisco 4000 Series kan het probleem worden veroorzaakt door defecte DRAM of SRAM voor deze platforms. Het probleem kan ook worden veroorzaakt door een gebrekkige processorkaart (RP, RSP of NPE). Cisco 7000 en 7500 kunnen ook pariteitsfouten rapporteren die door een defecte of slecht ingestelde interfaceprocessor (legacy xIP of VIP) zijn gegenereerd.
Controleer het crashinfo-bestand en de console logt voor een van deze foutmeldingen:
Voor de RP, RSP en NPE zie je meestal iets als dit:
Error: primary data cache, fields: data, (SysAD) virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000 virtual address corresponds to main:data, cache word 0
of gewoon:
Error: primary data cache, fields: data, SysAD phy21:3 0x201880, va14:12 0x1000, addr 63E01880
Dit duidt op een probleem op de RSP zelf. Als het probleem maar één keer optreedt, is het zeer waarschijnlijk een probleem van voorbijgaande aard.
Voor RSP kan het bericht er als volgt uitzien:
%RSP-3-ERROR: MD error 0000008000000200 %RSP-3-ERROR: QA parity error (bytes 0:3) 02 %RSP-3-ERROR: MEMD parity error condition %RSP-2-QAERROR: reused or zero link error, write at addr 0100 (QA) log 22010000, data 00000000 00000000 %RSP-3-RESTART: cbus complex
of
%RSP-3-ERROR: CyBus error 01 %RSP-3-ERROR: read data parity %RSP-3-ERROR: read parity error (bytes 0:7) 20 %RSP-3-ERROR: physical address (bits 20:15) 000000
Als er geen indicatie is van een andere interfaceprocessor die slechte pariteit in SRAM schrijft (bijvoorbeeld VIP2-1-MSG foutmeldingen) is de meest waarschijnlijke reden voor de pariteitsfout het SRAM zelf. In dit geval, vervang de RSP.
Als andere foutmeldingen erop wijzen dat een interfaceprocessor slechte pariteit schrijft, kan het een foute of slecht ingestelde kaart zijn.
Als u %VIP2-1-MSG ontvangt: In de sleuven(x) in de logbestanden of in het crashinformatie-bestand wordt verwezen naar VIP-crashes voor probleemoplossing.
Wanneer een pariteitsfout optreedt, is het niet mogelijk een onderscheid te maken tussen een zachte of harde pariteitsfout. Vanuit ervaring zijn de meeste parity voorkomen 'soft parity'-fouten, en je kunt ze meestal afwijzen. Als u onlangs wat hardware hebt veranderd of het vakje heeft verplaatst, probeer dan het getroffen onderdeel opnieuw te plaatsen (DRAM, SRAM, NPE, RP, RSP of VIP). Frequente meerdere pariteitsvoorvallen betekenen defecte hardware. Vervang het getroffen gedeelte (DRAM, RSP, VIP of moederbord) door de instructies in dit document.
Als u nog steeds assistentie nodig hebt nadat u de bovenstaande stappen voor het oplossen van problemen hebt gevolgd en een serviceaanvraag bij de Cisco TAC wilt openen, zorg er dan voor dat u deze informatie bevat: |
---|
N.B.: Pas de router niet handmatig opnieuw op of aan het elektriciteitsnet voordat u de bovenstaande informatie verzamelt, tenzij dit nodig is om een fout in de processorgeheugenpariteit op te lossen, omdat dit belangrijke informatie kan doen verloren gaan die nodig is om de oorzaak van het probleem vast te stellen. |