De documentatie van dit product is waar mogelijk geschreven met inclusief taalgebruik. Inclusief taalgebruik wordt in deze documentatie gedefinieerd als taal die geen discriminatie op basis van leeftijd, handicap, gender, etniciteit, seksuele oriëntatie, sociaaleconomische status of combinaties hiervan weerspiegelt. In deze documentatie kunnen uitzonderingen voorkomen vanwege bewoordingen die in de gebruikersinterfaces van de productsoftware zijn gecodeerd, die op het taalgebruik in de RFP-documentatie zijn gebaseerd of die worden gebruikt in een product van een externe partij waarnaar wordt verwezen. Lees meer over hoe Cisco gebruikmaakt van inclusief taalgebruik.
Cisco heeft dit document vertaald via een combinatie van machine- en menselijke technologie om onze gebruikers wereldwijd ondersteuningscontent te bieden in hun eigen taal. Houd er rekening mee dat zelfs de beste machinevertaling niet net zo nauwkeurig is als die van een professionele vertaler. Cisco Systems, Inc. is niet aansprakelijk voor de nauwkeurigheid van deze vertalingen en raadt aan altijd het oorspronkelijke Engelstalige document (link) te raadplegen.
In dit document worden fouten met zachte en harde pariteiten beschreven, worden veelvoorkomende foutmeldingen uitgelegd en worden methoden aanbevolen die pariteitsfouten helpen voorkomen of minimaliseren.
Recente verbeteringen in hardware- en softwareontwerp verminderen ook pariteitsproblemen.
Wat is een processor- of geheugenpariteitsfout?
Pariteitscontrole is de opslag van een extra binair cijfer (bit) om de pariteit (oneven of even) van een kleine hoeveelheid computergegevens (meestal één byte) weer te geven terwijl die gegevens in het geheugen worden opgeslagen. De pariteitswaarde berekend uit de opgeslagen gegevens wordt vervolgens vergeleken met de uiteindelijke pariteitswaarde. Als deze twee waarden verschillen, duidt dit op een gegevensfout en moet ten minste één bit zijn gewijzigd vanwege gegevensbeschadiging.
Binnen een computersysteem kan elektrische of magnetische interferentie door interne of externe oorzaken ervoor zorgen dat een enkel stukje geheugen spontaan naar de tegenovergestelde toestand omslaat. Deze gebeurtenis maakt de oorspronkelijke gegevensbits ongeldig en staat bekend als een pariteitsfout.
Dergelijke geheugenfouten kunnen, als ze niet worden gedetecteerd, niet-detecteerbare en onbelangrijke resultaten hebben of permanente beschadiging van opgeslagen gegevens of een crash van een machine veroorzaken.
Er zijn veel oorzaken van geheugenpariteitsfouten, die worden geclassificeerd als zachte pariteitsfouten of harde pariteitsfouten.
De meeste pariteitsfouten worden veroorzaakt door elektrostatische of magnetische omgevingsomstandigheden.
De meeste single-event-fouten in geheugenchips worden veroorzaakt door achtergrondstraling (zoals neutronen van kosmische stralen), elektromagnetische interferentie (EMI) of elektrostatische ontlading (ESD). Deze gebeurtenissen kunnen willekeurig de elektrische toestand van een of meer geheugencellen veranderen, of kunnen interfereren met de circuits die worden gebruikt om geheugencellen te lezen en te schrijven.
Bekend als zachte pariteitsfouten, zijn deze gebeurtenissen meestal van voorbijgaande of willekeurige aard en treden ze meestal eenmaal op. Zachte fouten kunnen klein of ernstig zijn:
Softfouten worden niet veroorzaakt door hardwarestoringen; ze zijn voorbijgaand en zeldzaam, zijn meestal waarschijnlijk een SEU en worden veroorzaakt door een omgevingsverstoring van de geheugengegevens.
Als u zachte pariteitsfouten tegenkomt, analyseert u recente omgevingsveranderingen die zich hebben voorgedaan op de locatie van het getroffen systeem. Veelvoorkomende bronnen van ESD en EMI die soft parity-fouten kunnen veroorzaken, zijn onder meer:
Andere pariteitsfouten worden veroorzaakt door een fysieke storing van de geheugenhardware of door de circuits die worden gebruikt om geheugencellen te lezen en te schrijven.
Hardwarefabrikanten nemen uitgebreide maatregelen om hardwarefouten te voorkomen en te testen. Defecten zijn echter nog steeds mogelijk. Als een van de geheugencellen die worden gebruikt om gegevensbits op te slaan bijvoorbeeld misvormd is, kunnen ze geen lading vasthouden of kunnen ze kwetsbaarder zijn voor omgevingsomstandigheden.
Evenzo, terwijl het geheugen zelf normaal kan werken, kan elke fysieke of elektrische schade aan het circuit dat wordt gebruikt om geheugencellen te lezen en te schrijven ook ervoor zorgen dat gegevensbits tijdens de overdracht worden gewijzigd, wat resulteert in een pariteitsfout.
Bekend als hardpariteitsfouten, deze gebeurtenissen zijn meestal zeer frequent en herhaald en treden op wanneer het aangetaste geheugen of circuit wordt gebruikt. De exacte frequentie hangt af van de omvang van de storing en hoe vaak de beschadigde apparatuur wordt gebruikt.
Onthoud dat hardpariteitsfouten het gevolg zijn van een hardwarestoring en opnieuw optreden wanneer de betreffende component wordt gebruikt.
Als u hardpariteitsfouten tegenkomt, analyseert u fysieke veranderingen die zich hebben voorgedaan op de locatie van het getroffen systeem. Veel voorkomende oorzaken van hardwarestoringen die kunnen leiden tot hardpariteitsfouten zijn:
De Cisco IOS®-software biedt een verscheidenheid aan pariteitsfoutmeldingen, die variëren met het betreffende onderdeel en de relatieve impact op het systeem.
|
Cachefout gedetecteerd Echte cache fout gedetecteerd. Het systeem kan worden stopgezet. Fout: primaire instr-cache, velden: gegevens, Onnauwkeurige gegevenspariteitsfout |
|
|
verklaring |
Dit is het gevolg van een pariteitsfout in de Level 2 (L2) cache (static random-access memory, of SRAM) die wordt gebruikt door de routeprocessor (RP) of switch processor (SP) CPU van de Multilayer Switch Feature Card 3 (MSFC3). |
|
Aanbeveling |
Controleer het systeem regelmatig op herhaling. Als er geen verdere gebeurtenissen worden waargenomen, is dit een zachte fout. Als de fout vaak optreedt, vraagt u een RMA (Return Material Authorization) aan om de Supervisor Engine te vervangen en markeert u de module voor analyse van apparatuurstoringen (EFA). |
|
%SYSTEM_CONTROLLER-3-ERROR: Foutvoorwaarde gedetecteerd: SYSAD_PARITY_ERROR |
|
|
verklaring |
Dit is het gevolg van een pariteitsfout in het systeemadres (gegevensbus) dat wordt gebruikt door de In-Band Controller (IBC) van de MSFC3. |
|
Aanbeveling |
Controleer het systeem regelmatig op herhaling. Als er geen verdere gebeurtenissen worden waargenomen, is dit een zachte fout. Als de fout vaak optreedt, vraagt u een RMA aan om de Supervisor Engine te vervangen en markeert u de module voor EFA. |
|
%SYSTEM_CONTROLLER-3-ERROR: Foutconditie gedetecteerd: TM_DATA_PARITY_ERROR |
|
|
verklaring |
Dit is het gevolg van een pariteitsfout in de gegevens van de tabelbeheerder die worden gebruikt door de IBC van de MSFC3. |
|
Aanbeveling |
Controleer het systeem regelmatig op herhaling. Als er geen verdere gebeurtenissen worden waargenomen, is dit een zachte fout. Als de fout vaak optreedt, vraagt u een RMA aan om de Supervisor Engine te vervangen en markeert u de module voor EFA. |
|
%SYSTEM_CONTROLLER-3-FOUT: Foutconditie gedetecteerd: TM_NPP_PARITY_ERROR |
|
|
verklaring |
Dit is het resultaat van een pariteitsfout in de tabelmanager 'next page pointer' die wordt gebruikt door de IBC van de MSFC3. |
|
Aanbeveling |
Controleer het systeem regelmatig op herhaling. Als er geen verdere gebeurtenissen worden waargenomen, is dit een zachte fout. Als de fout vaak optreedt, vraag dan een RMA aan om de Supervisor Engine te vervangen en markeer de module voor EFA.In Cisco IOS-softwareversies tussen 12.1(8)E en 12.2(33)SXI3 was het standaardgedrag in reactie op SYSTEM_CONTROLLER-3-ERROR-gebeurtenissen het opnieuw instellen van de IBC en het registreren van een foutbericht.Deze corrigerende actie resulteerde echter in enkele gedocumenteerde gevallen waarin de IBC (en dus de CPU) niet langer gegevens kon verzenden of ontvangen. Het gedrag werd dus gewijzigd in Cisco IOS-softwareversies later dan 12.2(33)SXI4 om een foutmelding te registreren en het systeem opnieuw in te stellen; raadpleeg Cisco bug ID CSCtf51541. |
|
Uitzondering voor onderbrekingen, CPU-signaal 20, pc = 0x[dec] |
|
|
verklaring |
Dit is het gevolg van een fout in de pariteit van één bit in de CPU L2-cache (SRAM) die wordt gebruikt door de modules uit de Cisco Catalyst 6700-reeks. |
|
Aanbeveling |
Controleer het systeem regelmatig op herhaling. Als er geen verdere gebeurtenissen worden waargenomen, is dit een zachte fout. Als de fout vaak optreedt, vraagt u een RMA aan om de 6700-module te vervangen en markeert u de module voor EFA. In Cisco IOS-softwareversies eerder dan 12.2(33)SXI5 zou een softwarebug (Cisco bug ID CSCtj06411) zelfs single-bit pariteitsfouten veroorzaken om de 6700-module opnieuw in te stellen. Dit werd opgelost in Versies 12.2(33)SXI6 en 12.2(33)SXJ voor Supervisor Engine 720 en in Versie 15.0SY voor Supervisor Engine 2T. |
|
%SYSTEM_CONTROLLER-3-ERROR: Foutvoorwaarde gedetecteerd: SYSDRAM_PARITY_ERROR |
|
|
verklaring |
Dit is het gevolg van een niet-corrigeerbare pariteitsfout in de synchrone DRAM (SDRAM)-geheugenmodules (DIMM) die door de MSFC3 worden gebruikt. |
|
Aanbeveling |
Controleer het systeem regelmatig op herhaling. Als er geen verdere gebeurtenissen worden waargenomen, is dit een zachte fout. Als de fout zich vaak voordoet, moet u de DIMM reinigen en opnieuw instellen en doorgaan met controleren. Als de fout zich blijft voordoen, vraagt u een RMA aan om de DIMM te vervangen of te upgraden. |
|
%SYSTEM_CONTROLLER-3-COR_MEM_ERR: Correcteerbare DRAM-geheugenfout. Aantal [dec], log [hex] |
|
|
verklaring |
Dit is het gevolg van een correcteerbare pariteitsfout in het SDRAM (DIMM) dat door de MSFC3 wordt gebruikt. |
|
Aanbeveling |
Controleer het systeem regelmatig op herhaling. Als er geen verdere gebeurtenissen worden waargenomen, is dit een zachte fout. Als de fout zich vaak voordoet, moet u de DIMM reinigen en opnieuw instellen en doorgaan met controleren. Als de fout zich blijft voordoen, vraagt u een RMA aan om de DIMM te vervangen of te upgraden. |
|
%MWAM-DFC[dec]-0-CORRECTABLE_ECC_ERR: Er is een corrigeerbare ECC-fout opgetreden, A_BUS_L2_FOUTEN: 0x10000, A_BUS_MEMIO_FOUTEN: 0x0, A_SCD_BUS_ERR_STATUS: 0x80983000 |
|
|
verklaring |
Dit is het resultaat van een pariteitsfout met één bit in de DRAM die wordt gebruikt door modules uit de 6700-reeks. |
|
Aanbeveling |
Controleer het systeem regelmatig op herhaling. Als er geen verdere gebeurtenissen worden waargenomen, is dit een zachte fout. Als de fout zich vaak voordoet, moet u de DIMM reinigen en opnieuw instellen en doorgaan met controleren. Als de fout zich blijft voordoen, vraagt u een RMA aan om de DIMM te vervangen of te upgraden. |
|
%PM_SCP-SP-2-LCP_FW_ERR_INFORM: Module [dec] heeft deze fout: LTL Parity error gedetecteerd op Coil #[dec]. |
|
|
verklaring |
Dit is het gevolg van een pariteitsfout in het SRAM dat wordt gebruikt door de Cisco Catalyst 6100- en Cisco Catalyst 6300-reeks modules. |
|
Aanbeveling |
Controleer het systeem regelmatig op herhaling. Als er geen verdere gebeurtenissen worden waargenomen, is dit een zachte fout. Als de fout vaak optreedt, vraagt u een RMA aan om de 6100- of 6300-module te vervangen en markeert u de module voor EFA. |
|
%SYS-4-SYS_LCPERR4: Module [dec]: fout LTL-pariteit gedetecteerd op coil #[dec] |
|
|
verklaring |
Dit is het gevolg van een pariteitsfout in het SRAM dat wordt gebruikt door de modules uit de 6100- en 6300-reeks. |
|
Aanbeveling |
Controleer het systeem regelmatig op herhaling. Als er geen verdere gebeurtenissen worden waargenomen, is dit een zachte fout. Als de fout vaak optreedt, vraagt u een RMA aan om de 6100- of 6300-module te vervangen en markeert u de module voor EFA. |
|
%PM_SCP-SP-2-LCP_FW_ERR_INFORM: Module [dec] heeft deze fout: Poort-ASIC ([naam])-pakketbufferfout gedetecteerd op poorten [dec] |
|
|
verklaring |
Dit is het gevolg van een pariteitsfout in de poort-ASIC-pakketbuffer (SRAM) die wordt gebruikt door de Ethernet-modules uit de Cisco Catalyst 6148A-reeks. |
|
Aanbeveling |
Controleer het systeem regelmatig op herhaling. Als er geen verdere gebeurtenissen worden waargenomen, is dit een zachte fout. Als de fout vaak optreedt, vraagt u een RMA aan om de 6148A-module te vervangen en markeert u de module voor EFA. |
|
%LTL-SP-2-LTL_PARITY_CHECK: LTL-pariteitscontroleverzoek voor 0x[hex] |
|
|
verklaring |
Dit is het resultaat van een pariteitsfout in de poort ASIC-poortindextabel (SRAM) die wordt gebruikt door de Catalyst 6100-6500- en 6700-reeksmodules. |
|
Aanbeveling |
Controleer het systeem regelmatig op herhaling. Als er geen verdere gebeurtenissen worden waargenomen, is dit een zachte fout. Als de fout vaak optreedt, vraagt u een RMA aan om de module te vervangen en markeert u de module voor EFA. |
Raadpleeg deze documenten van Cisco IOS-software voor een uitgebreide lijst met foutmeldingen:
De Output Interpreter Tool (alleen voor geregistreerde klanten) ondersteunt bepaalde opdrachten met show. Gebruik de Output Interpreter Tool om een analyse te bekijken van de output van de opdracht show.
Onderzoek naar pariteitsfouten is aan de gang en niet elk scenario kan worden aangepakt, maar de Cisco Catalyst 6500 hardware- en softwareontwikkelingsorganisaties blijven nieuwe manieren introduceren, zoals foutcorrigerende codebescherming (ECC), om het optreden van pariteitsfouten te minimaliseren en te beperken.
Hoewel dit document begon met de bespreking van de derde generatie (WS-XSUP720 en vroege 6700-serie) van Catalyst 6500-producten, vat dit gedeelte verbeteringen samen die zijn geïntroduceerd met de vierde generatie (VS-S720-10G en later 6700-serie) en de vijfde generatie (VS-SUP2T-10G en 6900-serie).
De VS-S720-10G-module beschikt over een nieuwer MSFC3-dochterbord, met een nieuwe IBC en bijgewerkte SR7010A RP- en SP-CPU's met verminderde instructieset die elk op 600 Mhz werken. De caches van niveau 1 (L1), L2 en niveau 3 (L3) kunnen pariteitsdetectie uitvoeren. De nieuwere IBC heeft alle functionaliteit van de eerdere generatie en voegt ECC-bescherming (single-bit correctie, multi-bit detectie) toe aan de aangesloten SRAM's.
De modules uit de 6700-reeks ondersteunen een CPU met ECC-beveiligde L2-cache (L1-cache is geschikt voor pariteitsdetectie), die pariteitsfouten met één bit kan corrigeren zonder dat deze opnieuw hoeven te worden ingesteld. Vanwege de Cisco-bug-ID CSCsz39222, reset versie 12.2SXI van de Cisco IOS-software (Supervisor Engine 720) de module echter toch als er een fout optreedt in de pariteit van de CPU-cache van één bit. Dit wordt opgelost in de versies 12.2SXJ (Supervisor Engine 720) en 15.0SY (Supervisor Engine 2T) van de Cisco IOS-software.
De VS-SUP2T-10G beschikt over een nieuw MSFC5-dochterbord met een geïntegreerde IBC en een nieuwe single-core MPC8572 PPC RP CPU (met ECC-beveiligde L2- en L3-cache, L1-cache is geschikt voor pariteitsdetectie) die werkt met 1,5 GHz per core. Het beschikt ook over een nieuwe, aparte, out-of-band Connectivity Management Processor (CMP) CPU en ECC-beveiligde DRAM, die beschikbaar is, zelfs als de RP CPU momenteel niet beschikbaar is.
De nieuwe IBC heeft alle functionaliteit van eerdere generaties en ondersteunt ECC-bescherming voor de aangesloten SRAM's en verbeteringen in pariteitsfoutafhandeling. De nieuwe MSFC5 beschikt ook over een OBFL-ROM (Onboard Failure Logging), waarin alle gebeurtenissen voor het initialiseren en diagnosticeren van modules zijn opgeslagen. Het nieuwe ontwerp met één CPU vermindert ook de statistische kans op pariteitsfouten.
De modules uit de 6900-reeks ondersteunen een nieuwere CPU met ECC-beveiligde L1- en L2-cache, die pariteitsfouten met één bit kan corrigeren zonder dat deze opnieuw hoeven te worden ingesteld. De nieuwe generatie ondersteunt dezelfde IBC en de software voor de correctie van de pariteit van één bit is geïntegreerd.
De VS-S720-10G met MSFC3 is uitgerust met SDRAM met dubbele gegevenssnelheid (DDR) en ECC-bescherming, die werkt op 266 Mhz.
De modules uit de 6700-reeks ondersteunen DDR SDRAM met ECC-bescherming en werken op 266 MHz.
In vergelijking met Single Data Rate (SDR) SDRAM maakt de DDR SDRAM-interface hogere overdrachtssnelheden mogelijk door een striktere controle van de timing van de elektrische gegevens en kloksignalen. De DDR-interface maakt gebruik van dubbel pompen (gegevensoverdracht aan zowel de stijgende als dalende randen van het kloksignaal) om de klokfrequentie te verlagen. Een lagere klokfrequentie vermindert de vereisten voor signaalintegriteit op de printplaat die het geheugen op de controller aansluit.
De VS-SUP2T-10G met MSFC5 is uitgerust met DDR3 SDRAM met ECC-bescherming en werkt op 667 Mhz.
De modules uit de 6900-reeks ondersteunen DDR3 SDRAM met ECC-bescherming en werken op 667 MHz.
Het primaire voordeel van DDR3 SDRAM ten opzichte van zijn directe voorgangers (DDR2 en DDR) is de mogelijkheid om gegevens tweemaal zo snel over te dragen (acht keer de snelheid van zijn interne geheugenarrays), waardoor hogere bandbreedte- of piekdatasnelheden mogelijk zijn. DDR3-geheugen vermindert ook het stroomverbruik met 30%, hoewel het dezelfde standaard voor elektrische signalen gebruikt als DDR en DDR2.
De VS-S720-10G met PFC3C beschikt over SRAM-pakketbuffers met ECC-bescherming. Dit zorgt voor foutcorrectie met één bit pariteit zonder module reset, evenals voor foutdetectie met meerdere bits pariteit.
De 6700-reeks met DFC3C is uitgerust met SRAM-pakketbuffers met ECC-bescherming. Dit zorgt voor foutcorrectie met één bit pariteit zonder module reset, evenals voor foutdetectie met meerdere bits pariteit.
De VS-SUP2T-10G met PFC4 beschikt over SRAM-pakketbuffers met ECC-bescherming. Dit zorgt voor foutcorrectie met één bit pariteit zonder module reset, evenals voor foutdetectie met meerdere bits pariteit.
De 6900-serie met DFC4 beschikt over SRAM-pakketbuffers met ECC-bescherming. Dit zorgt voor foutcorrectie met één bit pariteit zonder module reset, evenals voor foutdetectie met meerdere bits pariteit.
De Cisco IOS-software is ontworpen om ECC-bescherming te ondersteunen. Als een hardwarecomponent die ECC-beveiliging ondersteunt een SEU ondervindt, kan de code de beschadigde gegevens corrigeren of de betreffende component opnieuw instellen en hoeft de betreffende module niet volledig te worden gereset.
In eerdere versies van Cisco IOS-software zijn er echter een paar uitzonderingen waarbij het gedrag opzettelijk is gewijzigd of storingen als gevolg van een softwarebug. Hier zijn twee opmerkelijke uitzonderingen.
In Cisco IOS-softwareversies tussen 12.1(8)E en 12.2(33)SXI3 was het standaardgedrag in reactie op SEU SYSTEM_CONTROLLER-3-ERROR-gebeurtenissen het opnieuw instellen van de IBC en het registreren van een foutbericht. Deze corrigerende maatregel leidde er echter toe dat sommige gedocumenteerde gevallen van de IBC (en dus de CPU) niet langer gegevens konden verzenden of ontvangen.
Het gedrag werd dus gewijzigd na versie 12.2(33)SXI4 (Cisco bug ID CSCtf51541) om een foutmelding te registreren en het systeem opnieuw in te stellen. Hoewel deze reactie ernstiger kan lijken, is het beter om het systeem te resetten en de geheugenstructuur te corrigeren dan om een niet-reagerend systeem te hebben.
Een functie die nu in ontwikkeling is (Cisco bug ID CSCtr89859) voegt een nieuwe opdracht voor de opdrachtregelinterface (CLI) toe waarmee u het standaardgedrag kunt switches. Deze verbetering is het meest van toepassing op systemen die gebruikmaken van één toezichthouder en dus geen toezichthouder hebben.
In Cisco IOS-softwareversies eerder dan 12.2(33)SXI5 zou een softwarebug (Cisco-bug ID CSCtj06411) zelfs pariteitsfouten met één bit veroorzaken om de 6700-module opnieuw in te stellen. Dit zou normaal gesproken een corrigeerbare pariteitsfout zijn en niet vereisen dat de module opnieuw wordt ingesteld.
Deze bug werd opgelost in Versies 12.2(33)SXI6+ en 12.2SXJ voor Supervisor Engine 720 en in Versie 15.0SY voor Supervisor Engine 2T. Na een upgrade naar de juiste versie registreert de 6700-module eenvoudig een foutmelding en blijft deze werken.
Op dit punt hebt u waarschijnlijk bepaald of u een zachte of harde pariteitsfout bent tegengekomen. Hoewel dit een enkel incident kan aanpakken, kunnen andere pariteitsfoutkwetsbaarheden nog steeds bestaan, zodat u een meer uitgebreide benadering van uw hele netwerk kunt volgen.
Cisco en de Catalyst 6500 business unit raden u daarom aan deze mitigatieprocedures te herzien en passende corrigerende maatregelen te nemen om toekomstige pariteitsfouten te elimineren of te verminderen.
Single event (soft) pariteitsfouten worden veroorzaakt door omgevingsomstandigheden en kunnen slechts één keer (SEU) of zeer zelden voorkomen, zoals maandelijks of jaarlijks. Hoewel u de hardware niet hoeft te vervangen, wilt u toekomstige gebeurtenissen beperken.
Deze best practices verminderen de kans op fouten met zachte pariteit aanzienlijk.
Cisco raadt u aan een milieu-audit uit te voeren van uw getroffen netwerklocaties. U kunt deze controle zelf uitvoeren of in coördinatie met een Cisco-vertegenwoordiger, met een Cisco-team (zoals Cisco Advanced Services) of via een externe consultant.
De exacte dekking en complexiteit van een milieuaudit hangt af van veel verschillende variabelen, zoals geografische locatie, gebouw- en kamergrootte en ontwerp, elektrisch ontwerp en lay-out en andere gerelateerde factoren.
Overweeg welke milieubronnen van ESD en EMI in of rond uw netwerk kunnen bestaan. Dit zijn veel voorkomende bronnen van interferentie die kunnen leiden tot een zachte pariteitsfout:
SEU's kunnen optreden als stroomverdelers, stroomgeneratoren of verlichtingssystemen te dicht bij het chassis staan of als er meerdere stroomkabels op of naast het chassis zijn.
Het is belangrijk dat er voldoende afstand is tussen het Catalyst 6500-chassis en deze elektrische en magnetische bronnen. De aanbevolen afstanden verschillen per onderdeel en zijn beschikbaar in de gegevensbladen van de onderdelen.
Over het algemeen raadt Cisco aan om systemen op ten minste drie tot zes centimeter van gemeenschappelijke bronnen van elektrische en magnetische interferentie te lokaliseren. Stroomkabels kunnen, waar mogelijk, naar beneden en weg van het chassis worden geleid en kunnen niet in strak verpakte bundels of in grote aantallen over of naast het chassis worden gelegd.
Stroomfluctuaties en stroompieken komen relatief vaak voor en Catalyst 6500-voedingen zijn ontworpen om kleine variaties in spanningsstroom op te vangen.
Het is echter van cruciaal belang dat het chassis en het rack goed worden geaard, zodat eventuele overtollige elektrische spanning van het systeem wordt weggetrokken. Zonder de juiste aarding kunnen stroompieken leiden tot schade of storingen in verschillende ASIC's en geheugencomponenten. Raadpleeg de Installatiehandleiding voor de Switch van de Catalyst 6500-reeks, De Switch installeren, De systeemaarde instellen, voor meer informatie.
ESD kan gemakkelijk kritieke componenten beschadigen zonder zichtbare beschadiging. Passende preventieve maatregelen kunnen worden opgenomen in het beleid voor laboratoriumoperaties, maar dergelijke maatregelen worden vaak en helaas genegeerd vanwege de ervaring en het beperkte toezicht.
Cisco raadt aan dat het beheer van uw laboratoriumactiviteiten, samen met Cisco Systems, een milieu-audit uitvoert van alle netwerkgebieden of, op zijn minst, van alle gebieden waar hardwarefouten zijn opgetreden of die zijn aangemerkt als bedrijfskritiek. Zodra de audit is voltooid, raadt Cisco u aan een gestandaardiseerde milieuchecklist te implementeren voor alle nieuw geïnstalleerde systemen om toekomstige SEU-pariteitsgebeurtenissen te voorkomen.
Catalyst-hardwarecomponenten gebruiken firmware (ook bekend als Rommon-code) om diagnoses te initialiseren, te communiceren en uit te voeren. Zodra deze functies zijn voltooid, wordt de systeemwerking overgedragen aan de Cisco IOS-software. Het is ongebruikelijk om problemen met firmware te ervaren, maar er kunnen problemen optreden als u verschillende versies van firmwarecode gebruikt voor de supervisors en de modules.
Het is dus een best practice om ervoor te zorgen dat alle componenten de nieuwste firmwarecode gebruiken om de juiste moduleinitialisatie en communicatie te garanderen. Cisco raadt uw bedrijfsvoering aan om een netwerkaudit uit te voeren en alle hardwarecomponenten te upgraden met de nieuwste firmwareversie.
Bekende firmwareproblemen en upgradeprocedures zijn gedocumenteerd in:
Download de nieuwste firmwareversies van de Cisco-website:
Alle modulaire netwerksystemen zijn ontworpen om in een backplane van het chassis te worden geplaatst met een set fysieke interfacepinnen. De backplane van het chassis zelf is in wezen een reeks onderling verbonden draden. De pinnen in elke chassissleuf vormen de fysieke gegevensverbinding tussen de Supervisor- en Ethernet-modules. Een goede plaatsing en uitlijning van deze pinnen is dus van cruciaal belang.
De Catalyst 6500 biedt geleiderails en uitlijningspinnen die helpen bij de installatie in het chassis. De sleufpennen (sockets) en moduleconnectoren zijn ontworpen om gemakkelijk elektrische connectiviteit met hoge bandbreedte aan te sluiten en te bieden. Eenmaal in het chassis geplaatst, zijn er duimschroeven aan beide zijden van de module die de backplane-pinnen volledig activeren. Raadpleeg de installatienota voor de Catalyst 6500 Series Switch Module.
Als een module correct in de sleuf is geplaatst en de duimschroeven correct zijn aangedraaid, worden er geen communicatieproblemen verwacht. Er kunnen echter verschillende aandoeningen optreden bij het dagelijks inbrengen van modules die kunnen leiden tot onjuiste of zelfs onvolledige pinplaatsing:
Cisco raadt u aan een bedrijfsbeheerproces te implementeren dat het gebruik van de duimschroeven op alle Catalyst 6500-modules in productieomgevingen verplicht stelt. Dit zorgt voor een goede en volledige invoeging en uitlijning van backplane-pinnen en voorkomt toekomstige storingen als gevolg van bitfouten en gerelateerde communicatiefouten.
Frequente of herhaalbare (harde) pariteitsfouten worden veroorzaakt door een fysieke storing van het geheugen of de circuits die worden gebruikt om te lezen en te schrijven. Vervang in dergelijke gevallen de hardware en vraag het Cisco Technical Assistance Center (TAC) of uw Cisco Systems Engineer om een EFA uit te voeren op de geretourneerde hardware.
Deze best practices verminderen de kans op hardpariteitsfouten aanzienlijk.
Cisco raadt u aan een netwerkaudit uit te voeren van de getroffen netwerklocaties. U kunt deze controle zelf uitvoeren of in coördinatie met een Cisco-vertegenwoordiger, met een Cisco-team (zoals Cisco Advanced Services) of via een externe consultant.
Alle hardware (van alle leveranciers) is onderhevig aan de uiteindelijke verslechtering van de fysieke integriteit en het is belangrijk om de levenscyclus van alle hardwarecomponenten in uw netwerk bij te houden om de kans op componentfouten in de loop van de tijd volledig te begrijpen.
De betrouwbaarheid van de hardware kan worden gemeten aan de hand van het MTBF-framework (Mean Time Between Failure). Aangezien MTBF slechts een statistisch gemiddelde is, betekent dit niet dat een storing definitief kan optreden aan het einde van de MTBF-tijdsperiode. De kans op en kwetsbaarheid van componentfouten neemt echter toe, zodat dergelijke hardware kan worden gemarkeerd voor vernieuwing. Raadpleeg de Cisco Catalyst 6500 Series Switches Data Sheets voor specifieke MTBF-waarden voor elk Catalyst 6500-product.
De geaggregeerde berekende Catalyst 6500 MTBF-waarde op systeemniveau is > 7 jaar.
Naast het MTBF-raamwerk biedt Cisco ook een end-of-life (EOL) raamwerk, dat de verwachte levenscyclus van een bepaald product definieert en toepasselijke aankondigingen biedt om u te helpen uw bestaande apparatuur te vernieuwen. Raadpleeg de Einde-levenscyclus- en Einde-verkoopberichten voor verschillende oudere Catalyst 6500-producten.
Als gevolg van deze hardwareaudit raadt Cisco u aan uw eigen MTBF- en EOL-proces te implementeren dat hardware identificeert en bijhoudt voor mogelijke vernieuwing. Dit zorgt ervoor dat de nieuwste hardware wordt uitgevoerd en minimaliseert de kans op hardwarestoringen.
De Catalyst 6500-reeks en Cisco IOS-software bieden Generic Online Diagnostics (GOLD) en Health Monitoring (HM)-diagnostiek voor alle hardwarecomponenten die in het systeem worden gebruikt. De twee basistypen diagnostiek die kunnen worden ingeschakeld, zijn on-demand en opstarten. Raadpleeg Generic Online Diagnostics op de Cisco Catalyst 6500 Series-Switch voor meer informatie.
Cisco raadt aan om voor alle hardwarecomponenten een volledige opstartdiagnostiek in te schakelen om ervoor te zorgen dat alle diagnostische tests worden uitgevoerd en om te bevestigen dat alle hardwarecomponenten functioneren zoals verwacht bij het opstarten.
Cisco raadt u ook aan om op dagelijkse of wekelijkse basis regelmatige diagnoses van kritieke infrastructuurcomponenten te plannen. Naast de opstartdiagnostiek die alleen tijdens de initialisatie optreedt, zorgen de diagnostiek op aanvraag ervoor dat de hardware blijft werken zoals verwacht. Raadpleeg Catalyst 6500 Release 12.2SX Software Configuration Guide, Interface and Hardware Components, Online Diagnostics voor meer informatie.
Naast de standaard diagnostische tests op aanvraag, raadt Cisco u aan deze diagnostische tests op aanvraag in te schakelen om proactief geheugencomponenten te identificeren die defect kunnen raken:
| Revisie | Publicatiedatum | Opmerkingen |
|---|---|---|
2.0 |
15-Nov-2023
|
Bijgewerkte titel, inleiding, SEO, machinevertaling, stijlvereisten, brandingvereisten, spelling en opmaak. |
1.0 |
26-Apr-2013
|
Eerste vrijgave |
Feedback