In dem Dokumentationssatz für dieses Produkt wird die Verwendung inklusiver Sprache angestrebt. Für die Zwecke dieses Dokumentationssatzes wird Sprache als „inklusiv“ verstanden, wenn sie keine Diskriminierung aufgrund von Alter, körperlicher und/oder geistiger Behinderung, Geschlechtszugehörigkeit und -identität, ethnischer Identität, sexueller Orientierung, sozioökonomischem Status und Intersektionalität impliziert. Dennoch können in der Dokumentation stilistische Abweichungen von diesem Bemühen auftreten, wenn Text verwendet wird, der in Benutzeroberflächen der Produktsoftware fest codiert ist, auf RFP-Dokumentation basiert oder von einem genannten Drittanbieterprodukt verwendet wird. Hier erfahren Sie mehr darüber, wie Cisco inklusive Sprache verwendet.
Cisco hat dieses Dokument maschinell übersetzen und von einem menschlichen Übersetzer editieren und korrigieren lassen, um unseren Benutzern auf der ganzen Welt Support-Inhalte in ihrer eigenen Sprache zu bieten. Bitte beachten Sie, dass selbst die beste maschinelle Übersetzung nicht so genau ist wie eine von einem professionellen Übersetzer angefertigte. Cisco Systems, Inc. übernimmt keine Haftung für die Richtigkeit dieser Übersetzungen und empfiehlt, immer das englische Originaldokument (siehe bereitgestellter Link) heranzuziehen.
In diesem Dokument werden die Ursachen von Paritätsfehlern bei Cisco Routern sowie die Fehlerbehebung erläutert.
Cisco empfiehlt, dass Sie über Kenntnisse zur Fehlerbehebung bei Router-Abstürzen verfügen.
Weitere Informationen finden Sie unter Troubleshooting Router Crashes (Fehlerbehebung bei Router-Abstürzen).
Dieses Dokument ist nicht auf bestimmte Software- und Hardware-Versionen beschränkt.
Die Informationen in diesem Dokument beziehen sich auf Geräte in einer speziell eingerichteten Testumgebung. Alle Geräte, die in diesem Dokument benutzt wurden, begannen mit einer gelöschten (Nichterfüllungs) Konfiguration. Wenn Ihr Netz Live ist, überprüfen Sie, ob Sie die mögliche Auswirkung jedes möglichen Befehls verstehen.
Weitere Informationen zu Dokumentkonventionen finden Sie unter Cisco Technical Tips Conventions (Technische Tipps von Cisco zu Konventionen).
Speicherparitätsfehler treten bei auf MultiChannel Interface Processor (MIPS) basierenden Prozessorprodukten auf, z. B.:
Cisco Router der Serien 4500 und 4700
Cisco Router der Serie 7500 (RSP1, RSP2, RSP4, RSP8, VIP2-10, VIP2-15, VIP2-20, VIP2-40, VIP2-50)
Cisco Router der Serie 7000 (RSP 7000)
Cisco Router der Serie 7200 (NPE-100, NPE-150, NPE-175, NPE-200, NPE-225, NPE-300)
Cisco Internet Router der Serie 1200
Im Folgenden sind einige Meldungen aufgeführt, die sich alle auf die Erkennung schädlicher Parität irgendwo im System beziehen (die Liste ist nicht vollständig, enthält jedoch die häufigsten Meldungen):
In der Befehlsausgabe show version:
System restarted by processor memory parity error at PC 0x6014F7C0, address 0x0
Oder
System restarted by shared memory parity error at PC 0x60130F40
Wenn Sie den Befehl show version von Ihrem Cisco Gerät ausgegeben haben, können Sie mit dem Cisco CLI Analyzer potenzielle Probleme und Fixes anzeigen. Um den Cisco CLI Analyzer verwenden zu können, müssen Sie ein registrierter Kunde sein, angemeldet sein und JavaScript aktivieren.
In den Konsolenprotokollen oder in den Crashinffiles:
- *** Cache Error Exception *** Cache Err Reg = 0xa401a65a data reference, primary cache, data field error , error on SysAD Bus PC = 0xbfc17950, Cause = 0x0, Status Reg = 0x3040d007 - Error: primary data cache, fields: data, virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000 virtual address corresponds to main:data, cache word 0 Low Data High Data Par Low Data High Data Par L1 Data : 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8 Low Data High Data Par Low Data High Data Par Mem Data : 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8 - *** Shared Memory Parity Error *** shared memory control register= 0xffe3 error(s) reported for: CPU on byte(s): 0/1 - %PAR-1-FATAL: Shared memory parity error shared memory status register= 0xFFEF error(s) reported for: CPU on byte(s): 0/1 2/3 - %RSP-3-ERROR: MD error 0000008000000200 %RSP-3-ERROR: QA parity error (bytes 0:3) 02 %RSP-3-ERROR: MEMD parity error condition %RSP-2-QAERROR: reused or zero link error, write at addr 0100 (QA) log 22010000, data 00000000 00000000 %RSP-3-RESTART: cbus complex - %RSP-3-ERROR: CyBus error 01 %RSP-3-ERROR: read data parity %RSP-3-ERROR: read parity error (bytes 0:7) 20 %RSP-3-ERROR: physical address (bits 20:15) 000000 - %RSP-3-ERROR: MD error 00800080C000C000 %RSP-3-ERROR: SRAM parity error (bytes 0:7) F0 %RSP-3-RESTART: cbus complex
Es gibt zwei Arten von Paritätsfehlern:
Weiche Paritätsfehler
Diese Fehler treten auf, wenn sich ein Energiewert im Chip (z. B. ein oder Null) ändert. Wenn von der CPU darauf verwiesen wird, führen solche Fehler dazu, dass das System entweder abstürzt (wenn sich der Fehler in einem Bereich befindet, der nicht behebbar ist) oder dass andere Systeme wiederhergestellt werden (z. B. ein CyBus-Komplex wird neu gestartet, wenn der Fehler im Paket-Speicher (MEMD)) aufgetreten ist. Bei einem weichen Paritätsfehler muss die Platine oder eine der Komponenten nicht ausgetauscht werden. Weitere Informationen zu Soft Parity-Fehlern finden Sie im Abschnitt Related Information (Zugehörige Informationen).
Harte Paritätsfehler
Diese Fehler treten auf, wenn ein Chip oder ein Mainboard ausfällt, der Daten beschädigt. In diesem Fall müssen Sie die betroffene Komponente wieder einsetzen oder austauschen, die normalerweise einen Speicherchip-Austausch oder einen Plateaustauschen umfasst. Wenn mehrere Paritätsfehler an derselben Adresse auftreten, tritt ein Paritätsfehler auf. Es gibt kompliziertere Fälle, die schwieriger zu identifizieren sind. Wenn Sie in einem bestimmten Speicherbereich in relativ kurzer Zeit mehr als einen Paritätsfehler sehen, können Sie diesen im Allgemeinen als harten Paritätsfehler betrachten.
Studien haben gezeigt, dass weiche Paritätsfehler 10- bis 100-mal häufiger auftreten als harte Paritätsfehler. Aus diesem Grund empfiehlt Cisco dringend, auf einen zweiten Paritätsfehler zu warten, bevor Sie etwas austauschen. Dadurch werden die Auswirkungen auf Ihr Netzwerk erheblich reduziert.
Ein Router verfügt über Speicher an verschiedenen Standorten. Theoretisch kann jeder Speicherstandort durch den Paritätsfehler beeinflusst werden, aber die meisten Speicherprobleme treten im dynamischen RAM (DRAM) oder im gemeinsam genutzten RAM (SRAM) auf. Auf Basis der Plattform können Sie hier herausfinden, welche Speicherorte betroffen sind und welches Teil Sie ersetzen müssen, wenn sich herausstellt, dass es sich um einen schweren Paritätsfehler handelt:
Auf den Cisco 4500- und 4700-Plattformen ist die Crashinfo-Datei in Versionen vor der Cisco IOS® Software Release 12.2(10) und 12.2(10)T nicht verfügbar.
Eine Möglichkeit, herauszufinden, wo der Fehler aufgetreten ist, besteht darin, den "restart reason" in den Konsolenprotokollen und in der Ausgabe des Befehls show version zu überprüfen:
Paritätsfehler in DRAM:
Wenn Sie den Router nach dem Absturz nicht manuell neu geladen haben, sieht die Ausgabe show version wie folgt aus:
System restarted by processor memory parity error at PC 0x601799C4, address 0x0 System image file is "flash:c4500-inr-mz.111-14.bin", booted via flash
Wenn eine Crashinfo-Datei verfügbar ist oder Konsolenprotokolle erfasst wurden, können Sie auch Folgendes sehen:
*** Cache Error Exception *** Cache Err Reg = 0xa0255c61 data reference, primary cache, data field error , error on SysAD Bus PC = 0xbfc0edc0, Cause = 0xb800, Status Reg = 0x34408007
Wiederholte Paritätsfehler im DRAM bedeuten, dass entweder das DRAM oder das Gehäuse defekt ist. Wenn Sie das Gehäuse vor kurzem entfernt haben oder Änderungen an der Hardwarekonfiguration vorgenommen haben, setzen Sie die DRAM-Chips wieder ein, um das Problem zu beheben. Ersetzen Sie andernfalls das DRAM als ersten Schritt. Dadurch müssen Paritätsfehler vermieden werden. Wenn der Router immer noch abstürzt, ersetzen Sie das Chassis.
Paritätsfehler im SRAM:
Wenn Sie den Router nach dem Absturz nicht manuell neu geladen haben, sieht die Ausgabe des Befehls show version wie folgt aus:
System restarted by shared memory parity error at PC 0x60130F40 System image file is "flash:c4500-inr-mz.111-14.bin", booted via flash
Wenn eine Crashinfo-Datei verfügbar ist oder Konsolenprotokolle erfasst wurden, können Sie auch Folgendes sehen:
*** Shared Memory Parity Error *** shared memory control register= 0xffe3 error(s) reported for: CPU on byte(s): 0/1
Oder
%PAR-1-FATAL: Shared memory parity error shared memory status register= 0xFFEF error(s) reported for: CPU on byte(s): 0/1 2/3
Oder
*** Shared Memory Parity Error *** shared memory control register= 0xffdf error(s) reported for: NIM1 on byte(s): 0/1 2/3
Hinweis:
Wenn der Fehler für die CPU gemeldet wird, ersetzen Sie den SRAM.
Wenn der Fehler für NIM(x) gemeldet wird, ersetzen Sie das Netzwerkmodul in Steckplatz (x). Der SRAM, der Steckplatz (x) zugewiesen ist, kann ebenfalls betroffen sein. In diesem Fall ersetzen Sie den SRAM.
Wiederholte Paritätsfehler im SRAM weisen entweder auf defekte SRAM-Chips oder auf ein defektes Netzwerkmodul hin, das eine fehlerhafte Parität im SRAM verursacht hat. Wenn Sie das Gehäuse vor kurzem entfernt haben oder Änderungen an der Hardwarekonfiguration vorgenommen haben, setzen Sie die Netzwerkmodule und die SRAM-Chips wieder ein, um das Problem zu beheben. Andernfalls überprüfen Sie, wo der Fehler in den Konsolenprotokollen gemeldet wird (siehe obiges Ausgabebeispiel).
Wie bei der Cisco Serie 4000 kann das Problem auf defekte DRAM- oder SRAM-Module für diese Plattformen zurückzuführen sein. Das Problem kann auch durch eine fehlerhafte Prozessorkarte (RP, RSP oder NPE) verursacht werden. Die Cisco 7000 und 7500 können auch Paritätsfehler melden, die durch einen fehlerhaften oder schlecht sitzenden Schnittstellenprozessor (Legacy xIP oder VIP) verursacht wurden.
Überprüfen Sie die Crashinfo-Datei und die Konsolenprotokolle auf eine der folgenden Fehlermeldungen:
Für RP, RSP und NPE sehen Sie in der Regel Folgendes:
Error: primary data cache, fields: data, (SysAD) virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000 virtual address corresponds to main:data, cache word 0
oder einfach:
Error: primary data cache, fields: data, SysAD phy21:3 0x201880, va14:12 0x1000, addr 63E01880
Dies weist auf ein Problem mit dem RSP selbst hin. Wenn das Problem nur einmal auftritt, handelt es sich höchstwahrscheinlich um ein vorübergehendes Problem.
Für den RSP kann die Nachricht wie folgt aussehen:
%RSP-3-ERROR: MD error 0000008000000200 %RSP-3-ERROR: QA parity error (bytes 0:3) 02 %RSP-3-ERROR: MEMD parity error condition %RSP-2-QAERROR: reused or zero link error, write at addr 0100 (QA) log 22010000, data 00000000 00000000 %RSP-3-RESTART: cbus complex
Oder
%RSP-3-ERROR: CyBus error 01 %RSP-3-ERROR: read data parity %RSP-3-ERROR: read parity error (bytes 0:7) 20 %RSP-3-ERROR: physical address (bits 20:15) 000000
Wenn kein Hinweis auf einen anderen Schnittstellenprozessor vorliegt, der schlechte Parität in den SRAM schreibt (z. B. VIP2-1-MSG-Fehlermeldungen), ist der wahrscheinlichste Grund für den Paritätsfehler der SRAM selbst. In diesem Fall ersetzen Sie den RSP.
Wenn andere Fehlermeldungen darauf hindeuten, dass ein Schnittstellenprozessor schlechte Parität schreibt, kann es sich um eine fehlerhafte oder schlecht sitzende Karte handeln.
Wenn Sie %VIP2-1-MSG erhalten: slot(x)-Meldungen in den Protokollen oder in der Crashinfo-Datei finden Sie unter Beheben von VIP-Abstürzen.
Beim ersten Auftreten eines Paritätsfehlers ist es nicht möglich, zwischen einem weichen oder harten Paritätsfehler zu unterscheiden. Erfahrungsgemäß handelt es sich bei den meisten Paritätsvorfällen um weiche Paritätsfehler, die Sie normalerweise abtun können. Wenn Sie kürzlich etwas an Hardware geändert haben oder die Box verschoben haben, versuchen Sie, das betroffene Teil (DRAM, SRAM, NPE, RP, RSP oder VIP) wieder einzusetzen. Häufig auftretende mehrere Paritätsereignisse weisen auf fehlerhafte Hardware hin. Ersetzen Sie das betroffene Teil (DRAM, RSP, VIP oder Motherboard) mithilfe der in diesem Dokument erwähnten Anweisungen.
Wenn Sie nach den oben beschriebenen Schritten zur Fehlerbehebung weiterhin Hilfe benötigen und eine Serviceanfrage beim Cisco TAC öffnen möchten, geben Sie folgende Informationen an: |
---|
Hinweis: Laden Sie den Router nicht manuell neu oder schalten Sie ihn ein, bevor Sie die oben genannten Informationen sammeln, es sei denn, Sie müssen einen Paritätsfehler im Prozessorspeicher beheben, da dies dazu führen kann, dass wichtige Informationen verloren gehen, die zur Bestimmung der Ursache des Problems erforderlich sind. |