In dem Dokumentationssatz für dieses Produkt wird die Verwendung inklusiver Sprache angestrebt. Für die Zwecke dieses Dokumentationssatzes wird Sprache als „inklusiv“ verstanden, wenn sie keine Diskriminierung aufgrund von Alter, körperlicher und/oder geistiger Behinderung, Geschlechtszugehörigkeit und -identität, ethnischer Identität, sexueller Orientierung, sozioökonomischem Status und Intersektionalität impliziert. Dennoch können in der Dokumentation stilistische Abweichungen von diesem Bemühen auftreten, wenn Text verwendet wird, der in Benutzeroberflächen der Produktsoftware fest codiert ist, auf RFP-Dokumentation basiert oder von einem genannten Drittanbieterprodukt verwendet wird. Hier erfahren Sie mehr darüber, wie Cisco inklusive Sprache verwendet.
Cisco hat dieses Dokument maschinell übersetzen und von einem menschlichen Übersetzer editieren und korrigieren lassen, um unseren Benutzern auf der ganzen Welt Support-Inhalte in ihrer eigenen Sprache zu bieten. Bitte beachten Sie, dass selbst die beste maschinelle Übersetzung nicht so genau ist wie eine von einem professionellen Übersetzer angefertigte. Cisco Systems, Inc. übernimmt keine Haftung für die Richtigkeit dieser Übersetzungen und empfiehlt, immer das englische Originaldokument (siehe bereitgestellter Link) heranzuziehen.
In diesem Dokument wird die Ursache von Watchdog-Zeitüberschreitungen auf Cisco Routern beschrieben und die Fehlerbehebung erläutert.
Die Leser dieses Dokuments sollten folgende Themen kennen:
Die Informationen in diesem Dokument basierend auf folgenden Software- und Hardware-Versionen:
Alle Cisco Router
Alle Cisco IOS® Softwareversionen
Hinweis: Dieses Dokument gilt nicht für Cisco Catalyst Switches oder MGX-Plattformen, sondern nur für Cisco Router.
Die Informationen in diesem Dokument beziehen sich auf Geräte in einer speziell eingerichteten Testumgebung. Alle Geräte, die in diesem Dokument benutzt wurden, begannen mit einer gelöschten (Nichterfüllungs) Konfiguration. Wenn Ihr Netz Live ist, überprüfen Sie, ob Sie die mögliche Auswirkung jedes möglichen Befehls verstehen.
Weitere Informationen zu Dokumentkonventionen finden Sie unter Cisco Technical Tips Conventions (Technische Tipps von Cisco zu Konventionen).
Cisco Prozessoren verfügen über Timer, die bestimmte Arten von Systemstürzen verhindern. Die CPU setzt regelmäßig einen Überwachungs-Timer zurück. Der Überwachungs-Timer steuert grundsätzlich die Zeit jedes Prozesses. Wenn der Timer nicht zurückgesetzt wird, tritt ein Trap auf. Wenn ein Prozess länger als erforderlich ist, wird der Überwachungs-Timer verwendet, um aus diesem Prozess zu entkommen.
Dies geschieht nur, wenn etwas schief geht. Je nach Situation kann der Router sich selbst zurücksetzen oder sich nach dem Ausfall wiederherstellen und eine Fehlermeldung in den Konsolenprotokollen generieren, die wie folgt aussieht:
*** Watch Dog Timeout *** PC = 0x6022536C, SP = 0x00000000
Oder
%SYS-2-WATCHDOG: Process aborted on watchdog timeout, process = Exec *** System received a Software forced crash *** signal = 0x17, code = 0x24, context= 0x60ceca60
Wenn Sie den Router nicht aus- und wieder einschalten oder nicht manuell neu laden, sieht die Ausgabe des Befehls show version wie folgt aus:
Router#show version ... Router uptime is 1 hour, 47 minutes System restarted by watchdog timer expired at 09:26:24 UTC Mon Mar 27 2000 System image file is "flash:c3640-is-mz.113-7-T.bin", booted via flash ...
Wenn Sie den Befehl show version von Ihrem Cisco Gerät ausgegeben haben, können Sie mit dem Cisco CLI Analyzer potenzielle Probleme und Fixes anzeigen. Um den Cisco CLI Analyzer verwenden zu können, müssen Sie registrierter Kunde sein, sich anmelden und JavaScript aktiviert haben.
Die Ursache für das Überwachungs-Timeout kann Hardware- oder Software-bezogen sein. Im Folgenden sind die häufigsten Symptome aufgeführt, anhand derer Sie die Ursache des Problems ermitteln können:
Wenn ein Router, der seit Monaten ordnungsgemäß funktioniert, plötzlich alle 20 Minuten neu geladen wird oder wenn er ständig neu gestartet wird und Sie nicht mehr darauf zugreifen können, handelt es sich höchstwahrscheinlich um ein Hardwareproblem. Dies ist auch der Fall, wenn vor kurzem ein neues Modul installiert wurde und der Router danach durch das Überwachungs-Timeout abstürzt.
Wenn der Router nach einer Konfigurationsänderung oder Änderung der Cisco IOS-Softwareversion abstürzt, handelt es sich wahrscheinlich um ein softwarebezogenes Problem.
Der erste Schritt zur Behebung dieses Problems besteht darin, die Art der Überwachungs-Timeout zu identifizieren, der bei Ihnen auftritt. Es gibt zwei Arten von Watchdog-Timeouts:
Das Software Watchdog Timeout, das trotz seines Namens oft hardwarebezogen ist
Das Process Watchdog-Timeout, das häufig softwarebezogen ist
Dieses Timeout wird durch eine unbegrenzte Schleife auf Interrupt-Ebene oder durch ein Hardwareproblem verursacht. Diese Art von Zeitüberschreitung weist auf folgende Anzeichen hin:
Konsolenprotokolle enthalten die folgenden Zeilen:
*** Zeitüberschreitung bei Hunden ansehen ***
PC = 0x6022536C, SP = 0x0000000
Die Ausgabe der Programmversion gibt den Grund für das erneute Laden als "Überwachungs-Timer abgelaufen" an:
Router#show version ... Router uptime is 1 hour, 47 minutes System restarted by watchdog timer expired at 06:30:24 UTC Mon Jan 28 2000 System image file is "flash:c3640-is-mz.113-7-T.bin", booted via flash
Es wird keine Crashinfo-Datei generiert. Weitere Informationen finden Sie unter Abrufen von Informationen aus der Crashinfo-Datei.
Meistens weisen diese Meldungen auf ein Hardwareproblem hin, entweder bei der Hauptprozessorplatine oder bei einem der Module.
Nachdem Sie eine Zeitüberschreitung bei der Softwareüberwachung identifiziert haben, können Sie im nächsten Schritt die Produktkurzreferenz für Ihre Plattform und alle in diesem System installierten Komponenten auf bekannte kritische Hardwareprobleme überprüfen. Es gibt z. B. einen Problemhinweis für den Cisco Router der Serie 3600: Überwachungs-Timeouts für das Cisco 3600 T1/E1 PRI-Modul. Überprüfen Sie die Problemhinweise, bevor Sie die weitere Fehlerbehebung durchführen.
Wenn vor kurzem ein neues Modul installiert wurde, müssen Sie zunächst versuchen, es zu entfernen, um zu überprüfen, ob es der Grund für das Überwachungs-Timeout ist. Wenn die Überwachungszeitüberschreitung anhält, versuchen Sie, alle abnehmbaren Komponenten wieder einzusetzen.
Wenn die Überwachungs-Zeitüberschreitung zu diesem Zeitpunkt anhält, gibt es keine Problemhinweise für Ihre Hardware. Wenn in letzter Zeit kein neues Modul installiert wurde, setzen Sie die Hauptprozessorplatine ein. Auf High-End-Plattformen ist das Prozessorboard eine separate Karte (z. B. NPE-400 oder RSP8). Auf Low-End-Plattformen (Cisco 1700, 2500, 4000, 2600, 3600 usw.) kann das Motherboard nicht separat versendet werden. In diesem Fall müssen Sie das Gehäuse selbst ersetzen.
Dieses Timeout wird durch eine unbegrenzte Schleife auf Prozessebene verursacht. Hier einige Hinweise für diese Zeitüberschreitung:
Konsolenprotokolle enthalten die folgenden Zeilen:
%SYS-2-WATCHDOG: Process aborted on watchdog timeout, process = Exec *** System received a Software forced crash *** signal = 0x17, code = 0x24, context= 0x60ceca60
Die Ausgabe der show version meldet den Absturz als "Software-erzwungener Absturz":
Router#show version ... Router uptime is 2 days, 21 hours, 30 minutes System restarted by error - Software-forced crash, PC 0x316EF90 at 20:22:37 edt System image file is "flash:c2500-is-l.112-15a.bin", booted via flash
Für Plattformen, die diese Datei unterstützen, wird eine Crashinfo-Datei generiert.
Dieses Problem ist höchstwahrscheinlich ein Fehler der Cisco IOS-Software.
Wenn Sie die Ausgabe eines Befehls zum Anzeigen von Stacks von Ihrem Cisco Gerät erhalten, können Sie Cisco CLI Analyzer zur Anzeige potenzieller Probleme und Fehlerbehebungen verwenden. Um den Cisco CLI Analyzer verwenden zu können, müssen Sie registrierter Kunde sein, sich anmelden und JavaScript aktiviert haben.
Das System war jedoch vor dem Neuladen in einer Schleife stecken geblieben. Daher muss die Stapelüberwachung nicht unbedingt relevant sein. Sie können ein Upgrade auf die neueste Cisco IOS-Softwareversion in Ihrem Release Train durchführen, um alle bekannten Process Watchdog-Probleme zu beseitigen. Falls nach dem Upgrade immer noch ein Absturz auftritt, sammeln Sie so viele Informationen wie möglich (siehe Fehlerbehebung bei Router-Abstürzen) und wenden Sie sich an Ihren Mitarbeiter der technischen Unterstützung.
Es gibt weitere Konsolenfehlermeldungen zu Überwachungs-Timern. Verwechseln Sie diese Nachrichten nicht mit einem Uhren-Timer-Absturz. Überprüfen Sie die Bedeutung dieser Fehlermeldungen mithilfe des Fehlermeldung-Decoders (nur registrierte Kunden). Dieses Tool bietet eine detaillierte Erklärung für viele Fehlermeldungen und empfiehlt Maßnahmen, um diese zu beheben.
Betrachten Sie die folgende Meldung:
%SYS-2-WATCHDOG: Process aborted on watchdog timeout, process = [chars]
Diese Meldung weist darauf hin, dass der angegebene Prozess zu lange ausgeführt wurde und der Prozessor nicht aufgegeben wurde. Das System hat den angegebenen Prozess heruntergefahren. Basierend auf Ihrer Konfiguration kann dies zu einem Systemabsturz führen. Wenn die Meldung nur einmal auftritt, müssen Sie keine Maßnahmen ergreifen. Wenn es jedoch erneut auftritt, müssen Sie es als Process Watchdog-Timeout behandeln und die erforderlichen Maßnahmen ergreifen.
Wenn Sie nach den oben beschriebenen Fehlerbehebungsschritten weiterhin Hilfe benötigen und eine Serviceanfrage (nur registrierte Kunden) beim Cisco TAC öffnen möchten, geben Sie folgende Informationen an: |
---|
Bitte fügen Sie die gesammelten Daten Ihrer Serviceanfrage im unverzippten Textformat (.txt) bei. Sie können Informationen zu Ihrer Serviceanfrage hinzufügen, indem Sie sie mit dem TAC Service Request Tool hochladen (nur registrierte Kunden). Wenn Sie nicht auf das Service Request Tool zugreifen können, können Sie die Informationen in einem E-Mail-Anhang an attach@cisco.com senden, der Ihre Service-Anfrage-Nummer in der Betreffzeile Ihrer Nachricht enthält. Hinweis: Laden Sie den Router vor dem Erfassen der oben genannten Informationen nicht manuell neu oder starten Sie ihn nur, wenn Sie zur Fehlerbehebung bei einem Line Card-Crash auf dem Cisco Internet Router der Serie 12000 aufgefordert werden. Dies kann dazu führen, dass wichtige Informationen verloren gehen, die zur Bestimmung der Ursache des Problems erforderlich sind. |