Introduction
Quand nous nous référons à une « panne système », nous désignons une situation où le système a détecté une erreur irrécupérable et a redémarré.
Les erreurs qui entraînent des pannes sont en général détectées par le matériel processeur, qui se connecte automatiquement au code de traitement des erreurs spéciales dans le moniteur de ROM. Le moniteur de ROM identifie l'erreur, imprime un message, enregistre les informations sur la pann, et relance le système.
Conditions préalables
Exigences
Aucune spécification déterminée n'est requise pour ce document.
Ce document n'est pas limité à des versions de matériel et de logiciel spécifiques.
Les informations contenues dans ce document ont été créées à partir des périphériques d'un environnement de laboratoire spécifique. Tous les périphériques utilisés dans ce document ont démarré avec une configuration effacée (par défaut). Si votre réseau est opérationnel, assurez-vous que vous comprenez l'effet potentiel de toute commande.
Pour plus d'informations sur les conventions des documents, référez-vous aux Conventions utilisées pour les conseils techniques de Cisco.
Quand le routeur a une panne, il est extrêmement important de recueillir autant informations que possible sur la panne avant de recharger manuellement le routeur ou de le mettre hors tension puis sous tension. Toutes les informations sur la panne, sauf celles qui ont été enregistrées dans le fichier d'informations de la panne, sont perdues après un rechargement manuel ou une mise hors tension puis sous tension. Les sorties suivantes fournissent des indications et des informations sur la panne.
Si vous avez la sortie d'un show version, du show stacks, du show context, ou de la commande de support technique d'exposition de votre périphérique de Cisco, vous pouvez employer l'analyseur de Cisco CLI pour afficher des éventuels problèmes et des difficultés. Pour utiliser Cisco CLI Analyzer, vous devez être un client inscrit, être connecté et avoir activé JavaScript.
Commande |
Description |
show version |
Cette commande est d'abord apparu dans le logiciel Cisco IOS® Version 10.0. La commande show version EXEC affiche la configuration du matériel système, la version logicielle, les noms et les sources des fichiers de configuration et les images logicielles, la disponibilité du routeur et les informations sur le mode de redémarrage du système. IMPORTANT : Si le routeur est rechargé après la panne (par exemple, s'il a été mis hors tension puis sous tension ou que la commande reload a été exécutée, ces informations sont perdues. Donc tentez de les collecter avant le rechargement. |
show stacks |
Cette commande est d'abord apparu dans le logiciel Cisco IOS® Version 10.0. La commande Show stacks EXEC est utilisée pour surveiller l'utilisation des processus en pile et interrompre les routines. La sortie de la commande show stacks est l'une des sources d'information les plus indispensables à collecter lorsque le routeur tombe en panne. IMPORTANT : Si le routeur est rechargé après la panne (par exemple, par une mise hors tension puis sous tension ou la commande reload), ces informations sont perdues. Tentez donc de les collecter avant le rechargement. |
show context |
Cette commande est d'abord apparu dans le logiciel Cisco IOS® Version 10.3. La commande Show context EXEC sert à afficher les informations enregistrées dans la RAM non volatile (NVRAM) quand une exception se produit. Les informations contextuelles sont spécifiques aux processeurs et aux architectures, tandis que la version logicielle et les informations de disponibilité ne le sont pas. Les informations contextuelles pour différents types de routeurs peuvent donc différer. La sortie affichée par la commande show context inclut :
- le motif du redémarrage du système,
- la trace de la pile.
- la version logicielle,
- le numéro de signal, le code et les informations de disponibilité du routeur,
- tout le contenu du registre au moment de la panne.
|
show tech-support |
Cette commande est d'abord apparu dans le logiciel Cisco IOS® Version 11.2. Cette commande est pratique pour collecter les informations générales sur le routeur quand vous signalez un problème. Elle comprend :
- show version
- show running-config
- show stacks
- show interface
- show controller
- show process cpu
- show process memory
- show buffers
|
console log |
Si vous êtes connecté à la console du routeur au moment de la panne, vous verrez des éléments similaires lors de la panne : *** System received a Software forced crash ***
signal= 0x17, code= 0x24, context= 0x619978a0
PC = 0x602e59dc, Cause = 0x4020, Status Reg = 0x34008002
DCL Masked Interrupt Register = 0x000000f7
DCL Interrupt Value Register = 0x00000010
MEMD Int 6 Status Register = 0x00000000
Gardez ces informations et les journaux la précédant. Après la reprise du routeur, n'oubliez pas de générer la sortie de la commande show stacks. |
Syslog |
Si le routeur est configuré pour envoyer des journaux à un serveur syslog, vous verrez des informations sur ce qui s'est produit avant la panne sur le serveur syslog. Cependant, quand le routeur tombe en panne, il peut ne pas pouvoir envoyer la plupart des informations utiles à ce serveur syslog. Dans la majorité des cas, la sortie de la commande syslog n'est donc pas très utile pour dépanner les crashs. |
crashinfo |
Le fichier crashinfo contient une série d'informations pratiques relatives à la panne en cours, enregistrées dans la mémoire bootflash ou flash. Quand un routeur tombe en panne suite à la corruption des données ou de la pile, davantage d'informations de rechargement sont nécessaires pour déboguer ce type de panne que seule la sortie de la commande normale show stacks. Le fichier crashinfo est enregistré par défaut sur bootflash : crashinfo sur le Gigabit Router Processor (GRP) Cisco 12000, les Route Switch Processors (RSP) de la gamme Cisco 7000 et 7500 et les routeurs de la gamme Cisco 7200. Pour la Versatile Interface Processor 2 (VIP2) de Cisco 7500, ce fichier est enregistré par défaut au bootflash : vip2_slot_no_crashinfo où le slot_no est le nombre d'emplacement VIP2. Pour le Route Processor (RP) cisco 7000, le fichier est enregistré par défaut dans flash : crashinfo. Pour plus de détails, consultez Récupération des informations dans le fichier crashinfo. |
core dump |
Un core dump est une copie intégrale de l'image mémoire du routeur. Ces informations ne sont pas nécessaires pour dépanner la plupart des types de pannes, mais elles sont fortement recommandées lors du classement d'un nouveau bogue. Vous pouvez avoir besoin d'activer certains débogages pour ajouter plus d'informations au core dump telles que la sortie des commandes debug sanity, scheduler heapcheck process et memory check-interval 1. Pour plus de détails, reportez-vous à Création de core dumps. |
rom monitor |
Le routeur peut aboutir dans le moniteur de ROM après une panne lorsque sa valeur config-register se termine par 0. Si le processeur est un 68k, l'invite sera « > ». Vous pouvez obtenir la trace de pile avec la commande k. Si le processeur est un RISC (Reduced Instruction Set Computing), l'invite sera « rommon 1> ». Exécutez la commande stack 50 ou show context. |
Types de pannes
Les commandes Show version et show stacks génèrent une sortie qui donne une indication sur le type de panne qui s'est produit, comme une erreur de bus ou une panne logicielle forcée. Vous pouvez également obtenir des informations sur le type de panne avec les commandes crashinfo and show context . Pour certaines versions du logiciel Cisco IOS ultérieures, les raisons de la panne ne sont pas clairement indiquées (par exemple, vous voyez « Signal = x" » où x est un numéro). Référez-vous aux Codes des causes de pannes du processeur VIP (Versatile Interface Processor) pour trouver la signification de ce numéro. Par exemple, « signal = 23 » signifie une panne logicielle forcée. Cliquez sur les liens suivants pour dépanner le type spécifique de panne de votre routeur :
Pannes du module routeur
Parfois, seul un module de routeur spécifique tombe en panne et non le routeur lui-même. Voici quelques documents qui décrivent comment dépanner des crashs sur quelques modules routeur :
Router#show version
Cisco Internetwork Operating System Software
IOS (tm) RSP Software (RSP-PV-M), Version 12.0(10.6)ST, EARLY DEPLOYMENT
MAINTENANCE INTERIM SOFTWARE
Copyright (c) 1986-2000 by cisco Systems, Inc.
Compiled Fri 23-Jun-00 16:02 by richv
Image text-base: 0x60010908, data-base: 0x60D96000
ROM: System Bootstrap, Version 12.0(19990806:174725), DEVELOPMENT SOFTWARE
BOOTFLASH: RSP Software (RSP-BOOT-M), Version 12.0(9)S, EARLY DEPLOYMENT
RELEASE SOFTWARE (fc1)
Router uptime is 20 hours, 56 minutes
System returned to ROM by error - a Software forced crash, PC 0x60287EE8
System image file is "slot0:rsp-pv-mz.120-10.6.ST"
cisco RSP8 (R7000) processor with 131072K/8216K bytes of memory.
R7000 CPU at 250Mhz, Implementation 39, Rev 1.0, 256KB L2, 2048KB L3 Cache
Last reset from power-on
G.703/E1 software, Version 1.0.
G.703/JT2 software, Version 1.0.
X.25 software, Version 3.0.0.
Chassis Interface.
1 EIP controller (6 Ethernet).
1 VIP2 R5K controller (1 FastEthernet)(2 HSSI).
6 Ethernet/IEEE 802.3 interface(s)
1 FastEthernet/IEEE 802.3 interface(s)
2 HSSI network interface(s)
2043K bytes of non-volatile configuration memory.
20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K).
16384K bytes of Flash internal SIMM (Sector size 256K).
No slave installed in slot 7.
Configuration register is 0x2102
Router#show stacks
Minimum process stacks:
Free/Size Name
5188/6000 CEF Reloader
9620/12000 Init
5296/6000 RADIUS INITCONFIG
5724/6000 MDFS Reload
2460/3000 RSP memory size check
8176/9000 DHCP Client
Interrupt level stacks:
Level Called Unused/Size Name
1 163 8504/9000 Network Interrupt
2 14641 8172/9000 Network Status Interrupt
3 0 9000/9000 OIR interrupt
4 0 9000/9000 PCMCIA Interrupt
5 5849 8600/9000 Console Uart
6 0 9000/9000 Error Interrupt
7 396230 8604/9000 NMI Interrupt Handler
System was restarted by error - a Software forced crash, PC 0x602DE884 at 05:07:31
UTC Thu Sep 16 1999
RSP Software (RSP-JSV-M), Version 12.0(7)T, RELEASE SOFTWARE (fc2)
Compiled Mon 06-Dec-99 19:40 by phanguye
Image text-base: 0x60010908, database: 0x61356000
Stack trace from system failure:
FP: 0x61F73C30, RA: 0x602DE884
FP: 0x61F73C30, RA: 0x6030D29C
FP: 0x61F73D88, RA: 0x6025E96C
FP: 0x61F73DD0, RA: 0x6026A954
FP: 0x61F73E30, RA: 0x602B94BC
FP: 0x61F73E48, RA: 0x602B94A8
Quand un fichier crashinfo est disponible dans la mémoire bootflash, les éléments suivants s'affichent dans la sortie de la commande show stacks :
***************************************************
******* Information of Last System Crash **********
***************************************************
Using bootflash:crashinfo_20000323-061850. 2000
CMD: 'sh int fas' 03:23:41 UTC Thu Mar 2 2000
CMD: 'sh int fastEthernet 6/0/0' 03:23:44 UTC Thu Mar 2 2000
CMD: 'conf t' 03:23:56 UTC Thu Mar 2 2000
CMD: 'no ip cef di' 03:23:58 UTC Thu Mar 2 2000
CMD: 'no ip cef distributed ' 03:23:58 UTC Thu Mar 2 2000
...
Router#show context
System was restarted by error - a Software forced crash, PC 0x602DE884 at
05:07:31 UTC Thu Sep 16 1999
RSP Software (RSP-JSV-M), Version 12.0(7)T, RELEASE SOFTWARE (fc2)
Compiled Mon 06-DEC-99 19:40 by phanguye
Image text-base: 0x60010908, database: 0x61356000
Stack trace from system failure:
FP: 0x61F73C30, RA: 0x602DE884
FP: 0x61F73C30, RA: 0x6030D29C
FP: 0x61F73D88, RA: 0x6025E96C
FP: 0x61F73DD0, RA: 0x6026A954
FP: 0x61F73E30, RA: 0x602B94BC
FP: 0x61F73E48, RA: 0x602B94A8
Fault History Buffer:
RSP Software (RSP-JSV-M), Version 12.0(7)T, RELEASE SOFTWARE (fc2)
Compiled Mon 06-DEC-99 19:40 by phanguye
Signal = 23, Code = 0x24, Uptime 3w0d
$0 : 00000000, AT : 619A0000, v0 : 61990000, v1 : 00000032
a0 : 6026A114, a1 : 61A309A4, a2 : 00000000, a3 : 00000000
t0 : 61F6CD80, t1 : 8000FD88, t2 : 34008700, t3 : FFFF00FF
t4 : 00000083, t5 : 3E840024, t6 : 00000000, t7 : 00000000
s0 : 0000003C, s1 : 00000036, s2 : 00000000, s3 : 61F73C48
s4 : 00000000, s5 : 61993A10, s6 : 61982D00, s7 : 61820000
t8 : 0000327A, t9 : 00000000, k0 : 61E48C4C, k1 : 602E7748
gp : 6186F3A0, sp : 61F73C30, s8 : 00000000, ra : 6030D29C
EPC : 602DE884, SREG : 3400E703, Cause : 00000024
Error EPC : BFC00000, BadVaddr : 40231FFE
Si vous avez encore besoin d'aide après avoir suivi les étapes de dépannage ci-dessus et que vous voulez ouvrir une demande de service avec le TAC Cisco, n'oubliez pas d'inclure les informations suivantes pour le dépannage d'une panne de routeur : |
- Dépannage exécuté avant d'ouvrir la demande de service.
- Sortie de la commande show technical-support (si possible en mode activé).
- Sortie de la commande show log ou captures de console si disponibles.
- fichier crashinfo (si présent et pas déjà inclus dans la sortie de show technical-support).
- Sortie de show region (si non déjà inclus dans la sortie de show technical-support).
Veuillez joindre les données rassemblées à votre demande de service en format non compressé et texte clair (.txt). Vous pouvez joindre des informations à votre demande de service en les téléchargeant à l'aide de l'outil TAC Service Request (clients enregistrés uniquement). Si vous ne pouvez pas accéder à l'outil de Service Request, vous pouvez attacher les informations appropriées à votre demande de service en les envoyant à attach@cisco.com avec votre numéro de dossier sur la ligne d'objet de votre message. Remarque: Ne rechargez pas le routeur ou ne le mettez pas hors tension puis sous tension avant de collecter les informations ci-dessus sauf si vous êtes obligé de dépanner un crash de routeur, sinon des informations importantes peuvent être perdues qui sont nécessaires pour déterminer la cause à l'origine du problème. |