Ce document fournit des informations pour dépanner un crash de Versatile Interface Processor (VIP).
Cisco recommande que vous ayez la connaissance des notes de terrain en routeur de gamme 7500.
Les informations contenues dans ce document sont basées sur les versions de matériel et de logiciel suivantes :
VIP1
VIP2-10
VIP2-15
VIP2-20
VIP2-40
VIP2-50
FEIP2
GEIP
GEIP+
VIP4-50
VIP4-80
VIP6-80
Les informations contenues dans ce document ont été créées à partir des périphériques d'un environnement de laboratoire spécifique. Tous les périphériques utilisés dans ce document ont démarré avec une configuration effacée (par défaut). Si votre réseau est opérationnel, assurez-vous que vous comprenez l'effet potentiel de toute commande.
Pour plus d'informations sur les conventions utilisées dans ce document, reportez-vous à Conventions relatives aux conseils techniques Cisco.
Afin d'interpréter une panne de VIP, il est important pour d'abord comprennent l'architecture de base du VIP. La figure dans cette section affiche le schéma fonctionnel de bloc fonctionnel du VIP2, qui inclut ces composants :
CPU de traitement avec un jeu d'instructions réduit d'Orion (microprocesseur RISC) et circuits associés, qui incluent la mémoire vive dynamique (mémoire vive dynamique), le cache L2, le circuit intégré spécifique (ASIC) de RENO, et la ROM de démarrage.
CyBus ASIC — Le composant qui contrôle et transfère des paquets entre la MÉMOIRE RAM VIP2 statique (SRAM) et la mémoire de paquet de système (MEMD) à travers le CyBus ou le CxBus.
Mémoire ASIC de paquet — Responsable de déplacer des paquets entre les adaptateurs de port et le SRAM.
Bus de l'interconnexion de composants périphériques (PCI) — Chemins de données entre les adaptateurs et le VIP2 SRAM de port.
Passerelles — Responsable d'isoler les différents bus PCI des adaptateurs de port.
Le microcode VIP2 (micrologiciel) est une image qui fournit des instructions de logiciel de carte-particularité. Un périphérique de la mémoire microprogrammable (PROM) sur le VIP2 contient une image de démarrage de microcode par défaut qui aide le système en trouvant et en chargeant l'image de microcode du lot de logiciels de Cisco IOS® ou de la mémoire flash. L'image de démarrage de microcode dans le PROM initialise le VIP2, et puis aide télécharger l'image de microcode VIP2. Toutes les interfaces de la même chose tapent le chargement la même image de microcode, du lot de logiciels de Cisco IOS ou de la mémoire flash. Bien que la mémoire flash puisse des versions de microcode de multiple de mémoire pour un type d'interface spécifique, seulement une image peut charger au startup.
La commande de show controllers cbus affiche actuellement chargé et exécuter la version de microcode pour chaque processeur d'interface et le VIP2. La commande show startup-config affiche les instructions en cours de système pour le microcode de chargement au startup.
Quand vous dépannez, vous pouvez employer la figure dans cette section comme guide pour lire les informations d'un fichier d'informations sur les pannes de VIP ou du Syslog. Comme exemple, regardez ce Syslog sorti que la mauvaise parité d'expositions est trouvé une fois lu du VIP SRAM :
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Packet Memory Read Parity error !--- Bad parity is found when read from the VIP SRAM. Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PCI master address = 0460000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x00): cfid = 0x00011011 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x04): cfcs = 0x02800147 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x08): cfccid = 0x06040002 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x0C): cfpmlt = 0x00010000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x18): cfsmlt = 0x00010100 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x1C): cfsis = 0x02807020 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x20): cfmla = 0x01F00000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x24): cfpmla = 0x0000FE00 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x3C): cfbc = 0x00030000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x40): cfseed = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x44): cfstwt = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x48): cfswac = 0x00FFFFFF Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x4C): cfpwac = 0x00FFFFFF Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error
Comme vous voyez des recommandations dans la section suivante, le VIP dans cette sortie devrait être surveillé, et SRAM ou le VIP devrait être remplacé si les crash semblables se reproduisent.
Vous pouvez vérifier le contenu de l'adresse 0x21 dans EEPROM dans la sortie de commande de show diag afin de vérifier le modèle d'un VIP. Les valeurs qui correspondent à chaque type de VIP sont affichées dans cette table :
Valeur | VIP | Type de contrôleur |
---|---|---|
0x14 | VIP1 | Contrôleur de VIP |
0x15 | VIP2 (VIP2-10, VIP2-15, VIP2-20, VIP2-40) | Contrôleur VIP2 |
0x1E | VIP2-50 | Contrôleur VIP2 R5K |
0x20 | FEIP2 | Contrôleur FEIP2 |
0x21 | GEIP | Contrôleur GEIP |
0x40 | GEIP +* | Contrôleur GEIP+ |
0x22 | VIP4-80 | Contrôleur VIP4-80 RM7000 |
0x31 | VIP4-50 | Contrôleur VIP4-50 RM5271 |
0x4E | VIP6-80 | Contrôleur VIP6-80 RM7000B |
Remarque: Le GEIP+ est basé sur le VIP4-80. Toutes les informations supplémentaires dans ce document au sujet du VIP4-80 s'appliquent également au GEIP+.
Voici un exemple :
Router#show diag 10 Slot 10: Physical slot 10, ~physical slot 0x5, logical slot 10, CBus 0 Microcode Status 0x4 Master Enable, LED, WCS Loaded Board is analyzed Pending I/O Status: None EEPROM format version 1 VIP2 R5K controller, HW rev 2.02, board revision D0 Serial number: 17090200 Part number: 73-2167-05 Test history: 0x00 RMA number: 00-00-00 Flags: cisco 7000 board; 7500 compatible EEPROM contents (hex): 0x20: 01 1E 02 02 01 04 C6 98 49 08 77 05 00 00 00 00 0x30: 68 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 Slot database information: Flags: 0x4 Insertion time: 0x18C0 (00:29:13 ago) Controller Memory Size: 32 MBytes DRAM, 4096 KBytes SRAM
De cette sortie, vous pouvez voir que ce VIP est un VIP2-50.
La différence entre un VIP2-10, VIP2-15, VIP2-20, et un VIP2-40 est la quantité de mémoire vive dynamique et de SRAM sur chacun. Le divers VIP2s (s'ils n'ont pas été mis à jour) peut être distingué dans la sortie de commande de show diag par les configurations de mémoire affichées dans cette table :
Mémoire | VIP |
---|---|
8 KO SRAM DU MO DRAM/512 | VIP2-10 |
8 MO SRAM DU MO DRAM/1 | VIP2-15 |
16 MO SRAM DU MO DRAM/1 | VIP2-20 |
32 MO SRAM DU MO DRAM/2 | VIP2-40 |
Les informations contenues dans le fichier crashinfo peuvent s'avérer inestimables quand vous essayez de résoudre des problèmes logiciels ou la tentative de diagnostiquer la cause sous-jacente des blocages système. Non seulement le fichier crashinfo contient-il les informations de journalisation et un suivi de pile pour le VIP, il contient également la mémoire et les informations contextuelles étendues. Chaque fois que pannes de VIP, les tentatives de VIP d'écrire un fichier crashinfo au bootflash du RSP. Des fichiers crashinfo sont enregistrés dans ce format :
crashinfo_vip_<slot#>_<data>_<time>
Vous pouvez émettre la commande de dir afin de localiser des fichier d'informations sur les pannes de VIP comme affiché ici :
7500a#dir bootflash: Directory of bootflash:/ 1 -rw- 3951876 Jan 01 2000 00:01:22 rsp-boot-mz.111-22.CA 2 -rw- 162641 Jun 21 2000 12:53:40 crashinfo_vip_0_20000621-125340 3 -rw- 162778 Jun 21 2000 13:00:10 crashinfo_vip_0_20000621-130010 7602176 bytes total (3324492 bytes free) 7500a#
Ce bootflash du routeur contient deux fichier d'informations sur les pannes de VIP. Émettez le show file ou plus de commandes afin de visualiser et capturer le contenu de ces fichiers dans l'accord à cette procédure :
Mettez en marche se connecter avec votre programme de terminal.
Émettez la commande de la longueur 0 de terme.
Émettez plus de bootflash : nom du fichier > commande de <crashinfo.
Sauvegardez la sortie à un fichier.
Référez-vous à récupérer les informations à partir du fichier crashinfo pour plus d'informations sur la façon fonctionner avec des fichiers crashinfo.
Si vous avez la sortie d'une commande de Soutien technique d'exposition (du mode enable) de votre périphérique de Cisco, vous pouvez utiliser afin d'afficher des éventuels problèmes et des difficultés. Vous devez être un client enregistré, être ouvert une session, et faire activer le Javascript afin d'utiliser .
Des pannes de VIP sont classifiées dans plusieurs catégories basées sur la cause du crash. Lorsqu'une erreur non-réparable est trouvée, les pannes de VIP. Ces erreurs peuvent être le résultat des erreurs de parité, du matériel ou logiciel qui rendent un message négatif d'accusé de réception (NACK) présent sur le CyBus, ou des problèmes logiciels. Cette section fournit des informations sur chacun de ces types d'erreur.
Si vous avez la sortie d'une commande de Soutien technique d'exposition (du mode enable) de votre périphérique de Cisco, vous pouvez utiliser pour afficher des éventuels problèmes et des difficultés. Vous devez être un client enregistré, être ouvert une session, et faire activer le Javascript afin d'utiliser .
Les erreurs de parité se produisent sur un VIP quand les tentatives de matériel de vérifier la validité des données en comparant des valeurs de parité calculées aux valeurs de parité précédentes pour les mêmes données. Une secousse à bit unique dans les données peut avoir comme conséquence une erreur de parité. Quand vous diagnostiquez des erreurs de parité sur un VIP, il est important de comprendre chaque emplacement auquel la parité est vérifiée et à quelles erreurs de parité peuvent potentiellement se produire. Ce diagramme trace les grandes lignes de ces informations. En outre, référez-vous à l'analyse arborescente des défaillances de VIP de Cisco 7500 pour plus d'informations sur des erreurs de parité.
Suivant les indications de ce diagramme, il y a sept types différents d'erreurs de parité qui peuvent se produire sur un VIP. Notez que des erreurs peuvent être reçues d'une autre source et ne pourraient pas avoir commencé chez le VIP elle-même. La source d'erreur de parité peut être d'un processeur d'artère/commutateur (RSP), d'un VIP différent, ou mal d'assis ou des adaptateurs de port défectueux. Afin de comprendre correctement une panne de VIP, il est important de diagnostiquer la source de crash.
Il est également important de comprendre que les données avec la mauvaise parité peuvent être signalées par plusieurs de la parité vérifiant des périphériques sur le VIP et le routeur de gamme Cisco 7500 pour lue simple ou écrire l'exécution. Par exemple, si le VIP lit un paquet sur une file d'attente de transmission sur le RSP dans son propre SRAM, et il y a une erreur de parité dans SRAM du RSP, puis vous voyez des messages d'erreur de la DM ASIC sur le RSP, le CYA ASIC sur le VIP, et également la mémoire ASIC PCI/packet sur le VIP.
Ce diagramme affiche l'analyse de défaut-arborescence pour des pannes de VIP :
La correction d'erreurs à bit unique de l'utilisation VIP4-50, VIP4-80, et VIP6-80 et correction de 2 bits de code d'erreur de détection d'erreur (ECC) pour la mémoire UC Et la mémoire de paquet. Chacun des deux sont la mémoire vive dynamique synchrone (SDRAM). Une erreur à bit unique dans le SDRAM est corrigée et le système continue à fonctionner normalement.
Les erreurs de parité de Multibit aux numéros 2 ou 3 dans cette table sont un événement mortel qui font produire des erreurs de multibit ECC. Le cache interne et les bus CPU dans le système utilisent la détection à bit unique de parité. Comme affiché ici, l'architecture du VIP4 et VIP6 sont différents du VIP2. Par conséquent, quelques messages d'erreur ne sont pas vus et d'autres messages d'erreur sont signalés différemment qu'ils sont sur le VIP2. Dans cette section d'erreur de parité, des différences entre le VIP2, les VIP4, et les VIP6 sont dénotés et expliqués.
Les exceptions d'erreur de parité en cache se produisent quand la mauvaise parité est découverte dans la CPU ou dans la cache de données principale. L'erreur de parité pourrait s'être produite dans la mémoire vive dynamique de VIP, le contrôleur de DRAM, la mémoire cache principale, ou dans la CPU elle-même. Des erreurs de parité découvertes dans cet emplacement désigné également sous le nom des erreurs de parité de mémoire de processeur (PMPEs). Ces erreurs ont comme conséquence un crash immédiat du VIP et des sembler de sortie semblables sur des VIPs et RSPs. Une valeur de sig de vingt (sig=20) indique qu'une exception d'erreur de parité en cache s'est produite. La valeur de sig est affichée dans les messages du journal système pour le crash.
Le code récent fournit également une ligne bavarde signicative comme affiché ici :
Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System reloaded by a Cache Parity Exception Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System Reload called from 0x60125C8C, context=0x60220930 Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System exception: sig=20, code=0x20025B69, context=0x60220930
Les informations contenues dans le fichier d'informations sur les pannes de VIP indiquent également le même emplacement d'erreur de parité dans la cache de données principale :
Error: primary data cache, fields: data, virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000 virtual address corresponds to main:data, cache word 0 Low Data High Data Par Low Data High Data Par L1 Data : 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8 Low Data High Data Par Low Data High Data Par Mem Data: 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8
Une mémoire cache principale ou un PMPE peut être une erreur passagère. Si c'est le premier exemple d'un PMPE, vous pouvez habituellement sans risque l'ignorer. Cependant, si le même VIP éprouve un deuxième ou ultérieur PMPEs, vous devriez remplacer le VIP. Parfois le remplacement de la mémoire vive dynamique lui-même peut également résoudre le problème.
Note VIP4 et VIP6 — Des erreurs de parité qui se produisent dans le cache interne CPU et dans le CyAsic sont détectées comme exceptions d'erreur de parité en cache. Des erreurs de parité à bit unique dans la mémoire UC Sont corrigées et aucune mesure ne doit être prise. des erreurs de parité de Multi-bit dans la mémoire UC Sont détectées comme erreur de parité de multi-bit CCE de procmem. La mémoire UC Dans le VIP devrait être remplacée si une erreur de parité de multi-bit CCE de procmem est signalée.
Oct 25 09:30:54.708: %VIP4-50 RM5271-1-MSG: slot4 PMA error register1 00000000 00002000 Oct 25 09:30:54.716: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit error Oct 25 09:30:54.724: %VIP4-50 RM5271-1-MSG: slot4 PCI1 master address 00000000 Oct 25 09:30:54.732: %VIP4-50 RM5271-1-MSG: slot4 PCI1 slave address 00000000 Oct 25 09:30:54.740: %VIP4-50 RM5271-1-MSG: slot4 Latched Addresses Oct 25 09:30:54.748: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception addr 22220000 025F0860 Oct 25 09:30:54.756: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception data 00000000 00000000 Oct 25 09:30:54.764: %VIP4-50 RM5271-1-MSG: slot4 MPU addr exception/WPE address 00000000 00000000 Oct 25 09:30:54.772: %VIP4-50 RM5271-1-MSG: slot4 MPU WPE addr/WPE data 00000000 00000000 Oct 25 09:30:54.780: %VIP4-50 RM5271-1-MSG: slot4 ProcMem addr exception 0 0000000 Oct 25 09:30:54.788: %VIP4-50 RM5271-1-MSG: slot4 Pakmem addr exception 00000000 Oct 25 09:31:15.824: %VIP4-50 RM5271-1-MSG: slot4 System reloaded by a fatal hardware error Oct 25 09:31:15.836: %VIP4-50 RM5271-1-MSG: slot4 caller=0x600BCE18 Oct 25 09:31:15.844: %VIP4-50 RM5271-1-MSG: slot4 System exception: sig22, code 0x0, context=0x60615F28
Quand des téléchargements d'un VIP du MEMD dans le RSP et ces erreurs sont vus, ceci indique habituellement qu'un autre VIP a écrit la mauvaise parité au MEMD, ou le MEMD a été corrompu. Si la source est du MEMD et elle continue, vous devez remplacer le RSP. Réciproquement, si la source de mauvaise parité est un autre VIP, vous devriez réinsérer et, s'il y a lieu, remplacer le VIP qui écrit la mauvaise parité.
%VIP2-1-MSG: slot1 Nevada Error Interrupt Register 0x3 %VIP2-1-MSG: slot1 CYASIC Error Interrupt register 0x2020000C %VIP2-1-MSG: slot1 Parity Error internal to CYA %VIP2-1-MSG: slot1 Parity Error in data from CyBus !--- Bad parity is received by the VIP from the CyBus. %VIP2-1-MSG: slot1 CYASIC Other Interrupt register 0x200100 %VIP2-1-MSG: slot1 QE HIGH Priority Interrupt %VIP2-1-MSG: slot1 CYBUS Error register 0xD001A02, PKT Bus Error register 0x0 %VIP2-1-MSG: slot1 PMA error register = 0070000440000000 %VIP2-1-MSG: slot1 Packet Bus Write Parity error !--- The bad parity that was received from the CyBus is written to SRAM. %VIP2-1-MSG: slot1 PCI master address = 0700004 %VIP2-1-MSG: slot1 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 %VIP2-1-MSG: slot1 DEC21050 bridge chip, config=0x0 %VIP2-1-MSG: slot1 (0x00): cfid = 0x00011011 %VIP2-1-MSG: slot1 (0x04): cfcs= 0x02800147 %VIP2-1-MSG: slot1 (0x08):cfccid = 0x06040002 %VIP2-1-MSG: slot1 (0x0C):cfpmlt = 0x00010000 %VIP2-1-MSG: slot1 (0x18): cfsmlt = 0x00010100 %VIP2-1-MSG: slot1 (0x1C): cfsis = 0x22807020 %VIP2-1-MSG: slot1 Received Master Abort on secondary bus %VIP2-1-MSG: slot1 (0x20): cfmla = 0x01F00000
Remarque: Les VIP4 et les VIP6 affichent les mêmes messages d'erreur au sujet de l'erreur de parité de CyBus, mais le bus de paquets écrivent le message d'erreur de parité n'est pas affiché.
Des erreurs de parité de contrôleur de DRAM et les erreurs de parité du contrôleur de l'entrée/sortie (E/S) sont détectées par RENO ASIC. Une erreur de parité qui provient de la mémoire vive dynamique ou dans le contrôleur de DRAM est signalée comme exception de parité en cache. Une erreur de parité détectée par le contrôleur E/S est signalée, suivant les indications de cette sortie. Souvent, les erreurs de parité signalées par le contrôleur E/S ont commencé ailleurs et sont signalées par le contrôleur E/S en plus des messages d'autres emplacements.
Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Reno read parity error - bytes 0 & 1 Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 PMA error register = 0080004000001000 Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Packet Memory Read Parity error
Remarque: Les VIP4 et les VIP6 n'affichent pas ce message d'erreur.
Le PMA ASIC signale un erreur de parité mémoire en lecture des paquets quand une erreur de parité est lue hors de la mémoire de paquet (SRAM) sur le VIP. Cette erreur est signalée dans le log système comme affiché ici :
Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 Nevada Error Interrupt Register = 0x22 Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 PCI bus 0 parity error Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PMA error register = 4080103C00004000 Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PCI Transmit Parity error Oct 30 05:18:08.120: %VIP2-1-MSG: slot9 Packet Memory Read Parity error
Vous pouvez également voir des preuves d'un erreur de parité mémoire en lecture des paquets dans le fichier d'informations sur les pannes de VIP :
Nevada Error Interrupt Register = 0x2 PMA error register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000
Les erreurs de parité de SRAM peuvent également être passagères, ainsi traitez la première occurrence la même manière que des erreurs de parité de mémoire vive dynamique. Si les erreurs persistent, remplacez SRAM ou le VIP.
Note VIP4 et VIP6 — Des erreurs de parité à bit unique dans la mémoire de paquet sont corrigées. des erreurs de parité de Multi-bit dans la mémoire de paquet sont détectées comme erreur de parité de multi-bit CCE de pakmem. La mémoire de paquet VIP devrait être remplacée si une erreur de parité de multi-bit CCE de pakmem est signalée.
%VIP4-80 RM7000-1-MSG: slot1 PMA error register0 = 0000000000002000 %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit error %VIP4-80 RM7000-1-MSG: slot1 PCI0 master address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PCI0 slave address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PMA error register1 = 0000000000000000 %VIP4-80 RM7000-1-MSG: slot1 PCI1 master address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PCI1 slave address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 Latched Addresses %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception addr = 00012358 000000CA %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception data = 00000000 00040800 %VIP4-80 RM7000-1-MSG: slot1 MPU addr exception/WPE address = 00000000 00000000 %VIP4-80 RM7000-1-MSG: slot1 MPU WPE addr/WPE data = 00000000 00000000 %VIP4-80 RM7000-1-MSG: slot1 ProcMem addr exception = 00000000 %VIP4-80 RM7000-1-MSG: slot1 Pakmem addr exception = 00000000
Le PMA ASIC signale un bus de paquets écrit l'erreur de parité quand une erreur de parité est écrite à la mémoire de paquet. Dans cet exemple, le VIP est seulement le messenger et le problème n'existe pas avec la mémoire de ce VIP.
May 10 09:22:14.520: %VIP2-1-MSG: slot11 PMA error register = 2080002800800200 May 10 09:22:15.520: %VIP2-1-MSG: slot11 Packet Bus Write Parity error
Remarque: Les VIP4 et les VIP6 n'affichent pas ce message d'erreur.
Des erreurs de parité peuvent être détectées dans des bus PCI 1 et 2, qui se connectent par interface directement aux adaptateurs de port. Ces bus pont ensemble en un troisième bus PCI, le bus 0, sur lequel des erreurs de parité peuvent également être détectées. Des erreurs de parité qui proviennent des bus PCI l'uns des le plus généralement sont provoquées par mal assis ou des adaptateurs de port défectueux. Quand vous voyez ces messages dans la sortie de Syslog d'une panne de VIP, vous devez réinsérer l'adaptateur de port afin de résoudre le problème.
PCI bus <num> parity error PCI bus <num> system error Detected Parity Error on secondary bus
Si réinsérer l'adaptateur de port ne résout pas le problème, le problème se trouve avec l'adaptateur de port ou le VIP. Déplacez l'adaptateur de port à une autre baie et insérez un deuxième adaptateur de port dans la baie d'origine afin de dépanner. Ceci indique habituellement le matériel offensant. Un exemple est montré ici :
Mar 16 19:34:54: %GEIP-1-MSG: slot9 Nevada Error Interrupt Register = 0x6 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI bus 0 system error Mar 16 19:34:54: %GEIP-1-MSG: slot9 PMA error register = 0080043800100000 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI IRDY time-out Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI master address = 0800438 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0
Remarque: Les mêmes erreurs se produisent avec le VIP4 et le VIP6, mais le message d'erreur est différent. Il est détecté comme erreur de parité de maître PCI et erreur de parité d'esclave PCI. Exécutez les mêmes étapes que tracées les grandes lignes pour que les erreurs de parité de bus PCI de VIP dépannent ce problème.
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register0 = 0000000001800000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Master Parity error 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Slave Parity error 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 master address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 slave address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register1 = 0000000000000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 master address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 slave address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Latched Addresses 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU addr exception/WPE address = 00000000 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU WPE addr/WPE data = 00000000 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 ProcMem addr exception = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Pakmem addr exception = 00000000
Les erreurs de parité peuvent également être détectées par le VIP dans les données ou l'adresse d'une lire ou écrire l'exécution sur le CyBus. Si ceci se produit, vous voyez le Syslog sortir semblable à ceci :
CYASIC Error Interrupt register 0x2020000C Parity Error internal to CYA Parity Error in data from CyBus
Employez ces informations en même temps que les informations actuelles dans les logs système pour déterminer la source vraie d'erreur.
Remarque: Les VIP4 et les VIP6 affichent les mêmes messages d'erreur pour des erreurs de parité de CyBus.
Quand les essais de VIP à écrire à une adresse non valide dans MEMD, le RSP place un NACK sur le CyBus pour cet emplacement. C'est habituellement un problème logiciel, mais peut également être un problème de matériel. Par exemple, dans cette sortie, le VIP écrit 4 octets à une adresse non valide, ainsi le RSP place un NACK sur le CyBus pour cet emplacement.
%RSP-3-ERROR: CyBus0 error 10 %RSP-3-ERROR: command/address mismatch %RSP-3-ERROR: bus command write 4bytes (0xE) %RSP-3-ERROR: address offset (bits 3:1) 0 %RSP-3-ERROR: virtual address (bits 23:17) 000000 %VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 %VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20000003 %VIP2-1-MSG: slot5 Missing ACK on CyBus access %VIP2-1-MSG: slot5 NACK present on CyBus access %VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x0 %VIP2-1-MSG: slot5 CYBUS Error register 0x8001C48, PKT Bus Error register 0x0 %VIP2-1-MSG: slot5 System reloaded by a fatal hardware error %VIP2-1-MSG: slot5 caller=0x60126C44 %VIP2-1-MSG: slot5 System exception: sig=22, code=0x0, context=0x60265C68
Cependant, suivant les indications de cette sortie, le RSP place également un NACK sur un VIP pour qu'essayer écrive la mauvaise parité au MEMD.
CYASIC Error Interrupt register 0x1B Parity Error in data from Packet Bus Parity Error internal to CYA Missing ACK on CyBus access NACK present on CyBus access
Quand un NACK apparaît sur tous les emplacements, suivant les indications de cette sortie, c'est une erreur matérielle. L'arbitre est défectueux et le compartiment de cartes doit être remplacé.
Jan 1 23:55:21: %FEIP2-1-MSG: slot0 Nevada Error Interrupt Register =0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Error Interrupt register0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYBUS Error register 0x8001A00, PKTBus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %VIP2-1-MSG: slot2 NACK present on CyBus access Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYBUS Error register 0x800006A, PKT Bus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20200001 Jan 1 23:55:21: %VIP2-1-MSG: slot5 NACK present on CyBus access Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x200000 Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYBUS Error register 0x800006C, PKT Bus Error register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYBUS Error register 0x8001B80, PKT Bus Error register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYBUS Error register 0x8001C08, PKT Bus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 System reloaded by a fatal hardware error Jan 1 23:55:21: %VIP2-1-MSG: slot2 caller=0x6012640C Jan 1 23:55:21: %VIP2-1-MSG: slot2 System exception: sig=22, code=0x0, context=0x60265028
Les pannes de VIP non provoquées par des raisons l'unes des dans ce document sont le plus généralement dues à d'autres problèmes logiciels. Ces crash peuvent être manifestés d'un grand choix de différentes manières. Ce sont des suggestions générales pour réduire le risque de pannes de VIP dues aux problèmes logiciels et à faire face à eux si elles se produisent :
Assurez-vous toujours que l'image de logiciel Cisco IOS prend en charge le VIP.
Gardez toujours l'image RSP-BOOT et l'image de logiciel Cisco IOS principale à la même version.
Assurez-vous que la configuration de VIP et l'adaptateur de port sont pris en charge par la version en cours du logiciel de Cisco IOS.
Vérifiez les notes de mise à jour pour le niveau et les mémoires réquises corrects de logiciel de Cisco IOS.
C'est un exemple d'un résultat de log système d'une panne de VIP due à un problème logiciel :
Apr 18 17:13:33.884: %VIP2 R5K-1-MSG: slot0 System reloaded by a Bus Error exception Apr 18 17:13:33.892: %VIP2 R5K-1-MSG: slot0 caller=0x600BC974 Apr 18 17:13:33.900: %VIP2 R5K-1-MSG: slot0 System exception: sig=10, code=0x408, context=0x605B51E0 Apr 18 17:13:33.912: %VIP2 R5K-1-MSG: slot0 $0 : 00000000, AT : 605B0000, v0 : 00000001, v1 : FFFFFFFC, Apr 18 17:13:33.924: %VIP2 R5K-1-MSG: slot0 a0 : 00000002, a1 : 6042CEE0, a2 : 00000000, a3 : 6112FEC4, Apr 18 17:13:33.936: %VIP2 R5K-1-MSG: slot0 t0 : 00000053, t1 : 3400FF01, t2 : 00000000, t3 : FFFFFFFF, Apr 18 17:13:33.948: %VIP2 R5K-1-MSG: slot0 t4 : 600BC9B0, t5 : 000000F8, t6 : 00000000, t7 : 00000002, Apr 18 17:13:33.956: %VIP2 R5K-1-MSG: slot0 s0 : 0C58BA24, s1 : 00000064, s2 : 6112C7AC, s3 : 60560000, Apr 18 17:13:33.964: %VIP2 R5K-1-MSG: slot0 s4 : 60560000, s5 : 00000001, s6 : 6041433C, s7 : 60414310, Apr 18 17:13:33.972: %VIP2 R5K-1-MSG: slot0 t8 : 00008945, t9 : 00000000, k0 : 607F6CA0, k1 : 00000200, Apr 18 17:13:33.980: %VIP2 R5K-1-MSG: slot0 gp : 6056AFC0, sp : 6112FEC0, s8 : 60414460, ra : 6026EC4C, Apr 18 17:13:33.988: %VIP2 R5K-1-MSG: slot0 EPC : 6026EAA0, ErrorEPC : 800086B8, SREG : 3400FF03 Apr 18 17:13:33.996: %VIP2 R5K-1-MSG: slot0 Cause 00000408 (Code 0x2) Apr 18 17:13:34.004: %VIP2 R5K-1-MSG: slot0 Traceback= 6026EAA0 6026E2E8 6009BAF4 6009BAE0 Apr 18 17:13:35.012: %DBUS-3-DBUSINTERRSWSET: Slot 0, Internal Error due to VIP crash
Probablement l'information la plus importante à obtenir en cas d'un problème logiciel est le fichier crashinfo pour le VIP. Voyez l'obtenir par section de fichier d'informations sur les pannes de VIP pour que les instructions saisissent ces informations.
Les pannes de VIP beaucoup de fois et quand vous examinez le fichier de l'information de crash, vous pourriez voir ce message :
00:00:11: %LINK-3-UPDOWN: Interface POS1/0, changed state to up IOBUS Error Interrupt Status register 0x0 Unexpected exception, CPU signal 10, PC = 0x602A7660 -Traceback= 602A7660 602AB238
Le message d'erreur du signal 10 CPU signifie l'erreur d'exception de bus. Les erreurs sur le bus peuvent être l'un ou l'autre de questions de matériel ou logiciel. Le contournement pour ce problème est de réinsérer le module et de surveiller le routeur. Si le module continue à tomber en panne après que vous réinsériez le module, entrez en contact avec l'outil ouvert de cas TAC (clients enregistrés seulement) avec le fichier de l'information de crash.
C'est une bonne idée de créer un fichier récapitulatif de panne de VIP avec ces informations avant que vous ouvriez une valise. Incluez ces informations dans le domaine de description du problème de l'outil ouvert de cas TAC (clients enregistrés seulement).
Description du problème
Sortie de la commande de show version
Sortie de la commande de l'emplacement de show diag [x]
Extrait de fichier crashinfo
Extrait de Syslog
Puis, collectez les informations pour collecter si vous ouvrez une valise TAC.
C'est un exemple d'un fichier récapitulatif de crash :
******problem description.. VIP crashed with parity errors. The parity errors are being read by the SRAM, suspect the PA! ******show version Cisco Internetwork Operating System Software IOS (tm) GS Software (RSP-PV-M), Version 11.1(29)CC1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) V111_29_CC_THROTTLE_BRANCH Synced to mainline version: 11.1(29)CA Copyright (c) 1986-1999 by cisco Systems, Inc. Compiled Wed 13-Oct-99 02:21 by sharpd Image text-base: 0x60010910, data-base: 0x60832000 ROM: System Bootstrap, Version 11.1(8)CA1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) ROM: GS Software (RSP-BOOT-M), Version 11.1(29)CC1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) attga711c7 uptime is 27 weeks, 11 minutes System restarted by reload at 00:49:05 UTC Sun Oct 24 1999 System image file is "slot0:rsp-pv-mz.111-29.CC1", booted via slot0 Host configuration file is "cbb/al/ar-2", booted via tftp from 199.37.184.170 cisco RSP4 (R5000) processor with 262144K/2072K bytes of memory. R5000 processor, Implementation 35, Revision 2.1 (512KB Level 2 Cache) Last reset from power-on G.703/E1 software, Version 1.0. G.703/JT2 software, Version 1.0. X.25 software, Version 2.0, NET2, BFE and GOSIP compliant. Chassis Interface. 3 VIP2 R5K controllers (3 ATM). 3 ATM network interfaces. 123K bytes of non-volatile configuration memory. 20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K). 8192K bytes of Flash internal SIMM (Sector size 256K). ******show diag slot 6 Slot 6: Physical slot 6, ~physical slot 0x9, logical slot 0, CBus 0 Microcode Status 0x4 WCS Loaded Board is disabled analyzed wedged Pending I/O Status: None EEPROM format version 1 VIP2 R5K controller, HW rev 2.02, board revision C0 Serial number: 12639078 Part number: 73-2167-05 Test history: 0x00 RMA number: 00-00-00 Flags: cisco 7000 board; 7500 compatible EEPROM contents (hex): 0x20: 01 1E 02 02 00 C0 DB 66 49 08 77 05 00 00 00 00 0x30: 60 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 Slot database information: Flags: 0x295 Insertion time: 0x3AA4 (27w0d ago) Controller Memory Size: 128 MBytes DRAM, 8192 KBytes SRAM PA Bay 0 Information: ENHANCED ATM OC3 PA (MM), 1 port EEPROM format version 1 HW rev 2.00, Board revision A0 Serial number: 12366362 Part number: 73-2430-04 1 crash since restart. Last crash context (Apr 29 2000 23:19:26): Nevada Error Interrupt Register = 0x2 PMA error interrupt PMA Error Register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000 $0 : 00000000, AT : 60179244, v0 : 601D337C, v1 : 0000AAAA a0 : 604CF3E0, a1 : 604C8180, a2 : 00001182, a3 : 00000050 t0 : 00000800, t1 : 4E90424C, t2 : 00000001, t3 : 6014A620 t4 : 6016E220, t5 : 000000F8, t6 : 00000000, t7 : 00000000 s0 : 321735CC, s1 : 6052B508, s2 : 604C8180, s3 : 604CF3E0 s4 : 3226C120, s5 : 604D1440, s6 : 00000002, s7 : 00000CED t8 : 34000000, t9 : 603C9930, k0 : 00000000, k1 : 00000002 gp : 60337700, sp : 603C0350, s8 : 00000001, ra : 601476E8 EPC : 601D337C, ErrorEPC : 800086B8, SREG : 3400E103 Cause 00000000 (Code 0x0): Interrupt exception Traceback= 0x601D337C 0x601476E8 0x6014A674 ******excerpt from crashinfo Nevada Error Interrupt Register = 0x2 PMA error register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000 ******excerpt from syslog Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Packet Memory Read Parity error Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PCI master address = 0460000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x00): cfid = 0x00011011 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x04): cfcs = 0x02800147 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x08): cfccid = 0x06040002 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x0C): cfpmlt = 0x00010000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x18): cfsmlt = 0x00010100 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x1C): cfsis = 0x02807020 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x20): cfmla = 0x01F00000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x24): cfpmla = 0x0000FE00 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x3C): cfbc = 0x00030000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x40): cfseed = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x44): cfstwt = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x48): cfswac = 0x00FFFFFF Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x4C): cfpwac = 0x00FFFFFF Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error
Si vous avez besoin toujours d'assistance après que vous exécutiez les étapes de dépannage dans ce document et vouliez ouvrir une valise avec le support technique de Cisco, veillez à inclure ces informations : |
---|
Remarque: Si possible, ne rechargez pas manuellement ou arrêt et redémarrage le routeur avant que vous collectiez ces informations pendant que ceci peut causer les informations importantes d'être perdue qui sont nécessaires pour déterminer l'origine du problème. |