Introduction
Ce document décrit comment identifier des questions de mémoire dans ASR5K-PSC-32G (carte 2 (PSC2) de services de paquets) et ASR5K-PSC-64G (carte 3 (PSC3) de services de paquets) cartes. Le symptôme vu quand le problème est présent est que la carte se remet à l'état initial. Toutes les informations requises pour dépanner sont disponibles dans le détail de support d'exposition (disque transistorisé).
Conditions préalables
Conditions requises
Cisco recommande que vous ayez la connaissance de base du CLI du routeur 5000 (ASR5K) de services d'agrégation.
Ce document n'est pas limité à des versions de matériel et de logiciel spécifiques.
Les informations contenues dans ce document ont été créées à partir des périphériques d'un environnement de laboratoire spécifique. Tous les périphériques utilisés dans ce document ont démarré avec une configuration effacée (par défaut). Si votre réseau est opérationnel, assurez-vous que vous comprenez l'effet potentiel de toute commande.
Les services de paquets cardent 2 (PSC2), des services de paquets que la carte 3 (PSC3) peut tomber en panne l'Ether dû au « crash de noyau » ou à « manquer la pulsation ».
Crash de noyau
Le crash de noyau peut se produire quand la carte éprouve de plusieurs « erreurs de mémoire corrigibles » ou « une erreur de mémoire Uncorrectable » simple. Pour identifier si la question est crash de noyau suivez les étapes répertoriées ci-dessous :
- Dans le disque transistorisé, contrôle « liste de crash d'exposition » pour le crash de noyau :
<snip>
******** show crash list *******
== =================== ======= ========== =========== ================
# Time Process Card/CPU/ SW HW_SER_NUM
PID VERSION SMC / Crash Card
== =================== ======= ========== =========== ================
86 2012-Jun-07+18:28:21 sessmgr 15/0/04453 12.2(42876) PLB30103469/PLB40098624
87 2012-Jun-15+04:02:34 kernel 16/0/NA 12.2(NA) PLB30103469/PLB39098500
88 2012-Jun-15+04:50:38 sessmgr 02/0/04372 12.2(42876) PLB30103469/PLB40098609
<snip>
Une fois le nombre de crash pour le crash de noyau est identifié, vérifie les détails de crash pour le nombre de crash dans « la liste de crash d'exposition ». Dans l'exemple ci-dessus, le crash 87 s'est produit dans la carte 16.
<snip>
********************* CRASH #87 ***********************
2.6.38-staros-v3-hw-64 #1 SMP PREEMPT Wed Apr 18 14:32:38 EDT 2012 1 0 PLB39098500 428760, label "": Corrected error (Socket=0 channel=0 dimm=0)
<4>[52569.305831] EDAC MC0: CE row 0, channel 0, label "": Corrected error (Socket=0 channel=0 dimm=0)
<4>[52569.314566] EDAC MC0: CE row 0, channel 0, label "": Corrected error (Socket=0 channel=0 dimm=0)
<4>[52579.321273] edac_mc_handle_fbd_ce: 449 callbacks suppressed
<4>[52579.326820] EDAC MC0: CE row 0, channel 0, label "": Corrected error (Socket=0 channel=0 dimm=0)
????..
<0>[52668.605978] [Hardware Error]: CPU 0: Machine Check Exception: 4 Bank 8: fe0000000001009f
<0>[52668.614014] [Hardware Error]: TSC 66946ea1b05a ADDR 44f307280 MISC 4c43688800045941
<0>[52668.621767] [Hardware Error]: PROCESSOR 0:106a5 TIME 1339732830 SOCKET 0 APIC 0
<0>[52668.629028] [Hardware Error]: Machine check: Processor context corrupt
<0>[52668.635520] Kernel panic - not syncing: Fatal Machine check
<snip>
Le « EDAC MC0 : Ligne 0 de la CE, canal 0, "" d'étiquette : Erreur corrigée » avec ? Kernel panic ? le crash indique que panne de mémoire et RMA est exigée.
Mémoire non détectée
Le linecard PSC2/PSC3 peut redémarrer avec l'indication de « manquer la pulsation ». Une raison est que le système a détecté mauvais DIMM. Quand mauvais DIMM est détecté, la carte essayera de redémarrer de plusieurs périodes avant d'aller dans l'état « hors ligne ».
Pour la carte PSC2, dans la sortie ? mettez au point CPU 0 de la carte X de console ? trouvé dans le disque transistorisé, des erreurs suivantes seront vues.
1338537199.891 card 6-cpu0: ERROR: Memory size 24576 MB for cpu0 not matching with value 32768 MB in IDEEPROM 1338537199.891 card 6-cpu0:
1338537199.891 card 6-cpu0: ERROR: Bus 255 CPU 0 Chan 0 DIMM 0 NotPresent
Également le Syslog sera rempli avec l'erreur suivante :
The Packet Services Card 2 with serial number SAD154403TT in slot 6 has failed and will be brought down and brought back online. (Device=CPU_0, Reason=CARD_BOOT_TIMEOUT_EXPIRED, Status=[CPU0 MB: CFE_FAILURE] [CPU1] [CPU2] [CPU3] [GPIO_IN: 00,ff,ff,ff] [GPIO_OUT: 01,ff,00,ff]
Pour la carte PSC3, dans la sortie 'mettez au point CPU 0' de la carte X de console trouvée dans le disque transistorisé, les erreurs suivantes sera vu :
1412147713.299 card 7-cpu0: WARNING: Memory size 49152 MB for cpu0 not matching with value 65536 MB in IDEEPROM
La carte rencontrant ce problème doit être remplacée.