Commutateurs : Commutateurs Cisco Catalyst, s�rie�6500

Guide de dépannage d'erreurs de parité

18 octobre 2016 - Traduction automatique
Autres versions: PDFpdf | Anglais (21 avril 2016) | Commentaires

Introduction

Ce document décrit le doux et les erreurs de parité matérielle, explique les messages d'erreur communs, et recommande les méthodes qui vous aident à éviter ou réduire des erreurs de parité. Les améliorations récentes dans le matériel et la conception du logiciel réduisent des problèmes de parité aussi bien.

Contribué par Shawn Wargo, construction de Cisco.

Fond

Quel est un processeur ou une erreur de parité de la mémoire ?

Vérifier de parité est la mémoire d'un chiffre binaire supplémentaire (mordu) afin de représenter la parité (impaire ou même) d'un peu de données de l'ordinateur (en général un octet) tandis que ces données sont enregistrées dans la mémoire. La valeur de parité calculée à partir des données stockées est alors comparée à la valeur de parité finale. Si ces deux valeurs diffèrent, ceci indique une erreur de données, et au moins un bit doit avoir été dû changé à la corruption des données.

Dans un système informatique, l'interférence électrique ou magnétique des causes internes ou externes peut faire inverser spontanément un à bit unique de la mémoire à l'état opposé. Cet événement rend les bits de données d'origine non valides et est connu comme erreur de parité.

De telles erreurs de mémoire, si non détectées, peuvent avoir des résultats indétectables et sans importance ou peuvent entraîner la corruption permanente des données stockées ou d'un crash d'ordinateur.

Il y a beaucoup de causes des erreurs de parité de la mémoire, qui sont classifiées en tant que des erreurs de parité logicielle ou erreurs de parité matérielle.

Erreurs logicielles

La plupart des erreurs de parité sont provoqué par par des conditions environnementales électrostatiques ou liées magnétique.

La majorité d'erreurs de simple-événement dans des puces mémoire sont provoqué par par rayonnement de fond (tel que des neutrons des rayonnements), interférence électromagnétique (IEM), ou décharge électrostatique (décharge électrostatique). Ces événements peuvent aléatoirement changer l'état électrique d'un ou plusieurs cellules de mémoire ou peuvent gêner les circuits utilisés pour lire et des cellules de write memory.

Connu comme erreurs de parité logicielle, ces événements sont en général passagers ou aléatoires et se produisent habituellement une fois. Les erreurs logicielles peuvent être mineures ou graves :

  • Les erreurs logicielles mineures qui peuvent être corrigées sans remise composante sont des renversements simples d'événement (SEUs).
  • Les erreurs logicielles graves qui exigent un composant ou une remise de système sont les latchups simples d'événement (SEL).

Des erreurs logicielles ne sont pas provoquées par défaillance de matériel ; ils sont passagers et peu fréquents, sont en grande partie probables un SEU, et sont provoqué par par une interruption environnementale des données de mémoire.

Si vous rencontrez des erreurs de parité logicielle, analysez les modifications environnementales récentes qui se sont produites à l'emplacement du système affecté. Les sources communes de décharge électrostatique et IEM qui peuvent entraîner des erreurs de parité logicielle incluent :

  • Câbles d'alimentation et approvisionnements
  • Unités de distribution d'alimentation
  • Blocs d'alimentation universels
  • Systèmes d'éclairage
  • Groupes électrogènes
  • Installations nucléaires (rayonnement)
  • Éruptions chromosphériques (rayonnement)

Erreurs majeures

D'autres erreurs de parité sont provoqué par par une défaillance physique du matériel de mémoire ou par les circuits utilisés pour lire et des cellules de write memory.

Les fabricants de matériel prennent des mesures étendues d'empêcher et déterminer des défauts matériels. Cependant, les défauts sont encore possibles ; par exemple, si les cellules de mémoire l'unes des utilisées pour enregistrer des bits de données sont mal formées, elles peuvent ne pouvoir pas tenir une charge ou peuvent être plus vulnérables aux conditions environnementales.

De même, alors que la mémoire elle-même peut fonctionner normalement, n'importe quels dommages physiques ou électriques aux circuits utilisés pour lire et aux cellules de write memory peuvent également causer des bits de données d'être changés pendant le transfert, qui a comme conséquence une erreur de parité.

Connu comme erreurs de parité matérielle, ces événements sont en général très fréquents et répétés et se produisent toutes les fois que la mémoire ou les circuits affectés est utilisée. La fréquence précise dépend de l'ampleur de la défaillance et comment fréquemment le matériel endommagé est utilisé.

Souvenez-vous que les erreurs de parité matérielle sont le résultat d'une défaillance de matériel et reproduisez-vous toutes les fois que le composant affecté est utilisé.

Si vous rencontrez des erreurs de parité matérielle, analysez les modifications physiques qui se sont produites à l'emplacement du système affecté. Les sources communes de défaillance de matériel qui peuvent mener aux erreurs de parité matérielle incluent :

  • Surtensions (aucune terre)
  • décharge électrostatique
  • Surchauffe ou refroidissement
  • Installation incorrecte ou partielle
  • Incompatibilité composante
  • Défaut de fabrication

Messages d'erreur communs

Le logiciel de Cisco IOS® fournit un grand choix de messages d'erreur de parité, qui varient avec le composant affecté et son incidence relative sur le système.

Processeur

Erreur de cache détectée !
  CP0_CAUSE (repérage 13/0) : 0x00000400
  CPO_ECC (repérage 26/0) : 0x000000B3
  CPO_BUSERRDPA (repérage 26/1) : 0x000000B3
  CPO_CACHERI (repérage 27/0) : 0x20000000

Vraie erreur de cache détectée.  Le système sera arrêté.

Erreur : Cache primaire d'instr, champs : données,
Adr physique réel 0x00000000,
l'adresse virtuelle est imprécise.

 Erreur de parité imprécise de données

ExplicationC'est le résultat d'une erreur de parité dans le cache du niveau 2 (L2) (mémoire vive statique, ou SRAM) utilisés par la CPU du processeur d'artère (RP) ou du processeur de commutateur (fournisseur de services) de la carte de commutation multicouche 3 (MSFC3).
RecommandationSurveillez le système régulièrement pour le reoccurrence. Si on n'observe aucun autre événement, c'est une erreur logicielle. Si l'erreur se produit fréquemment, demandez une autorisation de contenu de retour (RMA) afin de remplacer l'engine de superviseur, et marquez le module pour l'analyse de panne de matériel (ACE).
%SYSTEM_CONTROLLER-3-ERROR : Error condition detected: SYSAD_PARITY_ERROR
ExplicationC'est le résultat d'une erreur de parité dans l'adresse de système (bus de données) utilisée par le contrôleur d'intrabande (IBC) du MSFC3.
RecommandationSurveillez le système régulièrement pour le reoccurrence. Si on n'observe aucun autre événement, c'est une erreur logicielle. Si l'erreur se produit fréquemment, invitez un RMA afin de remplacer l'engine de superviseur, et marquez le module pour l'ACE.
%SYSTEM_CONTROLLER-3-ERROR : Error condition detected: TM_DATA_PARITY_ERROR
ExplicationC'est le résultat d'une erreur de parité dans les données de gestionnaire de table utilisées par l'IBC du MSFC3.
RecommandationSurveillez le système régulièrement pour le reoccurrence. Si on n'observe aucun autre événement, c'est une erreur logicielle. Si l'erreur se produit fréquemment, invitez un RMA afin de remplacer l'engine de superviseur, et marquez le module pour l'ACE.
%SYSTEM_CONTROLLER-3-ERROR : Error condition detected: TM_NPP_PARITY_ERROR
ExplicationC'est le résultat d'une erreur de parité dans le gestionnaire « pointeur de table de page suivante » utilisé par l'IBC du MSFC3.
Recommandation

Surveillez le système régulièrement pour le reoccurrence. Si on n'observe aucun autre événement, c'est une erreur logicielle. Si l'erreur se produit fréquemment, invitez un RMA afin de remplacer l'engine de superviseur, et marquez le module pour l'ACE.

Dans des versions de logiciel de Cisco IOS entre 12.1(8)E et 12.2(33)SXI3, le comportement par défaut en réponse aux événements SYSTEM_CONTROLLER-3-ERROR était de remettre à l'état initial l'IBC et de se connecter un message d'erreur.

Cependant, cette action corrective a eu comme conséquence certains des cas documentés de l'IBC (et ainsi, CPU) ne pouvant plus transmettre ou recevoir des données. Ainsi, le comportement a été changé dans des versions de logiciel de Cisco IOS plus tard que 12.2(33)SXI4 pour se connecter un message d'erreur et pour remettre à l'état initial le système ; référez-vous à l'ID de bogue Cisco CSCtf51541.

Interrompez l'exception, le signal 20 CPU, PC = 0x[dec]
ExplicationC'est le résultat d'une erreur de parité à bit unique dans le cache CPU L2 (SRAM) utilisé par les modules de gamme Cisco Catalyst 6700.
Recommandation

Surveillez le système régulièrement pour le reoccurrence. Si on n'observe aucun autre événement, c'est une erreur logicielle. Si l'erreur se produit fréquemment, invitez un RMA afin de remplacer le module 6700, et marquez le module pour l'ACE.

Dans des versions de logiciel de Cisco IOS plus tôt que 12.2(33)SXI5, une erreur de programmation (ID de bogue Cisco CSCtj06411) ferait remettre à l'état initial même des erreurs de parité à bit unique le module 6700. Ceci a été résolu dans les versions 12.2(33)SXI6 et 12.2(33)SXJ pour l'engine 720 de superviseur et dans la version 15.0SY pour l'engine 2T de superviseur.

RAM

%SYSTEM_CONTROLLER-3-ERROR : Error condition detected: SYSDRAM_PARITY_ERROR
ExplicationC'est le résultat d'une erreur de parité uncorrectable dans les modules de mémoire synchrones de la mémoire vive dynamique (SDRAM) (DIMM) utilisés par le MSFC3.
RecommandationSurveillez le système régulièrement pour le reoccurrence. Si on n'observe aucun autre événement, c'est une erreur logicielle. Si l'erreur se produit fréquemment, nettoyez et réinsérez le DIMM, et continuez à surveiller. Si l'erreur continue, invitez un RMA afin de remplacer ou améliorer le DIMM.
%SYSTEM_CONTROLLER-3-COR_MEM_ERR : Erreur de mémoire corrigible de mémoire vive dynamique. [dec] de compte, log [hexa]
ExplicationC'est le résultat d'une erreur de parité corrigible dans le SDRAM (DIMM) utilisé par le MSFC3.
RecommandationSurveillez le système régulièrement pour le reoccurrence. Si on n'observe aucun autre événement, c'est une erreur logicielle. Si l'erreur se produit fréquemment, nettoyez et réinsérez le DIMM, et continuez à surveiller. Si l'erreur continue, invitez un RMA afin de remplacer ou améliorer le DIMM.
%MWAM-DFC[dec]-0-CORRECTABLE_ECC_ERR : Une erreur corrigible ECC s'est produite, A_BUS_L2_ERRORS : 0x10000, A_BUS_MEMIO_ERRORS : 0x0, A_SCD_BUS_ERR_STATUS : 0x80983000
Explication

C'est le résultat d'une erreur de parité à bit unique dans la DRACHME utilisée par des modules de gamme 6700.

Recommandation

Surveillez le système régulièrement pour le reoccurrence. Si on n'observe aucun autre événement, c'est une erreur logicielle. Si l'erreur se produit fréquemment, nettoyez et réinsérez le DIMM, et continuez à surveiller. Si l'erreur continue, invitez un RMA afin de remplacer ou améliorer le DIMM.

%PM_SCP-SP-2-LCP_FW_ERR_INFORM : Le [dec] de module éprouve l'erreur suivante : Erreur de parité LTL détectée sur la bobine # le [dec].
ExplicationC'est le résultat d'une erreur de parité dans le SRAM utilisé par les modules de Cisco Catalyst 6100 et de gamme Cisco Catalyst 6300.
Recommandation

Surveillez le système régulièrement pour le reoccurrence. Si on n'observe aucun autre événement, c'est une erreur logicielle. Si l'erreur se produit fréquemment, invitez un RMA afin de remplacer le module 6100 ou 6300, et marquez le module pour l'ACE.

%SYS-4-SYS_LCPERR4 : Module [dec]: Erreur de parité LTL détectée sur la bobine # le [dec]
ExplicationC'est le résultat d'une erreur de parité dans le SRAM utilisé par les modules de gammes 6100 et 6300.
RecommandationSurveillez le système régulièrement pour le reoccurrence. Si on n'observe aucun autre événement, c'est une erreur logicielle. Si l'erreur se produit fréquemment, invitez un RMA afin de remplacer le module 6100 ou 6300, et marquez le module pour l'ACE.

ASIC

%PM_SCP-SP-2-LCP_FW_ERR_INFORM : Le [dec] de module éprouve l'erreur suivante : Mettez en communication la panne de mise en tampon de paquets ASIC ([nom]) détectée sur le [dec] de ports
ExplicationC'est le résultat d'une erreur de parité dans le tampon de paquets du port ASIC (SRAM) utilisé par les modules d'Ethernets de gamme de Cisco Catalyst 6148A.
Recommandation

Surveillez le système régulièrement pour le reoccurrence. Si on n'observe aucun autre événement, c'est une erreur logicielle. Si l'erreur se produit fréquemment, invitez un RMA afin de remplacer le module 6148A, et marquez le module pour l'ACE.

%LTL-SP-2-LTL_PARITY_CHECK : Demande de contrôle de parité LTL de 0x[hex]
ExplicationC'est le résultat d'une erreur de parité dans la table d'index de port du port ASIC (SRAM) utilisée par les modules de gammes Catalyst 6100-6500 et 6700.
RecommandationSurveillez le système régulièrement pour le reoccurrence. Si on n'observe aucun autre événement, c'est une erreur logicielle. Si l'erreur se produit fréquemment, invitez un RMA afin de remplacer le module, et marquez le module pour l'ACE.

Référez-vous à ces documents de logiciel de Cisco IOS pour une liste complète de messages d'erreur :

L'Output Interpreter Tool (clients enregistrés seulement) prend en charge certaines commandes show. Utilisez l'Output Interpreter Tool afin de visualiser une analyse de sortie de commande show.

Les plus défunts avancements

La recherche dans le champ des erreurs de parité est actuelle, et non chaque scénario peut être adressé, mais les organismes de développement de matériel et de logiciel de Cisco Catalyst 6500 continuent à introduire de nouvelles manières, telles que la protection du code correcteur d'erreurs (ECC), de réduire et atténuer l'occurrence des erreurs de parité.

Tandis que ce document commençait par l'examen de la troisième génération (WS-XSUP720 et première gamme 6700) des Produits de Catalyst 6500, cette section récapitule des améliorations introduites avec la génération de quatrième génération (VS-S720-10G et gamme 6700 postérieure) et cinquième (VS-SUP2T-10G et gamme 6900).

Processeur

Le module VS-S720-10G comporte une plus nouvelle carte-fille MSFC3, avec un nouvel IBC et un traitement avec un jeu d'instructions réduit mis à jour SR7010A (microprocesseur RISC) les CPU RP et de fournisseur de services qui fonctionnent à 600Mhz chacun. Les caches du niveau 1 (L1), L2, et du niveau 3 (L3) sont capables de la détection de parité. L'IBC plus nouvel a toute les fonctionnalité de la génération première et ajoute la protection ECC (correction à bit unique, détection de multi-bit) au SRAMs relié.

Les modules de gamme 6700 prennent en charge une CPU avec le cache L2 ECC-protégé (le cache L1 est détection de parité capable), qui peut corriger des erreurs de parité à bit unique sans nécessité de remettre à l'état initial. Cependant, en raison de l'ID de bogue Cisco CSCsz39222, la version 12.2SXI du logiciel de Cisco IOS (engine 720 de superviseur) remet à l'état initial le module de toute façon si une erreur de parité en cache à bit unique CPU se produit. Ceci est résolu dans les versions 12.2SXJ (engine 720 de superviseur) et le 15.0SY (engine 2T de superviseur) du logiciel de Cisco IOS.

Le VS-SUP2T-10G comporte une nouvelle carte-fille MSFC5 avec un IBC intégré et un nouveau choisit, la CPU PPC RP du double coeur MPC8572 (avec L2 ECC-protégé et cache L3, le cache L1 est détection de parité capable) qui fonctionne à 1.5Ghz par noyau. Il comporte également une nouvelle, distincte, hors bande CPU du processeur de Gestion de Connectivité (CMP) et une mémoire vive dynamique ECC-protégée, qui est disponible même si la CPU RP est actuellement indisponible.

Le nouvel IBC a toute les fonctionnalité de premières générations et prend en charge la protection ECC pour le SRAMs relié et les améliorations dans la gestion d'erreur d'erreur de parité. Le nouveau MSFC5 comporte également une panne à bord se connectant (OBFL) la ROM, qui enregistre tous les initialisation de module et événements de diagnostics. La nouvelle conception simple CPU réduit également la probabilité statistique des événements d'erreur de parité.

Les modules de gamme 6900 prennent en charge une plus nouvelle CPU avec le cache L1 et L2 ECC-protégé, qui peut corriger des erreurs de parité à bit unique sans nécessité de remettre à l'état initial. La nouvelle génération prend en charge le même IBC, et le logiciel manipulant pour la correction d'erreurs à bit unique de parité a été incorporé.

RAM

Le VS-S720-10G avec MSFC3 comporte le DDR (DDR) SDRAM avec la protection ECC, fonctionnant à 266Mhz.

Les modules de gamme 6700 prennent en charge DDR SDRAM avec la protection ECC, fonctionnant à 266Mhz.

Le simple-donnée-débit comparé (SDR) SDRAM, l'interface de DDR-SDRAM rend des débits plus à transfert élevé possibles par plus de contrôle strict de la synchronisation des données et des signaux d'horloge électriques. L'interface DDR utilise le double pompage (transfert des données sur les périphéries en hausse et en baisse du signal d'horloge) afin de diminuer la fréquence de base. La fréquence de base inférieure réduit les conditions requises d'intégrité du signal sur le circuit imprimé qui connecte la mémoire au contrôleur.

Le VS-SUP2T-10G avec MSFC5 comporte DDR3 SDRAM avec la protection ECC, fonctionnant à 667Mhz.

Les modules de gamme 6900 prennent en charge DDR3 SDRAM avec la protection ECC, fonctionnant à 667Mhz.

L'avantage primaire de DDR3 SDRAM au-dessus de ses prédécesseurs immédiats (DDR2 et DDR) est sa capacité de transférer des données deux fois au débit (huit fois la vitesse de ses baies de mémoire interne), qui active des débits de données de bande passante élevée ou de crête. La mémoire DDR3 réduit également la consommation d'énergie de 30%, quoiqu'elle utilise la même norme électrique de signalisation que le DDR et le DDR2.

ASIC

Le VS-S720-10G avec PFC3C comporte des tampons de paquets de SRAM avec la protection ECC. Ceci fournit la correction d'erreurs à bit unique de parité sans remise de module, aussi bien que la détection d'erreur de parité de multi-bit.

La gamme 6700 avec DFC3C comporte des tampons de paquets SRAM avec la protection ECC. Ceci fournit la correction d'erreurs à bit unique de parité sans remise de module, aussi bien que la détection d'erreur de parité de multi-bit.

Le VS-SUP2T-10G avec PFC4 comporte des tampons de paquets de SRAM avec la protection ECC. Ceci fournit la correction d'erreurs à bit unique de parité sans remise de module, aussi bien que la détection d'erreur de parité de multi-bit.

La gamme 6900 avec DFC4 comporte des tampons de paquets SRAM avec la protection ECC. Ceci fournit la correction d'erreurs à bit unique de parité sans remise de module, aussi bien que la détection d'erreur de parité de multi-bit.

Logiciel

Le logiciel de Cisco IOS est conçu pour prendre en charge la protection ECC. Si un composant matériel qui prend en charge la protection ECC éprouve un SEU, le code devrait corriger les données corrompues ou remettre à l'état initial le composant affecté et ne pas exiger une pleine réinitialisation du matériel du module affecté. 

Cependant, dans les versions antérieures du logiciel de Cisco IOS, il y a quelques exceptions où le comportement a été intentionnellement changé ou des défaillances dues à une erreur de programmation. Voici deux exceptions notables.

Remise MSFC IBC

Dans des versions de logiciel de Cisco IOS entre 12.1(8)E et 12.2(33)SXI3, le comportement par défaut en réponse aux événements SEU SYSTEM_CONTROLLER-3-ERROR était de remettre à l'état initial l'IBC et de se connecter un message d'erreur. Cependant, cette action corrective a eu comme conséquence certains des cas documentés de l'IBC (et ainsi, CPU) ne pouvant plus transmettre ou recevoir des données.

Ainsi, le comportement a été changé après version 12.2(33)SXI4 (ID de bogue Cisco CSCtf51541) pour se connecter un message d'erreur et pour remettre à l'état initial le système. Tandis que cette réaction peut sembler plus grave, il est préférable de remettre à l'état initial le système et de corriger la structure de mémoire que pour avoir un système insensible.

Une caractéristique maintenant à l'étude (ID de bogue Cisco CSCtr89859) ajoutera une nouvelle commande de l'interface de ligne de commande (CLI) qui vous permet de commuter le comportement par défaut. Cette amélioration s'applique aux systèmes qui utilisent un superviseur simple et n'ont ainsi aucune Redondance de superviseur.

Remise de l'erreur de parité à bit unique de la gamme 6700 »

Dans les versions de logiciel un than12.2(33)SXI5 plus tôt de Cisco IOS, une erreur de programmation (ID de bogue Cisco CSCtj06411) ferait remettre à l'état initial même des erreurs de parité à bit unique le module 6700. Ce normalement serait une erreur de parité corrigible et n'exigerait pas du module d'être remis à l'état initial.

Cette bogue a été résolue dans les versions 12.2(33)SXI6+ et 12.2SXJ pour l'engine 720 de superviseur et dans la version 15.0SY pour l'engine 2T de superviseur. Après qu'une mise à jour à la version appropriée, le module 6700 se connecte simplement un message d'erreur et continue à fonctionner.

Recommandations

Par ce point, vous avez probablement déterminé si vous avez rencontré un doux ou une erreur de parité matérielle. Tandis que ceci peut adresser un incident simple, d'autres vulnérabilités d'erreur de parité peuvent encore exister, ainsi vous devriez adopter plus d'approche globale à votre tout le réseau.

Ainsi, Cisco et l'unité commerciale de Catalyst 6500 recommandent que vous examiniez ces procédures de réduction et prenniez des actions correctives appropriées afin d'éliminer ou réduire de futures erreurs de parité.

Erreurs logicielles (SEU)

Les erreurs de parité (douces) simples d'événement sont provoqué par par des conditions environnementales et peuvent se produire seulement une fois (SEU) ou très rarement, comme mensuel ou annuellement. Bien que vous n'ayez pas besoin de remplacer le matériel, vous voulez atténuer de futures occurrences.

Ces pratiques recommandées réduisent de manière significative la probabilité des erreurs de parité logicielle.

Audit environnemental

Cisco recommande que vous exécutiez un audit environnemental de vos emplacements réseau affectés. Vous pouvez exécuter cet audit vous-même ou en coordination avec un représentant Cisco, avec une équipe Cisco (telle que des Services avancés de Cisco), ou par un tiers consultant.

La couverture et la complexité précises d'un audit environnemental dépendent de beaucoup de différentes variables telles que la situation géographique, le bâtiment et la taille et la conception de pièce, la conception et l'affichage électrique, et d'autres facteurs relatifs.

Considérez quelles sources environnementales de décharge électrostatique et IEM peuvent exister dans ou autour de votre réseau. Ce sont des sources communes d'interférence qui peuvent mener à une erreur de parité logicielle :

  • Câbles d'alimentation et approvisionnements
  • Unités de distribution d'alimentation
  • Blocs d'alimentation universels
  • Systèmes d'éclairage
  • Groupes électrogènes
  • Installations nucléaires (rayonnement)
  • Éruptions chromosphériques (rayonnement)

Placement de châssis

SEUs peut se produire si les Unités de distribution d'alimentation, les groupes électrogènes, ou les systèmes d'éclairage sont trop proches du châssis ou si les plusieurs câbles d'alimentation sont sur ou près du châssis.

Il est important de fournir la distance adéquate entre le châssis de Catalyst 6500 et ces électriques et magnétiques sources. Les distances recommandées varient par le composant et sont fournies par les fiches techniques composantes.

Généralement Cisco vous recommande localisent des systèmes au moins trois à six pouces des sources communes d'interférence électrique et magnétique. Des câbles d'alimentation devraient être conduits en bas et à partir du châssis, dans la mesure du possible, et ne devraient pas être étendus dans les paquets étroitement emballés ou dans de grands nombres à travers ou près du châssis.

Fondre

Les fluctuations et les surtensions d'alimentation sont relativement communes, et des blocs d'alimentation de Catalyst 6500 sont conçus pour faciliter des variations mineures du courant de tension.

Cependant, il est essentiel de fournir fondre électrique approprié pour le châssis et l'étagère ainsi n'importe quelle tension électrique excédentaire est dessinée à partir du système. Sans fondre approprié, les surtensions peuvent avoir comme conséquence les dommages ou la défaillance dans divers ASIC et composants de mémoire. Référez-vous au guide d'installation de commutateur de gamme Catalyst 6500, en installant le commutateur, établissant l'au sol de système, pour en savoir plus.

décharge électrostatique

La décharge électrostatique peut facilement endommager des éléments essentiels sans n'importe quel problème visible. Des mesures préventives appropriées devraient être incorporées aux stratégies d'exécution de laboratoire, mais de telles mesures sont dues souvent et malheureusement ignoré à l'opportunité et à la supervision limitée.

Cisco recommande que votre Gestion d'exécutions de laboratoire, avec Cisco Systems, exécutent un audit environnemental de toutes les zones de réseau ou, au minimum, de toutes les zones qui ont montré des défaillances matérielles ou ont été indiquées comme mission essentielle. Une fois que l'audit est complet, Cisco recommande que vous implémentiez une liste de contrôle environnementale normalisée pour tous les systèmes nouvellement installés afin d'éviter de futurs événements de parité SEU.

Le plus défunt micrologiciel (Rommon)

Les composants matériels de Catalyst emploient le code de micrologiciel (également connu sous le nom de Rommon) pour initialiser, communiquent, et des diagnostics de passage. Une fois que ces fonctions sont complètes, l'exploitation du système est retournée au logiciel de Cisco IOS. Il est rare d'éprouver des questions avec le micrologiciel, mais il peut y avoir des questions si vous utilisez des différentes versions de code de microprogramme pour les superviseurs et les modules.

Ainsi, il est dans une pratique recommandée de s'assurer que tous les composants emploient dernier code de microprogramme afin d'assurer l'initialisation et la transmission appropriées de module. Cisco recommande que votre Gestion d'exécutions exécutent un audit du réseau et des composants matériels upgrade all avec la dernière version de firmware.

Des questions et les procédures de mise à niveau connues de micrologiciel sont documentées dans :

Téléchargez les dernières versions de firmware du site Web Cisco :

Vis d'or

Tous les systèmes réseau modulaires sont conçus pour s'insérer dans un fond de panier du châssis avec un ensemble de broches d'interface physique. Le fond de panier du châssis lui-même est essentiellement une gamme de fils interconnectés. Les broches dans chaque emplacement de châssis forment la connexion de données physique entre les modules de superviseur et d'Ethernets. Ainsi, la mise en place et le cadrage appropriés de ces broches est essentiel.

Le Catalyst 6500 fournit les rails de guide et les goupilles d'alignement qui aident à l'installation dans le châssis. Les broches d'emplacement (sockets) et des connecteurs de module sont conçus facilement pour engager et fournir la Connectivité électrique capable de bande passante élevée. Une fois inséré dans le châssis, il y a des vis d'or des deux côtés du module qui engagent entièrement les broches du fond de panier. Référez-vous à la note d'installation en module de commutation de gamme Catalyst 6500.

Si un module a été correctement inséré dans l'emplacement et les vis d'or ont été correctement serrées, aucun problème de communication n'est prévu. Cependant, plusieurs conditions peuvent se produire dans la mise en place de jour en jour des modules qui peuvent mener à la mise en place inexacte ou même inachevée de broche :

  • Force insuffisante de mise en place - Si le module est partiellement inséré sans utilisation des vis d'or, ceci peut entraîner des stalles de bus, et le module peut ne pas pouvoir communiquer avec d'autres modules. Selon le niveau de la mise en place (par exemple, s'il y a contact physique limité), le module peut pouvoir transmettre et recevoir des données, mais peut éprouver les erreurs de bit qui ont comme conséquence les paquets corrompus.
  • Désalignement vertical - Ceci se produit quand seulement un côté du module est sur les rails de guide. Ceci est facilement identifié parce que le module apparaît diagonale et ne se connecte pas habituellement aux broches du fond de panier.
  • Désalignement horizontal - Si des vis d'or sont utilisées de seulement un côté, certaines des broches ne s'engagent pas correctement. C'est un problème courant, parce que le module peut sembler être correctement inséré. Le désalignement horizontal est réellement une forme de la force insuffisante de mise en place.

Cisco recommande que vous implémentiez un processus de gestion d'exécution qui exige l'utilisation des vis d'or sur tous les modules de Catalyst 6500 dans les environnements de production. Ceci assure la mise en place et le cadrage appropriés et pleins des broches du fond de panier et empêche de futures pannes dues aux erreurs de bit et aux pannes de communication relatives.

Erreurs majeures (défaillance)

Les erreurs de parité (dures) fréquentes ou reproductibles sont provoqué par par la défaillance physique de la mémoire ou des circuits utilisés pour lire et écrire. En pareil cas, remplacez le matériel et demandez le centre d'assistance technique Cisco (TAC) ou votre Cisco Systems machinent pour conduire un ACE sur le matériel retourné.

Ces pratiques recommandées réduisent de manière significative la probabilité des erreurs de parité matérielle.

Audit de matériel (MTBF et EOL)

Cisco recommande que vous exécutiez un audit du réseau de vos emplacements réseau affectés. Vous pouvez exécuter cet audit vous-même ou en coordination avec un représentant Cisco, avec une équipe Cisco (telle que des Services avancés de Cisco), ou par un tiers consultant.

Tout le matériel (de tous les constructeurs) est sujet à la dégradation certaine de l'intégrité physique, et à lui est important pour dépister le cycle de vie de tous les composants matériels dans votre réseau afin de comprendre entièrement la probabilité de la panne composante au fil du temps.

La fiabilité de matériel peut être mesurée avec le cadre du temps moyen entre pannes (MTBF). Puisque le MTBF est seulement une moyenne statistique, ceci ne signifie pas qu'une panne se produira certainement à la fin du délai prévu MTBF. Cependant, la probabilité et la vulnérabilité des augmentations composantes de panne, ainsi d'un tel matériel devraient être signalées pour régénèrent. Référez-vous aux fiches techniques de Commutateurs de la gamme Cisco Catalyst 6500 pour des valeurs spécifiques MTBF pour chaque produit de Catalyst 6500.

La valeur « au niveau système » calculée agrégée MTBF de Catalyst 6500 est de > 7 ans.

En plus du cadre MTBF, Cisco fournit également un cadre de la fin de vie (EOL), qui définit le cycle de vie prévu d'un produit donné et fournit des annonces applicables afin de vous aider à régénérer votre équipement hérité. Référez-vous aux avis de fin de vie et de fin de commercialisation pour différents Produits existants de Catalyst 6500.

En raison de cet audit de matériel, Cisco recommande que vous implémentiez votre propre processus MTBF et EOL qui l'identifie et le matériel de pistes pour le potentiel régénèrent. Ceci s'assure que le dernier matériel s'exécute et réduit la probabilité de la défaillance de matériel.

Diagnostics de matériel

Le logiciel de gamme Catalyst 6500 et de Cisco IOS fournit des diagnostics génériques de diagnostics en direct (OR) et de surveillance de la santé (S.M.) pour tous les composants matériels utilisés dans le système. Les deux types de base de diagnostics qui peuvent être activés sont sur demande et amorce. Référez-vous aux diagnostics en direct génériques sur la gamme Cisco Catalyst 6500 commutent pour des informations supplémentaires.

Cisco recommande que des diagnostics d'amorce « complets » soient activés pour tous les composants matériels afin de s'assurer que tous les tests de diagnostic sont exécutés et pour confirmer que tous les composants matériels fonctionnent comme prévu sur l'amorce.

Cisco recommande également que vous programmiez le militaire de carrière, des diagnostics sur demande des composants essentiels d'infrastructure sur une base quotidienne ou hebdomadaire. Au delà des diagnostics d'amorce qui se produisent seulement pendant l'initialisation, les diagnostics sur demande s'assurent que le matériel continue à fonctionner comme prévu. Référez-vous au guide de configuration du logiciel, à l'interface et aux composants matériels de version 12.2SX de Catalyst 6500, pour en savoir plus de diagnostics en direct.

En plus des tests de diagnostic sur demande par défaut, Cisco recommande que vous permettiez à ces tests de diagnostic sur demande afin d'identifier proactivement les composants de mémoire qui pourraient fonctionner mal :

  • TestLinecardMemory
  • TestAsicMemory


Document ID: 116135