Dans le cadre de la documentation associée à ce produit, nous nous efforçons d’utiliser un langage exempt de préjugés. Dans cet ensemble de documents, le langage exempt de discrimination renvoie à une langue qui exclut la discrimination en fonction de l’âge, des handicaps, du genre, de l’appartenance raciale de l’identité ethnique, de l’orientation sexuelle, de la situation socio-économique et de l’intersectionnalité. Des exceptions peuvent s’appliquer dans les documents si le langage est codé en dur dans les interfaces utilisateurs du produit logiciel, si le langage utilisé est basé sur la documentation RFP ou si le langage utilisé provient d’un produit tiers référencé. Découvrez comment Cisco utilise le langage inclusif.
Cisco a traduit ce document en traduction automatisée vérifiée par une personne dans le cadre d’un service mondial permettant à nos utilisateurs d’obtenir le contenu d’assistance dans leur propre langue. Il convient cependant de noter que même la meilleure traduction automatisée ne sera pas aussi précise que celle fournie par un traducteur professionnel.
Ce document décrit les erreurs de parité logicielle et matérielle, explique les messages d'erreur courants et recommande des méthodes qui permettent d'éviter ou de réduire les erreurs de parité.
Les améliorations récentes apportées à la conception matérielle et logicielle réduisent également les problèmes de parité.
Qu'est-ce qu'une erreur de parité processeur ou mémoire ?
Le contrôle de parité est le stockage d'un chiffre binaire supplémentaire (bit) afin de représenter la parité (impaire ou paire) d'une petite quantité de données informatiques (généralement un octet) alors que ces données sont stockées en mémoire. La valeur de parité calculée à partir des données stockées est ensuite comparée à la valeur de parité finale. Si ces deux valeurs diffèrent, cela indique une erreur de données et au moins un bit doit avoir été modifié en raison d'une corruption des données.
Dans un système informatique, les interférences électriques ou magnétiques d'origine interne ou externe peuvent provoquer le basculement spontané d'un seul bit de mémoire vers l'état opposé. Cet événement rend les bits de données d'origine non valides et est appelé erreur de parité.
De telles erreurs de mémoire, si elles ne sont pas détectées, peuvent avoir des résultats indétectables et sans conséquence, ou peuvent provoquer une corruption permanente des données stockées ou une panne de machine.
Il existe de nombreuses causes d'erreurs de parité mémoire, qui sont classées soit comme des erreurs de parité logicielle, soit comme des erreurs de parité matérielle.
La plupart des erreurs de parité sont causées par des conditions environnementales électrostatiques ou magnétiques.
La majorité des erreurs d'événement unique dans les puces mémoire sont causées par le rayonnement de fond (comme les neutrons des rayons cosmiques), les interférences électromagnétiques (EMI) ou les décharges électrostatiques (ESD). Ces événements peuvent modifier de manière aléatoire l'état électrique d'une ou de plusieurs cellules mémoire, ou peuvent interférer avec les circuits utilisés pour lire et écrire des cellules mémoire.
Appelés erreurs de parité logicielle, ces événements sont généralement transitoires ou aléatoires et se produisent généralement une fois. Les erreurs logicielles peuvent être mineures ou graves :
Les erreurs logicielles ne sont pas causées par un dysfonctionnement matériel ; ils sont transitoires et peu fréquents, sont très probablement des UES et sont causés par une perturbation environnementale des données de mémoire.
Si vous rencontrez des erreurs de parité logicielle, analysez les modifications récentes de l'environnement qui se sont produites à l'emplacement du système affecté. Les sources courantes de décharges électrostatiques et d'interférences électromagnétiques pouvant entraîner des erreurs de parité logicielle sont les suivantes :
D'autres erreurs de parité sont provoquées par un dysfonctionnement physique du matériel de mémoire ou par les circuits utilisés pour lire et écrire des cellules de mémoire.
Les fabricants de matériel prennent des mesures étendues pour prévenir et tester les défauts matériels. Cependant, des défauts sont encore possibles. Par exemple, si l'une des cellules de mémoire utilisées pour stocker des bits de données est mal formée, elles peuvent ne pas être capables de contenir une charge ou être plus vulnérables aux conditions environnementales.
De même, alors que la mémoire elle-même peut fonctionner normalement, tout dommage physique ou électrique aux circuits utilisés pour lire et écrire des cellules de mémoire peut également provoquer une modification des bits de données lors du transfert, ce qui se traduit par une erreur de parité.
Appelés erreurs de parité matérielle, ces événements sont généralement très fréquents et répétés et se produisent chaque fois que la mémoire ou le circuit concerné est utilisé. La fréquence exacte dépend de l'étendue du dysfonctionnement et de la fréquence d'utilisation des équipements endommagés.
N'oubliez pas que les erreurs de parité matérielle sont le résultat d'un dysfonctionnement matériel et qu'elles se reproduisent chaque fois que le composant affecté est utilisé.
Si vous rencontrez des erreurs de parité matérielle, analysez les modifications physiques qui se sont produites à l'emplacement du système affecté. Les causes courantes de dysfonctionnement matériel pouvant entraîner des erreurs de parité matérielle sont les suivantes :
Le logiciel Cisco IOS® fournit une variété de messages d'erreur de parité, qui varient selon le composant affecté et son impact relatif sur le système.
|
Erreur de cache détectée ! Erreur de cache réelle détectée. Le système peut être arrêté. Erreur : Cache d'instructions principal, champs : données, Erreur de parité de données imprécise |
|
|
Explication |
Il s'agit du résultat d'une erreur de parité dans le cache de niveau 2 (L2) (mémoire vive statique ou SRAM) utilisé par le processeur de processeur de routage (RP) ou de processeur de commutation (SP) de la carte MSFC3 (Multilayer Switch Feature Card 3). |
|
Recommandation |
Surveillez régulièrement le système afin d'éviter toute répétition. Si aucun autre événement n'est observé, il s'agit d'une erreur temporaire. Si l'erreur se produit fréquemment, demandez une autorisation de retour de matériel (RMA) afin de remplacer le moteur de supervision, et marquez le module pour l'analyse de défaillance d'équipement (EFA). |
|
%SYSTEM_CONTROLLER-3-ERROR : Error condition detected: ERREUR_PARITÉ_SYSAD |
|
|
Explication |
Il s'agit du résultat d'une erreur de parité dans l'adresse système (bus de données) utilisée par le contrôleur intrabande (IBC) de la carte MSFC3. |
|
Recommandation |
Surveillez régulièrement le système afin d'éviter toute répétition. Si aucun autre événement n'est observé, il s'agit d'une erreur temporaire. Si l'erreur se produit fréquemment, demandez une RMA afin de remplacer le Supervisor Engine, et marquez le module pour EFA. |
|
%SYSTEM_CONTROLLER-3-ERROR : Error condition detected: ERREUR_PARITÉ_DONNÉES_TM |
|
|
Explication |
Il s'agit du résultat d'une erreur de parité dans les données du gestionnaire de tables utilisées par le IBC de la carte MSFC3. |
|
Recommandation |
Surveillez régulièrement le système afin d'éviter toute répétition. Si aucun autre événement n'est observé, il s'agit d'une erreur temporaire. Si l'erreur se produit fréquemment, demandez une RMA afin de remplacer le Supervisor Engine, et marquez le module pour EFA. |
|
%SYSTEM_CONTROLLER-3-ERROR : Error condition detected: TM_NPP_PARITY_ERROR |
|
|
Explication |
Il s'agit du résultat d'une erreur de parité dans le « pointeur de page suivante » du gestionnaire de tables utilisé par le IBC de la carte MSFC3. |
|
Recommandation |
Surveillez régulièrement le système afin d'éviter toute répétition. Si aucun autre événement n'est observé, il s'agit d'une erreur temporaire. Si l'erreur se produit fréquemment, demandez une RMA afin de remplacer le Supervisor Engine, et marquez le module pour EFA.Dans les versions du logiciel Cisco IOS entre 12.1(8)E et 12.2(33)SXI3, le comportement par défaut en réponse aux événements SYSTEM_CONTROLLER-3-ERROR était de réinitialiser le IBC et de consigner un message d'erreur.Cependant, cette action corrective a entraîné certains cas documentés où le IBC (et donc le CPU) n'était plus en mesure de transmettre ou de recevoir des données. Ainsi, le comportement a été modifié dans les versions du logiciel Cisco IOS ultérieures à 12.2(33)SXI4 pour consigner un message d'erreur et réinitialiser le système ; référez-vous à l'ID de bogue Cisco CSCtf51541. |
|
Exception d'interruption, signal CPU 20, PC = 0x[dec] |
|
|
Explication |
Il s'agit du résultat d'une erreur de parité d'un seul bit dans la mémoire cache L2 du processeur (SRAM) utilisée par les modules de la gamme Cisco Catalyst 6700. |
|
Recommandation |
Surveillez régulièrement le système afin d'éviter toute répétition. Si aucun autre événement n'est observé, il s'agit d'une erreur temporaire. Si l'erreur se produit fréquemment, demandez une RMA afin de remplacer le module 6700 et marquez le module pour EFA. Dans les versions du logiciel Cisco IOS antérieures à 12.2(33)SXI5, un bogue logiciel (ID de bogue Cisco CSCtj06411) provoquerait même des erreurs de parité à un seul bit pour réinitialiser le module 6700. Ceci a été résolu dans les versions 12.2(33)SXI6 et 12.2(33)SXJ pour Supervisor Engine 720 et dans la version 15.0SY pour Supervisor Engine 2T. |
|
%SYSTEM_CONTROLLER-3-ERROR : Error condition detected: SYSDRAM_PARITY_ERROR |
|
|
Explication |
Ceci est le résultat d'une erreur de parité non corrigible dans les modules de mémoire DRAM synchrone (SDRAM) (DIMM) utilisés par la carte MSFC3. |
|
Recommandation |
Surveillez régulièrement le système afin d'éviter toute répétition. Si aucun autre événement n'est observé, il s'agit d'une erreur temporaire. Si l'erreur se produit fréquemment, nettoyez et réinstallez le module DIMM, puis continuez à surveiller. Si l'erreur persiste, demandez une autorisation de retour de matériel afin de remplacer ou de mettre à niveau le module DIMM. |
|
%SYSTEM_CONTROLLER-3-COR_MEM_ERR : Erreur de mémoire DRAM corrigible. Count [dec], log [hex] |
|
|
Explication |
Il s'agit du résultat d'une erreur de parité corrigible dans la mémoire SDRAM (DIMM) utilisée par la carte MSFC3. |
|
Recommandation |
Surveillez régulièrement le système afin d'éviter toute répétition. Si aucun autre événement n'est observé, il s'agit d'une erreur temporaire. Si l'erreur se produit fréquemment, nettoyez et réinstallez le module DIMM, puis continuez à surveiller. Si l'erreur persiste, demandez une autorisation de retour de matériel afin de remplacer ou de mettre à niveau le module DIMM. |
|
%MWAM-DFC[dec]-0-CORRECTABLE_ECC_ERR : Une erreur ECC corrigible s'est produite, A_BUS_L2_ERRORS : 0x10000, A_BUS_MEMIO_ERRORS : 0x0, A_SCD_BUS_ERR_STATUS : 0x80983000 |
|
|
Explication |
Il s'agit du résultat d'une erreur de parité d'un seul bit dans la mémoire DRAM utilisée par les modules de la gamme 6700. |
|
Recommandation |
Surveillez régulièrement le système afin d'éviter toute répétition. Si aucun autre événement n'est observé, il s'agit d'une erreur temporaire. Si l'erreur se produit fréquemment, nettoyez et réinstallez le module DIMM, puis continuez à surveiller. Si l'erreur persiste, demandez une autorisation de retour de matériel afin de remplacer ou de mettre à niveau le module DIMM. |
|
%PM_SCP-SP-2-LCP_FW_ERR_INFORM : Le module [dec] rencontre cette erreur : Erreur de parité LTL détectée sur la bobine #[dec]. |
|
|
Explication |
Il s'agit du résultat d'une erreur de parité dans la mémoire SRAM utilisée par les modules des gammes Cisco Catalyst 6100 et Cisco Catalyst 6300. |
|
Recommandation |
Surveillez régulièrement le système afin d'éviter toute répétition. Si aucun autre événement n'est observé, il s'agit d'une erreur temporaire. Si l'erreur se produit fréquemment, demandez une RMA afin de remplacer le module 6100 ou 6300, et marquez le module pour EFA. |
|
%SYS-4-SYS_LCPERR4 : Module [dec]: Erreur de parité LTL détectée sur la bobine #[dec] |
|
|
Explication |
Ceci est le résultat d'une erreur de parité dans la mémoire SRAM utilisée par les modules des gammes 6100 et 6300. |
|
Recommandation |
Surveillez régulièrement le système afin d'éviter toute répétition. Si aucun autre événement n'est observé, il s'agit d'une erreur temporaire. Si l'erreur se produit fréquemment, demandez une RMA afin de remplacer le module 6100 ou 6300, et marquez le module pour EFA. |
|
%PM_SCP-SP-2-LCP_FW_ERR_INFORM : Le module [dec] rencontre cette erreur : Défaillance du tampon de paquets du port ASIC ([name]) détectée sur les ports [dec] |
|
|
Explication |
Ceci est le résultat d'une erreur de parité dans la mémoire tampon de paquets ASIC (SRAM) du port utilisée par les modules Ethernet de la gamme Cisco Catalyst 6148A. |
|
Recommandation |
Surveillez régulièrement le système afin d'éviter toute répétition. Si aucun autre événement n'est observé, il s'agit d'une erreur temporaire. Si l'erreur se produit fréquemment, demandez une RMA afin de remplacer le module 6148A et marquez le module pour EFA. |
|
%LTL-SP-2-LTL_PARITY_CHECK : Demande de contrôle de parité LTL pour 0x[hex] |
|
|
Explication |
Il s'agit du résultat d'une erreur de parité dans la table d'index des ports ASIC (SRAM) utilisée par les modules des gammes Catalyst 6100-6500 et 6700. |
|
Recommandation |
Surveillez régulièrement le système afin d'éviter toute répétition. Si aucun autre événement n'est observé, il s'agit d'une erreur temporaire. Si l'erreur se produit fréquemment, demandez une RMA afin de remplacer le module, et marquez le module pour EFA. |
Reportez-vous à ces documents de la plate-forme logicielle Cisco IOS pour obtenir une liste complète des messages d'erreur :
L'Outil d'interprétation de sortie (clients enregistrés seulement) prend en charge certaines commandes d'affichage. Utilisez l'Outil d'interprétation de sortie afin de visualiser une analyse de commande d'affichage de sortie .
La recherche dans le domaine des erreurs de parité est en cours et tous les scénarios ne peuvent pas être résolus, mais les organisations de développement matériel et logiciel Cisco Catalyst 6500 continuent à introduire de nouvelles méthodes, telles que la protection par code correcteur d'erreurs (ECC), pour minimiser et atténuer la survenue d'erreurs de parité.
Alors que ce document a commencé par une discussion sur la troisième génération (WS-XSUP720 et les premières séries 6700) de produits Catalyst 6500, cette section résume les améliorations introduites avec la quatrième génération (VS-S720-10G et séries 6700 ultérieures) et la cinquième génération (VS-SUP2T-10G et séries 6900).
Le module VS-S720-10G est équipé d'une carte fille MSFC3 plus récente, avec un nouveau module IBC et des processeurs à processeur de processeur de processeur à jeu d'instructions réduit (RISC) SR7010A mis à jour qui fonctionnent à 600 MHz chacun. Les caches de niveau 1 (L1), L2 et de niveau 3 (L3) peuvent détecter la parité. Le nouveau IBC dispose de toutes les fonctionnalités de la génération précédente et ajoute une protection ECC (correction sur un seul bit, détection sur plusieurs bits) aux SRAM connectées.
Les modules de la gamme 6700 prennent en charge un processeur doté d'un cache L2 protégé par ECC (le cache L1 est compatible avec la détection de parité), qui peut corriger les erreurs de parité sur un seul bit sans avoir à effectuer de réinitialisation. Cependant, en raison du bogue Cisco ayant l'ID CSCsz3922, la version 12.2SXI du logiciel Cisco IOS (Supervisor Engine 720) réinitialise le module de toute façon si une erreur de parité de cache de CPU à un bit se produit. Ceci est résolu dans les versions 12.2SXJ (Supervisor Engine 720) et 15.0SY (Supervisor Engine 2T) du logiciel Cisco IOS.
Le VS-SUP2T-10G dispose d'une nouvelle carte fille MSFC5 avec un IBC intégré et d'un nouveau processeur simple, double coeur MPC8572 PPC RP (avec cache L2 et L3 protégés par ECC, le cache L1 est capable de détection de parité) qui fonctionne à 1,5 GHz par coeur. Il dispose également d'un nouveau processeur de gestion de la connectivité (CMP) hors bande et d'une mémoire DRAM protégée par ECC, qui est disponible même si le processeur RP n'est pas disponible actuellement.
Le nouveau IBC offre toutes les fonctionnalités des générations précédentes et prend en charge la protection ECC pour les SRAM associées et des améliorations dans le traitement des erreurs de parité. La nouvelle carte MSFC5 est également équipée d'une mémoire ROM OBFL (Onboard Failure Logging) qui stocke tous les événements d'initialisation et de diagnostic du module. La nouvelle conception de processeur unique réduit également la probabilité statistique d'événements d'erreur de parité.
Les modules de la gamme 6900 prennent en charge un processeur plus récent avec cache L1 et L2 protégé par ECC, qui peut corriger les erreurs de parité sur un seul bit sans avoir à les réinitialiser. La nouvelle génération prend en charge le même IBC, et le traitement logiciel pour la correction des erreurs de parité sur un seul bit a été intégré.
Le VS-S720-10G avec MSFC3 est équipé d'une SDRAM DDR (double débit de données) avec protection ECC, fonctionnant à 266 Mhz.
Les modules de la gamme 6700 prennent en charge la SDRAM DDR avec protection ECC, fonctionnant à 266 MHz.
Par rapport à la SDRAM à débit de données unique (SDR), l'interface SDRAM DDR permet des débits de transfert plus élevés grâce à un contrôle plus strict de la synchronisation des signaux électriques de données et d'horloge. L'interface DDR utilise un double pompage (transfert de données à la fois sur le front montant et le front descendant du signal d'horloge) afin de diminuer la fréquence d'horloge. Une fréquence d'horloge inférieure réduit les exigences d'intégrité du signal sur la carte de circuit imprimé qui connecte la mémoire au contrôleur.
Le VS-SUP2T-10G avec MSFC5 est doté d'une mémoire SDRAM DDR3 avec protection ECC, fonctionnant à 667 MHz.
Les modules de la gamme 6900 prennent en charge la SDRAM DDR3 avec protection ECC, fonctionnant à 667 MHz.
Le principal avantage de la SDRAM DDR3 par rapport à ses prédécesseurs immédiats (DDR2 et DDR) est sa capacité à transférer des données à un débit deux fois supérieur (huit fois plus rapide que ses baies de mémoire internes), ce qui permet une bande passante ou des débits de pointe plus élevés. La mémoire DDR3 réduit également la consommation électrique de 30 %, même si elle utilise la même norme de signalisation électrique que la mémoire DDR et la mémoire DDR2.
Le VS-S720-10G avec PFC3C est doté de tampons de paquets SRAM avec protection ECC. Cela permet de corriger les erreurs de parité sur un seul bit sans réinitialisation du module, ainsi que de détecter les erreurs de parité sur plusieurs bits.
La gamme 6700 avec DFC3C dispose de mémoires tampon de paquets SRAM avec protection ECC. Cela permet de corriger les erreurs de parité sur un seul bit sans réinitialisation du module, ainsi que de détecter les erreurs de parité sur plusieurs bits.
Le VS-SUP2T-10G avec PFC4 dispose de mémoires tampon de paquets SRAM avec protection ECC. Cela permet de corriger les erreurs de parité sur un seul bit sans réinitialisation du module, ainsi que de détecter les erreurs de parité sur plusieurs bits.
La gamme 6900 avec DFC4 intègre des mémoires tampon de paquets SRAM avec protection ECC. Cela permet de corriger les erreurs de parité sur un seul bit sans réinitialisation du module, ainsi que de détecter les erreurs de parité sur plusieurs bits.
Le logiciel Cisco IOS est conçu pour prendre en charge la protection ECC. Si un composant matériel qui prend en charge la protection ECC subit un SEU, le code peut corriger les données corrompues ou réinitialiser le composant affecté et ne pas nécessiter une réinitialisation matérielle complète du module affecté.
Cependant, dans les versions antérieures du logiciel Cisco IOS, il existe quelques exceptions où le comportement a été intentionnellement modifié ou des dysfonctionnements dus à un bogue logiciel. Voici deux exceptions notables.
Dans les versions du logiciel Cisco IOS comprises entre 12.1(8)E et 12.2(33)SXI3, le comportement par défaut en réponse aux événements SEU SYSTEM_CONTROLLER-3-ERROR était de réinitialiser le module IBC et de consigner un message d'erreur. Cependant, cette mesure corrective a entraîné certains cas documentés où le GRV (et donc le CPU) n'était plus en mesure de transmettre ou de recevoir des données.
Par conséquent, le comportement a été modifié après la version 12.2(33)SXI4 (ID de bogue Cisco CSCtf51541) pour consigner un message d'erreur et réinitialiser le système. Bien que cette réaction puisse sembler plus grave, il est préférable de réinitialiser le système et de corriger la structure mémoire que d'avoir un système qui ne répond pas.
Une fonctionnalité actuellement en développement (ID de bogue Cisco CSCtr89859) ajoute une nouvelle commande d'interface de ligne de commande (CLI) qui vous permet de changer le comportement par défaut. Cette amélioration s'applique principalement aux systèmes qui utilisent un seul superviseur et n'ont donc pas de redondance de superviseur.
Dans les versions du logiciel Cisco IOS antérieures à 12.2(33)SXI5, un bogue logiciel (ID de bogue Cisco CSCtj06411) provoquerait même des erreurs de parité sur un seul bit pour réinitialiser le module 6700. Il s'agit normalement d'une erreur de parité corrigible et il n'est pas nécessaire de réinitialiser le module.
Ce bogue a été résolu dans les versions 12.2(33)SXI6+ et 12.2SXJ pour Supervisor Engine 720 et dans la version 15.0SY pour Supervisor Engine 2T. Après une mise à niveau vers la version appropriée, le module 6700 enregistre simplement un message d'erreur et continue à fonctionner.
À ce stade, vous avez probablement déterminé si vous avez rencontré une erreur de parité logicielle ou matérielle. Bien que cela puisse résoudre un seul incident, d'autres vulnérabilités d'erreur de parité peuvent toujours exister, de sorte que vous pouvez adopter une approche plus complète de l'ensemble de votre réseau.
Par conséquent, Cisco et l'unité commerciale Catalyst 6500 vous recommandent de revoir ces procédures d'atténuation et de prendre les mesures correctives appropriées afin d'éliminer ou de réduire les erreurs de parité futures.
Les erreurs de parité à événement unique (logiciel) sont causées par les conditions environnementales et ne peuvent se produire qu'une seule fois (SEU) ou très rarement, par exemple mensuellement ou annuellement. Bien que vous n'ayez pas besoin de remplacer le matériel, vous souhaitez limiter les occurrences futures.
Ces meilleures pratiques réduisent considérablement la probabilité d'erreurs de parité logicielle.
Cisco vous recommande d'effectuer un audit environnemental des emplacements de votre réseau affectés. Vous pouvez effectuer cet audit vous-même ou en coordination avec un représentant Cisco, avec une équipe Cisco (par exemple, les services avancés Cisco) ou par l'intermédiaire d'un consultant tiers.
La portée et la complexité exactes d'un audit environnemental dépendent de nombreuses variables différentes, telles que l'emplacement géographique, la taille et la conception des bâtiments et des pièces, la conception et l'agencement électriques, et d'autres facteurs connexes.
Déterminez quelles sources environnementales de décharges électrostatiques et d'interférences électromagnétiques peuvent exister dans ou autour de votre réseau. Voici des sources courantes d'interférence qui peuvent entraîner une erreur de parité logicielle :
Les SEU peuvent se produire si les unités de distribution de l'alimentation, les générateurs d'alimentation ou les systèmes d'éclairage sont trop proches du châssis ou si plusieurs câbles d'alimentation sont installés sur ou à côté du châssis.
Il est important de fournir une distance adéquate entre le châssis Catalyst 6500 et ces sources électriques et magnétiques. Les distances recommandées varient selon les composants et sont disponibles à partir des fiches techniques des composants.
En règle générale, Cisco vous recommande de localiser les systèmes situés à au moins trois à six pouces de sources courantes d'interférences électriques et magnétiques. Les câbles d'alimentation peuvent être acheminés vers le bas et loin du châssis, dans la mesure du possible, et ne peuvent pas être placés en faisceaux serrés ou en grand nombre à travers ou à côté du châssis.
Les fluctuations et les surtensions de puissance sont relativement courantes, et les modules d'alimentation Catalyst 6500 sont conçus pour prendre en charge des variations mineures de courant de tension.
Cependant, il est essentiel de mettre le châssis et le rack à la terre afin que toute tension électrique excessive soit évacuée du système. Sans mise à la terre appropriée, les surtensions peuvent endommager ou perturber divers circuits ASIC et composants de mémoire. Référez-vous au Guide d'installation du commutateur de la gamme Catalyst 6500, Installation du commutateur, Mise à la terre du système, pour plus d'informations.
Les décharges électrostatiques peuvent facilement endommager des composants critiques sans aucune altération visible. Des mesures préventives appropriées peuvent être incorporées dans les politiques d'exploitation des laboratoires, mais ces mesures sont souvent et malheureusement ignorées en raison de l'opportunité et de la surveillance limitée.
Cisco recommande que la direction des opérations de votre laboratoire, conjointement avec Cisco Systems, effectue un audit environnemental de toutes les zones du réseau ou, au minimum, de toutes les zones qui ont présenté des défaillances matérielles ou qui ont été désignées comme critiques. Une fois l'audit terminé, Cisco vous recommande de mettre en oeuvre une liste de contrôle d'environnement standardisée pour tous les systèmes nouvellement installés afin d'éviter de futurs événements de parité SEU.
Les composants matériels Catalyst utilisent le code du microprogramme (également appelé Rommon) pour initialiser, communiquer et exécuter les diagnostics. Une fois ces fonctions terminées, le fonctionnement du système est transféré au logiciel Cisco IOS. Il est rare de rencontrer des problèmes avec le micrologiciel, mais il peut y avoir des problèmes si vous utilisez différentes versions du code du micrologiciel pour les Supervisor Engine et les modules.
Par conséquent, il est recommandé de s'assurer que tous les composants utilisent le code de microprogramme le plus récent afin de garantir une initialisation et une communication correctes du module. Cisco recommande à votre équipe de gestion des opérations d'effectuer un audit du réseau et de mettre à niveau tous les composants matériels avec la dernière version du micrologiciel.
Les problèmes de microprogramme connus et les procédures de mise à niveau sont documentés dans :
Téléchargez les dernières versions du micrologiciel à partir du site Web de Cisco :
Tous les systèmes de mise en réseau modulaires sont conçus pour être insérés dans un fond de panier de châssis avec un ensemble de broches d'interface physiques. Le fond de panier du châssis lui-même est essentiellement une série de fils interconnectés. Les broches de chaque logement du châssis forment la connexion de données physique entre les modules Supervisor et Ethernet. Il est donc essentiel d'insérer et d'aligner correctement ces broches.
Le Catalyst 6500 fournit des rails de guidage et des broches d'alignement qui facilitent l'installation dans le châssis. Les broches de logement (sockets) et les connecteurs de module sont conçus pour s'enclencher facilement et fournir une connectivité électrique à large bande passante. Une fois insérées dans le châssis, des vis à oreilles situées de chaque côté du module viennent en prise avec les broches du fond de panier. Reportez-vous à la Note d'installation du module de commutation de la gamme Catalyst 6500.
Si un module a été correctement inséré dans le logement et que les vis à oreilles ont été correctement serrées, aucun problème de communication n'est attendu. Cependant, plusieurs conditions peuvent se produire lors de l'insertion quotidienne de modules, ce qui peut entraîner une insertion incorrecte ou même incomplète des broches :
Cisco recommande de mettre en oeuvre un processus de gestion des opérations qui impose l'utilisation de vis à oreilles sur tous les modules Catalyst 6500 dans les environnements de production. Cela garantit l'insertion et l'alignement corrects et complets des broches du fond de panier et empêche les défaillances futures dues à des erreurs de bit et à des défaillances de communication associées.
Les erreurs de parité (matérielles) fréquentes ou reproductibles sont dues à un dysfonctionnement physique de la mémoire ou des circuits utilisés pour la lecture et l'écriture. Dans ce cas, remplacez le matériel et demandez au centre d'assistance technique Cisco (TAC) ou à votre ingénieur système Cisco d'effectuer un AGE sur le matériel retourné.
Ces meilleures pratiques réduisent considérablement la probabilité d'erreurs de parité matérielle.
Cisco vous recommande d'effectuer un audit du réseau des emplacements réseau affectés. Vous pouvez effectuer cet audit vous-même ou en coordination avec un représentant Cisco, avec une équipe Cisco (par exemple, les services avancés Cisco) ou par l'intermédiaire d'un consultant tiers.
Tout le matériel (de tous les fournisseurs) est sujet à une éventuelle dégradation de l'intégrité physique, et il est important de suivre le cycle de vie de tous les composants matériels de votre réseau afin de bien comprendre la probabilité de défaillance des composants au fil du temps.
La fiabilité du matériel peut être mesurée à l'aide de la structure MTBF (temps moyen entre les défaillances). Puisque le MTBF n'est qu'une moyenne statistique, cela ne signifie pas qu'une panne peut se produire de façon certaine à la fin de la période MTBF. Cependant, la probabilité et la vulnérabilité des défaillances de composants augmentent, de sorte que ce matériel peut être marqué pour une actualisation. Reportez-vous aux fiches techniques des commutateurs Cisco Catalyst 6500 pour connaître les valeurs MTBF spécifiques de chaque produit Catalyst 6500.
La valeur MTBF calculée agrégée au niveau du système Catalyst 6500 est > 7 ans.
En plus de la structure MTBF, Cisco fournit également une structure de fin de vie (EOL), qui définit le cycle de vie prévu d'un produit donné et fournit des annonces applicables afin de vous aider à actualiser votre équipement existant. Reportez-vous aux Avis de fin de vie et de fin de commercialisation pour les différents produits Catalyst 6500 hérités.
À la suite de cet audit matériel, Cisco vous recommande de mettre en oeuvre votre propre processus MTBF et EOL qui identifie et suit le matériel en vue d'une éventuelle actualisation. Cela permet de s'assurer que le matériel le plus récent est en cours d'exécution et de réduire les risques de dysfonctionnement.
La gamme Catalyst 6500 et la plate-forme logicielle Cisco IOS fournissent des diagnostics GOLD (Generic Online Diagnostics) et HM (Health Monitoring) pour tous les composants matériels utilisés dans le système. Les deux types de diagnostics de base qui peuvent être activés sont le diagnostic à la demande et le diagnostic au démarrage. Référez-vous à Diagnostics génériques en ligne sur le commutateur de la gamme Cisco Catalyst 6500 pour plus d'informations.
Cisco recommande d'activer les diagnostics de démarrage complets pour tous les composants matériels afin de s'assurer que tous les tests de diagnostic sont exécutés et de confirmer que tous les composants matériels fonctionnent comme prévu au démarrage.
Cisco vous recommande également de programmer des diagnostics réguliers et à la demande des composants critiques de l'infrastructure, sur une base quotidienne ou hebdomadaire. Au-delà des diagnostics de démarrage qui se produisent uniquement pendant l'initialisation, les diagnostics à la demande garantissent que le matériel continue à fonctionner comme prévu. Référez-vous à Guide de configuration du logiciel Catalyst 6500 version 12.2SX, Composants matériels et d'interface, Diagnostics en ligne pour plus d'informations.
Outre les tests de diagnostic à la demande par défaut, Cisco recommande d'activer ces tests de diagnostic à la demande afin d'identifier de manière proactive les composants de mémoire susceptibles de mal fonctionner :
| Révision | Date de publication | Commentaires |
|---|---|---|
2.0 |
15-Nov-2023
|
Titre mis à jour, Introduction, SEO, Traduction automatique, Exigences de style, Exigences de marque, Orthographe et mise en forme. |
1.0 |
26-Apr-2013
|
Première publication |
Commentaires