Introduction
Ce document décrit les erreurs de logiciel principales qui peuvent causer les trames de données corrompues d'être injectées dans une matrice de l'Unified Computing System (UCS) comme identifiée par des compteurs d'erreurs de contrôle de redondance cyclique (CRC) ou de Frame Check Sequence d'interface (FCS).
Note: Ce document ne décrit pas comment isoler le point d'injection de CRC.
Dans un environnement UCS, les erreurs de CRC peuvent être d'à haute impression. L'isolation et la réduction de la cause de telles erreurs doivent être traitées avec la haute priorité.
L'incidence dépend du point auquel la question se produit, qui peut étendre au plusieurs châssis et affecte la Connectivité d'Ethernets et de mémoire.
Tandis que panne composante physique (particulièrement câble et Small Form-Factor Pluggable (SFP)) est la cause la plus fréquente, il y a une augmentation en terme des erreurs de logiciel qui peuvent également entraîner des erreurs de CRC.
Ces défauts entraînent la basse force du signal entre de divers composants, qui mène pour corrompre des trames.
Un concept clé que vous pouvez se référer est une hauteur d'oeil qui est une mesure de l'intégrité du signal entre les composants de couche physique. Si le niveau de signal chute au-dessous d'un niveau particulier (diffère entre les composants), encadre envoyé ou reçu peut être corrompu.
Cisco recommande que vous ayez les problèmes de performances, l'especiallyFrame et la perte de paquets communs de reviewedFlexPod afin d'identifier la source des erreurs unstomped de CRC dans les Commutateurs de matrice et/ou d'en amont UCS.
Tandis que le document est destiné pour des déploiements de FlexPod, la section mentionnée s'applique pour des environnements du non-FlexPod UCS.
Indications au défaut associé par CRC
Si vous avez le câblage de Twinax dans votre environnement UCS, il est pour être affecté par un ou plusieurs de ces défauts, car la majorité des défauts sont pour Twinax a basé le câblage.
Les environnements qui ont seulement le câble à fibres optiques peuvent encore éprouver des questions, pendant qu'il des erreurs de CRC peut être injecté entre l'adaptateur et le module E/S UCS (IOM). Cependant, ceci est limité aux serveurs spécifiques et n'affecte pas de plusieurs serveurs ou châssis dans le cas d'un problème de port de liaison ascendante ou de serveur.
Si le débronchement/enable d'un port dans les UCS Manager semble arrêter les erreurs d'interface sans davantage d'action telle que le câble permutent ou reviennent sur leur siège, d'autres contrôles doivent être faites pour vérifier si une erreur de logiciel est la cause principale de la question.
Si des erreurs de CRC ont été vues après port soudain s'agite/réinitialisations, ces défauts peuvent être une cause possible.
Commandes de vérifier la hauteur d'oeil
Une indication principale des défauts des logiciels connexes de CRC est une valeur basse de hauteur d'oeil pour des un ou plusieurs ports.
Les commandes communes utilisées pour vérifier ceci sont :
Le Nexus 5500 a basé des Commutateurs :
show hardware internal carmel eye
La matrice UCS 6200 interconnecte :
connect nxos a
show hardware internal carmel eye
exit
connect nxos b
show hardware internal carmel eye
exit
Sortie témoin qui affiche une bonne hauteur d'oeil (200 système mv) :
UCSB-5-A(nxos)# show hardware internal carmel eye
+-------+------------+-------------+------------+----------------------------+--+--+--+--+--+--+--+--+--+--+
| Port | Eye Height | Eye Width | Raw values | Time measured |St|20|21|22|23|24|25|26|2E|2F|
+-------+------------+-------------+------------+----------------------------+--+--+--+--+--+--+--+--+--+--+
Eth 1/1 | 200 mv | 796 mUI | 40/ 33 | 08/31/2016 16:48:52.345248 |a9|ee|82|00|00|6e|82|00|88|00|
fi0 | 200 mv | 843 mUI | 40/ 36 | 08/31/2016 16:48:52.350360 |00|00|00|00|00|00|00|00|00|00|
fi1 | 200 mv | 859 mUI | 40/ 37 | 08/31/2016 16:48:52.355470 |00|00|00|00|00|00|00|00|00|00|
Sur ces Plateformes, si la valeur est :
- Au-dessous de 50mV, il s'est avéré pour déclencher des erreurs de CRC
- 50 - 100mV, il peut entraîner des erreurs de CRC et la réduction est informée
- > 100 système mv, il ne doit pas entraîner des erreurs de CRC
Modules UCS 2200 IOM :
connect local-mgmt a or connect local-mgmt b
connect iom x
show platform software woodside sts (Note: The HI number/s for the servers that you need to check)
dbgexec woo
kr_geteye HIxx
Ctrl-C to exit dbgexec mode
Sortie témoin qui affiche une bonne hauteur d'oeil (125 système mv) :
woo> kr_geteye HI31
[serdes] reg: 64/40h = 42ch
check_kr_status: HI31: up (kr_retries=0)
sent SPICO interrupt(20, 0, 49)
Vertical eye result 0x14
sent SPICO interrupt(20, 0, 49)
Horizontal eye result 0x28
HI31: 125.0 mV, 0.6250 UI (NORM)
Modules UCS 2300 IOM :
connect local-mgmt a or connect local-mgmt b
connect iom x
show platform software tiburon sts (Note the HI number/s for the servers you need to check)
dbgexec tib
kr_geteye 0 HIxx
Ctrl-C to exit dbgexec mode
Sortie témoin qui affiche une bonne hauteur d'oeil (156 système mv) :
tib> kr_geteye 0 HI31
Start eye measurement HI31...
bottom: -73.5 (mV), top: 82.7 (mV), height: 156.2 (mV)
left: -0.34 (UI), right: 0.33 (UI), width: 0.69 (UI)
total time = 0.119456 sec
Sur ces Plateformes, si la valeur de hauteur est :
- En-dessous de 90 système mv, il s'est avéré pour déclencher des erreurs de CRC
- > 90 système mv, il ne doit pas déclencher des erreurs de CRC
Défauts
Fabric Interconnect
- CSCuo76425 observant l'erreur de CRC sur le câble cuivre
Ce défaut est vu sur des ports de Fabric Interconnect, tels que des ports de liaison ascendante et de serveur.
Il est réparé en infrastructure UCS 2.2(3a), se rapportent à l'outil de recherche de bogue pour d'autres versions corrigées.
- Près de la bogue identique qui micrologiciel postérieur des affects UCS :
CSCuw36398 observant des erreurs de CRC sur le câble cuivre
Ce défaut est vu sur des ports de Fabric Interconnect, tels que des ports de liaison ascendante et de serveur
Il est réparé en infrastructure UCS 2.2(7b). Référez-vous à l'outil de recherche de bogue pour d'autres versions corrigées.
IOM et adaptateur
- Hauteur d'oeil CSCuz78417 Serdes entre IOM et carte d'interface virtuelle inférieurs à 90mV
Ce défaut est vu entre les interfaces d'hôte IOM (HIF) et les adaptateurs, qui affecte les différents serveurs.
On l'a depuis constaté que ceci est provoqué par par des questions de châssis d'adaptateur. Si vous observez cette question, ouvrez une demande de service avec Cisco TAC.
- La question indigène de formation du lien 40g CSCva47085 VIC1340+2304 IOM entraîne la perte de Connectivité
Ce défaut est vu entre IOM HIF et adaptateurs, qui affecte les différents serveurs.
Actuellement à l'étude.
Série C
- CSCux31002 la carte d'interface virtuelle 1227 affiche des crc quand vous utilisez un câble actif de twinax.
Réparé en micrologiciel autonome de série C 2.0(9c). Référez-vous à l'outil de recherche de bogue pour d'autres versions corrigées.
L'état du déclencheur de cette bogue est l'inverse de la sagesse commune que Twinax actif est moins pour entraîner des questions de CRC dues à son transport d'énergie active.
Nexus 5500
- Le besoin CSCuj86736 d'optimiser DFE accordant dans la gamme 55xxUP commute - des erreurs de CRC RX
Tandis que pas strictement une bogue UCS, il est toujours généralement - vu dans des installations UCS dues à la prédominance de l'en amont du Nexus 55xx. Référez-vous à l'outil de recherche de bogue pour des informations sur des versions corrigées.
Contournements/réduction
Référez-vous à la note de mise à jour pour chaque bogue pour les détails spécifiques, mais si vous avez trouvé des preuves de la basse hauteur d'oeil, alors le shut/no fermé du port est raisonnable.
Dans le cas d'un défaut de hauteur d'oeil IOM/Adapter, une remise du DCI dans l'interface peut être faite. Naviguez vers le serveur > l'adaptateur > l'interface DCE > Connectivityas remis à l'état initial qu'il est approprié.
Des sorties doivent être alors vérifiées pour voir si la hauteur d'oeil a grimpé jusqu'aux bonnes valeurs et si les compteurs de CRC n'ont plus incrémenté.
Plusieurs instabilités (généralement jusqu'à 5) peut être nécessaire pour augmenter la hauteur d'oeil suffisamment.
Si la hauteur d'oeil ne récupère pas après plusieurs instabilités de lien, il pourrait y a une défaillance matérielle du composant.
Quand vous agitez des ports, rendez-vous compte que ceci peut déclencher une détection peu profonde par des UCS Manager.
Une détection peu profonde sous des circonstances normales n'est pas plan de données affectant, cependant, il y a des défauts connus qui affectent les lames B200-M4 (voir le CSCut61527 pour le défaut le plus commun). Une détection peu profonde peut se transformer en détection profonde, qui peut déclencher la réinitialisation de SYSTÈME D'EXPLOITATION d'hôte.
Cisco recommande que vous examiniez les notes de mise à jour pour votre version d'UCS Manager pour d'autres défauts applicables.
Sans compter que le lien instable manuel de port comme étape réactive de reprise, la gestion d'erreur d'erreur de port basée sur la politique UCS dans les UCS Manager 2.2(4) et plus tard peut être utilisée pour désactiver des ports NIF quand des erreurs de CRC sont vues. Tandis qu'une telle action peut rapidement limiter l'incidence des erreurs de CRC, elle peut avoir le potentiel pour l'interruption de la circulation, par conséquent n'est pas activée par défaut et le soin doit être pris si vous enabke il.
Les UCS Manager génèrent des défauts pour des erreurs de CRC et de tels défauts peuvent être surveillés par l'intermédiaire de XML API ou Protocole SNMP (Simple Network Management Protocol).