Introduction
Ce document décrit le problème lié aux alarmes de point de défaillance unique (SPOF) sur ASR 5000 pour les ports d'agrégation de liaisons (LAG) après un renvoi de port. Les fausses alarmes peuvent entraîner l'ouverture de tickets inutiles alors qu'en fait il n'y a aucun problème à craindre.
Produits affectés
Tout ASR 5000, y compris les ports LAG, est affecté.
Symptômes
Il y a un problème lié au déclenchement inutile d'alarmes de point de défaillance unique (SPOF) pour les cartes de ligne 10 Go basées sur LAG (XGLC) sur la plate-forme ASR 5000. Chaque fois qu'un port LAG tombe en panne (piège PortDown), que le piège CardSPOFClear se déclenche et chaque fois que le port s'active (piège PortUp), le piège CardSPOFAlarm se déclenche. Les renvois de port peuvent être motivés par un certain nombre de raisons, notamment les migrations PSC, les redémarrages npumgr, les pannes matérielles, le rechargement du châssis ou les problèmes de liaison causés de l'extérieur. Cet extrait montre les interruptions SPOF respectives pour un renvoi de port 19/1, pendant ce temps, un basculement LAG entraîne souvent des interruptions pour tous les ports qui peuvent rebondir dans le processus.
Tue Jan 21 07:35:55 2014 Internal trap notification 1024 (PortDown) card 19 port 1 port type 10G Ethernet
Tue Jan 21 07:35:55 2014 Internal trap notification 1503 (EntStateOperDisabled) Port(19/1) Admin state:"Locked", Alarm severity:"Major"
Tue Jan 21 07:35:55 2014 Internal trap notification 93 (CardStandby) card 19 type 10 Gig Ethernet Line Card
Tue Jan 21 07:35:55 2014 Internal trap notification 140 (CardSPOFClear) card 19 type 10 Gig Ethernet Line Card
Tue Jan 21 07:40:36 2014 Internal trap notification 1025 (PortUp) card 19 port 1 port type 10G Ethernet
Tue Jan 21 07:40:51 2014 Internal trap notification 139 (CardSPOFAlarm) card 19 type 10 Gig Ethernet Line Card
À partir de la version 15.0 déployée en janvier 2015, outre les déroutements SNMP, le mécanisme alarmant a également commencé à être notifié. Voici l'alarme correspondante de l'exemple :
******** show alarm outstanding verbose *******
Severity Object Timestamp Alarm ID
-------- ---------- ---------------------------------- ---------------------
Alarm Details
--------------------------------------------------------------------------------
Minor Card 19 Tuesday January 21 07:40:51 5769809167128920064
La carte de ligne Ethernet 10 Gig du logement 19 est un point de défaillance unique. Une carte de ligne Ethernet 10 Gig est nécessaire dans le logement 20.
Solution
Les alarmes SPOF pour les cartes configurées LAG doivent être simplement ignorées et effacées pour la raison expliquée dans l'analyse de la cause première. La commande clear alarm peut être utilisée pour effacer toutes les alarmes en attente (y compris les alarmes non SPOF si cela est souhaité), ou pour effacer des SPOF spécifiques en spécifiant l'ID d'alarme signalé par show alarm exceptionnel [verbose]. Pour l'exemple ci-dessus :
clear alarm id 5769809167128920064
ou
clear alarme all
Note: Les alarmes restent en place indéfiniment à moins qu'un autre port ne rebondisse, auquel cas une nouvelle alarme (comme l'indique l'horodatage) remplace l'alarme existante.
Analyse des causes premières
En raison de la conception du LAG, la redondance de la carte est effectuée par le LAG et n'est PAS effectuée au niveau de la carte, de sorte que toutes les cartes configurées par le LAG sont toujours actives sur le plan opérationnel - aucune d'elles n'est en veille. Par conséquent, la configuration des cartes configurées par LAG ne spécifie AUCUNE redondance.
show port info
...
Card 23: card 26:
Card Type: 10 Gig Ethernet Line Card Card Type: 10 Gig Ethernet Line Card
Operational State : Active Operational State : Active
Redundant With : None Redundant With : None
******** show card table all ********
Slot Card Type Oper State SPOF Attach
---------- ---------------------------------------- ------------- ---- ------
19: LC 10 Gig Ethernet Line Card Active Yes 3
20: LC 10 Gig Ethernet Line Card Active Yes 4
21: LC 1000 Ethernet Line Card Active No 5
22: LC 1000 Ethernet Line Card Active No 6
23: LC 10 Gig Ethernet Line Card Active Yes 7
24: SPIO Switch Processor I/O Card Active No 8
25: SPIO Switch Processor I/O Card Active No 8
26: LC 10 Gig Ethernet Line Card Active Yes 10
27: LC 10 Gig Ethernet Line Card Active Yes 11
28: LC 10 Gig Ethernet Line Card Active Yes 12
29: LC 10 Gig Ethernet Line Card Active Yes 13
30: LC 10 Gig Ethernet Line Card Active Yes 14
Pendant ce temps, la configuration des cartes non LAG spécifie la redondance. Par exemple, voici la configuration qui n'a AUCUN port LAG, auquel cas les alarmes SPOF ont une signification et doivent être étudiées. Il s'agit de la table de cartes qui montre les paires respectives de XGLC actifs/en veille.
card 19
redundant with 20
#exit
card 23
redundant with 26
#exit
card 27
redundant with 28
#exit
card 29
redundant with 30
#exit
[local]ASR5000> show card table all
Slot Card Type Oper State SPOF Attach
----------- -------------------------------------- ------------- ---- ------
...
19: LC 10 Gig Ethernet Line Card Active No 3
20: LC 10 Gig Ethernet Line Card Standby - 4
21: LC 1000 Ethernet Line Card Active No 5
22: LC 1000 Ethernet Line Card Active No 6
23: LC 10 Gig Ethernet Line Card Active No 7
24: SPIO Switch Processor I/O Card Active No 8
25: SPIO Switch Processor I/O Card Active No 8
26: LC 10 Gig Ethernet Line Card Standby - 10
27: LC 10 Gig Ethernet Line Card Active No 11
28: LC 10 Gig Ethernet Line Card Standby - 12
29: LC 10 Gig Ethernet Line Card Active No 13
30: LC 10 Gig Ethernet Line Card Standby - 14