Introduction
Este documento descreve o problema relacionado aos alarmes de ponto de falha único (SPOF - Single Point of Failure) no ASR 5000 para portas LAG (Link Aggregation) após um salto de porta. Os alarmes falsos podem provocar a abertura de bilhetes desnecessários quando, na verdade, não há qualquer problema a preocupar-se.
Produtos afetados
Qualquer ASR 5000 incluindo portas LAG são afetados.
Sintomas
Há um problema relacionado ao disparo desnecessário de alarmes SPOF (Single Point of Failure) para placas de linha de 10 GB (XGLC) baseadas em LAG na plataforma ASR 5000. Sempre que uma porta LAG cai (trap PortDown), a armadilha CardSPOFClear é acionada e sempre que a porta é ativada (trap PortUp), a armadilha CardSPOFAlarm é acionada. Os bounces de porta podem ser feitos por vários motivos, incluindo migrações de PSC, reinicializações de bombeiros, falhas de hardware, recarga de chassi ou problemas de link causados externamente. Esse trecho mostra as respectivas armadilhas SPOF para uma devolução de porta 19/1, enquanto que um switchover de LAG geralmente resulta em armadilhas para todas as portas que podem ser devolvidas no processo.
Tue Jan 21 07:35:55 2014 Internal trap notification 1024 (PortDown) card 19 port 1 port type 10G Ethernet
Tue Jan 21 07:35:55 2014 Internal trap notification 1503 (EntStateOperDisabled) Port(19/1) Admin state:"Locked", Alarm severity:"Major"
Tue Jan 21 07:35:55 2014 Internal trap notification 93 (CardStandby) card 19 type 10 Gig Ethernet Line Card
Tue Jan 21 07:35:55 2014 Internal trap notification 140 (CardSPOFClear) card 19 type 10 Gig Ethernet Line Card
Tue Jan 21 07:40:36 2014 Internal trap notification 1025 (PortUp) card 19 port 1 port type 10G Ethernet
Tue Jan 21 07:40:51 2014 Internal trap notification 139 (CardSPOFAlarm) card 19 type 10 Gig Ethernet Line Card
A partir da v15.0 implementada em janeiro de 2015, além das armadilhas SNMP, o mecanismo alarmante também começou a ser notificado. Aqui está o alarme correspondente do exemplo:
******** show alarm outstanding verbose *******
Severity Object Timestamp Alarm ID
-------- ---------- ---------------------------------- ---------------------
Alarm Details
--------------------------------------------------------------------------------
Minor Card 19 Tuesday January 21 07:40:51 5769809167128920064
A placa de linha Ethernet de 10 Gig no slot 19 é um ponto único de falha. Uma placa de linha Ethernet de 10 Gig é necessária no slot 20.
Solução
Os alarmes SPOF para placas configuradas por LAG devem ser simplesmente ignorados e apagados pelo motivo explicado na Análise da causa raiz. O comando clear alarm pode ser usado para limpar todos os alarmes pendentes (incluindo os não SPOF, se desejado), ou para limpar apenas SPOFs específicos especificando a ID de alarme reportada pelo show alarm notória [verbose]. Para o exemplo acima:
clear alarm id 5769809167128920064
or
clear alarm all
Note: Os alarmes permanecem indefinidamente, a menos que ocorra outra devolução de porta, caso em que um novo alarme (como evidenciado pelo carimbo de data/hora) substitui o existente.
Análise da causa raiz
Devido ao projeto do LAG, a redundância da placa é feita pelo LAG e NÃO é feita no nível da placa, de modo que todas as placas configuradas por LAG estejam sempre ativas operacionalmente - nenhuma delas está em espera. Portanto, a configuração para placas configuradas por LAG NÃO especifica nenhuma redundância.
show port info
...
Card 23: card 26:
Card Type: 10 Gig Ethernet Line Card Card Type: 10 Gig Ethernet Line Card
Operational State : Active Operational State : Active
Redundant With : None Redundant With : None
******** show card table all ********
Slot Card Type Oper State SPOF Attach
---------- ---------------------------------------- ------------- ---- ------
19: LC 10 Gig Ethernet Line Card Active Yes 3
20: LC 10 Gig Ethernet Line Card Active Yes 4
21: LC 1000 Ethernet Line Card Active No 5
22: LC 1000 Ethernet Line Card Active No 6
23: LC 10 Gig Ethernet Line Card Active Yes 7
24: SPIO Switch Processor I/O Card Active No 8
25: SPIO Switch Processor I/O Card Active No 8
26: LC 10 Gig Ethernet Line Card Active Yes 10
27: LC 10 Gig Ethernet Line Card Active Yes 11
28: LC 10 Gig Ethernet Line Card Active Yes 12
29: LC 10 Gig Ethernet Line Card Active Yes 13
30: LC 10 Gig Ethernet Line Card Active Yes 14
Enquanto isso, a configuração para placas não LAG especifica redundância. Por exemplo, aqui está a configuração que NÃO tem nenhuma porta LAG, caso em que os alarmes SPOF têm significado e devem ser investigados. Esta é a tabela da placa que mostra os respectivos pares de XGLCs ativos/em espera.
card 19
redundant with 20
#exit
card 23
redundant with 26
#exit
card 27
redundant with 28
#exit
card 29
redundant with 30
#exit
[local]ASR5000> show card table all
Slot Card Type Oper State SPOF Attach
----------- -------------------------------------- ------------- ---- ------
...
19: LC 10 Gig Ethernet Line Card Active No 3
20: LC 10 Gig Ethernet Line Card Standby - 4
21: LC 1000 Ethernet Line Card Active No 5
22: LC 1000 Ethernet Line Card Active No 6
23: LC 10 Gig Ethernet Line Card Active No 7
24: SPIO Switch Processor I/O Card Active No 8
25: SPIO Switch Processor I/O Card Active No 8
26: LC 10 Gig Ethernet Line Card Standby - 10
27: LC 10 Gig Ethernet Line Card Active No 11
28: LC 10 Gig Ethernet Line Card Standby - 12
29: LC 10 Gig Ethernet Line Card Active No 13
30: LC 10 Gig Ethernet Line Card Standby - 14