소개
이 문서에서는 포트 바운스 후 LAG(Link Aggregation) 포트에 대한 ASR 5000의 SPOF(Single Point of Failure) 경보와 관련된 문제에 대해 설명합니다.잘못된 경보는 사실 걱정할 문제가 없을 때 불필요한 티켓을 열 수 있습니다.
영향을 받는 제품
LAG 포트를 포함한 모든 ASR 5000이 영향을 받습니다.
증상
ASR 5000 플랫폼의 LAG 기반 10GB XGLC(Line Card)에 대해 불필요한 SPOF(Single Point of Failure) 알람의 트리거와 관련된 문제가 있습니다.LAG 포트가 다운(트랩 PortDown)될 때마다 CardSPOFClear 트랩이 트리거되고 포트가 업(트랩 PortUp)될 때마다 CardSPOFAlarm 트랩이 트리거됩니다.포트 반송은 PSC 마이그레이션, Pumgr 재시작, 하드웨어 장애, 섀시 다시 로드, 외부 발생 링크 문제 등 다양한 이유로 발생할 수 있습니다.이 코드 조각은 포트 19/1 바운스에 대한 각 SPOF 트랩을 보여줍니다. 한편 LAG 전환은 프로세스에서 바운스될 수 있는 모든 포트에 대한 트랩을 생성하는 경우가 많습니다.
Tue Jan 21 07:35:55 2014 Internal trap notification 1024 (PortDown) card 19 port 1 port type 10G Ethernet
Tue Jan 21 07:35:55 2014 Internal trap notification 1503 (EntStateOperDisabled) Port(19/1) Admin state:"Locked", Alarm severity:"Major"
Tue Jan 21 07:35:55 2014 Internal trap notification 93 (CardStandby) card 19 type 10 Gig Ethernet Line Card
Tue Jan 21 07:35:55 2014 Internal trap notification 140 (CardSPOFClear) card 19 type 10 Gig Ethernet Line Card
Tue Jan 21 07:40:36 2014 Internal trap notification 1025 (PortUp) card 19 port 1 port type 10G Ethernet
Tue Jan 21 07:40:51 2014 Internal trap notification 139 (CardSPOFAlarm) card 19 type 10 Gig Ethernet Line Card
2015년 1월에 구축된 v15.0부터 SNMP 트랩 외에 경보 메커니즘도 알림을 받기 시작했습니다. 다음은 예제의 일치하는 알람입니다.
******** show alarm outstanding verbose *******
Severity Object Timestamp Alarm ID
-------- ---------- ---------------------------------- ---------------------
Alarm Details
--------------------------------------------------------------------------------
Minor Card 19 Tuesday January 21 07:40:51 5769809167128920064
슬롯 19의 10Gig 이더넷 라인 카드는 단일 장애 지점입니다.슬롯 20에는 10Gig 이더넷 라인 카드가 필요합니다.
솔루션
LAG 구성 카드에 대한 SPOF 경보는 Root Cause Analysis(근본 원인 분석)에 설명된 사유별로 단순히 무시하고 지워야 합니다.clear alarm 명령을 사용하여 미해결 모든 알람(원하는 경우 비 SPOF 알람 포함)을 지우거나 show alarm outstanding [verbose]에서 보고한 알람 ID를 지정하여 특정 SPOF만 지울 수 있습니다.위의 예에서는
clear alarm id 5769809167128920064
또는
경보 해제 모두
참고:다른 포트 바운스가 발생하지 않는 한 경보는 무기한 유지됩니다. 이 경우 타임스탬프에서 알 수 있듯이 새로운 경보가 기존 경계를 대체합니다.
근본 원인 분석
LAG의 설계로 인해 카드 이중화는 LAG에 의해 수행되며 카드 레벨에서 수행되지 않습니다. 즉, 모든 LAG 구성 카드가 항상 작동 상태로 활성 상태로 작동하며 둘 중 어느 것도 대기 상태가 아닙니다.따라서 LAG 구성 카드에 대한 컨피그레이션에서는 이중화를 지정하지 않습니다.
show port info
...
Card 23: card 26:
Card Type: 10 Gig Ethernet Line Card Card Type: 10 Gig Ethernet Line Card
Operational State : Active Operational State : Active
Redundant With : None Redundant With : None
******** show card table all ********
Slot Card Type Oper State SPOF Attach
---------- ---------------------------------------- ------------- ---- ------
19: LC 10 Gig Ethernet Line Card Active Yes 3
20: LC 10 Gig Ethernet Line Card Active Yes 4
21: LC 1000 Ethernet Line Card Active No 5
22: LC 1000 Ethernet Line Card Active No 6
23: LC 10 Gig Ethernet Line Card Active Yes 7
24: SPIO Switch Processor I/O Card Active No 8
25: SPIO Switch Processor I/O Card Active No 8
26: LC 10 Gig Ethernet Line Card Active Yes 10
27: LC 10 Gig Ethernet Line Card Active Yes 11
28: LC 10 Gig Ethernet Line Card Active Yes 12
29: LC 10 Gig Ethernet Line Card Active Yes 13
30: LC 10 Gig Ethernet Line Card Active Yes 14
한편 비 LAG 카드에 대한 컨피그레이션에서는 이중화를 지정합니다.예를 들어, LAG 포트가 없는 컨피그레이션은 다음과 같습니다. 이 경우 SPOF 경보는 중요하며 조사해야 합니다.활성/대기 XGLC의 각 쌍을 보여 주는 카드 테이블입니다.
card 19
redundant with 20
#exit
card 23
redundant with 26
#exit
card 27
redundant with 28
#exit
card 29
redundant with 30
#exit
[local]ASR5000> show card table all
Slot Card Type Oper State SPOF Attach
----------- -------------------------------------- ------------- ---- ------
...
19: LC 10 Gig Ethernet Line Card Active No 3
20: LC 10 Gig Ethernet Line Card Standby - 4
21: LC 1000 Ethernet Line Card Active No 5
22: LC 1000 Ethernet Line Card Active No 6
23: LC 10 Gig Ethernet Line Card Active No 7
24: SPIO Switch Processor I/O Card Active No 8
25: SPIO Switch Processor I/O Card Active No 8
26: LC 10 Gig Ethernet Line Card Standby - 10
27: LC 10 Gig Ethernet Line Card Active No 11
28: LC 10 Gig Ethernet Line Card Standby - 12
29: LC 10 Gig Ethernet Line Card Active No 13
30: LC 10 Gig Ethernet Line Card Standby - 14