소개
이 문서에서는 코드 F1545~F1552의 fault에 대해 설명합니다. 이는 ACI에서 삭제된 패킷을 분류하는 방식과 관련된 외관상 fault입니다.
문제
기본적으로 ACI에는 atomic 카운터가 활성화되어 있습니다.
이들 계기는 리프 상호간에 직접 또는 리프에서 스핀들간에 드롭을 검사한다.
규칙 : 진행 중인 원자 계수기
이 경우, 결함 코드는 leaf-leaf 카운터인 F1545, F1546, F1547, F1548, F1549, F1550, F1551, F1552입니다.
왜 보고되었을까요?
이러한 카운터는 통신이 TEP-TEP인 경우에만 유효합니다(예: VPC 없음). ACI 모니터링을 위한 첫 번째 버전이었지만, ACI의 설계 및 구현에서는 이러한 결함이 무관한 것으로 오랫동안 간주되어 왔습니다. 패브릭이 현재 사용 중인 버전에 관계없이 이 기능을 비활성화하면 패브릭을 승인하고 삭제할 수 있습니다.
일부 패킷은 삭제로 계산되지만 실제 테넌트 트래픽 삭제는 아닙니다. 예를 들면 다음과 같습니다.
- 리프 vPC 쌍은 vPC 쌍 vPC VIP(Virtual IP)를 사용하여 개별 터널 인터페이스를 통해 패킷을 다른 leaf로 전송합니다. ACI는 패킷 통계에 터널 인터페이스를 사용합니다. vPC VIP는 가상 인터페이스이기 때문에 개별 leaf에 해당 터널 인터페이스가 없으며, 그 결과 드롭을 추적할 터널 인터페이스가 없습니다. 따라서 vPC VIP로 향하는 패킷은 수신 vPC 피어 리프 스위치에서 삭제로 계산됩니다.
- 리프 및 엔드포인트 정보 교환 간의 vPC 제어 플레인 패킷
- 적소에 있는 계약으로 인해 발생하는 드롭도 드롭으로 계산되지만, 이는 계약이 작업을 수행하기 때문에 예상되며 나쁘지 않습니다.
해결 방법
진행 중인 Atomic 카운터 기능을 비활성화합니다. 스퀼링하더라도 진행 중인 Atomic 카운터 개체의 수가 많으면 노드 수가 많은 일부 패브릭에서 APIC 성능 문제가 발생할 수 있습니다.
기본적으로 Cisco 버그 ID CSCwh67235를 통해 지속적인 atomic 카운터를 비활성화하도록 문서화된 개선 사항이 있으며, 이는 6.1.x 버전 이후의 기본 동작입니다.
Operations(운영) > Visualization(시각화)을 클릭하고 Settings(설정)를 클릭한 다음 Administrative State Disabled(관리 상태 비활성화)를 선택하고 Submit(제출)을 클릭합니다.
진행 중인 atomic 카운터 비활성화
미세 카운터를 비활성화하더라도 사용자는 Configure Atomic Counter Policies 설명서에 설명된 온디맨드 미세 카운터를 계속 사용할 수 있고 사용해야 한다는 점에 유의하십시오.
진행 중인 작업은 유효하지 않으며 확장/결함에 크게 기여합니다. 온디맨드는 사후 대응적이며 유효합니다. 지속적인 사용을 비활성화해도 온디맨드 사용을 막을 수 없습니다.
이 기능을 비활성화하면 패킷이 전혀 쓸모 없는 알림을 삭제합니까?
ACI에는 다양한 결함 카운터가 있습니다. 실제 드롭이 있는 경우, 해당 결함 코드 아래에 표시됩니다.
예를 들어, F100696 - 인그레스 포워딩 드롭 패킷, ACI의 패킷 드롭 결함에 대한 설명에 대한 자세한 내용.
관련 문제
지원되는 규모 이상의 dbgr 객체에 대해 발생한 메모리 부족 문제로 인해 APIC 응답 또는 단일 요청에 대한 응답 실패를 확인하고 느리게 할 수 있습니다. 이 기능은 노드 수가 많은 패브릭에서는 제대로 확장되지 않습니다.
일반적인 확인
특성 규칙에 "on-going-atomic-counter"가 포함된 오류를 확인합니다.
APIC# moquery -c faultInst -x 'query-target-filter=wcard(faultInst.rule,"on-going-atomic-counter")' | grep dn
dn : dbgs/ac/sdvpcpath-101-103-to-102-104/fault-F1546
dn : dbgs/ac/sdvpcpath-101-103-to-102-104/fault-F1548
dn : dbgs/ac/sdvpcpath-102-104-to-101-103/fault-F1548
dn : dbgs/ac/sdvpcpath-102-104-to-101-103/fault-F1546
dn : dbgs/ac/path-101-to-103/fault-F1545
dn : dbgs/ac/path-101-to-103/fault-F1547
dn : dbgs/ac/path-103-to-101/fault-F1545
dn : dbgs/ac/path-103-to-101/fault-F1546
DBGR 서비스가 실행 중인지 확인:
APIC# ps -ef | egrep "dbgr.bin|STIME"
UID PID PPID C STIME TTY TIME CMD
ifc 15785 1 1 May23 ? 07:57:39 /mgmt//bin/svc_ifc_dbgr.bin --x
dbgr 서비스에서 텍스트 "충분한 토큰"과 일치하는 레코드를 확인합니다. 이 예에서는 날짜 및 발생 횟수(날짜 2024-05-20의 총 153506)를 기준으로 선택할 수 있습니다
APIC# zgrep "enough tokens" /var/log/dme/log/svc_ifc_dbgr*
svc_ifc_dbgr.bin.log.595460.gz:30038||2024-05-20T08:11:01.125937358+00:00||doer||INFO||co=doer:1:1:0x800000013811b8b:0||Dropping stimuli as doer does not have enough tokens||../common/src/framework/./core/proc/Doer.cc||1303
...
svc_ifc_dbgr.bin.log.595460.gz:30038||2024-05-20T08:11:03.126887965+00:00||doer||INFO||co=doer:19:1:0x98000000129a2c01:0||Dropping stimuli as doer does not have enough tokens||../common/src/framework/./core/proc/Doer.cc||1303
APIC# zgrep "enough tokens" /var/log/dme/log/svc_ifc_dbgr* | grep 2024-05-20 | wc -l
153506
참조:
Cisco APIC Faults, Events, and System Messages Management Guide > Handling Expected Faults
미세 카운터 지침 및 제한
Atomic 카운터 정책 구성
ACI의 패킷 삭제 오류에 대한 설명
참조 버그:
Cisco 버그 ID CSCwh67235: 진행 중인 미세 카운터를 기본적으로 비활성화합니다.
Cisco 버그 ID CSCuz99892: TEP-to-TEP atomic 카운터를 신뢰할 수 없습니다.
Cisco 버그 IDCSCvp07545: ACI 패브릭에서 결함 수신 F1545 및 F1547 결함
Cisco 버그 ID CSCwf18707: dbgAcPathA 확장성이 초과될 경우 제기되는 결함