소개
이 문서에서는 코드 F1545~F1552의 fault에 대해 설명합니다. 이는 ACI에서 삭제된 패킷을 분류하는 방식과 관련된 외관상 fault입니다.
문제
기본적으로 ACI에는 atomic 카운터가 활성화되어 있습니다.
이러한 카운터는 leaf 간에 직접 또는 leaf에서 spine으로의 드랍을 검사합니다.
규칙: 진행 중인 원자 계수기
이 경우, 결함 코드는 leaf-leaf 카운터인 F1545, F1546, F1547, F1548, F1549, F1550, F1551, F1552입니다.
보고되는 이유
이러한 카운터는 통신이 TEP-TEP인 경우에만 유효합니다(예: VPC 없음). ACI 모니터링을 위한 첫 번째 버전이었지만, ACI의 설계 및 구현에서는 이러한 결함이 무관한 것으로 오랫동안 간주되어 왔습니다. 패브릭이 현재 사용 중인 버전에 관계없이 이 기능을 비활성화하면 패브릭을 승인하고 삭제할 수 있습니다.
일부 패킷은 삭제로 계산되지만 실제 테넌트 트래픽 삭제는 아닙니다.
예를 들면 다음과 같습니다.
- 리프 vPC 쌍은 vPC 쌍 vPC VIP(Virtual IP)를 사용하여 개별 터널 인터페이스를 통해 패킷을 다른 leaf로 전송합니다. ACI는 패킷 통계에 터널 인터페이스를 사용합니다. vPC VIP는 가상 인터페이스이므로 개별 leaf에는 해당 터널 인터페이스가 없으므로 드롭을 추적할 터널 인터페이스가 없습니다. 따라서 vPC VIP로 향하는 패킷은 수신 vPC 피어 리프 스위치에서 삭제로 계산됩니다.
- 리프 및 엔드포인트 정보 교환 간의 vPC 제어 플레인 패킷
- 적소에 있는 계약으로 인해 발생하는 드롭도 드롭으로 계산되지만, 이는 계약이 작업을 수행하기 때문에 예상되며 나쁘지 않습니다.
해결 방법
진행 중인 atomic 카운터 기능을 비활성화합니다. 스퀼링하더라도 지속적인 atomic 카운터 개체의 수는 노드 수가 많은 일부 패브릭에서 APIC 성능 문제를 야기할 수 있습니다.
기본적으로 Cisco 버그 ID CSCwh67235를 통해 지속적인 atomic 카운터를 비활성화하도록 문서화된 개선 사항이 있으며, 이는 6.1.x 버전 이후의 기본 동작입니다.
Operations(운영) > Visualization(시각화)을 클릭하고 Settings(설정)를 클릭한 다음 Administrative State Disabled(관리 상태 사용 안 함)를 선택하고 Submit(제출)을 클릭합니다.
진행 중인 atomic 카운터 비활성화
CLI 확인
APIC# moquery -c dbgOngoingAcMode | grep adminSt
adminSt : disabled
미세 카운터가 비활성화된 경우에도 사용자는 Configure Atomic Counter Policies 설명서에 설명된 온디맨드 미세 카운터를 계속 사용할 수 있고 사용해야 한다는 점에 유의하십시오.
진행 중인 작업은 유효하지 않으며 확장/결함에 크게 기여합니다. 온디맨드는 사후 대응적이며 유효합니다. 계속을 비활성화해도 온디맨드 사용을 막을 수 없습니다.
이 기능을 비활성화하면 패킷이 전혀 쓸모 없는 알림을 삭제합니까?
ACI에는 다양한 결함 카운터가 있습니다. 실제 드롭인 경우, 해당 결함 코드 아래에 표시됩니다.
예를 들어, F100696 - 인그레스 포워딩 드롭 패킷, ACI의 패킷 드롭 결함 설명에 대한 자세한 내용.
관련 문제
지원되는 규모 이상의 dbgr 개체에 대해 발생한 메모리 부족 문제로 인해 APIC 응답 속도가 느리거나 단일 요청에 응답하지 못하는 것을 볼 수 있습니다. 이 기능은 노드 수가 많은 패브릭에서 제대로 확장되지 않습니다.
일반적인 확인
특성 규칙에 on-going-atomic-counter가 포함된 오류를 확인합니다.
APIC# moquery -c faultInst -x 'query-target-filter=wcard(faultInst.rule,"on-going-atomic-counter")' | grep dn
dn : dbgs/ac/sdvpcpath-101-103-to-102-104/fault-F1546
dn : dbgs/ac/sdvpcpath-101-103-to-102-104/fault-F1548
dn : dbgs/ac/sdvpcpath-102-104-to-101-103/fault-F1548
dn : dbgs/ac/sdvpcpath-102-104-to-101-103/fault-F1546
dn : dbgs/ac/path-101-to-103/fault-F1545
dn : dbgs/ac/path-101-to-103/fault-F1547
dn : dbgs/ac/path-103-to-101/fault-F1545
dn : dbgs/ac/path-103-to-101/fault-F1546
DBGR 서비스가 실행 중인지 확인:
APIC# ps -ef | egrep "dbgr.bin|STIME"
UID PID PPID C STIME TTY TIME CMD
ifc 15785 1 1 May23 ? 07:57:39 /mgmt//bin/svc_ifc_dbgr.bin --x
dbgr 서비스에서 텍스트 충분 토큰과 일치하는 레코드를 확인합니다. 이 예에서는 날짜 및 발생 수를 기준으로 선택할 수 있으며, 날짜 2024-05-20에 대한 총 153506.
APIC# zgrep "enough tokens" /var/log/dme/log/svc_ifc_dbgr*
svc_ifc_dbgr.bin.log.595460.gz:30038||2024-05-20T08:11:01.125937358+00:00||doer||INFO||co=doer:1:1:0x800000013811b8b:0||Dropping stimuli as doer does not have enough tokens||../common/src/framework/./core/proc/Doer.cc||1303
...
svc_ifc_dbgr.bin.log.595460.gz:30038||2024-05-20T08:11:03.126887965+00:00||doer||INFO||co=doer:19:1:0x98000000129a2c01:0||Dropping stimuli as doer does not have enough tokens||../common/src/framework/./core/proc/Doer.cc||1303
APIC# zgrep "enough tokens" /var/log/dme/log/svc_ifc_dbgr* | grep 2024-05-20 | wc -l
153506
APIC# egrep "Shard|id |tokens.available" /debug/$HOSTNAME/dbgr/ifm/debug/mo | grep -B 2 "tokens.available : 0"
Shard : id : 1
tokens.available : 0
관련 정보
Cisco APIC Faults, Events, and System Messages Management Guide > Handling Expected Faults
미세 카운터 지침 및 제한
Atomic 카운터 정책 구성
ACI의 패킷 삭제 결함 설명
참조 버그
Cisco 버그 ID CSCwh67235: 진행 중인 미세 카운터를 기본적으로 비활성화합니다.
Cisco 버그 ID CSCuz99892: TEP-to-TEP atomic 카운터를 신뢰할 수 없습니다.
Cisco 버그 IDCSCvp07545: ACI 패브릭에서 결함 수신 F1545 및 F1547 결함
Cisco 버그 ID CSCwf18707: dbgAcPathA 확장성이 초과될 경우 제기된 결함