简介
本文档介绍代码F1545至F1552的故障,这些故障是与ACI对丢弃的数据包进行分类的方式相关的表面故障。
问题
默认情况下,ACI已启用原子计数器。
这些计数器直接检查枝叶之间的滴落或者从枝叶到主干。
规则:正在运行的原子计数器
在这种情况下,故障代码为F1545、F1546、F1547、F1548、F1549、F1550、F1551和F1552,它们是枝叶计数器。
为什么要报告它们
只要通信仅是TEP到TEP(例如,没有VPC),这些计数器就是有效的。 它是ACI监控的最初版本,但ACI的设计和实施早已使这些故障变得无关紧要。无论您的交换矩阵当前处于哪个版本,都可以通过禁用该功能来确认和删除它们。
某些数据包被计为丢包,但不是实际的租户流量丢包。
例如:
- 枝叶vPC对使用vPC对虚拟IP(vPC VIP)通过其单独的隧道接口将数据包传输到其他枝叶。ACI使用隧道接口进行数据包统计。由于vPC VIP是虚拟接口,因此它在各个枝叶上没有对应的隧道接口,因此它没有跟踪丢包的隧道接口。因此,发往vPC VIP的数据包在接收的vPC对等枝叶交换机上被视为丢包。
- 枝叶和终端信息交换之间的vPC控制平面数据包。
- 现有合同导致的丢包也视为丢包,但由于您的合同正在进行工作,这些丢包是预期的(而且不是坏的)。
解决方法
禁用正在进行的原子计数器功能。即使静音,持续的原子计数器对象的数量也会导致具有大量节点的某些交换矩阵中的APIC性能问题。
默认情况下会记录禁用持续原子计数器的增强功能Cisco Bug ID CSCwh67235,这是6.1.x版本之后的默认行为。
操作>可视化,单击Settings,选择Administrative State Disabled,然后单击Submit。
禁用持续的原子计数器
CLI验证
APIC# moquery -c dbgOngoingAcMode | grep adminSt
adminSt : disabled
请注意,即使已禁用原子计数器,用户仍可以(且必须)使用Configure Atomic Counter Policies文档上记录的按需原子计数器。
持续运行无效,会极大地造成扩展/故障。按需是被动且有效的。禁用持续性不会阻止按需使用。
通过禁用此功能,数据包是否丢弃了一个完全无用的警报?
ACI具有许多不同的故障计数器。如果它们确实是跌落,它们就会出现在这些故障代码下。
例如,F100696 — 入口转发丢弃数据包,有关解释ACI中的数据包丢弃故障的详细信息。
相关问题
您可以看到APIC响应缓慢,或者由于内存不足问题导致单个请求响应失败,这些问题在支持的扩展范围内导致dbgr对象。此功能无法与具有大量节点的交换矩阵很好地扩展。
通用验证
检查属性规则包含正在运行的原子计数器的故障:
APIC# moquery -c faultInst -x 'query-target-filter=wcard(faultInst.rule,"on-going-atomic-counter")' | grep dn
dn : dbgs/ac/sdvpcpath-101-103-to-102-104/fault-F1546
dn : dbgs/ac/sdvpcpath-101-103-to-102-104/fault-F1548
dn : dbgs/ac/sdvpcpath-102-104-to-101-103/fault-F1548
dn : dbgs/ac/sdvpcpath-102-104-to-101-103/fault-F1546
dn : dbgs/ac/path-101-to-103/fault-F1545
dn : dbgs/ac/path-101-to-103/fault-F1547
dn : dbgs/ac/path-103-to-101/fault-F1545
dn : dbgs/ac/path-103-to-101/fault-F1546
检查DBGR服务是否正在运行:
APIC# ps -ef | egrep "dbgr.bin|STIME"
UID PID PPID C STIME TTY TIME CMD
ifc 15785 1 1 May23 ? 07:57:39 /mgmt//bin/svc_ifc_dbgr.bin --x
检查dbgr服务,查找与足够文本令牌匹配的记录。可以按日期和出现次数选择此示例,日期2024-05-20的总值为153506。
APIC# zgrep "enough tokens" /var/log/dme/log/svc_ifc_dbgr*
svc_ifc_dbgr.bin.log.595460.gz:30038||2024-05-20T08:11:01.125937358+00:00||doer||INFO||co=doer:1:1:0x800000013811b8b:0||Dropping stimuli as doer does not have enough tokens||../common/src/framework/./core/proc/Doer.cc||1303
...
svc_ifc_dbgr.bin.log.595460.gz:30038||2024-05-20T08:11:03.126887965+00:00||doer||INFO||co=doer:19:1:0x98000000129a2c01:0||Dropping stimuli as doer does not have enough tokens||../common/src/framework/./core/proc/Doer.cc||1303
APIC# zgrep "enough tokens" /var/log/dme/log/svc_ifc_dbgr* | grep 2024-05-20 | wc -l
153506
APIC# egrep "Shard|id |tokens.available" /debug/$HOSTNAME/dbgr/ifm/debug/mo | grep -B 2 "tokens.available : 0"
Shard : id : 1
tokens.available : 0
相关信息
思科APIC故障、事件和系统消息管理指南>处理预期故障
原子计数器准则和限制
配置原子计数器策略
解释ACI中的丢包故障
引用错误
Cisco Bug ID CSCwh67235(思科漏洞ID CSCwh):默认禁用持续的原子计数器
Cisco Bug ID CSCuz99892(仅限注册用户):TEP到TEP原子计数器不可靠
Cisco bug IDCSCvp07545(仅限注册用户):接收ACI交换矩阵中的故障F1545和F1547
思科漏洞ID CSCwf18707:如果超出dbgAcPathA可扩展性,则引发故障