简介
本文档介绍代码F1545至F1552的故障,这些故障是与ACI对丢弃的数据包分类方式相关的表面故障。
问题
默认情况下,ACI已启用原子计数器。
这些计数器直接检查枝叶之间的丢包或检查枝叶到主干之间的丢包
规则:正在运行的原子计数器
在这种情况下,故障代码为F1545、F1546、F1547、F1548、F1549、F1550、F1551和F1552,它们是枝叶到枝叶计数器。
为什么会报告?
只要通信是仅从TEP到TEP的,这些计数器就有效(例如,没有VPC)。ACI监控最初版本中曾经出现过该漏洞,但是ACI的设计和实施早已使这些故障变得无关紧要。无论交换矩阵当前使用的版本如何,都可以通过禁用功能来确认和删除它们。
某些数据包被视为丢包,但不是实际的租户流量丢包。例如:
- 枝叶vPC对使用vPC对虚拟IP (vPC VIP)通过其各自的隧道接口将数据包传输到其他枝叶。ACI使用隧道接口进行数据包统计,因为vPC VIP是虚拟接口,在单个枝叶上没有与其对应的隧道接口,因此没有用于跟踪丢包的隧道接口。因此,发往vPC VIP的数据包在接收方vPC对等枝叶交换机上被视为丢包。
- 枝叶和终端信息交换之间的vPC控制平面数据包。
- 由现有合同引起的丢包也被视为丢包,但由于您的合同正在进行工作,因此这些丢包是预期的(而不是坏的)。
解决方法
禁用持续原子计数器功能,即使已被抑制,持续原子计数器对象的数量也会导致具有大量节点的某些交换矩阵中的APIC性能问题。
默认情况下,Cisco Bug ID CSCwh67235禁用持续的原子计数器记录有一项增强功能,这是6.1.x版本之后的默认行为。
操作>可视化,单击“设置”,选择“已禁用管理状态”,然后单击“提交”。
禁用正在进行的原子计数器
请注意,即使禁用了原子计数器,用户仍可以(并且必须)使用配置原子计数器策略文档中记录的按需原子计数器。
持续运行是无效的,而且会大大增加扩展/故障数。按需模式是被动且有效的,禁用持续模式不会阻止按需使用。
通过禁用此功能,数据包是否会丢弃完全无用的警报?
ACI具有许多不同的故障计数器。如果确实有丢弃,它们就会出现在这些故障代码下。
例如,F100696 -入口转发丢弃数据包,有关ACI中数据包丢弃故障的解释的详细信息。
相关问题
我们可以看到,由于在支持的扩展范围内对dbgr对象引起的内存不足问题,APIC响应缓慢或无法响应单个请求。 此功能无法很好地与具有大量节点的交换矩阵一起扩展。
常见验证
检查属性规则包含“on-going-atomic-counter”的故障:
APIC# moquery -c faultInst -x 'query-target-filter=wcard(faultInst.rule,"on-going-atomic-counter")' | grep dn
dn : dbgs/ac/sdvpcpath-101-103-to-102-104/fault-F1546
dn : dbgs/ac/sdvpcpath-101-103-to-102-104/fault-F1548
dn : dbgs/ac/sdvpcpath-102-104-to-101-103/fault-F1548
dn : dbgs/ac/sdvpcpath-102-104-to-101-103/fault-F1546
dn : dbgs/ac/path-101-to-103/fault-F1545
dn : dbgs/ac/path-101-to-103/fault-F1547
dn : dbgs/ac/path-103-to-101/fault-F1545
dn : dbgs/ac/path-103-to-101/fault-F1546
检查DBGR服务正在运行:
APIC# ps -ef | egrep "dbgr.bin|STIME"
UID PID PPID C STIME TTY TIME CMD
ifc 15785 1 1 May23 ? 07:57:39 /mgmt//bin/svc_ifc_dbgr.bin --x
检查dbgr服务中是否存在与文本“足够令牌”匹配的记录。可按日期和出现次数选择此示例,日期2024-05-20总计为153506
APIC# zgrep "enough tokens" /var/log/dme/log/svc_ifc_dbgr*
svc_ifc_dbgr.bin.log.595460.gz:30038||2024-05-20T08:11:01.125937358+00:00||doer||INFO||co=doer:1:1:0x800000013811b8b:0||Dropping stimuli as doer does not have enough tokens||../common/src/framework/./core/proc/Doer.cc||1303
...
svc_ifc_dbgr.bin.log.595460.gz:30038||2024-05-20T08:11:03.126887965+00:00||doer||INFO||co=doer:19:1:0x98000000129a2c01:0||Dropping stimuli as doer does not have enough tokens||../common/src/framework/./core/proc/Doer.cc||1303
APIC# zgrep "enough tokens" /var/log/dme/log/svc_ifc_dbgr* | grep 2024-05-20 | wc -l
153506
参考资料:
思科APIC故障、事件和系统消息管理指南>处理预期故障
原子计数器准则和限制
配置原子计数器策略
ACI中数据包丢弃故障的说明
引用Bug:
思科漏洞ID CSCwh67235:默认情况下禁用持续的原子计数器
思科漏洞ID CSCuz99892:TEP到TEP原子计数器不可靠
思科漏洞IDCSCvp07545:在ACI交换矩阵中接收故障F1545和F1547故障
思科漏洞ID CSCwf18707:如果超过dbgAcPathA可扩展性,则会引发故障