簡介
本文檔介紹代碼為F1545至F1552的故障,這些故障是與ACI分類丟棄資料包的方式相關的表面故障。
問題
預設情況下,ACI啟用了原子計數器。
這些計數器會直接檢查枝葉之間或從枝葉到主幹之間的落點
規則:正在運行的原子計數器
在本例中,故障代碼為F1545、F1546、F1547、F1548、F1549、F1550、F1551和F1552,它們是枝葉到枝葉計數器。
為什麼會報告?
只要通訊是僅TEP到TEP的(例如,無VPC),這些計數器就有效。它是ACI監控的最初版本,但ACI的設計和實施早已使這些故障變得無關緊要。無論交換矩陣當前處於何種版本,都可以透過停用該功能來確認和刪除它們。
某些資料包被計為丟棄,但不是實際租戶流量丟棄。舉例來說:
- 枝葉vPC對使用vPC對虛擬IP (vPC VIP)透過其單獨的隧道介面將資料包傳輸到其他枝葉。ACI使用隧道介面進行資料包統計,因為vPC VIP是虛擬介面,在單個枝葉上沒有對應的隧道介面,因此沒有跟蹤丟棄的隧道介面。因此,發往vPC VIP的資料包在接收vPC對等枝葉交換機上被視為丟包。
- 枝葉和終端資訊交換之間的vPC控制平面資料包。
- 由已簽訂合約造成的跌價也算作跌價,但由於您的合約正在進行工作,因此這些下跌是預期發生的(而且並非壞事)。
因應措施
停用持續原子計數器功能,即使被擠壓,持續原子計數器對象的數量可能會導致某些具有大量節點的交換矩陣中的APIC效能問題。
預設情況下會記錄一個用於停用持續原子計數器的增強功能思科漏洞ID CSCwh67235,這是6.1.x版本後的預設行為。
操作>視覺化,按一下「設定」,選擇「管理狀態已停用」,然後按一下「提交」。
停用持續的原子計數器
請注意,即使已停用原子計數器,使用者仍可以(並且必須)使用配置原子計數器策略文檔中記錄的按需原子計數器。
持續性功能無效,會大大增加擴展/故障率。按需是被動且有效的,停用持續性並不能阻止按需使用。
透過停用此功能,資料包是否丟棄了完全無用的警報?
ACI有許多不同的故障計數器。如果有真正的掉落,它們就會出現在這些故障碼下。
例如,F100696 -入口轉發丟棄資料包,有關ACI中的資料包丟棄故障說明的詳細資訊。
相關問題
我們可以看到APIC響應緩慢或由於記憶體不足問題導致dbgr對象在支援的擴展範圍內無法響應單個請求。 對於具有大量節點的交換矩陣,此功能無法很好地擴展。
通用驗證
檢查屬性規則包含「進行中的原子計數器」的錯誤:
APIC# moquery -c faultInst -x 'query-target-filter=wcard(faultInst.rule,"on-going-atomic-counter")' | grep dn
dn : dbgs/ac/sdvpcpath-101-103-to-102-104/fault-F1546
dn : dbgs/ac/sdvpcpath-101-103-to-102-104/fault-F1548
dn : dbgs/ac/sdvpcpath-102-104-to-101-103/fault-F1548
dn : dbgs/ac/sdvpcpath-102-104-to-101-103/fault-F1546
dn : dbgs/ac/path-101-to-103/fault-F1545
dn : dbgs/ac/path-101-to-103/fault-F1547
dn : dbgs/ac/path-103-to-101/fault-F1545
dn : dbgs/ac/path-103-to-101/fault-F1546
檢查DBGR服務是否正在運行:
APIC# ps -ef | egrep "dbgr.bin|STIME"
UID PID PPID C STIME TTY TIME CMD
ifc 15785 1 1 May23 ? 07:57:39 /mgmt//bin/svc_ifc_dbgr.bin --x
檢查dbgr服務中是否存在與文本「足夠令牌」匹配的記錄。可以按日期和發生次數選擇此示例,日期2024-05-20總計為153506
APIC# zgrep "enough tokens" /var/log/dme/log/svc_ifc_dbgr*
svc_ifc_dbgr.bin.log.595460.gz:30038||2024-05-20T08:11:01.125937358+00:00||doer||INFO||co=doer:1:1:0x800000013811b8b:0||Dropping stimuli as doer does not have enough tokens||../common/src/framework/./core/proc/Doer.cc||1303
...
svc_ifc_dbgr.bin.log.595460.gz:30038||2024-05-20T08:11:03.126887965+00:00||doer||INFO||co=doer:19:1:0x98000000129a2c01:0||Dropping stimuli as doer does not have enough tokens||../common/src/framework/./core/proc/Doer.cc||1303
APIC# zgrep "enough tokens" /var/log/dme/log/svc_ifc_dbgr* | grep 2024-05-20 | wc -l
153506
參考資料:
思科APIC故障、事件和系統消息管理指南>處理預期故障
原子計數器準則和限制
配置原子計數器策略
ACI中的資料包丟棄故障說明
參考錯誤:
思科漏洞ID CSCwh67235:預設情況下停用持續的原子計數器
思科漏洞ID CSCuz99892:TEP到TEP原子計數器不可靠
思科漏洞IDCSCvp07545:ACI交換矩陣中接收故障F1545和F1547故障
思科漏洞ID CSCwf18707:如果超過dbgAcPathA可擴充性,則會引發故障