簡介
本檔案介紹代碼F1545到F1552的錯誤,這些錯誤是與ACI對丟棄的資料包進行分類的方式相關的修飾性錯誤。
問題
預設情況下,ACI啟用了原子計數器。
這些計數器直接檢查葉子之間的滴落或者從葉子到脊柱。
rule:正在運行的原子計數器
在本例中,故障代碼為F1545、F1546、F1547、F1548、F1549、F1550、F1551和F1552,它們是葉到葉計數器。
為什麼報告它們
只要通訊僅是TEP到TEP(例如,無VPC),這些計數器就有效。 它最初用於ACI監控,但ACI的設計和實施早已使這些故障變得無關緊要。無論交換矩陣當前使用的版本如何,都可以通過禁用該功能來確認和刪除交換矩陣。
某些資料包被計為丟棄,但並非實際的租戶流量丟棄。
舉例來說:
- 枝葉vPC對使用vPC對虛擬IP(vPC VIP)通過其各自的隧道介面將資料包傳輸到其他枝葉。ACI使用隧道介面進行資料包統計。由於vPC VIP是一個虛擬介面,因此它在各個枝葉上沒有對應的隧道介面,因此它沒有跟蹤丟棄的隧道介面。因此,目的地為vPC VIP的資料包在接收vPC對等枝葉交換機上被計為丟包。
- 在枝葉和終端資訊交換之間的vPC控制平面資料包。
- 現有合約引起的丟包也算為丟包,但這是預期值(而且不是壞值),因為您的合約正在進行工作。
因應措施
禁用正在進行的原子計數器功能。即使被擠壓,正在進行的原子計數器對象的數量也會導致具有大量節點的某些交換矩陣出現APIC效能問題。
預設情況下,會記錄一個增強功能,用於禁用Cisco錯誤ID CSCwh67235的持續原子計數器,這是6.1.x版本之後的預設行為。
操作>視覺化,按一下設定,選擇管理狀態Disabled,然後按一下提交。
禁用正在進行的原子計數器
CLI 驗證
APIC# moquery -c dbgOngoingAcMode | grep adminSt
adminSt : disabled
請注意,即使已禁用原子計數器,使用者仍然可以(且必須)使用Configure Atomic Counter Policies文檔中記錄的按需原子計數器。
持續性是無效的,並且會大大增加規模/故障。按需服務是被動且有效的。禁用持續性不會阻止按需使用。
通過禁用此功能,資料包是否丟棄了一個完全無用的警報?
ACI有許多不同的故障計數器。如果它們是真實跌落,它們就會出現在這些故障代碼下。
例如,F100696 — 入口轉發丟棄資料包,有關解釋ACI中的資料包丟棄故障的詳細資訊。
相關問題
您可以看到APIC響應緩慢或無法響應單個請求,這是由於記憶體不足問題導致的。在支援的擴展範圍上,dbgr對象存在記憶體不足問題。對於具有大量節點的交換矩陣,此功能不能很好地擴展。
通用驗證
檢查屬性規則包含正在運行的原子計數器的錯誤:
APIC# moquery -c faultInst -x 'query-target-filter=wcard(faultInst.rule,"on-going-atomic-counter")' | grep dn
dn : dbgs/ac/sdvpcpath-101-103-to-102-104/fault-F1546
dn : dbgs/ac/sdvpcpath-101-103-to-102-104/fault-F1548
dn : dbgs/ac/sdvpcpath-102-104-to-101-103/fault-F1548
dn : dbgs/ac/sdvpcpath-102-104-to-101-103/fault-F1546
dn : dbgs/ac/path-101-to-103/fault-F1545
dn : dbgs/ac/path-101-to-103/fault-F1547
dn : dbgs/ac/path-103-to-101/fault-F1545
dn : dbgs/ac/path-103-to-101/fault-F1546
檢查DBGR服務是否正在運行:
APIC# ps -ef | egrep "dbgr.bin|STIME"
UID PID PPID C STIME TTY TIME CMD
ifc 15785 1 1 May23 ? 07:57:39 /mgmt//bin/svc_ifc_dbgr.bin --x
請檢查dbgr服務以查詢與文本 — 足夠的令牌匹配的記錄。可以按日期和在此示例中的出現次數選擇此服務,日期為2024-05-20的發生次數合計為153506。
APIC# zgrep "enough tokens" /var/log/dme/log/svc_ifc_dbgr*
svc_ifc_dbgr.bin.log.595460.gz:30038||2024-05-20T08:11:01.125937358+00:00||doer||INFO||co=doer:1:1:0x800000013811b8b:0||Dropping stimuli as doer does not have enough tokens||../common/src/framework/./core/proc/Doer.cc||1303
...
svc_ifc_dbgr.bin.log.595460.gz:30038||2024-05-20T08:11:03.126887965+00:00||doer||INFO||co=doer:19:1:0x98000000129a2c01:0||Dropping stimuli as doer does not have enough tokens||../common/src/framework/./core/proc/Doer.cc||1303
APIC# zgrep "enough tokens" /var/log/dme/log/svc_ifc_dbgr* | grep 2024-05-20 | wc -l
153506
APIC# egrep "Shard|id |tokens.available" /debug/$HOSTNAME/dbgr/ifm/debug/mo | grep -B 2 "tokens.available : 0"
Shard : id : 1
tokens.available : 0
相關資訊
思科APIC故障、事件和系統消息管理指南>處理預期故障
原子計數器准則和限制
配置原子計數器策略
解釋ACI中的丟包故障
參考錯誤
思科錯誤ID CSCwh67235:預設情況下禁用持續的原子計數器
思科錯誤ID CSCuz99892:TEP到TEP原子計數器不可靠
Cisco錯誤IDCSCvp07545:ACI交換矩陣中接收故障F1545和F1547故障
思科錯誤ID CSCwf18707:在超過dbgAcPathA可伸縮性時引發故障