Introducción
Este documento describe fallas con los códigos F1545 a F1552 que son fallas cosméticas relacionadas con la manera en que ACI clasifica los paquetes descartados.
Problema
De forma predeterminada, ACI tiene los contadores atómicos habilitados.
Estos contadores revisan las gotas entre las hojas directamente o desde las hojas hasta las espinas
regla: on-going-atomic-counter
En este caso, los códigos de error son F1545, F1546, F1547, F1548, F1549, F1550, F1551 y F1552, que son contadores hoja a hoja.
¿Por qué se denuncian?
Estos contadores son válidos siempre y cuando la comunicación sea TEP a TEP solamente, (no VPC por ejemplo). Estaba en las primeras versiones para la supervisión de ACI, pero el diseño y la implementación de ACI hace tiempo que estos fallos son irrelevantes. Independientemente de la versión en la que se encuentre su fabric actualmente, se pueden reconocer y eliminar desactivando la función.
Algunos paquetes se cuentan como descartes, pero no son descartes de tráfico de arrendatarios reales. Por ejemplo:
- Los pares vPC de hoja utilizan un par vPC IP virtual (vPC VIP) para transmitir paquetes a través de sus interfaces de túnel individuales a otras hojas. ACI utiliza interfaces de túnel para las estadísticas de paquetes. Dado que vPC VIP es una interfaz virtual, no existe una interfaz de túnel correspondiente para ella en los folletos individuales y, como resultado, no tiene ninguna interfaz de túnel con la que realizar un seguimiento de las caídas. Por lo tanto, los paquetes destinados a un VIP de vPC se cuentan como caídas en el switch de hoja de par vPC de recepción.
- Intercambio de información de los paquetes del plano de control vPC entre las hojas y los terminales.
- Las caídas causadas por contratos vigentes también se cuentan como caídas, pero se esperan (y no son malas) ya que su contrato está haciendo su trabajo.
Solución Aternativa
Desactivar la función Contador atómico en curso, incluso si se ha suprimido, el número de objetos de contador atómico en curso puede provocar problemas de rendimiento de APIC en algunos fabrics con un gran número de nodos.
Hay una mejora documentada para inhabilitar los contadores atómicos en curso de forma predeterminada Cisco bug ID CSCwh67235 y este es el comportamiento predeterminado después de las versiones 6.1.x.
Operations > Visualization, haga clic en Settings, seleccione Administrative State Disabled y, a continuación, haga clic en Submit.
deshabilitar contadores atómicos en curso
Tenga en cuenta que incluso con los contadores atómicos desactivados, los usuarios pueden (y deben) utilizar los contadores atómicos a demanda documentados en la documentación Configurar políticas de contadores atómicos.
Los procesos en curso no son válidos y contribuyen en gran medida a la ampliación/fallos. Los servicios a petición son reactivos y válidos, la desactivación de los servicios en curso no impide el uso a petición.
Al inhabilitar esta función, ¿son las pérdidas de paquetes una alerta completamente inútil?
ACI tiene muchos contadores de fallos diferentes. Si hay caídas reales, aparecen bajo esos códigos de falla.
Por ejemplo, F100696 - ingress forwarding drop packets, más detalles sobre Explicaciones de los fallos de paquetes descartados en ACI.
Problemas relacionados
Podemos ver y ralentizar la respuesta de APIC o la falla al responder a una sola solicitud debido a problemas de falta de memoria que se han causado para el objeto dbgr en la escala admitida. Esta función no se amplía bien con el fabric con un gran número de nodos.
Verificaciones comunes
Verifique si hay fallas donde la regla de atributo contenga "on-going-atomic-counter":
APIC# moquery -c faultInst -x 'query-target-filter=wcard(faultInst.rule,"on-going-atomic-counter")' | grep dn
dn : dbgs/ac/sdvpcpath-101-103-to-102-104/fault-F1546
dn : dbgs/ac/sdvpcpath-101-103-to-102-104/fault-F1548
dn : dbgs/ac/sdvpcpath-102-104-to-101-103/fault-F1548
dn : dbgs/ac/sdvpcpath-102-104-to-101-103/fault-F1546
dn : dbgs/ac/path-101-to-103/fault-F1545
dn : dbgs/ac/path-101-to-103/fault-F1547
dn : dbgs/ac/path-103-to-101/fault-F1545
dn : dbgs/ac/path-103-to-101/fault-F1546
Verifique que los servicios DBGR se estén ejecutando:
APIC# ps -ef | egrep "dbgr.bin|STIME"
UID PID PPID C STIME TTY TIME CMD
ifc 15785 1 1 May23 ? 07:57:39 /mgmt//bin/svc_ifc_dbgr.bin --x
Verifique el servicio dbgr para encontrar registros que coincidan con el texto "suficientes tokens". Se puede seleccionar por fecha y número de apariciones en este ejemplo, un total de 153506 para la fecha 2024-05-20
APIC# zgrep "enough tokens" /var/log/dme/log/svc_ifc_dbgr*
svc_ifc_dbgr.bin.log.595460.gz:30038||2024-05-20T08:11:01.125937358+00:00||doer||INFO||co=doer:1:1:0x800000013811b8b:0||Dropping stimuli as doer does not have enough tokens||../common/src/framework/./core/proc/Doer.cc||1303
...
svc_ifc_dbgr.bin.log.595460.gz:30038||2024-05-20T08:11:03.126887965+00:00||doer||INFO||co=doer:19:1:0x98000000129a2c01:0||Dropping stimuli as doer does not have enough tokens||../common/src/framework/./core/proc/Doer.cc||1303
APIC# zgrep "enough tokens" /var/log/dme/log/svc_ifc_dbgr* | grep 2024-05-20 | wc -l
153506
Referencias:
Guía de administración de errores, eventos y mensajes del sistema de Cisco APIC > Gestión de errores esperados
Directrices y restricciones de los contadores atómicos
Configurar políticas de contadores atómicos
Explicaciones de los errores de paquetes descartados en ACI
Errores de referencia:
ID de bug de Cisco CSCwh67235 : Inhabilita los contadores atómicos en curso de forma predeterminada
ID de error de Cisco CSCuz99892: los contadores atómicos de TEP a TEP no son fiables
Error de Cisco IDCSCvp07545: Recepción de fallos F1545 y F1547 en el fabric ACI
Id. de error de Cisco CSCwf18707: se ha producido un error si se supera la escalabilidad de dbgAcPathA