Introdução
Este documento descreve falhas com o código F1545 a F1552, que são falhas estéticas relacionadas à maneira como a ACI classifica pacotes descartados.
Problema
Por padrão, a ACI tem contadores atômicos ativados.
Esses contadores verificam quedas entre folhas diretamente ou de folhas para espinhos.
regra: contador atômico contínuo
Neste caso, os códigos de anomalia são F1545, F1546, F1547, F1548, F1549, F1550, F1551 e F1552, que são contadores folha a folha.
Por que eles são reportados
Esses contadores são válidos desde que a comunicação seja apenas TEP para TEP (sem VPC, por exemplo). Ela estava nas primeiras versões para monitoramento da ACI, mas o projeto e a implementação da ACI há muito tempo tornam essas falhas irrelevantes. Independentemente da versão na qual sua estrutura está atualmente, eles podem ser confirmados e excluídos desativando o recurso.
Alguns pacotes são contados como descartes, mas não são descartes de tráfego de locatário reais.
Por exemplo:
- Os pares de vPC leaf usam um par de vPC Virtual IP (vPC VIP) para transmitir pacotes através de suas interfaces de túnel individuais para outros leafs. A ACI usa interfaces de túnel para estatísticas de pacotes. Como o vPC VIP é uma interface virtual, não há interface de túnel correspondente para ele nos leafs individuais e, como resultado, não há interface de túnel para rastrear descartes. Assim, os pacotes destinados a um vPC VIP são contados como descartes no vPC peer leaf switch recebido.
- Pacotes de plano de controle vPC entre folhas e troca de informações de endpoint.
- As quedas causadas por contratos em vigor também são contadas como quedas, mas são esperadas (e não ruins) já que seu contrato está fazendo o trabalho deles.
Solução
Desative o recurso Contador atômico em andamento. Mesmo que seja espremido, o número de objetos de contador atômico em andamento pode levar a problemas de desempenho do APIC em algumas malhas com um grande número de nós.
Há um aprimoramento documentado para desabilitar contadores atômicos em andamento por padrão, ID de bug da Cisco CSCwh67235, e esse é o comportamento padrão após as versões 6.1.x.
Operações > Visualização, clique em Configurações, escolha Estado Administrativo Desabilitado e clique em Enviar.
desabilitar contadores atômicos em andamento
Verificação da CLI
APIC# moquery -c dbgOngoingAcMode | grep adminSt
adminSt : disabled
Esteja ciente de que, mesmo com contadores atômicos desativados, os usuários ainda podem (e devem) usar contadores atômicos sob demanda documentados na documentação Configure Atomic Counter Policies.
As configurações contínuas não são válidas e contribuem muito para a escala/falhas. Sob demanda são reativos e válidos. A desativação contínua não impede o uso sob demanda.
Ao desativar esse recurso, o pacote perde um alerta completamente inútil?
A ACI tem muitos contadores de falhas diferentes. Se são gotas reais, elas aparecem sob os códigos de falha.
Por exemplo, F100696 - encaminhamento de entrada de pacotes de queda, mais detalhes sobre Explicar falhas de queda de pacote na ACI.
Problemas relacionados
Você pode ver uma resposta APIC lenta ou falha em responder a uma única solicitação devido a problemas de falta de memória que foram causados para o objeto dbgr na escala suportada. Esse recurso não escala bem com a malha com um grande número de nós.
Verificações Comuns
Verificar falhas em que a regra de atributo contém um contador atômico em andamento:
APIC# moquery -c faultInst -x 'query-target-filter=wcard(faultInst.rule,"on-going-atomic-counter")' | grep dn
dn : dbgs/ac/sdvpcpath-101-103-to-102-104/fault-F1546
dn : dbgs/ac/sdvpcpath-101-103-to-102-104/fault-F1548
dn : dbgs/ac/sdvpcpath-102-104-to-101-103/fault-F1548
dn : dbgs/ac/sdvpcpath-102-104-to-101-103/fault-F1546
dn : dbgs/ac/path-101-to-103/fault-F1545
dn : dbgs/ac/path-101-to-103/fault-F1547
dn : dbgs/ac/path-103-to-101/fault-F1545
dn : dbgs/ac/path-103-to-101/fault-F1546
Verifique se os serviços do DBGR estão em execução:
APIC# ps -ef | egrep "dbgr.bin|STIME"
UID PID PPID C STIME TTY TIME CMD
ifc 15785 1 1 May23 ? 07:57:39 /mgmt//bin/svc_ifc_dbgr.bin --x
Verifique o serviço dbgr para registros que correspondam a tokens de texto suficientes. Ele pode ser selecionado por data e número de ocorrências neste exemplo, um total de 153506 para a data 2024-05-20.
APIC# zgrep "enough tokens" /var/log/dme/log/svc_ifc_dbgr*
svc_ifc_dbgr.bin.log.595460.gz:30038||2024-05-20T08:11:01.125937358+00:00||doer||INFO||co=doer:1:1:0x800000013811b8b:0||Dropping stimuli as doer does not have enough tokens||../common/src/framework/./core/proc/Doer.cc||1303
...
svc_ifc_dbgr.bin.log.595460.gz:30038||2024-05-20T08:11:03.126887965+00:00||doer||INFO||co=doer:19:1:0x98000000129a2c01:0||Dropping stimuli as doer does not have enough tokens||../common/src/framework/./core/proc/Doer.cc||1303
APIC# zgrep "enough tokens" /var/log/dme/log/svc_ifc_dbgr* | grep 2024-05-20 | wc -l
153506
APIC# egrep "Shard|id |tokens.available" /debug/$HOSTNAME/dbgr/ifm/debug/mo | grep -B 2 "tokens.available : 0"
Shard : id : 1
tokens.available : 0
Informações Relacionadas
Guia de gerenciamento de falhas, eventos e mensagens do sistema do Cisco APIC > Como lidar com as falhas esperadas
Diretrizes e restrições de contadores atômicos
Configurar políticas de contador atômico
Explicar as falhas de queda de pacote na ACI
Erros de referência
ID de bug da Cisco CSCwh67235 : Desabilitar contadores atômicos em andamento por padrão
ID de bug Cisco CSCuz99892 : Os contadores atômicos TEP-to-TEP não são confiáveis
Bug Cisco IDCSCvp07545: Recebendo falhas F1545 e F1547 na estrutura da ACI
ID de bug da Cisco CSCwf18707: Falha gerada se a escalabilidade de dbgAcPathA for excedida