Introdução
Este documento descreve falhas com o código F1545 a F1552, que são falhas estéticas relacionadas à maneira como a ACI classifica pacotes descartados.
Problema
Por padrão, a ACI tem contadores atômicos ativados.
Esses contadores verificam quedas entre folhas diretamente ou de folhas para espinhos
regra : contador atômico em andamento
Neste caso, os códigos de anomalia são F1545, F1546, F1547, F1548, F1549, F1550, F1551 e F1552, que são contadores folha a folha.
Por que eles foram informados?
Esses contadores são válidos desde que a comunicação seja apenas TEP para TEP (não VPC, por exemplo). Ela estava nas primeiras versões para monitoramento da ACI, mas o projeto e a implementação da ACI há muito tempo tornam essas falhas irrelevantes. Independentemente da versão na qual sua estrutura está atualmente, eles podem ser confirmados e excluídos desativando o recurso.
Alguns pacotes são contados como descartes, mas não são descartes de tráfego de locatário reais. Por exemplo:
- Os pares de vPC leaf usam um par de vPC Virtual IP (vPC VIP) para transmitir pacotes através de suas interfaces de túnel individuais para outros leafs. A ACI usa interfaces de túnel para estatísticas de pacotes, já que o vPC VIP é uma interface virtual, não há interface de túnel correspondente para ele nos leafs individuais e, como resultado, não há interface de túnel para rastrear descartes. Assim, os pacotes destinados a um vPC VIP são contados como descartes no vPC peer leaf switch recebido.
- Pacotes de plano de controle vPC entre folhas e troca de informações de endpoint.
- As quedas causadas por contratos em vigor também são contadas como quedas, mas são esperadas (e não ruins) já que seu contrato está fazendo o trabalho deles.
Solução
Desative o recurso Contador atômico em andamento, mesmo que selecionado, o número de objetos de contador atômico em andamento pode levar a problemas de desempenho do APIC em algumas malhas com um grande número de nós.
Há um aprimoramento documentado para desabilitar contadores atômicos em andamento por padrão, ID de bug da Cisco CSCwh67235, e esse é o comportamento padrão após as versões 6.1.x.
Operações > Visualização, clique em Configurações, escolha Estado Administrativo Desabilitado e clique em Enviar.
desabilitar contadores atômicos em andamento
Esteja ciente de que, mesmo com desabilitar contadores atômicos, os usuários ainda podem (e devem) usar contadores atômicos sob demanda documentados na documentação Configurar políticas de contadores atômicos.
As configurações contínuas não são válidas e contribuem muito para a escala/falhas. As solicitações sob demanda são reativas e válidas, desativar as solicitações contínuas não impede o uso das solicitações sob demanda.
Ao desativar esse recurso, o pacote perde um alerta completamente inútil?
A ACI tem muitos contadores de falhas diferentes. Se houver quedas reais, elas aparecerão sob os códigos de falha.
Por exemplo, F100696 - encaminhamento de ingresso de pacotes de queda, mais detalhes sobre Explicações de Falhas de Queda de Pacotes na ACI.
Questões relacionadas
Podemos ver e retardar a resposta do APIC ou a falha em responder a uma única solicitação devido a problemas de falta de memória que foram causados para o objeto dbgr na escala suportada. Esse recurso não é escalável com a malha com um grande número de nós.
Verificações comuns
Verificar falhas em que a regra de atributo contenha "contador atômico em andamento":
APIC# moquery -c faultInst -x 'query-target-filter=wcard(faultInst.rule,"on-going-atomic-counter")' | grep dn
dn : dbgs/ac/sdvpcpath-101-103-to-102-104/fault-F1546
dn : dbgs/ac/sdvpcpath-101-103-to-102-104/fault-F1548
dn : dbgs/ac/sdvpcpath-102-104-to-101-103/fault-F1548
dn : dbgs/ac/sdvpcpath-102-104-to-101-103/fault-F1546
dn : dbgs/ac/path-101-to-103/fault-F1545
dn : dbgs/ac/path-101-to-103/fault-F1547
dn : dbgs/ac/path-103-to-101/fault-F1545
dn : dbgs/ac/path-103-to-101/fault-F1546
Verifique se os serviços do DBGR estão em execução:
APIC# ps -ef | egrep "dbgr.bin|STIME"
UID PID PPID C STIME TTY TIME CMD
ifc 15785 1 1 May23 ? 07:57:39 /mgmt//bin/svc_ifc_dbgr.bin --x
Verifique o serviço dbgr para registros que correspondam ao texto "tokens suficientes". Ele pode ser selecionado por data e número de ocorrências neste exemplo, um total de 153506 para a data 2024-05-20
APIC# zgrep "enough tokens" /var/log/dme/log/svc_ifc_dbgr*
svc_ifc_dbgr.bin.log.595460.gz:30038||2024-05-20T08:11:01.125937358+00:00||doer||INFO||co=doer:1:1:0x800000013811b8b:0||Dropping stimuli as doer does not have enough tokens||../common/src/framework/./core/proc/Doer.cc||1303
...
svc_ifc_dbgr.bin.log.595460.gz:30038||2024-05-20T08:11:03.126887965+00:00||doer||INFO||co=doer:19:1:0x98000000129a2c01:0||Dropping stimuli as doer does not have enough tokens||../common/src/framework/./core/proc/Doer.cc||1303
APIC# zgrep "enough tokens" /var/log/dme/log/svc_ifc_dbgr* | grep 2024-05-20 | wc -l
153506
Referências:
Guia de gerenciamento de falhas, eventos e mensagens do sistema do Cisco APIC > Como lidar com as falhas esperadas
Diretrizes e restrições de contadores atômicos
Configurar políticas de contador atômico
Explicações de falhas de queda de pacotes na ACI
Erros de referência:
ID de bug da Cisco CSCwh67235 : Desabilitar contadores atômicos em andamento por padrão
ID de bug Cisco CSCuz99892 : Os contadores atômicos TEP-to-TEP não são confiáveis
Bug Cisco IDCSCvp07545: falhas de recebimento F1545 e F1547 na estrutura da ACI
ID de bug Cisco CSCwf18707: Falha gerada se a escalabilidade de dbgAcPathA for excedida