Ce document décrit le dépannage des feuilles et des spines de l'ACI Cisco, y compris une table de triage, des contrôles spécifiques au commutateur et une corrélation côté APIC.
Vous pouvez résoudre la plupart des problèmes de commutateur ACI plus rapidement lorsque vous utilisez une séquence de commandes ordonnées au lieu de passer directement aux commandes internes approfondies. Commencez par les vérifications de la ligne de base du logiciel et du matériel, poursuivez avec les diagnostics et l'état de l'environnement, puis établissez une corrélation entre les problèmes de commutateur actif sur le contrôleur APIC avant de passer aux commandes spécifiques aux fonctionnalités.
| Objectif |
Commande |
Que faut-il rechercher ? |
Que faire ensuite ? |
|---|---|---|---|
| Confirmer le mode et la version de l'ACI |
show version |
Image de démarrage ACI, version attendue, raison de réinitialisation saine |
Si le commutateur n'est pas en mode ACI, arrêtez et corrigez d'abord l'image de démarrage. |
| Vérifier l'intégrité du module |
show module |
Les modules sont « OK » et les diagnostics en ligne sont « réussis » |
Si un module actif n'est pas « ok » ou si les diagnostics échouent, traitez-le d'abord comme un problème matériel. |
| Vérification de l'alimentation, du ventilateur et de l'état thermique |
show environment |
Les blocs d'alimentation en fonctionnement sont « ok », l'état du ventilateur est « ok » et les températures sont « normales » |
Si la seule anomalie est un bloc d'alimentation redondant à l'état « fermé », vérifiez l'intention de conception avant de procéder à une escalade. |
| Vérifier les résultats du diagnostic |
show diagnostic result module all |
Les tests montrent '.' pour passer à travers les modules actifs |
Si l'un des tests est 'F', 'A' ou 'I', corrélez avec le module et la sortie de panne. |
| Vérifier la détection et la ligne de base du fabric |
show discoveryissues |
Vérifications de l'état du système, de la contiguïté, du VLAN infrarouge et du téléchargement des stratégies |
Si les vérifications de détection échouent, corrigez la connectivité de base avant de dépanner les locataires ou le routage. |
| Corrélation sur le contrôleur APIC |
show faults leaf <node-id> ou show faults history leaf <node-id> |
Code d'erreur, gravité et DN affecté |
Utilisez la vue APIC pour séparer les symptômes actifs des événements historiques déjà effacés. |
Avant d'interpréter l'état d'exécution, vérifiez que le noeud est détecté, enregistré et qu'il exécute le logiciel en mode ACI. Pour l'intégration du commutateur et les vérifications de détection de ligne de base, utilisez la commande intégrée etshow discoveryissuesvérifiez que le contrôleur APIC signale le noeud comme étant en service.
leaf-A# show version
Software
BIOS: version 05.53
kickstart: version 16.1(3f) [build 16.1(3f)]
system: version 16.1(3f) [build 16.1(3f)]
PE: version 6.1(3f)
kickstart image file is: /bootflash/aci-n9000-dk9.16.1.3f.bin <--- ACI mode indicator
system image file is: /bootflash/auto-s
Hardware
cisco N9K-C93108TC-FX ("supervisor")
Device name: leaf-A
Last reset at 241000 usecs after Wed Mar 11 17:28:38 2026 JST
Reason: reset-requested-by-cli-command-reload
A quoi ressemble le bien : Les lignes Kickstart et system sont présentes, l'image kickstart commence par 'aci-n9000' et la raison de la réinitialisation est explicable.
A quoi ressemble le mauvais : Le résultat montre un fichier image NXOS autonome sans démarrage de l'ACI ni lignes système.
Cette section utilise un commutateur Leaf à facteur de forme fixe comme ligne de base. Le résultat est basé sur une feuille ACI vivante et reflète des conditions saines et dégradées qui sont utiles pendant le triage.
Exécutez cette commande afin de vérifier le niveau du logiciel, le mode image, la disponibilité et la dernière raison de réinitialisation.
leaf-A# show version
Software
BIOS: version 05.53
kickstart: version 16.1(3f) [build 16.1(3f)]
system: version 16.1(3f) [build 16.1(3f)]
PE: version 6.1(3f)
kickstart image file is: /bootflash/aci-n9000-dk9.16.1.3f.bin
system image file is: /bootflash/auto-s
Hardware
cisco N9K-C93108TC-FX ("supervisor")
Device name: leaf-A
Kernel uptime is 29 day(s), 19 hour(s), 52 minute(s), 45 second(s)
Last reset at 241000 usecs after Wed Mar 11 17:28:38 2026 JST
Reason: reset-requested-by-cli-command-reload
Service: PolicyElem Ch reload
Exécutez cette commande afin de vérifier l'état de la carte de ligne et le résultat du diagnostic en ligne au niveau du module.
leaf-A# show module Mod Ports Module-Type Model Status --- ----- ----------------------------------- ------------------ ---------- 1 54 48x10G+6x40/100G Switch N9K-C93108TC-FX ok Mod Online Diag Status --- ------------------ 1 pass <--- basic diagnostic baseline
A quoi ressemble le bien : Le module actif est ok et l'état de diagnostic en ligne est pass.
A quoi ressemble le mauvais : L'état du module n'est pas ok ou l'état de diagnostic n'est pas passé.
Exécutez cette commande afin de vérifier l'état du bloc d'alimentation, du ventilateur et thermique.
leaf-A# show environment Power Supply: Supply Model Output Capacity Status 1 NXA-PAC-500W-PE 0 W 500 W shut <--- redundant PSU not in use 2 NXA-PAC-500W-PE 219 W 500 W ok Fan: Fan1(sys_fan1) NXA-FAN-30CFM-F Status: ok Fan2(sys_fan2) NXA-FAN-30CFM-F Status: ok Fan3(sys_fan3) NXA-FAN-30CFM-F Status: ok Fan4(sys_fan4) NXA-FAN-30CFM-F Status: ok Temperature: 1 Inlet(1) 37 normal 1 outlet(2) 38 normal 1 x86 processor(3) 71 normal 1 Homewood(4) 56 normal
A quoi ressemble le bien : L'unité d'alimentation active est correcte, les ventilateurs sont corrects et les températures sont normales.
A quoi ressemble le mauvais : Une unité d'alimentation opérationnelle est défaillante, l'état du ventilateur n'est pas correct, ou tout capteur thermique n'est pas normal.
Exécutez cette commande afin de valider les tests de diagnostic en ligne réels, et pas seulement le champ résumé dans show module.
leaf-A# show diagnostic result module all Current bootup diagnostic level: bypass Module 1: 48x10G (Active) Test results: (. = Pass, F = Fail, I = Incomplete, U = Untested, A = Abort, E = Error disabled) 1) bios-mem-----------------------> . 2) mgmtp-lb-----------------------> . 22) cpu-cache----------------------> . 23) mem-health---------------------> . 24) ssd-acc------------------------> . 33) fpga-reg-chk-------------------> . 43) tahoe-mem----------------------> .
A quoi ressemble le bien : Tous les tests requis indiquent '.'.
A quoi ressemble le mauvais : Tout résultat F, I ou A pour le matériel actif.
Exécutez cette commande afin de valider l'intégration, la contiguïté, le VLAN infra et l'accessibilité du contrôleur. Il s’agit de l’une des commandes de premier passage les plus utiles pour les commutateurs Leaf.
leaf-A# show discoveryissues
Check 3 HW Modules Check
Test01 Fans status check PASSED
Test02 Power Supply status check FAILED
[Warn] Operational state of sys/ch/psuslot-1/psu is: shut
[Info] Ignore this if it is a redundant power supply
Check 5 System State
Test01 Check System State PASSED
[Info] TopSystem State is : in-service
Check 8 Infra VLAN Check
Test01 Check if infra VLAN is received PASSED
[Info] Infra VLAN received is : 4093
Check 10 IS-IS Adj Info
Test01 check IS-IS adjacencies PASSED
[Info] IS-IS adjacencies found on interfaces:
[Info] eth1/54.30
[Info] eth1/51.31
[Info] eth1/53.32
Check 11 Reachability to APIC
Test01 Ping check to APIC FAILED
[Error] Ping to APIC IP 198.51.100.1 from 198.51.100.64 with MTU 1450 failed.
Cet exemple est utile car il montre un résultat mixte réaliste : le noeud est en service et a des contiguïtés de fabric, mais l'accessibilité du contrôleur échoue quand même lorsqu'une unité d'alimentation redondante est fermée. Vous devez interpréter chaque échec dans son contexte au lieu de traiter chaque ligne défaillante comme aussi grave.
Cette section utilise un commutateur spine modulaire. La structure de la sortie est différente de celle d'un leaf fixe, car vous devez évaluer séparément les cartes de ligne, les modules de fabric, les superviseurs et les contrôleurs système.
spine-A# show version
Software
BIOS: version 05.53
kickstart: version 16.1(3f) [build 16.1(3f)]
system: version 16.1(3f) [build 16.1(3f)]
PE: version 6.1(3f)
kickstart image file is: /bootflash/aci-n9000-dk9.16.1.3f-cs_64.bin <--- modular spine image
system image file is: /bootflash/auto-s
Hardware
cisco N9K-SUP-A+ ("supervisor")
Device name: spine-A
Last reset at 983000 usecs after Wed Mar 11 17:31:09 2026 JST
Reason: reset-requested-by-cli-command-reload
Exécutez cette commande afin de vérifier chaque plan matériel dans le châssis.
spine-A# show module Mod Ports Module-Type Model Status --- ----- ----------------------------------- ------------------ ---------- 1 32 32p 40/100G Ethernet Module N9K-X9732C-EX ok 2 32 32p 40/100G Ethernet Module N9K-X9732C-EX ok 3 36 36p 40/100G Ethernet Module N9K-X9736C-FX ok 22 0 Fabric Module N9K-C9504-FM-E ok 23 0 Fabric Module N9K-C9504-FM-E ok 24 0 Fabric Module N9K-C9504-FM-E ok 26 0 Fabric Module N9K-C9504-FM-E ok 27 0 Supervisor Module N9K-SUP-A+ active 28 0 Supervisor Module N9K-SUP-A+ standby 29 0 System Controller N9K-SC-A standby 30 0 System Controller N9K-SC-A active Mod Online Diag Status --- ------------------ 1 pass 2 pass 3 pass 22 pass 23 pass 24 pass 26 pass 27 pass 28 pass 29 pass 30 pass
A quoi ressemble le bien : Les cartes de ligne, les modules de fabric, les superviseurs et les contrôleurs système sont tous présents et les diagnostics sont réussis.
A quoi ressemble le mauvais : Modules de fabric manquants ou non fonctionnels, anomalies de basculement de superviseur ou diagnostics de module défaillants.
spine-A# show environment Power Supply: Supply Model Output Capacity Status 1 N9K-PAC-3000W-B 1031 W 3000 W ok 2 N9K-PAC-3000W-B 0 W 3000 W shut 3 N9K-PAC-3000W-B 992 W 3000 W ok 4 ------------ N/A W 0 W Absent Power Usage Summary: Power Supply redundancy mode (operational) Non-Redundant(combined) Total Power Output (actual draw) 1523 W Total Power Available for additional modules 1793 W Fan: Fan1(sys_fan1) N9K-C9504-FAN Status: ok Fan2(sys_fan2) N9K-C9504-FAN Status: ok Fan3(sys_fan3) N9K-C9504-FAN Status: ok Fan4(sys_fan4) N9K-C9504-FAN Status: ok Fan5(sys_fan5) N9K-C9504-FAN Status: ok Fan6(sys_fan6) N9K-C9504-FAN Status: ok Temperature: 1 ATOM processor(1) 32 normal 3 Homewood instance 2(3) 78 normal 22 LAC instance 1(2) 70 normal 27 x86 processor(4) 36 normal
Ce résultat est un bon exemple de châssis sain même si une unité d'alimentation est fermée et qu'un autre logement est absent. Le mode de redondance configuré explique pourquoi le châssis est toujours opérationnel.
spine-A# show diagnostic result module all Current bootup diagnostic level: bypass Module 1: 32p 40/100G Ethernet Module 1) bios-mem-----------------------> . 9) mvl4p-eobc-snake---------------> . 39) lcfc-conn----------------------> . 43) tahoe-mem----------------------> . Module 22: Fabric Module 10) mvl10p-snake-------------------> . 42) fclc-conn----------------------> . 43) tahoe-mem----------------------> . Module 27: Supervisor Module (Active) 24) ssd-acc------------------------> . 32) nvram-cksum--------------------> . 35) eobc-mon-----------------------> . Module 30: System Controller 11) bcm28p-snake-------------------> . 41) pcie-bus-----------------------> .
Sur une colonne vertébrale modulaire, la valeur principale de cette commande est la largeur. Vous pouvez vérifier que les cartes de ligne, les modules de fabric et les superviseurs passent tous les diagnostics dans une vue unique.
Après avoir validé la ligne de base de l'interface de ligne de commande du commutateur, passez au contrôleur APIC afin de corréler le noeud avec les objets de panne actifs et historiques. Il s'agit de la manière la plus rapide de déterminer si le problème du commutateur est isolé, lié à la stratégie, environnemental ou déjà résolu.
apic-A# show version Role Pod Node Name Version ---------- --- ---- --------- ----------- controller 1 1 apic-A 6.1(3f) controller 1 2 apic-B 6.1(3f) controller 1 3 apic-C 6.1(3f) leaf 1 101 leaf-A n9000-16.1(3f) spine 1 201 spine-A n9000-16.1(3f)
Utilisez cette commande afin de vérifier l'alignement des versions entre les contrôleurs et les commutateurs avant de supposer une non-correspondance logicielle.
apic-A# show faults leaf 101
Code : F0532
Severity : critical
Lifecycle : raised
DN : topology/pod-1/node-101/sys/phys-[eth1/11]/phys/fault-F0532
Description : Port is down, reason being Link Not Connected(Connected),
used by EPG on node 101 with hostname leaf-A
Code : F1451
Severity : minor
Lifecycle : raised
DN : topology/pod-1/node-101/sys/ch/psuslot-1/psu/fault-F1451
Description : Power supply shutdown.
Code : F1699
Severity : warning
Lifecycle : raised
DN : topology/pod-1/node-101/sys/time/prov-198.51.100.10/status/fault-F1699
Description : NTP configuration on Leaf leaf-A is not synced to NTP server
Cette sortie est utile car elle sépare immédiatement trois domaines : les ports d'accès utilisés par les groupes de terminaux, l'état des blocs d'alimentation et la synchronisation temporelle.
apic-A# show faults history leaf 101 ID : 8589940065 Description : Port is down, reason:Link Not Connected(Connected), used by:Fabric Severity : minor Code : F1394 Action : modification Life Cycle : raised ID : 8589940026 Description : TCA: ingress drop packets rate value 233 raised above threshold 200 Severity : warning Code : F112128 Action : creation ID : 8589939383 Description : BGP peer is not established, current state Idle Severity : cleared Code : F0299 Action : deletion
Utilisez la vue d'historique afin de distinguer les problèmes actifs des événements transitoires qui ont déjà récupéré.
apic-A# moquery -c topSystem -f 'top.System.name=="spine-A"' # top.System dn : topology/pod-1/node-201/sys name : spine-A role : spine state : in-service oobMgmtAddr : 198.51.100.201 version : n9000-16.1(3f)
Utilisez cette requête afin de confirmer que la vue APIC du noeud correspond au commutateur que vous dépannez.
Problème : La commande show environment ou show discoveryissues signale un bloc d'alimentation à l'état fermé.
Contrôle opérationnel : Comparez l'état de l'unité d'alimentation avec le mode de redondance configuré et opérationnel dans le même résultat.
Cause première : Dans de nombreux déploiements de travaux pratiques et non redondants, une unité d'alimentation est intentionnellement inutilisée.
Solution : Considérez le résultat comme informatif, sauf si l'unité d'alimentation active est dégradée ou si le mode de redondance ne correspond pas à l'intention de conception.
Problème : show discoveryissues affiche le noeud comme étant en service, mais les vérifications de la requête ping APIC échouent.
Vérification de la configuration : Vérifier la conception de la gestion et de l'accessibilité de l'infrastructure, y compris le chemin orienté APIC utilisé par le test.
Contrôle opérationnel : Confirmez les contiguïtés IS-IS, le déploiement de VLAN infrarouge et les défaillances actives du côté APIC pour le noeud.
Cause première : Le noeud peut avoir suffisamment d'état de structure de base pour se joindre tout en exposant les cas d'accessibilité du contrôleur ou de périphérie de téléchargement de stratégie.
Solution : Utilisez la vue des pannes du contrôleur APIC et la configuration de la gestion des noeuds pour déterminer si la panne est liée au chemin de gestion, au tunnel ou à la stratégie.
Collecter l'assistance technique et la transmettre lorsqu'une ou plusieurs de ces conditions existent :
| Révision | Date de publication | Commentaires |
|---|---|---|
1.0 |
12-Jun-2026
|
Première publication |