In dit document wordt beschreven hoe u problemen met Cisco ACI-bladeren en -ruggegraat kunt oplossen, inclusief een triagetabel, switch-specifieke controles en APIC-correlatie.
U kunt de meeste problemen met de ACI-switch sneller oplossen wanneer u een geordende opdrachtreeks gebruikt in plaats van direct in diepe interne opdrachten te springen. Begin met software- en hardwarecontroles, ga door met diagnostiek en omgevingsstatus en correleer vervolgens problemen met actieve switch op de APIC voordat u overgaat op functiespecifieke opdrachten.
| doel |
Opdracht |
Wat te zoeken |
Wat te doen Volgende |
|---|---|---|---|
| ACI-modus en versie bevestigen |
show version |
ACI kick start beeld, verwachte release, gezonde reset reden |
Als de switch zich niet in de ACI-modus bevindt, moet u eerst het opstartbeeld stoppen en corrigeren. |
| Modulestatus controleren |
show module |
Modules zijn 'ok' en online diagnostiek is 'pass' |
Als een actieve module niet 'OK' is of als de diagnostiek niet werkt, moet u deze eerst als een hardwareprobleem behandelen. |
| Controleer het vermogen, de ventilator en de thermische toestand |
Toon omgeving |
Operationele PSU's zijn 'ok', ventilatorstatus is 'ok', temperaturen zijn 'normaal' |
Als de enige anomalie een redundante PSU in de status 'shut' is, controleert u de ontwerpintentie voordat u escaleert. |
| Diagnostische resultaten controleren |
Alle diagnostische resultaatmodule tonen |
Tests tonen '.' voor pass over actieve modules |
Als een test 'F', 'A' of 'I' is, correleer dan met de module en de foutuitvoer. |
| Controleren van de basislijn voor detectie en verbindingen |
Ontdekkingsproblemen weergeven |
Controles voor systeemstatus, nabijheid, infra-VLAN en downloadbeleid |
Als de detectiecontroles mislukken, repareert u de basislijnconnectiviteit voordat u problemen met huurders of routering oplost. |
| Correleren op de APIC |
Fouten weergeven Leaf <node-id> of Fouten weergeven Geschiedenis Leaf <node-id> |
Foutcode, ernst en aangetast DN |
Gebruik de APIC-weergave om actieve symptomen te scheiden van reeds geklaarde historische gebeurtenissen. |
Voordat u de runtime-status interpreteert, moet u controleren of de node is ontdekt, geregistreerd en ACI-modus-software uitvoert. Gebruik voor onboarding van switch en detectiecontroles van de basislijn de ingebouwdeshow discoveryissuesopdracht en bevestig dat de APIC de node meldt als in-service.
leaf-A# show version
Software
BIOS: version 05.53
kickstart: version 16.1(3f) [build 16.1(3f)]
system: version 16.1(3f) [build 16.1(3f)]
PE: version 6.1(3f)
kickstart image file is: /bootflash/aci-n9000-dk9.16.1.3f.bin <--- ACI mode indicator
system image file is: /bootflash/auto-s
Hardware
cisco N9K-C93108TC-FX ("supervisor")
Device name: leaf-A
Last reset at 241000 usecs after Wed Mar 11 17:28:38 2026 JST
Reason: reset-requested-by-cli-command-reload
Hoe goed ziet eruit: Kickstart en systeemlijnen zijn aanwezig, de kickstart-afbeelding begint met 'aci-n9000' en de reden voor het resetten is verklaarbaar.
Hoe slecht ziet eruit: Uitvoer toont een standalone NXOS-beeldbestand zonder ACI-kickstart of systeemlijnen.
Deze sectie gebruikt een switch met een vaste vorm als basislijn. De output is gebaseerd op een levend ACI-blad en weerspiegelt zowel gezonde als gedegenereerde omstandigheden die nuttig zijn tijdens triage.
Voer deze opdracht uit om het softwareniveau, de imagemodus, de uptime en de reden voor de laatste reset te controleren.
leaf-A# show version
Software
BIOS: version 05.53
kickstart: version 16.1(3f) [build 16.1(3f)]
system: version 16.1(3f) [build 16.1(3f)]
PE: version 6.1(3f)
kickstart image file is: /bootflash/aci-n9000-dk9.16.1.3f.bin
system image file is: /bootflash/auto-s
Hardware
cisco N9K-C93108TC-FX ("supervisor")
Device name: leaf-A
Kernel uptime is 29 day(s), 19 hour(s), 52 minute(s), 45 second(s)
Last reset at 241000 usecs after Wed Mar 11 17:28:38 2026 JST
Reason: reset-requested-by-cli-command-reload
Service: PolicyElem Ch reload
Voer deze opdracht uit om de status van de lijnkaart en het online diagnoseresultaat op moduleniveau te controleren.
leaf-A# show module Mod Ports Module-Type Model Status --- ----- ----------------------------------- ------------------ ---------- 1 54 48x10G+6x40/100G Switch N9K-C93108TC-FX ok Mod Online Diag Status --- ------------------ 1 pass <--- basic diagnostic baseline
Hoe ziet goed eruit: de actieve module is ok en de online diagnostische status is geslaagd.
Hoe slecht ziet eruit: de modulestatus is niet OK of de diagnostische status is niet geslaagd.
Voer deze opdracht uit om de voedingseenheid, ventilator en thermische toestand te controleren.
leaf-A# show environment Power Supply: Supply Model Output Capacity Status 1 NXA-PAC-500W-PE 0 W 500 W shut <--- redundant PSU not in use 2 NXA-PAC-500W-PE 219 W 500 W ok Fan: Fan1(sys_fan1) NXA-FAN-30CFM-F Status: ok Fan2(sys_fan2) NXA-FAN-30CFM-F Status: ok Fan3(sys_fan3) NXA-FAN-30CFM-F Status: ok Fan4(sys_fan4) NXA-FAN-30CFM-F Status: ok Temperature: 1 Inlet(1) 37 normal 1 outlet(2) 38 normal 1 x86 processor(3) 71 normal 1 Homewood(4) 56 normal
Hoe goed ziet eruit: De actieve PSU is ok, fans zijn ok, en de temperaturen zijn normaal.
Hoe slecht ziet eruit: een operationele PSU is mislukt, de ventilatorstatus is niet ok, of een thermische sensor is niet normaal.
Voer deze opdracht uit om de daadwerkelijke online diagnostische tests te valideren, niet alleen het overzichtsveld in de weergavemodule.
leaf-A# show diagnostic result module all Current bootup diagnostic level: bypass Module 1: 48x10G (Active) Test results: (. = Pass, F = Fail, I = Incomplete, U = Untested, A = Abort, E = Error disabled) 1) bios-mem-----------------------> . 2) mgmtp-lb-----------------------> . 22) cpu-cache----------------------> . 23) mem-health---------------------> . 24) ssd-acc------------------------> . 33) fpga-reg-chk-------------------> . 43) tahoe-mem----------------------> .
Hoe ziet goed eruit: Alle vereiste tests tonen '.'.
Hoe slecht ziet eruit: Elke F, I, of A resultaat voor actieve hardware.
Voer deze opdracht uit om onboarding, nabijheid, infra VLAN en bereikbaarheid van de controller te valideren. Dit is een van de meest bruikbare first-pass commando's voor blad switches.
leaf-A# show discoveryissues
Check 3 HW Modules Check
Test01 Fans status check PASSED
Test02 Power Supply status check FAILED
[Warn] Operational state of sys/ch/psuslot-1/psu is: shut
[Info] Ignore this if it is a redundant power supply
Check 5 System State
Test01 Check System State PASSED
[Info] TopSystem State is : in-service
Check 8 Infra VLAN Check
Test01 Check if infra VLAN is received PASSED
[Info] Infra VLAN received is : 4093
Check 10 IS-IS Adj Info
Test01 check IS-IS adjacencies PASSED
[Info] IS-IS adjacencies found on interfaces:
[Info] eth1/54.30
[Info] eth1/51.31
[Info] eth1/53.32
Check 11 Reachability to APIC
Test01 Ping check to APIC FAILED
[Error] Ping to APIC IP 198.51.100.1 from 198.51.100.64 with MTU 1450 failed.
Dit voorbeeld is handig omdat het een realistisch gemengd resultaat laat zien - de node is in gebruik en heeft aansluitingen op de fabric, maar de bereikbaarheid van de controller mislukt nog steeds terwijl één redundante PSU is afgesloten. Je moet elk falen in context interpreteren in plaats van elke mislukte lijn als even ernstig te behandelen.
Deze sectie maakt gebruik van een modulaire wervelkolom switch. De structuur van de uitvoer verschilt van een vast blad omdat u lijnkaarten, weefselmodules, supervisors en systeemcontrollers afzonderlijk moet evalueren.
spine-A# show version
Software
BIOS: version 05.53
kickstart: version 16.1(3f) [build 16.1(3f)]
system: version 16.1(3f) [build 16.1(3f)]
PE: version 6.1(3f)
kickstart image file is: /bootflash/aci-n9000-dk9.16.1.3f-cs_64.bin <--- modular spine image
system image file is: /bootflash/auto-s
Hardware
cisco N9K-SUP-A+ ("supervisor")
Device name: spine-A
Last reset at 983000 usecs after Wed Mar 11 17:31:09 2026 JST
Reason: reset-requested-by-cli-command-reload
Voer deze opdracht uit om elk hardwarevlak in het chassis te controleren.
spine-A# show module Mod Ports Module-Type Model Status --- ----- ----------------------------------- ------------------ ---------- 1 32 32p 40/100G Ethernet Module N9K-X9732C-EX ok 2 32 32p 40/100G Ethernet Module N9K-X9732C-EX ok 3 36 36p 40/100G Ethernet Module N9K-X9736C-FX ok 22 0 Fabric Module N9K-C9504-FM-E ok 23 0 Fabric Module N9K-C9504-FM-E ok 24 0 Fabric Module N9K-C9504-FM-E ok 26 0 Fabric Module N9K-C9504-FM-E ok 27 0 Supervisor Module N9K-SUP-A+ active 28 0 Supervisor Module N9K-SUP-A+ standby 29 0 System Controller N9K-SC-A standby 30 0 System Controller N9K-SC-A active Mod Online Diag Status --- ------------------ 1 pass 2 pass 3 pass 22 pass 23 pass 24 pass 26 pass 27 pass 28 pass 29 pass 30 pass
Hoe goed ziet eruit: Lijnkaarten, weefselmodules, supervisors en systeemcontrollers zijn allemaal aanwezig en diagnostiek is geslaagd.
Hoe slecht ziet eruit: ontbrekende of niet-OK fabric-modules, failover-anomalieën van de supervisor of een defecte diagnostische module.
spine-A# show environment Power Supply: Supply Model Output Capacity Status 1 N9K-PAC-3000W-B 1031 W 3000 W ok 2 N9K-PAC-3000W-B 0 W 3000 W shut 3 N9K-PAC-3000W-B 992 W 3000 W ok 4 ------------ N/A W 0 W Absent Power Usage Summary: Power Supply redundancy mode (operational) Non-Redundant(combined) Total Power Output (actual draw) 1523 W Total Power Available for additional modules 1793 W Fan: Fan1(sys_fan1) N9K-C9504-FAN Status: ok Fan2(sys_fan2) N9K-C9504-FAN Status: ok Fan3(sys_fan3) N9K-C9504-FAN Status: ok Fan4(sys_fan4) N9K-C9504-FAN Status: ok Fan5(sys_fan5) N9K-C9504-FAN Status: ok Fan6(sys_fan6) N9K-C9504-FAN Status: ok Temperature: 1 ATOM processor(1) 32 normal 3 Homewood instance 2(3) 78 normal 22 LAC instance 1(2) 70 normal 27 x86 processor(4) 36 normal
Deze uitvoer is een goed voorbeeld van een chassis dat gezond is, ook al is één voedingseenheid gesloten en is een andere sleuf afwezig. De geconfigureerde redundantie-modus verklaart waarom het chassis nog steeds operationeel is.
spine-A# show diagnostic result module all Current bootup diagnostic level: bypass Module 1: 32p 40/100G Ethernet Module 1) bios-mem-----------------------> . 9) mvl4p-eobc-snake---------------> . 39) lcfc-conn----------------------> . 43) tahoe-mem----------------------> . Module 22: Fabric Module 10) mvl10p-snake-------------------> . 42) fclc-conn----------------------> . 43) tahoe-mem----------------------> . Module 27: Supervisor Module (Active) 24) ssd-acc------------------------> . 32) nvram-cksum--------------------> . 35) eobc-mon-----------------------> . Module 30: System Controller 11) bcm28p-snake-------------------> . 41) pcie-bus-----------------------> .
Op een modulaire wervelkolom is de belangrijkste waarde van dit commando breedte. U kunt bevestigen dat lijnkaarten, weefselmodules en supervisors alle diagnoses in één weergave doorstaan.
Nadat u de basislijn van de switch-CLI hebt gevalideerd, gaat u naar de APIC om de node te correleren met actieve en historische objecten met fouten. Dit is de snelste manier om te bepalen of de switch probleem is geïsoleerd, beleidsgerelateerde, milieu, of al opgeruimd.
apic-A# show version Role Pod Node Name Version ---------- --- ---- --------- ----------- controller 1 1 apic-A 6.1(3f) controller 1 2 apic-B 6.1(3f) controller 1 3 apic-C 6.1(3f) leaf 1 101 leaf-A n9000-16.1(3f) spine 1 201 spine-A n9000-16.1(3f)
Gebruik deze opdracht om de uitlijning van de release tussen controllers en switches te controleren voordat u een softwaremismatch veronderstelt.
apic-A# show faults leaf 101
Code : F0532
Severity : critical
Lifecycle : raised
DN : topology/pod-1/node-101/sys/phys-[eth1/11]/phys/fault-F0532
Description : Port is down, reason being Link Not Connected(Connected),
used by EPG on node 101 with hostname leaf-A
Code : F1451
Severity : minor
Lifecycle : raised
DN : topology/pod-1/node-101/sys/ch/psuslot-1/psu/fault-F1451
Description : Power supply shutdown.
Code : F1699
Severity : warning
Lifecycle : raised
DN : topology/pod-1/node-101/sys/time/prov-198.51.100.10/status/fault-F1699
Description : NTP configuration on Leaf leaf-A is not synced to NTP server
Deze uitvoer is handig omdat deze onmiddellijk drie domeinen scheidt - toegangspoorten die worden gebruikt door EPG's, PSU-status en tijdsynchronisatie.
apic-A# show faults history leaf 101 ID : 8589940065 Description : Port is down, reason:Link Not Connected(Connected), used by:Fabric Severity : minor Code : F1394 Action : modification Life Cycle : raised ID : 8589940026 Description : TCA: ingress drop packets rate value 233 raised above threshold 200 Severity : warning Code : F112128 Action : creation ID : 8589939383 Description : BGP peer is not established, current state Idle Severity : cleared Code : F0299 Action : deletion
Gebruik de geschiedenisweergave om actieve problemen te onderscheiden van tijdelijke gebeurtenissen die al zijn hersteld.
apic-A# moquery -c topSystem -f 'top.System.name=="spine-A"' # top.System dn : topology/pod-1/node-201/sys name : spine-A role : spine state : in-service oobMgmtAddr : 198.51.100.201 version : n9000-16.1(3f)
Gebruik deze query om te bevestigen dat de APIC-weergave van het knooppunt overeenkomt met de switch waarmee u problemen oplost.
Probleem: toon de omgeving of toon detectieproblemen meldt een PSU in gesloten toestand.
Operationele controle: vergelijk de PSU-status met de geconfigureerde en operationele redundantie-modus in dezelfde uitvoer.
Hoofdoorzaak: in veel laboratorium- en niet-redundante implementaties is één voedingseenheid opzettelijk ongebruikt.
Oplossing: behandel de uitvoer als informatief, tenzij de actieve voedingseenheid is gedegradeerd of de redundantiemodus niet overeenkomt met de ontwerpintentie.
Probleem: detectieproblemen tonen toont de node als in-service, maar APIC-pingcontroles mislukken.
Configuratiecontrole: controleer het ontwerp van het beheer en de bereikbaarheid van de infra, inclusief het APIC-gerichte pad dat door de test wordt gebruikt.
Operationele controle: bevestig de IS-IS-aansluitingen, de infra-VLAN-implementatie en actieve APIC-side-fouten voor de node.
Hoofdoorzaak: de node kan voldoende basislijnstructuurstatus hebben om deel te nemen terwijl de bereikbaarheid van de controller of de randgevallen voor het downloaden van het beleid nog steeds worden weergegeven.
Oplossing: gebruik de APIC-storingsweergave en de configuratie van het knooppuntbeheer om te bepalen of de storing verband houdt met het beheerpad, de tunnel of het beleid.
Verzamel technische ondersteuning en escaleer wanneer een of meer van deze voorwaarden bestaan:
| Revisie | Publicatiedatum | Opmerkingen |
|---|---|---|
1.0 |
12-Jun-2026
|
Eerste vrijgave |