Este documento describe la resolución de problemas de columna y hoja de Cisco ACI, incluida una tabla de clasificación, comprobaciones específicas del switch y correlación del lado APIC.
Puede resolver la mayoría de los problemas de los switches ACI más rápidamente cuando utiliza una secuencia de comandos ordenada en lugar de saltar directamente a comandos internos profundos. Comience con las comprobaciones de la línea de base del software y el hardware, continúe con el diagnóstico y el estado del entorno y, a continuación, relacione los problemas activos del switch en el APIC antes de pasar a los comandos específicos de la función.
| Objetivo |
Comando |
Qué buscar |
Pasos Siguientes |
|---|---|---|---|
| Confirmar modo y versión de ACI |
show version |
Imagen de inicio de ACI, liberación esperada, motivo de restablecimiento normal |
Si el switch no está en modo ACI, detenga y corrija primero la imagen de inicio. |
| Verificar el estado del módulo |
show module |
Los módulos están 'correctos' y los diagnósticos en línea están 'aprobados' |
Si algún módulo activo no está 'correcto' o falla el diagnóstico, trátelo primero como un problema de hardware. |
| Verifique la alimentación, el ventilador y el estado térmico |
show environment |
Las fuentes de alimentación operativas están 'bien', el estado del ventilador está 'bien', las temperaturas son 'normales' |
Si la única anomalía es una PSU redundante en estado 'shut', verifique la intención del diseño antes de escalar. |
| Verificar resultados de diagnóstico |
show diagnostic result module all |
Las pruebas muestran '.' para pasar a través de módulos activos |
Si alguna prueba es 'F', 'A', o 'I', correlacione con el módulo y la salida de falla. |
| Comprobar la detección y el fabric de referencia |
show discovery issues |
Estado del sistema, adyacencia, VLAN infra y comprobaciones de descarga de políticas |
Si las comprobaciones de detección fallan, corrija la conectividad de línea base antes de solucionar problemas de arrendatarios o routing. |
| Correlación en el APIC |
show faults leaf <node-id> o show faults history leaf <node-id> |
Código de error, gravedad y DN afectado |
Utilice la vista APIC para separar los síntomas activos de los eventos históricos ya borrados. |
Antes de interpretar el estado de tiempo de ejecución, compruebe que el nodo se ha detectado, registrado y que se está ejecutando el software del modo ACI. Para las comprobaciones de incorporación de switch y detección de línea base, utilice elshow discoveryissuescomando integrado y confirme que el APIC informa que el nodo está en servicio.
leaf-A# show version
Software
BIOS: version 05.53
kickstart: version 16.1(3f) [build 16.1(3f)]
system: version 16.1(3f) [build 16.1(3f)]
PE: version 6.1(3f)
kickstart image file is: /bootflash/aci-n9000-dk9.16.1.3f.bin <--- ACI mode indicator
system image file is: /bootflash/auto-s
Hardware
cisco N9K-C93108TC-FX ("supervisor")
Device name: leaf-A
Last reset at 241000 usecs after Wed Mar 11 17:28:38 2026 JST
Reason: reset-requested-by-cli-command-reload
Qué buena apariencia tiene: Kickstart y las líneas del sistema están presentes, la imagen de kickstart comienza con 'aci-n9000', y la razón de reinicio es explicable.
Qué mal se ve: La salida muestra un archivo de imagen de NXOS independiente sin líneas de sistema o de inicio de la ACI.
Esta sección utiliza un switch de hoja de formato fijo como línea base. El resultado se basa en una hoja de ACI viva y refleja condiciones tanto saludables como degradadas que son útiles durante el triaje.
Ejecute este comando para verificar el nivel de software, el modo de imagen, el tiempo de actividad y el motivo del último restablecimiento.
leaf-A# show version
Software
BIOS: version 05.53
kickstart: version 16.1(3f) [build 16.1(3f)]
system: version 16.1(3f) [build 16.1(3f)]
PE: version 6.1(3f)
kickstart image file is: /bootflash/aci-n9000-dk9.16.1.3f.bin
system image file is: /bootflash/auto-s
Hardware
cisco N9K-C93108TC-FX ("supervisor")
Device name: leaf-A
Kernel uptime is 29 day(s), 19 hour(s), 52 minute(s), 45 second(s)
Last reset at 241000 usecs after Wed Mar 11 17:28:38 2026 JST
Reason: reset-requested-by-cli-command-reload
Service: PolicyElem Ch reload
Ejecute este comando para verificar el estado de la tarjeta de línea y el resultado del diagnóstico en línea en el nivel del módulo.
leaf-A# show module Mod Ports Module-Type Model Status --- ----- ----------------------------------- ------------------ ---------- 1 54 48x10G+6x40/100G Switch N9K-C93108TC-FX ok Mod Online Diag Status --- ------------------ 1 pass <--- basic diagnostic baseline
Qué buena apariencia tiene: El módulo activo es ok y el estado de diagnóstico en línea es pass.
Qué mal se ve: El estado del módulo no es correcto o el estado de diagnóstico no es correcto.
Ejecute este comando para verificar la PSU, el ventilador y el estado térmico.
leaf-A# show environment Power Supply: Supply Model Output Capacity Status 1 NXA-PAC-500W-PE 0 W 500 W shut <--- redundant PSU not in use 2 NXA-PAC-500W-PE 219 W 500 W ok Fan: Fan1(sys_fan1) NXA-FAN-30CFM-F Status: ok Fan2(sys_fan2) NXA-FAN-30CFM-F Status: ok Fan3(sys_fan3) NXA-FAN-30CFM-F Status: ok Fan4(sys_fan4) NXA-FAN-30CFM-F Status: ok Temperature: 1 Inlet(1) 37 normal 1 outlet(2) 38 normal 1 x86 processor(3) 71 normal 1 Homewood(4) 56 normal
Qué buena apariencia tiene: La PSU activa está bien, los ventiladores están bien y las temperaturas son normales.
Qué mal se ve: Fallo en una fuente de alimentación en funcionamiento, el estado del ventilador no es correcto o cualquier sensor térmico no es normal.
Ejecute este comando para validar las pruebas de diagnóstico en línea reales, no sólo el campo de resumen en show module.
leaf-A# show diagnostic result module all Current bootup diagnostic level: bypass Module 1: 48x10G (Active) Test results: (. = Pass, F = Fail, I = Incomplete, U = Untested, A = Abort, E = Error disabled) 1) bios-mem-----------------------> . 2) mgmtp-lb-----------------------> . 22) cpu-cache----------------------> . 23) mem-health---------------------> . 24) ssd-acc------------------------> . 33) fpga-reg-chk-------------------> . 43) tahoe-mem----------------------> .
Qué buena apariencia tiene: Todas las pruebas necesarias muestran '.'.
Qué mal se ve: Cualquier resultado F, I o A para el hardware activo.
Ejecute este comando para validar la onboarding, la adyacencia, la VLAN infra y la disponibilidad del controlador. Este es uno de los comandos de primer paso más útiles para los switches de hoja.
leaf-A# show discoveryissues
Check 3 HW Modules Check
Test01 Fans status check PASSED
Test02 Power Supply status check FAILED
[Warn] Operational state of sys/ch/psuslot-1/psu is: shut
[Info] Ignore this if it is a redundant power supply
Check 5 System State
Test01 Check System State PASSED
[Info] TopSystem State is : in-service
Check 8 Infra VLAN Check
Test01 Check if infra VLAN is received PASSED
[Info] Infra VLAN received is : 4093
Check 10 IS-IS Adj Info
Test01 check IS-IS adjacencies PASSED
[Info] IS-IS adjacencies found on interfaces:
[Info] eth1/54.30
[Info] eth1/51.31
[Info] eth1/53.32
Check 11 Reachability to APIC
Test01 Ping check to APIC FAILED
[Error] Ping to APIC IP 198.51.100.1 from 198.51.100.64 with MTU 1450 failed.
Este ejemplo es útil porque muestra un resultado mixto realista: el nodo está en servicio y tiene adyacencias de fabric, pero la disponibilidad del controlador sigue fallando mientras se cierra una PSU redundante. Debe interpretar cada fallo en contexto en lugar de tratar cada línea fallida como igualmente grave.
Esta sección utiliza un conmutador central modular. La estructura del resultado es diferente de una hoja fija porque debe evaluar las tarjetas de línea, los módulos de fabric, los supervisores y los controladores del sistema por separado.
spine-A# show version
Software
BIOS: version 05.53
kickstart: version 16.1(3f) [build 16.1(3f)]
system: version 16.1(3f) [build 16.1(3f)]
PE: version 6.1(3f)
kickstart image file is: /bootflash/aci-n9000-dk9.16.1.3f-cs_64.bin <--- modular spine image
system image file is: /bootflash/auto-s
Hardware
cisco N9K-SUP-A+ ("supervisor")
Device name: spine-A
Last reset at 983000 usecs after Wed Mar 11 17:31:09 2026 JST
Reason: reset-requested-by-cli-command-reload
Ejecute este comando para verificar cada plano de hardware en el chasis.
spine-A# show module Mod Ports Module-Type Model Status --- ----- ----------------------------------- ------------------ ---------- 1 32 32p 40/100G Ethernet Module N9K-X9732C-EX ok 2 32 32p 40/100G Ethernet Module N9K-X9732C-EX ok 3 36 36p 40/100G Ethernet Module N9K-X9736C-FX ok 22 0 Fabric Module N9K-C9504-FM-E ok 23 0 Fabric Module N9K-C9504-FM-E ok 24 0 Fabric Module N9K-C9504-FM-E ok 26 0 Fabric Module N9K-C9504-FM-E ok 27 0 Supervisor Module N9K-SUP-A+ active 28 0 Supervisor Module N9K-SUP-A+ standby 29 0 System Controller N9K-SC-A standby 30 0 System Controller N9K-SC-A active Mod Online Diag Status --- ------------------ 1 pass 2 pass 3 pass 22 pass 23 pass 24 pass 26 pass 27 pass 28 pass 29 pass 30 pass
Qué buena apariencia tiene: Las tarjetas de línea, los módulos de fabric, los supervisores y los controladores del sistema están presentes y se superan los diagnósticos.
Qué mal se ve: Módulos de fabric faltantes o no correctos, anomalías de failover del supervisor o cualquier diagnóstico de módulo fallido.
spine-A# show environment Power Supply: Supply Model Output Capacity Status 1 N9K-PAC-3000W-B 1031 W 3000 W ok 2 N9K-PAC-3000W-B 0 W 3000 W shut 3 N9K-PAC-3000W-B 992 W 3000 W ok 4 ------------ N/A W 0 W Absent Power Usage Summary: Power Supply redundancy mode (operational) Non-Redundant(combined) Total Power Output (actual draw) 1523 W Total Power Available for additional modules 1793 W Fan: Fan1(sys_fan1) N9K-C9504-FAN Status: ok Fan2(sys_fan2) N9K-C9504-FAN Status: ok Fan3(sys_fan3) N9K-C9504-FAN Status: ok Fan4(sys_fan4) N9K-C9504-FAN Status: ok Fan5(sys_fan5) N9K-C9504-FAN Status: ok Fan6(sys_fan6) N9K-C9504-FAN Status: ok Temperature: 1 ATOM processor(1) 32 normal 3 Homewood instance 2(3) 78 normal 22 LAC instance 1(2) 70 normal 27 x86 processor(4) 36 normal
Este resultado es un buen ejemplo de un chasis que funciona correctamente aunque una PSU esté cerrada y otra ranura esté ausente. El modo de redundancia configurado explica por qué el chasis aún está operativo.
spine-A# show diagnostic result module all Current bootup diagnostic level: bypass Module 1: 32p 40/100G Ethernet Module 1) bios-mem-----------------------> . 9) mvl4p-eobc-snake---------------> . 39) lcfc-conn----------------------> . 43) tahoe-mem----------------------> . Module 22: Fabric Module 10) mvl10p-snake-------------------> . 42) fclc-conn----------------------> . 43) tahoe-mem----------------------> . Module 27: Supervisor Module (Active) 24) ssd-acc------------------------> . 32) nvram-cksum--------------------> . 35) eobc-mon-----------------------> . Module 30: System Controller 11) bcm28p-snake-------------------> . 41) pcie-bus-----------------------> .
En una columna modular, el valor principal de este comando es la amplitud. Puede confirmar que las tarjetas de línea, los módulos de fabric y los supervisores superan los diagnósticos en una única vista.
Después de validar la línea de base de CLI del switch, desplácese al APIC para correlacionar el nodo con los objetos con errores activos e históricos. Esta es la forma más rápida de determinar si el problema del switch está aislado, relacionado con la política, relacionado con el entorno o ya resuelto.
apic-A# show version Role Pod Node Name Version ---------- --- ---- --------- ----------- controller 1 1 apic-A 6.1(3f) controller 1 2 apic-B 6.1(3f) controller 1 3 apic-C 6.1(3f) leaf 1 101 leaf-A n9000-16.1(3f) spine 1 201 spine-A n9000-16.1(3f)
Utilice este comando para verificar la alineación de la versión entre los controladores y los switches antes de asumir una discordancia de software.
apic-A# show faults leaf 101
Code : F0532
Severity : critical
Lifecycle : raised
DN : topology/pod-1/node-101/sys/phys-[eth1/11]/phys/fault-F0532
Description : Port is down, reason being Link Not Connected(Connected),
used by EPG on node 101 with hostname leaf-A
Code : F1451
Severity : minor
Lifecycle : raised
DN : topology/pod-1/node-101/sys/ch/psuslot-1/psu/fault-F1451
Description : Power supply shutdown.
Code : F1699
Severity : warning
Lifecycle : raised
DN : topology/pod-1/node-101/sys/time/prov-198.51.100.10/status/fault-F1699
Description : NTP configuration on Leaf leaf-A is not synced to NTP server
Este resultado es útil porque separa inmediatamente tres dominios: puertos de acceso utilizados por EPG, estado de PSU y sincronización horaria.
apic-A# show faults history leaf 101 ID : 8589940065 Description : Port is down, reason:Link Not Connected(Connected), used by:Fabric Severity : minor Code : F1394 Action : modification Life Cycle : raised ID : 8589940026 Description : TCA: ingress drop packets rate value 233 raised above threshold 200 Severity : warning Code : F112128 Action : creation ID : 8589939383 Description : BGP peer is not established, current state Idle Severity : cleared Code : F0299 Action : deletion
Utilice la vista de historial para distinguir los problemas activos de los eventos transitorios que ya se han recuperado.
apic-A# moquery -c topSystem -f 'top.System.name=="spine-A"' # top.System dn : topology/pod-1/node-201/sys name : spine-A role : spine state : in-service oobMgmtAddr : 198.51.100.201 version : n9000-16.1(3f)
Utilice esta consulta para confirmar que la vista APIC del nodo coincide con el switch que está resolviendo.
Problema: show environment o show discovery issues informa que una PSU está en estado cerrado.
Comprobación operativa: Compare el estado de la PSU con el modo de redundancia configurado y en funcionamiento en la misma salida.
Causa raíz: En muchas implementaciones de laboratorio y no redundantes, una PSU no se utiliza intencionadamente.
Solución: Trate el resultado como informativo a menos que la PSU activa se degrade o que el modo de redundancia no coincida con la intención del diseño.
Problema: show discovery issues muestra el nodo como en servicio, pero las comprobaciones de ping APIC fallan.
Comprobación de configuración: Verificar la gestión y el diseño de infrarrojabilidad, incluida la ruta de acceso de cara al APIC utilizada por la prueba.
Comprobación operativa: Confirme las adyacencias IS-IS, la implementación de VLAN infra y los fallos activos del lado APIC para el nodo.
Causa raíz: El nodo puede tener suficiente estado de fabric de línea base para unirse y, al mismo tiempo, exponer la disponibilidad del controlador o los casos periféricos de descarga de políticas.
Solución: Utilice la vista de fallos de APIC y la configuración de gestión de nodos para aislar si el fallo está relacionado con la ruta de gestión, con el túnel o con la política.
Recopile soporte técnico y escale cuando se den una o más de estas condiciones:
| Revisión | Fecha de publicación | Comentarios |
|---|---|---|
1.0 |
12-Jun-2026
|
Versión inicial |