이 문서에서는 Cisco ACI 리프 및 스파인 트러블슈팅에 대해 설명하며, 여기에는 분류 테이블, 스위치별 검사, APIC 측 상관관계가 포함되어 있습니다.
내부 명령을 직접 실행하는 대신 순서가 지정된 명령 시퀀스를 사용하면 대부분의 ACI 스위치 문제를 더 빠르게 해결할 수 있습니다. 소프트웨어 및 하드웨어 기준 검사로 시작하여 진단 및 환경 상태를 계속한 다음 기능별 명령으로 이동하기 전에 APIC에서 활성 스위치 문제의 상관관계를 분석합니다.
| 목표 |
명령을 사용합니다 |
살펴볼 내용 |
다음 작업 |
|---|---|---|---|
| ACI 모드 및 버전 확인 |
show version |
ACI 킥 시작 이미지, 예상 릴리스, sane 재설정 이유 |
스위치가 ACI 모드가 아닐 경우 먼저 부팅 이미지를 중지했다가 수정하십시오. |
| 모듈 상태 확인 |
show module |
모듈은 '정상'이고 온라인 진단은 '합격'입니다. |
활성 모듈이 '정상'이 아니거나 진단이 실패할 경우 먼저 하드웨어 문제로 처리합니다. |
| 전원, 팬 및 열 상태 확인 |
환경 표시 |
작동 중인 PSU는 '정상', 팬 상태는 '정상', 온도는 '정상' |
이중화 PSU가 '종료' 상태인 경우에만 에스컬레이션 전에 설계 의도를 확인하십시오. |
| 진단 결과 확인 |
show diagnostic result module all |
테스트에 '.'이 표시됩니다. 활성 모듈 간 전달 |
테스트가 'F', 'A' 또는 'I'인 경우 모듈 및 결함 출력과의 상관성을 분석합니다. |
| 검색 및 패브릭 베이스라인 확인 |
검색 문제 표시 |
시스템 상태, 인접성, 인프라 VLAN 및 정책 다운로드 확인 |
검색 확인에 실패할 경우 테넌트 또는 라우팅의 문제를 해결하기 전에 기본 연결을 수정합니다. |
| APIC에서 상관성 분석 |
show faults leaf <node-id> 또는 show faults history leaf <node-id> |
결함 코드, 심각도 및 영향을 받는 DN |
APIC 보기를 사용하여 이미 지워진 기록 이벤트와 활성 증상을 구분합니다. |
런타임 상태를 해석하기 전에 노드가 검색, 등록 및 ACI 모드 소프트웨어를 실행 중인지 확인합니다. 스위치 온보딩 및 베이스라인 검색 확인을 위해 built-show discoveryissuesincommand를 사용하고 APIC에서 노드를 in-service로 보고하는지 확인합니다.
leaf-A# show version
Software
BIOS: version 05.53
kickstart: version 16.1(3f) [build 16.1(3f)]
system: version 16.1(3f) [build 16.1(3f)]
PE: version 6.1(3f)
kickstart image file is: /bootflash/aci-n9000-dk9.16.1.3f.bin <--- ACI mode indicator
system image file is: /bootflash/auto-s
Hardware
cisco N9K-C93108TC-FX ("supervisor")
Device name: leaf-A
Last reset at 241000 usecs after Wed Mar 11 17:28:38 2026 JST
Reason: reset-requested-by-cli-command-reload
좋은 모습: Kickstart 및 시스템 라인이 있으며, kickstart 이미지는 'aci-n9000'으로 시작하고 재설정 이유를 설명할 수 있습니다.
어떤 나쁜 모습인가: 출력은 ACI kickstart 또는 시스템 라인이 없는 독립형 NXOS 이미지 파일을 보여줍니다.
이 섹션에서는 고정 폼 팩터 리프 스위치를 기준으로 사용합니다. 출력은 라이브 ACI 리프를 기반으로 하며 분류 중에 유용한 정상 및 저하된 조건을 모두 반영합니다.
소프트웨어 레벨, 이미지 모드, 가동 시간 및 마지막 재설정 이유를 확인하려면 이 명령을 실행합니다.
leaf-A# show version
Software
BIOS: version 05.53
kickstart: version 16.1(3f) [build 16.1(3f)]
system: version 16.1(3f) [build 16.1(3f)]
PE: version 6.1(3f)
kickstart image file is: /bootflash/aci-n9000-dk9.16.1.3f.bin
system image file is: /bootflash/auto-s
Hardware
cisco N9K-C93108TC-FX ("supervisor")
Device name: leaf-A
Kernel uptime is 29 day(s), 19 hour(s), 52 minute(s), 45 second(s)
Last reset at 241000 usecs after Wed Mar 11 17:28:38 2026 JST
Reason: reset-requested-by-cli-command-reload
Service: PolicyElem Ch reload
라인 카드 상태 및 온라인 진단 결과를 모듈 레벨에서 확인하려면 이 명령을 실행합니다.
leaf-A# show module Mod Ports Module-Type Model Status --- ----- ----------------------------------- ------------------ ---------- 1 54 48x10G+6x40/100G Switch N9K-C93108TC-FX ok Mod Online Diag Status --- ------------------ 1 pass <--- basic diagnostic baseline
좋은 모습: 활성 모듈은 정상이고 온라인 진단 상태는 통과입니다.
어떤 나쁜 모습인가: 모듈 상태가 양호하지 않거나 진단 상태가 통과하지 않습니다.
PSU, 팬 및 열 상태를 확인하려면 이 명령을 실행합니다.
leaf-A# show environment Power Supply: Supply Model Output Capacity Status 1 NXA-PAC-500W-PE 0 W 500 W shut <--- redundant PSU not in use 2 NXA-PAC-500W-PE 219 W 500 W ok Fan: Fan1(sys_fan1) NXA-FAN-30CFM-F Status: ok Fan2(sys_fan2) NXA-FAN-30CFM-F Status: ok Fan3(sys_fan3) NXA-FAN-30CFM-F Status: ok Fan4(sys_fan4) NXA-FAN-30CFM-F Status: ok Temperature: 1 Inlet(1) 37 normal 1 outlet(2) 38 normal 1 x86 processor(3) 71 normal 1 Homewood(4) 56 normal
좋은 모습: 활성 PSU는 정상이고, 팬은 정상이며, 온도는 정상입니다.
어떤 나쁜 모습인가: 작동 중인 PSU가 고장 났거나, 팬 상태가 양호하지 않거나, 열 센서가 정상적이지 않습니다.
show 모듈의 summary 필드뿐만 아니라 실제 온라인 진단 테스트를 검증하려면 이 명령을 실행합니다.
leaf-A# show diagnostic result module all Current bootup diagnostic level: bypass Module 1: 48x10G (Active) Test results: (. = Pass, F = Fail, I = Incomplete, U = Untested, A = Abort, E = Error disabled) 1) bios-mem-----------------------> . 2) mgmtp-lb-----------------------> . 22) cpu-cache----------------------> . 23) mem-health---------------------> . 24) ssd-acc------------------------> . 33) fpga-reg-chk-------------------> . 43) tahoe-mem----------------------> .
좋은 모습: 모든 필수 테스트에 '.'가 표시됩니다.
어떤 나쁜 모습인가: 활성 하드웨어에 대한 모든 F, I 또는 A 결과.
온보딩, 인접성, 인프라 VLAN 및 컨트롤러 연결성을 검증하려면 이 명령을 실행합니다. 리프 스위치에 가장 유용한 first-pass 명령 중 하나입니다.
leaf-A# show discoveryissues
Check 3 HW Modules Check
Test01 Fans status check PASSED
Test02 Power Supply status check FAILED
[Warn] Operational state of sys/ch/psuslot-1/psu is: shut
[Info] Ignore this if it is a redundant power supply
Check 5 System State
Test01 Check System State PASSED
[Info] TopSystem State is : in-service
Check 8 Infra VLAN Check
Test01 Check if infra VLAN is received PASSED
[Info] Infra VLAN received is : 4093
Check 10 IS-IS Adj Info
Test01 check IS-IS adjacencies PASSED
[Info] IS-IS adjacencies found on interfaces:
[Info] eth1/54.30
[Info] eth1/51.31
[Info] eth1/53.32
Check 11 Reachability to APIC
Test01 Ping check to APIC FAILED
[Error] Ping to APIC IP 198.51.100.1 from 198.51.100.64 with MTU 1450 failed.
이 예는 노드가 서비스 중이고 패브릭 인접성이 있지만, 이중화된 PSU 1개가 종료된 상태에서 컨트롤러 연결 기능이 계속 실패하는 등 현실적인 혼합 결과를 보여주기 때문에 유용합니다. 모든 실패 회선을 동일하게 심각으로 간주하는 대신 컨텍스트에서 각 실패를 해석해야 합니다.
이 섹션에서는 모듈형 스파인 스위치를 사용합니다. 라인 카드, 패브릭 모듈, 수퍼바이저 및 시스템 컨트롤러를 각각 평가해야 하므로 출력의 구조는 고정 리프와 다릅니다.
spine-A# show version
Software
BIOS: version 05.53
kickstart: version 16.1(3f) [build 16.1(3f)]
system: version 16.1(3f) [build 16.1(3f)]
PE: version 6.1(3f)
kickstart image file is: /bootflash/aci-n9000-dk9.16.1.3f-cs_64.bin <--- modular spine image
system image file is: /bootflash/auto-s
Hardware
cisco N9K-SUP-A+ ("supervisor")
Device name: spine-A
Last reset at 983000 usecs after Wed Mar 11 17:31:09 2026 JST
Reason: reset-requested-by-cli-command-reload
섀시의 모든 하드웨어 플레인을 확인하려면 이 명령을 실행합니다.
spine-A# show module Mod Ports Module-Type Model Status --- ----- ----------------------------------- ------------------ ---------- 1 32 32p 40/100G Ethernet Module N9K-X9732C-EX ok 2 32 32p 40/100G Ethernet Module N9K-X9732C-EX ok 3 36 36p 40/100G Ethernet Module N9K-X9736C-FX ok 22 0 Fabric Module N9K-C9504-FM-E ok 23 0 Fabric Module N9K-C9504-FM-E ok 24 0 Fabric Module N9K-C9504-FM-E ok 26 0 Fabric Module N9K-C9504-FM-E ok 27 0 Supervisor Module N9K-SUP-A+ active 28 0 Supervisor Module N9K-SUP-A+ standby 29 0 System Controller N9K-SC-A standby 30 0 System Controller N9K-SC-A active Mod Online Diag Status --- ------------------ 1 pass 2 pass 3 pass 22 pass 23 pass 24 pass 26 pass 27 pass 28 pass 29 pass 30 pass
좋은 모습: 라인 카드, 패브릭 모듈, 수퍼바이저, 시스템 컨트롤러가 모두 있고 진단 기능을 통과했습니다.
어떤 나쁜 모습인가: 누락되거나 정상 상태가 아닌 패브릭 모듈, 수퍼바이저 장애 조치 이상 징후 또는 모듈 진단에 실패했습니다.
spine-A# show environment Power Supply: Supply Model Output Capacity Status 1 N9K-PAC-3000W-B 1031 W 3000 W ok 2 N9K-PAC-3000W-B 0 W 3000 W shut 3 N9K-PAC-3000W-B 992 W 3000 W ok 4 ------------ N/A W 0 W Absent Power Usage Summary: Power Supply redundancy mode (operational) Non-Redundant(combined) Total Power Output (actual draw) 1523 W Total Power Available for additional modules 1793 W Fan: Fan1(sys_fan1) N9K-C9504-FAN Status: ok Fan2(sys_fan2) N9K-C9504-FAN Status: ok Fan3(sys_fan3) N9K-C9504-FAN Status: ok Fan4(sys_fan4) N9K-C9504-FAN Status: ok Fan5(sys_fan5) N9K-C9504-FAN Status: ok Fan6(sys_fan6) N9K-C9504-FAN Status: ok Temperature: 1 ATOM processor(1) 32 normal 3 Homewood instance 2(3) 78 normal 22 LAC instance 1(2) 70 normal 27 x86 processor(4) 36 normal
이 출력은 한 PSU가 종료되고 다른 슬롯이 없더라도 정상 상태인 섀시의 좋은 예입니다. 구성된 이중화 모드는 섀시가 계속 작동하는 이유를 설명합니다.
spine-A# show diagnostic result module all Current bootup diagnostic level: bypass Module 1: 32p 40/100G Ethernet Module 1) bios-mem-----------------------> . 9) mvl4p-eobc-snake---------------> . 39) lcfc-conn----------------------> . 43) tahoe-mem----------------------> . Module 22: Fabric Module 10) mvl10p-snake-------------------> . 42) fclc-conn----------------------> . 43) tahoe-mem----------------------> . Module 27: Supervisor Module (Active) 24) ssd-acc------------------------> . 32) nvram-cksum--------------------> . 35) eobc-mon-----------------------> . Module 30: System Controller 11) bcm28p-snake-------------------> . 41) pcie-bus-----------------------> .
모듈형 스파인에서 이 명령의 기본 값은 폭입니다. 라인 카드, 패브릭 모듈 및 수퍼바이저가 모두 단일 보기에서 진단을 통과하는지 확인할 수 있습니다.
스위치 CLI 기준을 검증한 후 노드를 활성 및 기록 장애 객체와 상호 연결하기 위해 APIC로 이동합니다. 이는 스위치 문제가 격리되었는지, 정책과 관련되었는지, 환경인지, 아니면 이미 해결되었는지를 확인하는 가장 빠른 방법입니다.
apic-A# show version Role Pod Node Name Version ---------- --- ---- --------- ----------- controller 1 1 apic-A 6.1(3f) controller 1 2 apic-B 6.1(3f) controller 1 3 apic-C 6.1(3f) leaf 1 101 leaf-A n9000-16.1(3f) spine 1 201 spine-A n9000-16.1(3f)
소프트웨어 불일치를 가정하기 전에 컨트롤러와 스위치 간의 릴리스 정렬을 확인하려면 이 명령을 사용합니다.
apic-A# show faults leaf 101
Code : F0532
Severity : critical
Lifecycle : raised
DN : topology/pod-1/node-101/sys/phys-[eth1/11]/phys/fault-F0532
Description : Port is down, reason being Link Not Connected(Connected),
used by EPG on node 101 with hostname leaf-A
Code : F1451
Severity : minor
Lifecycle : raised
DN : topology/pod-1/node-101/sys/ch/psuslot-1/psu/fault-F1451
Description : Power supply shutdown.
Code : F1699
Severity : warning
Lifecycle : raised
DN : topology/pod-1/node-101/sys/time/prov-198.51.100.10/status/fault-F1699
Description : NTP configuration on Leaf leaf-A is not synced to NTP server
이 출력은 3개의 도메인(EPG에서 사용하는 액세스 포트, PSU 상태 및 시간 동기화)을 즉시 분리하므로 유용합니다.
apic-A# show faults history leaf 101 ID : 8589940065 Description : Port is down, reason:Link Not Connected(Connected), used by:Fabric Severity : minor Code : F1394 Action : modification Life Cycle : raised ID : 8589940026 Description : TCA: ingress drop packets rate value 233 raised above threshold 200 Severity : warning Code : F112128 Action : creation ID : 8589939383 Description : BGP peer is not established, current state Idle Severity : cleared Code : F0299 Action : deletion
기록 보기를 사용하여 활성 문제를 이미 복구된 일시적인 이벤트와 구별할 수 있습니다.
apic-A# moquery -c topSystem -f 'top.System.name=="spine-A"' # top.System dn : topology/pod-1/node-201/sys name : spine-A role : spine state : in-service oobMgmtAddr : 198.51.100.201 version : n9000-16.1(3f)
노드의 APIC 보기가 트러블슈팅 중인 스위치와 일치하는지 확인하려면 이 쿼리를 사용합니다.
문제/장애: show environment 또는 show discoveryissues는 PSU가 종료 상태에 있음을 보고합니다.
운영 확인: 동일한 출력에서 PSU 상태를 구성된 및 작동 이중화 모드와 비교합니다.
근본 원인: 많은 실습과 비중복 구축에서는 PSU 1개가 의도적으로 사용되지 않습니다.
해결책: 활성 PSU의 성능이 저하되거나 이중화 모드가 설계 의도와 일치하지 않는 경우가 아니면 출력을 정보 출력으로 취급합니다.
문제/장애: show discoveryissues는 노드를 in-service로 표시하지만 APIC ping 검사가 실패합니다.
컨피그레이션 확인: 테스트에서 사용하는 APIC 연결 경로를 포함하여 관리 및 인프라 연결 설계를 확인합니다.
운영 확인: 노드에 대한 IS-IS 인접성, 인프라 VLAN 구축 및 활성 APIC 측 결함을 확인합니다.
근본 원인: 노드는 컨트롤러 연결성 또는 정책 다운로드 에지 사례를 계속 노출하면서 참가하기에 충분한 기본 패브릭 상태를 가질 수 있습니다.
해결책: APIC 결함 보기 및 노드 관리 컨피그레이션을 사용하여 관리 경로 관련 장애, 터널 관련 장애 또는 정책 관련 장애 여부를 격리합니다.
다음 조건 중 하나 이상이 있는 경우 기술 지원을 수집하고 에스컬레이션합니다.
| 개정 | 게시 날짜 | 의견 |
|---|---|---|
1.0 |
12-Jun-2026
|
최초 릴리스 |