本文档介绍SWIM故障排除,包括实际检查、明确的恢复步骤以及上报之前需要检查的信息。
在本文档中,CatC表示Cisco Catalyst Center(CatC),而SWIM表示软件映像管理(SWIM)。
在进行任何更改之前,请确保控制台或管理访问可用、目标映像正确、存在回退路径、设备未运行其他安装操作,并且更改已获批准。
在转到CLI或数据库检查之前,GUI会提供有用的上下文。
此检查必须是在映像分发或激活故障排除之前进行的最早检查之一。

推荐的TAC审核流程:

TAC验证的内容:
为什么此步骤很重要:此步骤可帮助您及早捕获图像选择错误。它还可以帮助您解释升级是由合规性、生命周期协调还是安全建议驱动的。
如果启用FIPS模式,则平台安全控制必须限制基于URL的映像导入。在这种情况下,请使用支持的导入方法(例如Cisco.com)或本地文件上传,然后确认导入后映像元数据和校验和已正确填充。
![]() |
![]() |

如果在System > Settings > Device Settings > Image Distribution Servers下配置了远程分发服务器,则从案例开始将其包含在分析中。它可以影响传输方法、传输定时、暂存行为和图像分发期间实际故障点。

TAC检查的内容:
这一点为何重要:
当使用远程分发服务器时,映像路径不再是简单的控制器到设备传输。故障是由外部服务器、协议首选项、可访问性、映像暂存或服务器端可用性而非设备本身引起的。
推荐的TAC验证流程:
需要注意的常见TAC问题:
在进行深度故障排除之前,收集:
推荐的TAC收集顺序:
这一点为何重要:尽早收集此信息可减少升级过程中的来回传递,并帮助TAC确定问题是否与映像选择、任务协调、平台兼容性或设备状态相关。
在GUI中检查以下项目:
推荐的TAC验证订单:
这一点为何重要:这些检查可帮助TAC确定问题是由映像选择、分配、控制器任务处理、资产同步还是设备本身引起的。
仅运行适合平台和软件模式的命令。
这些与安装相关的命令在SWIM升级分析期间尤其有用。thhow tech installcommand提供安装过程的全面技术快照,通常用于捕获与安装相关的总体证据,以供审阅或上报。show platform software install-manager switch X R0 operation history detailcommand显示特定堆叠成员的安装 — 管理器操作的详细历史记录,并帮助确认哪些步骤已完成以及进程失败的位置。show platform software install-manager switch X R0 operation current detailcommand显示该交换机的实时安装状态,在升级显示为停滞或仍在运行时很有用。请求平台软件trace archivecommand收集平台软件跟踪数据以进行深入分析,而request platform software trace slot switch X archivecommand收集特定堆栈成员的相同跟踪数据。总之,这些命令可帮助团队了解安装过程中发生了什么事情,现在正在发生什么,以及必须收集哪些证据进行进一步分析。
show tech install
show platform software install-manager switch X R0 operation history detail(stack)
show platform software install-manager switch X R0 operation current detail(stack)
request platform software trace archive
request platform software trace slot switch X archive(stack)
show version
show inventory
show platform
show boot
show running-config | include boot system
show startup-config | include boot system
show file systems
dir flash:
dir bootflash:
使用这些命令确认当前版本、引导设置和可用存储。
show install summary
show install active
show install committed
show install log detail
show install request
这些命令可帮助您检查以前的安装是否仍在运行、未完成或未提交。
show logging
show logging | include INSTALL|install|BOOT|boot|ERROR|FAIL|ROMMON
show archive log config all
show reload
show tech-support
show switch
show switch detail
显示冗余
show platform software status control-processor brief
显示平台软件包状态
ping <网关或管理对等体>
show ip interface brief
show interfaces status
show processes cpu sorted | exclude 0.00
show processes memory sorted
show file systems
dir flash:
dir bootflash:
show logging | include SCP|SFTP|HTTP|TFTP|copy|transfer|flash
show processes cpu sorted | exclude 0.00
确认是否有足够的可用空间,检查管理路径是否稳定,只有在确认旧文件未使用时才删除旧文件。
GUI操作:打开失败的任务,确认设备仍受管理,确认映像仍存在于存储库中,检查远程分发服务器是否正在使用中,仅在存储、凭据和传输路径看起来正常之后重试。
show version
show boot
show running-config | include boot system
show startup-config | include boot system
show install summary
检查引导变量是否仍指向旧映像。如果需要,请更正引导路径,然后在重新加载之前保存配置。
配置terminalno boot systemboot system flash:<target-image.bin>endwrite memoryshow boot
GUI操作:查看任务时间表,检查设备在重新加载后是否恢复,如果GUI版本过时,则运行资产同步,并在重试前验证激活检查和清理设置。
show install summary
show install active
show install committed
show install log detail
show logging |包括安装|安装
检查包是否已激活但未提交。在了解当前状态之前,请不要开始另一次安装。
install commit(安装提交)
首先检查确认完好的映像是否仍可在本地使用,然后对该平台使用已批准的ROMMON恢复方法。
dir flash:
boot flash:<known-good-image.bin>
show version
show boot
configure terminal
no boot system
boot system flash:<known-good-image.bin>
结束
写存储器
show switch
show switch detail
show version
dir flash:
show install summary
show logging | include switch|version|install
确认所有成员都存在,验证所有成员上的映像可用性,仅在完整堆栈正常时重试。
show version
show inventory
show running-config | include boot system
如果设备版本正确,则可疑的陈旧资产或合规性数据,然后将其视为失败的升级。
GUI操作:刷新设备记录,重新运行合规性,确认金色映像映射是否仍然正确,并查看任务历史记录以确认预期的目标版本。
dir flash:
dir bootflash:
delete /force flash:<unused-image.bin>
delete /force /recursive flash:<unused-package-directory>
show boot
configure terminal
no boot system
boot system flash:<target-image.bin>
结束
写存储器
show boot
reload
show install summary
install commit(安装提交)
show install committed
show version
show boot
show install summary
show logging |尾部
show ip interface brief
13. TAC工作流
在主GUI和CLI检查后使用此工作流程。将其视为实时TAC案例的工作流程。
目标:确定问题是在Catalyst Center、传输路径中还是在设备上开始出现。
工作检查:查看任务详细信息、时间戳、库存状态和设备可达性。尽早将控制器端故障与传输故障和设备端故障分开。
决策:如果任务在映像到达设备之前失败,请始终关注资产、凭证、存储库状态和传输路径。如果映像复制成功,但激活失败,请移动到引导变量、安装状态和设备日志。
目标:制定干净的故障时间表。
捕获:记录准确的GUI错误文本、任务ID、故障时间戳和子任务详细信息(如果可用)。
为什么这很重要:数据需要将GUI事件与设备日志、SWIM日志和数据库记录相匹配。
目标:确定这是单设备问题还是更广泛的平台问题。
检查:确定问题是否影响整个环境中的一台设备、一个堆栈、一个站点、一个平台系列或许多设备。
决策:如果同一故障出现在多个设备上,则在将一台设备归罪之前,会出现可疑的映像质量、平台兼容性、存储库状态、凭证或控制器端任务处理。
目标:查找成功完成的最后一个阶段。
跟踪:指导工作流程完成映像导入、分配、分发、激活、重新加载和升级后同步。
这一点为何重要:这样可以避免重复已经有效的步骤,并帮助您专注于真正的故障点。
目标:确认转接阶段是否真的已完成。
检查:验证镜像是否存在于闪存中:或bootflash:,确认是否有足够的可用空间,确认文件是否完整,并确认映像是否与目标平台匹配。
决策:如果缺少映像,请继续进行传输故障排除。如果存在映像,请切换到激活、引导选择、软件包状态或升级后验证。
目标:将故障放置在时间线的正确位置。
分类:将问题划分为以下某个时间点:在重新加载之前、重新加载期间或重新加载之后。
决策:如果在重新加载之前发生故障,请重点介绍安装逻辑、启动设置和任务协调。如果在重新加载期间发生这种情况,请检查控制台输出、重新加载原因和引导行为。如果在重新加载后发生这种情况,请重点关注重新发现、合规性同步、堆栈运行状况和服务恢复。
目标:在再次运行任何操作之前,请确保设备处于稳定状态。
确认:确认了解软件模式、引导变量正确、存储运行正常、安装状态不完整、堆栈或HA状态正常,并且没有先前的安装操作仍处于活动状态。
退出条件:在所有这些检查均已清除或您有书面理由继续之前,请不要重试。
目标:降低风险,同时继续推进案例。
开头为:刷新资产、重新运行合规性、查看日志、更正引导变量或提交包(如果激活成功)。
指南:除非常规检查已显示任务已过期且设备在工作流中不再处于活动状态,否则不要跳转到数据库更新或强制清理。
目标:在下一次尝试之前设置一个明确的决策点。
仅在以下情况下重试:可以了解当前问题,设备运行正常,没有冲突的任务仍然打开,映像和分配正确,并且已保存并验证恢复更改。
决策:如果不满足这些条件,请停止重试路径,然后使用已收集的证据进行上报。
show version
show boot
show install summary
show install log detail
show logging
show switch
show redundancy
dir flash:
dir bootflash:
| 版本 | 发布日期 | 备注 |
|---|---|---|
1.0 |
17-Jun-2026
|
初始版本 |