通用网关和接入服务器 : 思科 90 系列客户端设备

路由器崩溃故障排除

2015 年 8 月 28 日 - 机器翻译
其他版本: PDFpdf | 英语 (2015 年 4 月 22 日) | 反馈


交互:本文档对您的 Cisco 设备进行自定义分析。


目录


简介

当我们提到“系统崩溃”时,是指系统已经检测到不可恢复的错误并且已经自动重启的情况。

引起崩溃的错误通常是由处理器硬件检测的,处理器硬件在 ROM 监视器中自动派生出特殊的错误处理代码。ROM 监视器可以识别错误,打印消息,保存故障信息并重新启动系统。

先决条件

要求

本文档没有任何特定的要求。

使用的组件

本文档不限于特定的软件和硬件版本。

本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。

规则

有关文档规则的详细信息,请参阅 Cisco 技术提示规则

获得崩溃信息

如果路由器崩溃,则在手动重新载入路由器或为其重新通电之前,尽可能多地收集有关崩溃的信息极为重要。人工重载或重新加电启动之后,除 crashinfo 文件中成功保存的信息外,有关崩溃的所有其他信息都将丢失。下面的输出内容显示了有关崩溃的一些信息。

如果已从 Cisco 设备获得 show versionshow stacksshow contextshow tech support 命令的输出,则可以使用 显示潜在问题和解决方法。 要使用输出结果,您必须是注册用户,并且必须进行登录,还要激活JavaScript。

命令 说明
show version 此命令在思科IOS�软件Release10.0首先出现。show version EXEC 命令可显示系统硬件的配置、软件版本、配置文件和软件镜像的名称和来源、路由器正常运行时间以及有关如何重新启动系统的信息。重要信息:如果路由器在崩溃后重新加载(例如,如果已经重新通电或已发出 reload 命令),则此信息将丢失,因此请设法在重新加载前收集此信息!
show stacks 此命令最早出现于 Cisco IOS 软件版本 10.0。show stacks EXEC 命令可用于监视进程和中断例程的堆栈使用情况。在路由器崩溃的情况下,show stacks命令输出是信息的最重要来源之一。重要信息:如果路由器在崩溃后重新加载(例如,通过重新通电或发出 reload 命令),则此信息将丢失,因此请设法在重新加载前收集此信息!
show context 此命令最早出现于 Cisco IOS 软件版本 10.3。show context EXEC 命令可用于在意外情况发生时显示储存于非易失性 RAM (NVRAM) 中的信息。上下文信息是处理器和基础结构所特定的,而软件版本和运行时间信息则不是。因此,不同路由器类型的上下文信息可能会有所不同。show context 命令的显示输出包括:
  • 系统重启原因。
  • 堆栈跟踪。
  • 软件版本。
  • 信号编号、代码和路由器正常运行时间信息。
  • 崩溃时的所有注册内容。
show tech-support 此命令最早出现于 Cisco IOS 软件版本 11.2。报告问题时,此命令对收集有关路由器的一般信息非常有用。此命令包括:
  • show version
  • show running-config
  • show stacks
  • show interface
  • show controller
  • show process cpu
  • show process memory
  • show buffers
console log 如果在崩溃时连接到路由器控制台,则将在崩溃期间看到类似以下信息的显示内容:
*** System received a Software forced crash *** 
signal= 0x17, code= 0x24, context= 0x619978a0 
PC = 0x602e59dc, Cause = 0x4020, Status Reg = 0x34008002 
DCL Masked Interrupt Register = 0x000000f7 
DCL Interrupt Value Register = 0x00000010 
MEMD Int 6 Status Register = 0x00000000 
保存此信息以及此前的日志。路由器恢复运行时,一定要获得 show stacks 输出。
Syslog 若路由器设置为向syslog服务器发送日志,则可在syslog服务器上显示崩溃前所发生的事件。但是,路由器崩溃时,可能不会将最有用的信息发送到此 syslog 服务器。因此,大多数情况下,syslog 输出对于排除崩溃故障不是很有用。
Crash信息 crashinfo 文件包含有关当前崩溃的有用信息,这些信息保存在 bootflash 或 flash 存储器中。因数据或堆栈损坏使路由器发生故障时,调试此类型故障与来自正常 show stacks 命令的输出相比,需要更多的重载信息。默认情况下,crashinfo 将写入 bootflash:crashinfo,其位于 Cisco 12000 千兆路由器处理器 (GRP)、Cisco 7000 和 7500 路由交换处理器 (RSP) 以及 Cisco 7200 系列路由器上。对于Cisco 7500通用接口处理器2 (VIP2)默认情况下,此文件存储对Bootflash :vip2_slot_no_crashinfo slot_no是VIP2插槽编号的地方。对于 Cisco 7000 路由处理器 (RP),默认情况下,该文件保存到 flash: Crash信息。有关详细信息,请参阅从 Crashinfo 文件检索信息
core dump core dump 是路由器内存镜像的完全拷贝。此信息对于排除大多数崩溃类型故障不是必需的,但在记录新故障时,最好使用此信息。您可能需要启用一些调试添加更多信息到core dump例如调试充分,调度程序堆检查进程,并且内存检查间隔1.欲了解更详细的信息,参见创建Core dump
rom monitor 当路由器的配置寄存器设置以 0 结尾时,在崩溃后,路由器可能以 ROM monitor 结束。如果处理器是 68k,则提示符将是“>”。可通过 k 命令获取堆栈跟踪。若处理器为精简指令集计算 (RISC),则提示符将为“rommon 1>”。获取 stack 50show context 的输出。

崩溃类型

show versionshow stacks 命令为您提供能指示所发生崩溃类型(如总线错误或软件强制崩溃)的输出。您还可根据 crashinfoshow context 命令获取崩溃类型信息。对于某些较新的 Cisco IOS 软件版本,没有明确指示崩溃原因(例如,您将看到“Signal = x”,其中 x 是一个数字)。请参阅通用接口处理器崩溃原因代码,将此编号转换成有意义的东西。例如,“Signal = 23”转换后为软件强制崩溃。查看以下链接,对路由器上所发生特定类型的崩溃进行故障排除:

路由器模块崩溃

有时只是特定的路由器模块崩溃,而不是路由器本身崩溃。以下的一些介绍如何对某些路由器模块崩溃进行故障排除的文档:

指示崩溃的输出示例

Router#show version 
Cisco Internetwork Operating System Software 
IOS (tm) RSP Software (RSP-PV-M), Version 12.0(10.6)ST, EARLY DEPLOYMENT
MAINTENANCE INTERIM SOFTWARE 
Copyright (c) 1986-2000 by cisco Systems, Inc. 
Compiled Fri 23-Jun-00 16:02 by richv 
Image text-base: 0x60010908, data-base: 0x60D96000 

ROM: System Bootstrap, Version 12.0(19990806:174725), DEVELOPMENT SOFTWARE 
BOOTFLASH: RSP Software (RSP-BOOT-M), Version 12.0(9)S, EARLY DEPLOYMENT 
RELEASE SOFTWARE (fc1) 

Router uptime is 20 hours, 56 minutes 
System returned to ROM by error - a Software forced crash, PC 0x60287EE8 
System image file is "slot0:rsp-pv-mz.120-10.6.ST" 

cisco RSP8 (R7000) processor with 131072K/8216K bytes of memory. 
R7000 CPU at 250Mhz, Implementation 39, Rev 1.0, 256KB L2, 2048KB L3 Cache 
Last reset from power-on 
G.703/E1 software, Version 1.0. 
G.703/JT2 software, Version 1.0. 
X.25 software, Version 3.0.0. 
Chassis Interface. 
1 EIP controller (6 Ethernet). 
1 VIP2 R5K controller (1 FastEthernet)(2 HSSI). 
6 Ethernet/IEEE 802.3 interface(s) 
1 FastEthernet/IEEE 802.3 interface(s) 
2 HSSI network interface(s) 
2043K bytes of non-volatile configuration memory. 
20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K). 
16384K bytes of Flash internal SIMM (Sector size 256K). 
No slave installed in slot 7. 
Configuration register is 0x2102 

Router#show stacks 
Minimum process stacks: 
Free/Size   Name 
5188/6000   CEF Reloader 
9620/12000  Init 
5296/6000   RADIUS INITCONFIG 
5724/6000   MDFS Reload 
2460/3000   RSP memory size check 
8176/9000   DHCP Client 

Interrupt level stacks: 
Level    Called Unused/Size  Name 
  1         163   8504/9000  Network Interrupt 
  2       14641   8172/9000  Network Status Interrupt 
  3           0   9000/9000  OIR interrupt 
  4           0   9000/9000  PCMCIA Interrupt 
  5        5849   8600/9000  Console Uart 
  6           0   9000/9000  Error Interrupt 
  7      396230   8604/9000  NMI Interrupt Handler 

System was restarted by error - a Software forced crash, PC 0x602DE884 at 05:07:31 
UTC Thu Sep 16 1999 
RSP Software (RSP-JSV-M), Version 12.0(7)T,  RELEASE SOFTWARE (fc2) 
Compiled Mon 06-Dec-99 19:40 by phanguye 
Image text-base: 0x60010908, database: 0x61356000 
Stack trace from system failure: 
FP: 0x61F73C30, RA: 0x602DE884 
FP: 0x61F73C30, RA: 0x6030D29C 
FP: 0x61F73D88, RA: 0x6025E96C 
FP: 0x61F73DD0, RA: 0x6026A954 
FP: 0x61F73E30, RA: 0x602B94BC 
FP: 0x61F73E48, RA: 0x602B94A8

当 bootflash 中有 crashinfo 时,show stacks 命令的结尾会显示以下内容:

     
*************************************************** 
******* Information of Last System Crash ********** 
*************************************************** 
    
Using bootflash:crashinfo_20000323-061850. 2000 
CMD: 'sh int fas' 03:23:41 UTC Thu Mar 2 2000 
CMD: 'sh int fastEthernet 6/0/0' 03:23:44 UTC Thu Mar 2 2000 
CMD: 'conf t' 03:23:56 UTC Thu Mar 2 2000 
CMD: 'no ip cef di' 03:23:58 UTC Thu Mar 2 2000 
CMD: 'no ip cef distributed ' 03:23:58 UTC Thu Mar 2 2000 
... 
       
Router#show context 

System was restarted by error - a Software forced crash, PC 0x602DE884 at 
05:07:31 UTC Thu Sep 16 1999 
RSP Software (RSP-JSV-M), Version 12.0(7)T,  RELEASE SOFTWARE (fc2) 
Compiled Mon 06-DEC-99 19:40 by phanguye 
Image text-base: 0x60010908, database: 0x61356000 
       
Stack trace from system failure: 
FP: 0x61F73C30, RA: 0x602DE884 
FP: 0x61F73C30, RA: 0x6030D29C 
FP: 0x61F73D88, RA: 0x6025E96C 
FP: 0x61F73DD0, RA: 0x6026A954 
FP: 0x61F73E30, RA: 0x602B94BC 
FP: 0x61F73E48, RA: 0x602B94A8 

Fault History Buffer: 
RSP Software (RSP-JSV-M), Version 12.0(7)T,  RELEASE SOFTWARE (fc2) 
Compiled Mon 06-DEC-99 19:40 by phanguye 
Signal = 23, Code = 0x24, Uptime 3w0d 
$0 : 00000000, AT : 619A0000, v0 : 61990000, v1 : 00000032 
a0 : 6026A114, a1 : 61A309A4, a2 : 00000000, a3 : 00000000 
t0 : 61F6CD80, t1 : 8000FD88, t2 : 34008700, t3 : FFFF00FF 
t4 : 00000083, t5 : 3E840024, t6 : 00000000, t7 : 00000000 
s0 : 0000003C, s1 : 00000036, s2 : 00000000, s3 : 61F73C48 
s4 : 00000000, s5 : 61993A10, s6 : 61982D00, s7 : 61820000 
t8 : 0000327A, t9 : 00000000, k0 : 61E48C4C, k1 : 602E7748 
gp : 6186F3A0, sp : 61F73C30, s8 : 00000000, ra : 6030D29C 
EPC : 602DE884, SREG : 3400E703, Cause : 00000024 
Error EPC : BFC00000, BadVaddr : 40231FFE 

建立 TAC 服务请求时应收集的信息

如果在完成上述故障排除步骤后仍需要帮助,并且希望通过 Cisco TAC 打开服务请求,则确保包括排除路由器崩溃故障所需的以下信息:
  • 在建立服务请求之前执行的故障排除。
  • show technical-support 输出(如可能,在启动模式下)。
  • show log 输出或控制台捕获信息(如果可用)。
  • crashinfo 文件(如果出现,并且尚未包括在 show technical-support 输出中)。
  • show region 输出(如果尚未包括在 show technical-support 输出中)。
请将收集到的数据以未压缩的纯文本格式 (.txt) 附加到服务请求中。您可以使用 TAC 服务请求工具仅限注册用户)来加载信息,将信息附加到服务请求中。如果无法访问该服务请求工具,请将服务请求相关信息以电子邮件附件形式发送到 attach@cisco.com,并在消息标题栏中注明案例编号。

注意: 收集上述信息之前,请勿手动重新加载路由器或为其重新通电,除非排除路由器崩溃故障要求,因为这可能会导致确定问题根源所需的重要信息丢失。

相关的思科支持社区讨论

思科支持社区是您提问、解答问题、分享建议以及与工作伙伴协作的论坛。


相关信息


Document ID: 7900