簡介
本檔案介紹如何對路由器崩潰進行疑難排解。
必要條件
需求
本文件沒有特定需求。
採用元件
本文件所述內容不限於特定軟體和硬體版本。
本文中的資訊是根據特定實驗室環境內的裝置所建立。文中使用到的所有裝置皆從已清除(預設)的組態來啟動。如果您的網路運作中,請確保您瞭解任何指令可能造成的影響。
背景資訊
系統崩潰是指系統檢測到不可恢復的錯誤並且已重新啟動自己的情況。 導致崩潰的錯誤通常由處理器硬體檢測到,處理器硬體會自動分支到ROM監控器中的特殊錯誤處理代碼。ROM監控器可識別錯誤、列印消息、儲存有關故障的資訊並重新啟動系統。
獲取有關崩潰的資訊
當路由器崩潰時,在手動重新載入或重新啟動路由器之前,收集儘可能多的崩潰相關資訊非常重要。有關崩潰的所有資訊,但成功儲存在 crashinfo
手動重新載入或重新通電後檔案丟失。這些輸出提供有關崩潰的一些指示和資訊。
如果您有 show version
中, show stacks
中, show context
,或 show tech support
命令,您可以使用Cisco CLI Analyzer顯示潛在問題和修正程式。要使用Cisco CLI Analyzer,您必須登入並啟用JavaScript。
注意:只有註冊的思科使用者才能訪問內部思科工具和資訊。
指令 |
說明 |
顯示版本 |
此命令最初出現在Cisco IOS®軟體版本10.0中。其 show version EXEC 命令顯示系統硬體的配置、軟體版本、配置檔案和軟體映像的名稱和來源、路由器運行時間以及如何重新啟動系統的資訊。重要信息:如果路由器在崩潰後重新載入(例如,如果路由器已重新通電或已發出reload 命令),此資訊可能會丟失,因此請嘗試在重新載入之前收集它! |
show stacks |
此命令最初出現在Cisco IOS軟體版本10.0中。其 show stacks EXEC 命令用於監控進程和中斷常式的堆疊使用情況。其 show stacks 當路由器崩潰時,輸出是收集資訊的最不可或缺的來源之一。重要資訊:如果路由器在崩潰後重新載入(例如,通過重新通電或reload 命令),此資訊可能會丟失,因此請在重新載入之前嘗試收集它! |
顯示上下文 |
此命令最初出現在Cisco IOS軟體版本10.3中。其 show context EXEC 當發生異常時,命令用於顯示儲存在非易失性RAM(NVRAM)中的資訊。上下文資訊特定於處理器和體系結構,而軟體版本和正常運行時間資訊則不是。因此,不同路由器型別的環境資訊可能不同。顯示的輸出來自 show context 命令包括:
- 系統重新啟動的原因。
- 堆疊追蹤。
- 軟體版本.
- 訊號號、代碼和路由器正常運行時間資訊。
- 崩潰時的所有暫存器內容。
|
show tech-support |
此命令最初出現在Cisco IOS軟體版本11.2中。此命令可幫助您在報告問題時收集有關路由器的常規資訊。它包括:
show version
show running-config
show stacks
show interface
show controller
show process cpu
show process memory
show buffers
|
控制檯日誌 |
如果您在崩潰時連線到路由器的控制檯,則可以在崩潰期間看到類似的情況: *** System received a Software forced crash ***
signal= 0x17, code= 0x24, context= 0x619978a0
PC = 0x602e59dc, Cause = 0x4020, Status Reg = 0x34008002
DCL Masked Interrupt Register = 0x000000f7
DCL Interrupt Value Register = 0x00000010
MEMD Int 6 Status Register = 0x00000000
保留此資訊和之前的日誌。路由器再次啟動後,不要忘記獲取 show stacks 輸出。 |
系統日誌 |
如果路由器設定為將日誌傳送到系統日誌伺服器,您可以看到系統日誌伺服器崩潰之前發生的一些資訊。但是,當路由器崩潰時,它無法將最有用的資訊傳送到此syslog伺服器。所以大多數時候, syslog 輸出對於排除崩潰故障不是非常有用。 |
crashinfo |
crashinfo檔案是儲存在引導快閃記憶體或快閃記憶體中的與當前崩潰相關的有用資訊的集合。當路由器由於資料或堆疊損壞而崩潰時,需要更多的重新載入資訊來調試此型別的崩潰,而不僅僅是正常情況下的輸出 show stacks 指令。其 crashinfo 預設情況下寫入 bootflash:crashinfo 在Cisco 12000 Gigabit路由器處理器(GRP)、Cisco 7000和7500路由交換處理器(RSP)以及Cisco 7200系列路由器上。對於思科7500多功能介面處理器2(VIP2),該檔案預設儲存為 bootflash:vip2_slot_no_crashinfo slot_no 是VIP2插槽編號。對於Cisco 7000路由處理器(RP),該檔案預設儲存為 flash:crashinfo .有關更多詳細資訊,請參閱Retrieving Information from the Crashinfo File。 |
核心傾印 |
核心轉儲是路由器記憶體映像的完整副本。對大多數型別的崩潰進行故障排除時不需要此資訊,但是強烈建議在提交新錯誤時使用此資訊。您需要啟用某些調試功能,以便將更多資訊新增到核心轉儲中,例如debug sanity、scheduler heapcheck process和memory check-interval 1。有關詳細資訊,請參閱建立核心轉儲。 |
ROM監控 |
當路由器的配置暫存器設定以0結尾時,路由器在崩潰後可能會進入ROM監控器。如果處理器是68k,則提示符可以是「>」。您可以使用k 指令取得堆疊追蹤軌跡。如果處理器是縮減指令集計算(RISC),則提示符可以 rommon 1> .獲取 stack 50 或 show context . |
崩潰的型別
其 show version
和 show stacks
命令提供輸出,指示所發生的崩潰型別,例如匯流排錯誤或軟體強制崩潰。您還可以從獲取崩潰型別資訊 crashinfo
和 show context
指令。對於某些較新版本的Cisco IOS軟體,系統沒有清楚說明崩潰的原因(例如,您會看到Signal = x,其中x是一個數字)。請參閱多功能介面處理器崩潰原因代碼,將此數字轉換為有意義的代碼。例如,Signal = 23轉換為軟體強制崩潰。使用以下連結對路由器遇到的特定型別的崩潰進行故障排除:
請參閱處理器記憶體奇偶校驗錯誤(PMPE)以瞭解以下問題:
請檢視什麼原因導致路由器通過Abort或Trace Trap命令重新啟動這些問題:
有關這些問題的資訊,請參閱系統崩潰的不常見型別:
路由器模組崩潰
有時,只有特定路由器模組崩潰,而不是路由器本身。以下是一些說明如何對一些路由器模組上的崩潰進行疑難排解的檔案:
指示崩潰的輸出示例
Router#show version
Cisco Internetwork Operating System Software
Cisco IOS (tm) RSP Software (RSP-PV-M), Version 12.0(10.6)ST, EARLY DEPLOYMENT
MAINTENANCE INTERIM SOFTWARE
Copyright (c) 1986-2000 by cisco Systems, Inc.
Compiled Fri 23-Jun-00 16:02 by richv
Image text-base: 0x60010908, data-base: 0x60D96000
ROM: System Bootstrap, Version 12.0(19990806:174725), DEVELOPMENT SOFTWARE
BOOTFLASH: RSP Software (RSP-BOOT-M), Version 12.0(9)S, EARLY DEPLOYMENT
RELEASE SOFTWARE (fc1)
Router uptime is 20 hours, 56 minutes
System returned to ROM by error - a Software forced crash, PC 0x60287EE8
System image file is "slot0:rsp-pv-mz.120-10.6.ST"
cisco RSP8 (R7000) processor with 131072K/8216K bytes of memory.
R7000 CPU at 250Mhz, Implementation 39, Rev 1.0, 256KB L2, 2048KB L3 Cache
Last reset from power-on
G.703/E1 software, Version 1.0.
G.703/JT2 software, Version 1.0.
X.25 software, Version 3.0.0.
Chassis Interface.
1 EIP controller (6 Ethernet).
1 VIP2 R5K controller (1 FastEthernet)(2 HSSI).
6 Ethernet/IEEE 802.3 interface(s)
1 FastEthernet/IEEE 802.3 interface(s)
2 HSSI network interface(s)
2043K bytes of non-volatile configuration memory.
20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K).
16384K bytes of Flash internal SIMM (Sector size 256K).
No slave installed in slot 7.
Configuration register is 0x2102
Router#show stacks
Minimum process stacks:
Free/Size Name
5188/6000 CEF Reloader
9620/12000 Init
5296/6000 RADIUS INITCONFIG
5724/6000 MDFS Reload
2460/3000 RSP memory size check
8176/9000 DHCP Client
Interrupt level stacks:
Level Called Unused/Size Name
1 163 8504/9000 Network Interrupt
2 14641 8172/9000 Network Status Interrupt
3 0 9000/9000 OIR interrupt
4 0 9000/9000 PCMCIA Interrupt
5 5849 8600/9000 Console Uart
6 0 9000/9000 Error Interrupt
7 396230 8604/9000 NMI Interrupt Handler
System was restarted by error - a Software forced crash, PC 0x602DE884 at 05:07:31
UTC Thu Sep 16 1999
RSP Software (RSP-JSV-M), Version 12.0(7)T, RELEASE SOFTWARE (fc2)
Compiled Mon 06-Dec-99 19:40 by phanguye
Image text-base: 0x60010908, database: 0x61356000
Stack trace from system failure:
FP: 0x61F73C30, RA: 0x602DE884
FP: 0x61F73C30, RA: 0x6030D29C
FP: 0x61F73D88, RA: 0x6025E96C
FP: 0x61F73DD0, RA: 0x6026A954
FP: 0x61F73E30, RA: 0x602B94BC
FP: 0x61F73E48, RA: 0x602B94A8
bootflash中提供crashinfo時,此資訊將顯示在 show stacks
指令:
***************************************************
******* Information of Last System Crash **********
***************************************************
Using bootflash:crashinfo_20000323-061850. 2000
CMD: 'sh int fas' 03:23:41 UTC Thu Mar 2 2000
CMD: 'sh int fastEthernet 6/0/0' 03:23:44 UTC Thu Mar 2 2000
CMD: 'conf t' 03:23:56 UTC Thu Mar 2 2000
CMD: 'no ip cef di' 03:23:58 UTC Thu Mar 2 2000
CMD: 'no ip cef distributed ' 03:23:58 UTC Thu Mar 2 2000
...
Router#show context
System was restarted by error - a Software forced crash, PC 0x602DE884 at
05:07:31 UTC Thu Sep 16 1999
RSP Software (RSP-JSV-M), Version 12.0(7)T, RELEASE SOFTWARE (fc2)
Compiled Mon 06-DEC-99 19:40 by phanguye
Image text-base: 0x60010908, database: 0x61356000
Stack trace from system failure:
FP: 0x61F73C30, RA: 0x602DE884
FP: 0x61F73C30, RA: 0x6030D29C
FP: 0x61F73D88, RA: 0x6025E96C
FP: 0x61F73DD0, RA: 0x6026A954
FP: 0x61F73E30, RA: 0x602B94BC
FP: 0x61F73E48, RA: 0x602B94A8
Fault History Buffer:
RSP Software (RSP-JSV-M), Version 12.0(7)T, RELEASE SOFTWARE (fc2)
Compiled Mon 06-DEC-99 19:40 by phanguye
Signal = 23, Code = 0x24, Uptime 3w0d
$0 : 00000000, AT : 619A0000, v0 : 61990000, v1 : 00000032
a0 : 6026A114, a1 : 61A309A4, a2 : 00000000, a3 : 00000000
t0 : 61F6CD80, t1 : 8000FD88, t2 : 34008700, t3 : FFFF00FF
t4 : 00000083, t5 : 3E840024, t6 : 00000000, t7 : 00000000
s0 : 0000003C, s1 : 00000036, s2 : 00000000, s3 : 61F73C48
s4 : 00000000, s5 : 61993A10, s6 : 61982D00, s7 : 61820000
t8 : 0000327A, t9 : 00000000, k0 : 61E48C4C, k1 : 602E7748
gp : 6186F3A0, sp : 61F73C30, s8 : 00000000, ra : 6030D29C
EPC : 602DE884, SREG : 3400E703, Cause : 00000024
Error EPC : BFC00000, BadVaddr : 40231FFE
開啟TAC服務請求時要收集的資訊
完成故障排除步驟後,如果您仍需要幫助,並且希望通過Cisco TAC開啟服務請求,請確保提供以下資訊,用於排除路由器崩潰故障:
- 在開啟服務請求之前執行的故障排除。
show technical-support
輸出(如果可能,在啟用模式下)。
show log
輸出或控制檯捕獲(如果可用)。
- crashinfo文件(如果存在,且尚未包含在
show technical-support
輸出)。
- show region輸出(如果尚未包含在
show technical-support
輸出)。
將收集的資料以非壓縮的純文字檔案格式(.txt)附加到您的服務請求。如果您無法訪問Service Request工具,則可以將相關資訊附加到您的服務請求中,方法是將您的服務請求傳送到attach@cisco.com,並將您的案例編號填寫在郵件主題行。
注意:收集資訊之前,除非需要排除路由器崩潰故障,否則請勿手動重新載入或重新啟動路由器。這可能導致丟失確定問題根本原因所需的重要資訊。
相關資訊