路由器 : Cisco ASR 1000 系列汇聚服务路由器

排除Cisco ASR 1000 Series Aggregation Services Routers失败故障

2015 年 8 月 28 日 - 机器翻译
其他版本: PDFpdf | 英语 (2014 年 9 月 16 日) | 反馈


目录


简介

本文提供信息关于怎样排除故障在Cisco ASR 1000系列聚合服务路由器的失败。

先决条件

要求

本文档没有任何特定的要求。

使用的组件

本文档中的信息基于以下软件和硬件版本:

  • 所有Cisco ASR 1000系列汇聚服务路由器,包括1002, 1004和1006。

  • 支持Cisco ASR 1000系列汇聚服务路由器的所有Cisco IOS XE软件版本。

本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。

规则

有关文档规则的详细信息,请参阅 Cisco 技术提示规则

Cisco ASR 1000系列汇聚服务路由器故障

崩溃类型

Cisco ASR 1000系列汇聚服务路由器介绍Cisco IOS XE软件作为他们的软件体系结构。凭Cisco IOS软件, Cisco IOS XE软件是在路由处理器(RP)、嵌入式服务处理器(ESP),或者SPA接口处理器(SIP)的Linux内核建立的一个模块化操作系统。IOS守护程序(IOSD)和在Linux内核运行的其他IOS XE进程,那么那里是在Cisco ASR 1000系列汇聚服务路由器的显示的几种故障类型1

表1 –故障类型

崩溃类型 模块 说明
IOSD失败 RP Cisco IOS软件运行作为在Linux内核的IOSD在RP。
SPA驱动程序失败 SIP 控制在SIP的SPA的有限的Cisco IOS软件运行。
Cisco IOS XE进程失败 RP ESP SIP 在Linux内核运行的几Cisco IOS XE进程。例如,机箱管理器,转发管理器,接口管理器,等等在RP运作。
思科Quantum流处理器(QFP)微码失败 ESP 在QFP的微码运行。QFP是在ESP的信息包转发ASIC。
Linux内核失败 RP ESP SIP Linux内核在RP、ESP和SIP运行。

获得关于失败的信息

如果遇到模块意外的重新载入,您必须确保,控制台输出、crashinfo文件目录和core dump文件目录为排除故障是可用的。为了确定原因,第一步是尽可能多的获取该问题的大量信息。此信息是必要的以确定问题的原因:

  • 控制台日志 - 有关详细信息,请参阅为控制台连接应用正确的终端仿真器设置

  • 系统日志信息—如果设置路由器至发送日志为系统日志服务器,您能得到关于发生什么的信息。有关详细信息,请参阅如何针对 Syslog 配置 Cisco 设备

  • 显示平台show platform命令显示RP、ESP、温泉和电源的状态。

  • show tech-supportshow tech-support命令是包括show versionshow running-config许多不同的命令的编译。当路由器遇到问题时, Cisco技术支持中心(TAC)工程师通常请求此信息排除故障硬件问题。您必须收集show tech-support,在您执行重新加载或关机并重新开机前,因为这些操作能导致信息丧失关于问题的。

    注意: show tech-support命令不包括显示平台show logging命令。

  • 启动顺序信息—完整启动顺序,如果路由器经历启动错误。

  • Crashinfo文件(若有) —请参阅Crashinfo文件文件部分。

  • Core dump文件(若有) —请参阅Core dump文件部分

  • Tracelog文件(若有) —在Cisco ASR 1000系列汇聚服务路由器, Cisco IOS XE进程trace日志生成在光盘下:tracelogs (ASR 1006或ASR 1004)或Bootflash :tracelogs (ASR 1002)在激活RP。当Cisco IOS XE处理失败时, Cisco TAC工程师通常要求收集此信息为了排除故障问题。

Crashinfo文件

当IOSD或SPA驱动程序失败时, crashinfo文件生成在显示的位置下2。

表2 – Crashinfo文件位置

型号 崩溃类型 Crashinfo文件位置
ASR 1002 IOSD失败SPA驱动程序失败 Bootflash :在RP
ASR 1004 ASR 1006 IOSD失败 Bootflash :在RP
SPA驱动程序失败 光盘:在RP

表3显示crashinfo文件名称。

表3 – Crash信息文件名

崩溃类型 Crash信息文件名 示例
IOSD失败 crashinfo_RP_SlotNumber_00_Date-Time-Zone crashinfo_RP_00_00_20080807-063430-UTC
SPA驱动程序失败 crashinfo_SIP_SlotNumber_00_Date-Time-Zone crashinfo_SIP_00_00_20080828-084907-UTC

Core dump文件

当进程失败时,您能找到core dump文件在显示的位置下4。core dump是进程的存储图像的全双工复制。推荐您保存core dump文件,直到排除故障完成。这是因为core dump比crashinfo文件包括关于失败问题的更多信息,并且为深刻的调查是需要的。一旦Cisco ASR 1002路由器,因为没有一个光盘:设备, core dump文件生成在Bootflash下:核心

表4 – Core dump文件位置

型号 Core dump文件位置
ASR 1002 Bootflash :在RP的核心
ASR 1004 ASR 1006 光盘:在RP的核心

不仅RP core dump,但是ESP或SIP进程core dump生成在同一个位置下。一旦Cisco ASR 1006路由器,您必须检查待机RP的同一个位置,因为它是激活RP,当问题发生了。

表5 – Core dump文件名

崩溃类型 Core dump文件名 示例
IOSD失败 主机名_RP_SlotNumber_ppc_linux_iosd-_ProcessID.core.gz Router_RP_0_ppc_linux_iosd-_17407.core.gz
SPA驱动程序失败 主机名_SIP_SlotNumber_mcpcc-lc-ms_ProcessID.core.gz Router_SIP_1_mcpcc-lc-ms_6098.core.gz
IOS XE进程失败 hostname_FRU_SlotNumber_ProcessName_ProcessID.core.gz Router_RP_0_fman_rp_28778.core.gz Router_ESP_1_cpp_cp_svr_4497.core.gz
思科QFP失败 主机名_ESP_SlotNumber_cpp-mcplo-ucode_ID.core.gz Router_ESP_0_cpp-mcplo-ucode_042308082102.core.gz
Linux内核失败 hostname_FRU_SlotNumber_kernel.core Router_ESP_0_kernel.core

IOSD失败

IOS守护程序(IOSD)运行作为其自己的Linux进程(ppc_linux_iosd-)在RP。在双重IOS模式(仅Cisco ASR 1002路由器和Cisco ASR 1004路由器),两在RP运行的IOSDs。

为了识别IOSD失败,请查找下面例外输出在控制台。一旦没有双重IOS模式的Cisco ASR 1002路由器或Cisco ASR 1004路由器失败,方框重新加载。一旦Cisco ASR 1002路由器或Cisco ASR 1004路由器失败同双重IOS模式, IOSD在RP交换。一旦Cisco ASR 1006路由器失败, RP交换,并且新的待机RP重新加载。

Exception to IOS Thread:
Frame pointer 2C111978, PC = 1029ED60

ASR1000-EXT-SIGNAL: U_SIGSEGV(11), Process = Exec
-Traceback= 1#106b90f504fce8544ce4979667ec2d5d  
   :10000000+29ED60 :10000000+29ECB4 :10000000+2A1A9C 
:10000000+2A1DAC :10000000+492438 :10000000+1C22DC0 
   :10000000+4BBBE0 

Fastpath Thread backtrace: 
-Traceback= 1#106b90f504fce8544ce4979667ec2d5d  
   c:BC16000+C2AF0 c:BC16000+C2AD0 
iosd_unix:BD73000+111DC pthread:BA1B000+5DA0 

Auxiliary Thread backtrace: 
-Traceback= 1#106b90f504fce8544ce4979667ec2d5d  
   pthread:BA1B000+95E4 pthread:BA1B000+95C8 
c:BC16000+D7294 iosd_unix:BD73000+1A83C 
   pthread:BA1B000+5DA0 

PC  = 0x1029ED60  LR  = 0x1029ECB4  MSR = 0x0002D000
CTR = 0x0BD83C2C  XER = 0x20000000
R0  = 0x00000000  R1  = 0x2C111978  R2  = 0x2C057890  R3  = 0x00000034
R4  = 0x000000B4  R5  = 0x0000003C  R6  = 0x2C111700  R7  = 0x00000000
R8  = 0x12B04780  R9  = 0x00000000  R10 = 0x2C05048C  R11 = 0x00000050
R12 = 0x22442082  R13 = 0x13B189AC  R14 = 0x00000000  R15 = 0x00000000
R16 = 0x00000000  R17 = 0x00000001  R18 = 0x00000000  R19 = 0x00000000
R20 = 0x00000000  R21 = 0x00000000  R22 = 0x00000000  R23 = 0x00000001
R24 = 0x00000001  R25 = 0x34409AD4  R26 = 0x00000000  R27 = 0x2CE88448
R28 = 0x00000001  R29 = 0x00000000  R30 = 0x3467A0FC  R31 = 0x2C1119B8

Writing crashinfo to bootflash:crashinfo_RP_00_00_20080904-092940-UTC
Buffered messages: (last 4096 bytes only)
...

当IOSD失败时, crashinfo文件和core dump文件在RP生成。

Router#dir bootflash:
Directory of bootflash:

bootflash:crashinfo_RP_00_00_20080904-092940-UTC


Router#dir harddisk:core
Directory of harddisk:core/

3620877  -rw-    10632280   Sep 4 2008 09:31:00 +00:00  
   Router_RP_0_ppc_linux_iosd-_17407.core.gz

SPA驱动程序失败

SPA驱动程序限制了SPA控制和运行的IOS功能在SIP由于mcpcc LC MS进程和其中一Cisco IOS XE进程。您能识别SPA驱动程序失败,如果发现进程mcpcc LC MS持续。在SPA驱动程序失败后, SPA重新加载。

Aug 28 08:52:12.418: %PMAN-3-PROCHOLDDOWN: SIP0: 
   pman.sh:  The process mcpcc-lc-ms has been helddown (rc 142)
Aug 28 08:52:12.425: %ASR1000_OIR-6-REMSPA: 
   SPA removed from subslot 0/0, interfaces disabled
Aug 28 08:52:12.427: %SPA_OIR-6-OFFLINECARD: 
   SPA (SPA-1X10GE-L-V2) offline in subslot 0/0
Aug 28 08:52:13.131: %ASR1000_OIR-6-INSSPA: 
   SPA inserted in subslot 0/0
Aug 28 08:52:19.060: %LINK-3-UPDOWN: SIP0/0: 
   Interface EOBC0/1, changed state to up
Aug 28 08:52:20.064: %SPA_OIR-6-ONLINECARD: 
   SPA (SPA-1X10GE-L-V2) online in subslot 0/0

当SPA驱动程序失败时, crashinfo文件和core dump文件在RP生成。

Router#dir harddisk:
Directory of harddisk:/

   14  -rw-      224579  Aug 28 2008 08:52:06 +00:00  
   crashinfo_SIP_00_00_20080828-085206-UTC

Router#dir harddisk:core
Directory of harddisk:/core/

4653060  -rw-     1389762  Aug 28 2008 08:52:12 +00:00  
   Router_SIP_0_mcpcc-lc-ms_6985.core.gz

Cisco IOS XE进程失败

Cisco IOS XE进程在RP、ESP和SIP的Linux内核运行。表6列出他们的主要进程。如果失败出现,模块重新加载。

表6 –主要Cisco IOS XE进程

标题 进程名 模块
机箱管理器 cmand RP
cman_fp ESP
cmcc SIP
环境监控 emd RP, ESP, SIP
转发管理器 fman_rp RP
fman_fp_image ESP
主机管理器 hman RP, ESP, SIP
接口管理器 imand RP
imccd SIP
记录的管理器 plogd RP, ESP, SIP
可插入的服务 psd RP
QFP客户端控制进程 cpp_cr_svr ESP
QFP驱动程序进程 cpp_driver ESP
QFP HA服务器 cpp_ha_top_level_server ESP
QFP客户端服务进程 cpp_sp_server ESP
Shell管理器 smand RP

万一cpp_cp_svr进程在Cisco ASR 1006路由器的ESP失败,此消息能出现在控制台。

Jan 24 23:37:06.644 JST: %PMAN-3-PROCHOLDDOWN: 
   F0: pman.sh:  The process cpp_cp_svr has been helddown (rc 134)
Jan 24 23:37:06.727 JST: %PMAN-0-PROCFAILCRIT: F0: pvp.sh:  
   A critical processcpp_cp_svr has failed (rc 134)
Jan 24 23:37:11.539 JST: %ASR1000_OIR-6-OFFLINECARD: 
   Card (fp) offline in slot F0

您能找到在光盘的core dump文件:核心。

Router#dir harddisk:core
Directory of harddisk:/core/

1032194  -rw-    38255956  Jan 24 2009 23:37:06 +09:00  
   Router_ESP_0_cpp_cp_svr_4714.core.gz

进程的tracelog能包括有用的输出。

Router#dir harddisk:tracelogs/cpp_cp*
Directory of harddisk:tracelogs/

4456753  -rwx       24868  Jan 24 2009 23:37:15 +09:00  
   cpp_cp_F0-0.log.4714.20090124233714

思科Quantum流处理器微码失败

思科设计思科Quantum流处理器作为两硬件和软件体系结构。第一代在硅两个片段驻留;最新生成可以是遵守描述的同一软件体系结构此处的单片解决方案。期限“思科QuantumFlow处理器”单独是指网络处理器的整体硬件和软件体系结构。

当QFP ucode失败, ESP重新加载。为了识别QFP ucode失败,请查找在控制台或CPP mcplo ucode core dump文件的此输出:

Dec 17 05:50:26.417 JST: %IOSXE-3-PLATFORM: F0: 
   cpp_cdm: CPP crashed, core file /tmp/corelink/
   Router_ESP_0_cpp-mcplo-ucode_121708055026.core.gz
Dec 17 05:50:28.206 JST: %ASR1000_OIR-6-OFFLINECARD: 
   Card (fp) offline in slot F0

您能找到core dump文件。

Router#dir harddisk:core
Directory of harddisk:core/

3719171  -rw-     1572864  Dec 17 2008 05:50:31 +09:00 
   Router_ESP_0_cpp-mcplo-ucode_121708055026.core.gz

Linux内核失败

在1000系列的Cisco ASR, Linux内核在RP、ESP和SIP运行。当Linux内核失败,没有失败输出的模块重新加载。在它再后启动,您能识别Linux内核失败,如果查找Linux内核的core dump文件。大小内核内核文件比100MByte可以是更多。

Router#dir harddisk:core
Directory of harddisk:/core/

393230  ----   137389415  Dec 19 2008 01:19:40 +09:00  
   Router_RP_0_kernel_20081218161940.core

建立 TAC 服务请求时应收集的信息

如果还需要援助,在您遵从上面步骤并且要打开与Cisco TAC后的一服务请求,请务必包括此信息排除故障路由器崩溃:
  • 在您打开服务请求前,故障排除实行了
  • 输出的显示平台(若可能,在特权模式)
  • 若有show logging输出或控制台获取,
  • 输出的show tech-support (若可能,在特权模式)
  • crashinfo文件(若有)
  • core dump文件(若有)
请将收集到的数据以未压缩的纯文本格式 (.txt) 附加到服务请求中。您能附上信息到您的服务请求是否用TAC Service Request Tool (仅限注册用户)上传它。如果不能访问服务请求工具,您能附上相关信息到您的服务请求是否在您的消息标题栏发送它对attach@cisco.com同您的案例编号。

注意: 请勿手工重新加载也请勿重新启动路由器,在您收集此信息前,除非要求排除故障路由器崩溃,因为这能造成是需要的确定问题的根本原因的重要信息丢失。

相关的思科支持社区讨论

思科支持社区是您提问、解答问题、分享建议以及与工作伙伴协作的论坛。


相关信息


Document ID: 109723