目录

简介

更换实际正常运行的硬件时,通常会浪费宝贵的时间和资源。本文档帮助排除Cisco 7300系列路由器的潜在硬件问题,并提供指针以识别硬件故障。

注:本文档不涉及任何与软件相关的故障,但通常被误认为硬件故障的故障除外。

先决条件

要求

本文档的读者应掌握以下这些主题的相关知识:

使用的组件

本文档中的信息基于以下软件和硬件版本:

本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。

规则

有关文件规则的更多信息请参见“ Cisco技术提示规则”。

硬件软件兼容性与内存要求

无论何时安装新的线卡、模块或Cisco IOS软件映像,都必须确保路由器有足够的内存。您还必须检查硬件和软件是否与您希望使用的功能兼容。

完成以下步骤以检查硬件软件兼容性和内存要求:

  1. 请使用软件顾问(仅限注册用户)工具为您的网络设备选择软件。

    提示:硬件软件支持(限注册客户)”部分可帮助您验证所选的Cisco IOS软件版本是否支持路由器上安装的模块和卡。

  2. 使用下载软件地区(注册用户)检查Cisco IOS软件需要的最小内存(RAM和闪存)数量,并且/或者下载Cisco IOS软件镜像。要确定路由器上安装的内存(RAM和闪存)大小,请参阅如何选择Cisco IOS软件版本 — 内存要求

    技巧:

    • 如果希望保留与当前版本相同的功能,但不知道您拥有哪个功能集,请在路由器上发出show version命令。将输出粘贴到“输出解释程序”(仅注册客户)工具中以查找。始终检查功能支持。如果您计划使用最新的软件功能,这一点尤为重要。

    • 如果需要将Cisco IOS软件镜像升级到新版本或功能集,请参见"如何选择Cisco IOS软件版本",以获得更多信息。

  3. 如果您确定需要升级 Cisco IOS 软件,请遵循 Cisco 7300 系列路由器的软件安装和升级过程。

    提示:有关如何恢复滞留在ROMmon(rommon # > prompt)中的Cisco 7300系列路由器的信息,请参阅Cisco 7300的ROMmon恢复过程

识别问题

为了确定原因,第一步是尽可能多的获取该问题的大量信息。此信息是必要的以确定问题的原因:

如果从Cisco设备得show命令的输出(例如show technical-support),则可以使用 来显示潜在的故障和修复方法。为了使用 ,您必须是注册客户、登录并启用JavaScript。

启动问题

要排除此类故障,必须从路由器的控制台捕获信息。将控制台输出记录到文件中以供以后分析,或者,如果要打开TAC服务请求,请记录到思科技术支持中心(TAC)。

如果您不熟悉Cisco路由器的启动过程,请参阅图12:“Rebooting Documentation(重启文档)”中的“Booting Process(引导过程)”。

如果遇到引导问题,请检查表1中的症状和建议的操作

表1 — 引导问题的症状和建议操作

症状 建议操作
打开路由器电源后,未打开发光二极管(LED)。 确保路由器已牢固地插入有效的电源。打开路由器电源后,验证电源上的LED指示灯是否发生变化,如电源概述中所述。网络服务引擎(NSE)的通电顺序LED为:
  • 通电时,NSE LED上的硬件指示灯为橙色。
  • 当路由器进入ROMmon时,所有LED都会关闭。
  • 当路由器在Cisco IOS软件上成功启动时,LED变为绿色。
电源上的故障LED为红色。 检查开/备用交换机。如果问题仍然存在,请重新安放并更换电源,如卸下和更换电源中所述
电源上的输入正常LED熄灭。 验证线路输入电压是否可用且是否在适当范围内:
  • 交流电压> 90 Vrms(均方根电压)
  • DC > 38 VDC,极性正常
如果输入电压正常,请更换电源。如果输入电压不正常,则问题出在电源。
打开路由器电源后,适当的网络服务引擎(NSE)和电源LED亮起,但控制台不响应。 检查您的终端设置
路由器每次都在设置模式下启动和启动,但配置存储在非易失性RAM(NVRAM)中。 验证配置寄存器是否设置正确
路由器启动并停滞在ROMmon模式(rommon #>提示符)下。 设置配置寄存器对0x2102并且重新载入路由器。
rommon 1 > confreg 0x2102  
rommon 2 > reset  
如果7300路由器仍处于ROMmon模式,请参阅ROMmon恢复过程
路由器启动,但陷入启动模式(路由器(引导)>提示符)。 如果路由器停滞在引导模式下,则可能是Cisco IOS软件映像不存在或损坏。要解决此问题,您可能需要升级Cisco IOS软件映像。

路由器重新启动/重新加载

软件和硬件都可能导致自发路由器重新启动/重新加载或崩溃。本文档仅介绍与硬件相关的崩溃。要确定问题是硬件相关还是软件相关,您需要crashinfo和控制台日志。

以下是硬件可能导致的崩溃示例:

路由器不响应

路由器挂起最常由软件问题引起。有关如何处理此问题的信息,请参阅排除路由器挂起故障

路由器崩溃

当我们提到“系统崩溃”时,是指系统已经检测到某个不可恢复的错误并且已经重新启动的情况。软件问题、硬件问题或两者都可能导致崩溃。本部分介绍硬件引起的崩溃和与软件相关的崩溃,但可能被误认为硬件问题。

重要信息:如果在崩溃后重新加载路由器(例如,通过重新通电或使用reload命令),则有关崩溃的重要信息可能会丢失。在重新加载路由器之前,请尝试收集show technical-support和show log输出,以及crashinfo文件(如果可能)!

有关此问题的详细信息,请参阅排除路由器崩溃故障。

总线错误崩溃

在某些情况下,处理器会尝试访问不存在(软件错误)或未正确响应(硬件问题)的内存位置。 在这些情况下,系统遇到总线错误。

要识别总线错误,请查看路由器(在尚未重新通电或手动重新加载的路由器中)提供的show version输出。

此处显示了总线错误崩溃的两个示例。

Router uptime is 2 days, 21 hours, 30 minutes
System restarted by bus error at PC 0x30EE546, address 0xBB4C4
System image file is "flash:igs-j-l.111-24.bin", booted via flash 
.........

在总线错误期间,您可能在控制台提示符处看到以下错误消息:

*** System received a Bus Error exception *** 
signal= 0xa, code= 0x8, context= 0x608c3a50
PC = 0x60368518, Cause = 0x20, Status Reg = 0x34008002

有关详细信息,请参阅排除总线错误崩溃故障

线路卡未被识别

表2列出了线卡问题的症状和建议措施:

表2 — 线卡问题的症状和建议操作

症状 建议操作
show diag输出显示插卡时为空插槽。 检验LED是否可见。如果LED不可见,请卸下并重新插入线卡,或尝试使用其他插槽。如果这不起作用,则可能是路由器或卡的硬件故障。请联系思科TAC获取进一步帮助。
未知线路卡。错误消息,例如:
00:00:06: %LC-3-LCCREATE: Unable to create driver for 
Line Card type 630 in slot 2
验证当前Cisco IOS软件版本是否支持线卡。为此使用软件问(仅限注册客户)工具。
show diag输出显示线卡是已停用的线卡。 如果show diag输出显示线路卡已停用,请验证当前Cisco IOS软件版本是否支持该线路卡。使用Software Advisor(限注册客户)工具执行此操作。

PXF 处理器故障

默认情况下,并行eXpress转发(PXF)处理器已启用。但是,如果您不确定或遇到PXF问题,请验证是否启用了思科快速转发和PXF。要使用PXF处理,必须启用IP思科快速转发交换。要验证此情况,请查看show running-config命令的输出。如果思科快速转发已启用,您会在配置输出中看到“ip cef”。如果PXF被禁用,您会在配置输出中看到“no ip pxf”。如果您未看到“no ip pxf”,则PXF已启用。

输入show c7300 pxf interface all命令,查看从该接口接收的数据包是经过PXF处理还是已丢弃。

Router# show c7300 pxf int all
PXF-If: Y 00001 Gi0/0 (Up, Processing Input) 
!--- Processing input => PXF processed

Features: in=CEF [0x208], out=None [0x0] qstatus=XON 

为了进一步排除PXF故障,请查看show c7300 pxf accounting命令的输出,以验证哪些数据包进入和退出PXF处理器。

OIR 问题

7300平台引入了基于命令行界面的线卡在线插拔(OIR)准备机制。您可以通过hw-module slot slot-number stop命令停止特定线卡流量、关闭所有接口并停用线卡

当线路卡处于停用过程中时,请等待OIR LED呈绿色,然后发出与线路卡相关的任何命令。此外,如果线卡处于激活过程中,请等到OIR LED熄灭后再发出与卡相关的任何命令。

要从Cisco 7304路由器移除线卡而不中断数据流,请使用hw-module slot slot-number stop命令。此命令会停止流量,打开绿色OIR LED,并关闭所有线卡接口。当有活动流量时,请勿移除线卡。

stop关键字可停止通过线卡接口的流量并停用线卡。当OIR LED变为绿色时,线卡已停用,可以物理移除。

hw-module slot slot-number start命令可重新启动线卡并关闭OIR LED,并使卡重新联机。如果使用hw-module slot slot-number stop命令,请使用hw-module slot slot-number start命令重新激活线卡。您还可以使用hw-module slot slot-number start命令恢复因某些故障而已停用的线卡。如果在不使用hw-module slot slot-number start命令的情况下实际移除并重新插入该卡,您还可以重新激活线卡。

注:插入线卡时或系统启动后,线卡会自动初始化。您不需要发出hw-module slot slot-number start命令。

常见 7300 OIR 消息

表3显示了7300的常见错误消息及其原因:

表3 - 7300路由器上的常见错误消息

错误消息 原因
Line card activation is in progress.  
Please retry the command later.
如果已输入hw-module slot slot-number start命令,则忽略hw-module slot slot-number start命令的任何其他配置。
Line card deactivation is in progress.  
Please retry the command later.
可以使用hw-module slot slot-number stop命令停用线卡。但是,如果在OIR LED变为绿色且停用过程完成之前发出hw-module slot slot-number start命令,您会看到此消息。
Command cannot be executed. 
Line card status is deactivated.
如果线路卡已停用,您会看到此消息。忽略hw-module slot slot-number stop命令。

建立 TAC 服务请求时要收集的信息

如果在执行上述故障排除步骤后仍需要帮助,您可以向Cisco TAC提交服务请求(仅限注册客户)。请务必包括以下信息:
  • 显示错误消息的控制台获取。
  • 控制台捕获,显示您在每个步骤中排除故障的步骤和启动顺序。
  • 出故障的硬件组件和机柜的序列号。
  • 故障排除日志。
  • show technical-support指令的输出。
请将收集到的数据以未压缩的纯文本格式 (.txt) 附加到服务请求中。 您可以使用TAC服务请求工具(仅限注册客户)将信息上传到您的服务请求。 如果无法访问服务请求工具,可以通过电子邮件附件将信息发送到attach@cisco.com。将您的服务请求编号包含在邮件的主题行中,以将相关信息附加到您的服务请求。

注意:除非绝对必要,否则在收集上述信息之前,请勿手动重新加载或重新通电路由器。这可能导致确定问题根本原因所需的重要信息丢失。

相关信息