思科接口和模块 : Cisco ATM 端口适配器

PA-A3 上 SAR 崩溃故障排除

2016 年 10 月 27 日 - 机器翻译
其他版本: PDFpdf | 英语 (2015 年 8 月 22 日) | 反馈


目录


简介

在少见的情况下,在PA-A3 ATM端口适配器的主处理器可能失败和打印到控制台一个“故障转储”与输出类似于此:

%ATMPA-3-SARCRASH: ATM1/0: SAR1 Chip Crashdump: 
%ATMPA-7-REG00: status 0xF040FF00, cause 0x00008018, epc 0xBFC002EC    
%ATMPA-7-REG01: ccc 0x03E7B620, eepc 0x00000000, apu_status 0x00015010    
%ATMPA-7-REG02: edma_src 0x4B050964, edma_dest 0xA0820968, edma_cntl 0x00280000    
%ATMPA-7-REG03: edma_count 0x060001E0, edma_status 0x00000000, aci_cntrl 0x44400540 
%ATMPA-7-CWREG00: zero 0xBABEBABE, at 0x10000000, v0 0xBFC002EC, v1 0xF040FF00 
%ATMPA-7-CWREG01: a0 0xB8000804, a1 0x08000000, a2 0x00000190, a3 0x10338530    
%ATMPA-7-CWREG02: t0 0x8066B590, t1 0x00015010, t2 0x4B050964, t3 0xA0820968    
%ATMPA-7-CWREG03: t4 0x060001E0, t5 0x00280000, t6 0x00000000, t7 0x44400540    
%ATMPA-7-CWREG04: s0 0xC0000000, s1 0x00008001, s2 0x00000000, s3 0x00000000    
%ATMPA-7-CWREG05: s4 0xB8100000, s5 0x4B01EA44, s6 0x88800000, s7 0x008002F4    
%ATMPA-7-CWREG06: t8 0xF557C400, t9 0xB8000000, k0 0x00000000, k1 0xAB0DE6D4    
%ATMPA-7-CWREG07: gp 0x8080309C, sp 0x8080398C, fp/s8 0xCCCCCCCD, ra 0x80801440    
%ATMPA-7-MISC0: 00 0x00008001, 01 0x00000000, 02 0x00000000, 03 0xB8100000    
%ATMPA-7-MISC1: 04 0x4B01EA44, 05 0x88800000, 06 0x008002F4, 07 0x00000000    
%ATMPA-7-MISC2: 08 0x00000000, 09 0x00000000, 10 0x00000000, 11 0x00000000    
%ATMPA-7-MISC3: 12 0x00000000, 13 0x00000000, 14 0x00000000, 15 0x00000000

本文解释如何排除故障在PA-A3的分段和重组(SAR)失败。

先决条件

要求

本文档没有任何特定的要求。

使用的组件

本文档不限于特定的软件和硬件版本。

规则

有关文档规则的详细信息,请参阅 Cisco 技术提示规则

PA-A3 结构

PA-A3使用呼叫LSI ATMizer的一块芯片II提供SAR以及其他关键功能。SAR的名称在输出显示show controllers atm命令中

router# show controller atm 3/0 
Interface ATM3/0 is up 
Hardware is ENHANCED ATM PA - DS3 (45Mbps)    
Lane client mac address is 0030.7b1e.9054 
Framer is PMC PM7345 S/UNI-PDH, SAR is LSI ATMIZER II 
Firmware rev: G119, Framer rev: 1, ATMIZER II rev: 3 

!--- Output suppressed.

ATMizer微码(固件)是该的镜像提供SAR特定软件指令。在Cisco 7500平台的多用途接口处理器IOSï ¿  ½和在7200平台的系统IOS包含SAR固件,下载对SAR,当从重置出来时。根据用于的平台请使用以下命令显示您的ATM接口的当前装载的和运行微码版本:

  • 7200系列- show controller atm (请参阅上面输出示例:)

  • 7500系列- show controller vip slot-技术

PA-A3用途两SARs提供必要的处理功率为一条高速的OC-3和OC-12链路同时处理和传送。

注意: 单个SAR为DS-3/E-3是满足的,但是PA-A3-T3也使用两SARs一致性。

SAR故障转储指示哪个SAR遇到问题。

%ATMPA-3-SARCRASH: ATM1/0: SAR1 Chip Crashdump:   
 SAR0 = receive
 SAR1 = transmit

7xxx路由器系列中支持PA-A3。7200和7500路由器使用外围部件互连(PCI) BUS,端口适配器和“主机”内存之间的数据路径。主机内存是在VIP的本地SRAM或在网络处理引擎(NPE)的SRAM 7200。

此图表说明VIP2的体系结构和PCI BUS的位置:

/image/gif/paws/10501/vip_crash1.gif

对PCI总线的SAR提供连接转移的到数据包内存里。它为ATM信元处理也提供SAR功能和PHY或者物理接口给外部电线。

崩溃类型

我们能分类SAR崩溃到根据事故的原因的几个类别。找到非可恢复错误, SAR崩溃。这些错误可以是软件或硬件结果。要确定原因,请参见在crashdump输出的第二行出现的原因寄存器。例外代码在位两至六原因寄存器值被记录。从最右边的位的开始作为位零。例如:

%ATMPA-7-REG00: status 0xF040FF10, cause 0x00004018, epc 0x80802F68
  1. 翻译十六进制值0x00004018成二进制。注意每十六进制值代表四个位。在我们的示例的二进制等值是4个= 0100个, 0个= 0000个, 1个=0001和8 = 10000,然后0x00004018 = 0100 0000 00011000

  2. 找出位两至六通过从右到左计数。在我们的示例中,位两至六等同于到00110

  3. 转换这五个位回到十六进制。在我们的示例中, 0x06的00110个转换。

  4. 参见异常代码表。在示例中, SAR失败了以回应附属总线错误异常。

异常代码 说明 可能起因
0x00 中断 主张的中断状态。
0x01 TLB修改例外
0x02 TLB例外(负载/取指令)
0x03 TLB例外(存储)
0x04 地址错误(负载/取指令) 未调整的地址(软件)。
0x05 地址错误(存储) 未调整的地址(软件)。
0x06 总线错误 总线超时、奇偶校验错误等等(硬件)。
0x07 预留
0x08 Syscall 尝试执行SYSCALL说明。
0x09 盲点 尝试执行工间休息时间说明。
0x0a 保留说明 尝试执行无效的指令。
0x0b 不可用的共处理器 尝试执行在不可用的共处理器。
0x0c 运算溢出
0x0d 陷阱
0x0e 预留
0x0f 浮点 尝试访问不存在的FPU。
0x10-1f 预留

当所有值原因寄存器有位15集到一个时, SAR崩溃的原因是PCI中止或奇偶校验错误由于硬件。特别地,原因寄存器在故障转储将出现如下:

cause 0x00008000

通过替换ATM端口适配器排除故障此原因值。如果问题持续,请替换多用途接口处理器,如果曾经7500系列路由器或者网络处理引擎(NPE) /network服务引擎(NSE),如果使用一个7200或7400系列路由器。

已知问题

因为仅第一个故障转储与排除故障,是相关的Cisco Bug ID CSCdr09895防止重复了从打印的故障转储到控制台。以下Bug ID解决引起SAR崩溃的少见的情况。请使用Bug Toolkit (仅限注册用户)确定您的Cisco IOS软件版本是否是受这些Bug ID的影响的。

Cisco Bug ID 说明
CSCdp62791 通过不发送数据包对在没有配置的VC的SAR或发送数据包防止SAR1失败对与无效封装的SAR。

注意: 虽然它报告一不同的症状, CSCdp01166易受骗的人对和通过CSCdp62791修复。

CSCdp42529 防止SAR1接收引起的失败在传输SAR不存在的一个VPI/VCI对的一个信元。此问题能发生,当很大数量的SVC创建或被切断时,因此传输SAR未命中从主机CPU的命令中断在VIP或NPE。当这发生时, VC在接收SAR和仅传输SAR崩溃定义,如果OAM环回或资源管理信元在未确定VPI/VCI对接收。
CSCdr09895 防止SAR0发生的失败,当,与大量中转流量, SAR设法访问在辅助存储器的一个非法地址,等待分段和重组的数据包存储。此情况呼叫总线错误。
CSCdp64588 防止由于一的路由器崩溃重复了SAR (0或1)失败。当SAR崩溃, PCI host-driver (提供PA-A3和PCI总线之间的一个接口在路由器)设法再开始PA。如果有被重复的SAR崩溃,并且PA不响应对host-driver, host-driver设法关闭(关机) PA,并且PA交换。有时,如果SAR失败了,并且host-driver已经清除了与此PA涉及的内存,路由器失效由于总线错误。

排除故障

下列问题汇总如何排除故障在PA-A3 ATM端口适配器的SAR崩溃:

  • 确定是否SAR0 (接收SAR)或SAR1 (传输SAR)失败了。故障转储的第一行将告诉您。

    %ATMPA-3-SARCRASH: ATM1/0: SAR1 Chip Crashdump
  • 请使用异常代码表解码原因寄存器值在crashdump输出中。

  • 如果原因寄存器是与位15集的一个值到一个,请更换硬件。

  • 如果原因寄存器是其他值,请收集思科技术支持的以下信息:

    • crashdump输出

    • show controller atm (7200系列)

    • show controller vip slot-技术(7500系列)

    • show tech-support

  • 可以重点考虑安装您目前正在运行的Cisco IOS软件系列最新的维护版本。


相关信息


Document ID: 10501