交换机 : Cisco Catalyst 6500 系列交换机

运行 Cisco IOS 软件的 Catalyst 6500/6000 系列交换机上常见的错误消息

2015 年 8 月 28 日 - 机器翻译
其他版本: PDFpdf | 英语 (2015 年 4 月 23 日) | 反馈


目录


简介

您在Cisco Catalyst 6500/6000系列交换机看到运行Cisco IOS�系统软件的本文提供普通的Syslog简要说明和错误消息。如果您遇到的错误消息未出现在本文档中,请使用命令输出解释程序仅限注册用户)。 通过该工具,可以了解 Cisco IOS 软件和 Catalyst OS (CatOS) 软件生成的错误消息的含义。

注意: 本文档中描述的 syslog 和错误消息的确切格式可能会稍有不同。不同之处取决于 Supervisor 引擎上运行的软件版本。

注意: 以下是 Catalyst 6500/6000 上推荐的最低日志记录配置:

  • 设置交换机上的日期和时间,或者将交换机配置为使用网络时间协议 (NTP),以从 NTP 服务器获得日期和时间。

  • 确保已启用日志记录和日志记录时间戳,即默认设置。

  • 如有可能,将交换机配置为登录到 syslog 服务器。

先决条件

要求

本文档没有任何特定的要求。

使用的组件

本文档不限于特定的软件和硬件版本。

规则

有关文档规则的详细信息,请参阅 Cisco 技术提示规则

%C6KPWR-SP-4-UNSUPPORTED :unsupported module in slot [num], power not allowed:[chars]

问题

交换机报告以下错误消息:

  • C6KPWR-SP-4-UNSUPPORTED :unsupported module in slot [num], power not allowed:[chars]

以下示例显示了发生该问题时所显示的控制台输出:

Oct 14 16:50:13: %C6KPWR-SP-4-UNSUPPORTED: unsupported module in slot 2, power not allowed: 
Unknown Card Type
Oct 14 16:50:20: %C6KPWR-SP-4-UNSUPPORTED: unsupported module in slot 2, power not allowed: 
Unknown Card Type

说明

该消息表示指定插槽内的模块不受支持。[num] 是插槽编号,[chars] 提供关于错误的详细信息。

解决方法

将 Supervisor 引擎软件升级到支持该硬件模块的版本。请参阅 Cisco Catalyst 6500 系列交换机发行版本注释支持的硬件 部分,了解相关版本。要解决该消息描述的问题,请执行这些操作之一:

  • 插入或替换交换矩阵模块。

  • 将不支持的模块移到其他插槽中。

%DUAL-3-INTERNAL :IP-EIGRP 1:Internal Error

问题

交换机报告以下错误消息:

  • %DUAL-3-INTERNAL :IP-EIGRP 1:Internal Error

说明

该错误消息表示在 Cisco IOS 软件中有一个内部 bug。该 bug 已在以下版本中得到修复:

  • Cisco IOS 软件版本 12.2(0.4)

  • Cisco IOS 软件版本 12.1(6.1)

  • Cisco IOS 软件版本 12.2(0.5)T

  • Cisco IOS 软件版本 12.1(6.5)E

  • Cisco IOS 软件版本 12.1(6.5)EC

  • Cisco IOS 软件版本 12.1(6)E02

  • Cisco IOS 软件版本 12.2(0.18)S

  • Cisco IOS 软件版本 12.2(2)B

  • Cisco IOS 软件版本 12.2(15)ZN

解决方法

将 Cisco IOS 软件升级到以下版本之一,或者升级到最新版本。

%EARL_L3_ASIC-SP-4-INTR_THROTTLE :Throttling "IP_TOO_SHRT"

问题

交换机报告以下错误消息:

  • %EARL_L3_ASIC-SP-4-INTR_THROTTLE :Throttling "IP_TOO_SHRT"

以下示例显示了发生该问题时所显示的控制台输出:

Jul 25 12:00:40.228 AEST: %EARL_L3_ASIC-SP-4-INTR_THROTTLE: Throttling "IP_TOO_SHRT"Intr. 
Exceeded permitted 1000/100 intrs/msec

说明

该消息表示交换机转发引擎收到的 IP 数据包长度比允许的最短长度还短。交换机丢弃了该数据包。在旧版本中,这样的数据包都会被静默丢弃,并计入转发引擎统计数据中。在更高版本中,会每隔 30 分钟在 syslog 中记录一次该错误消息。以下这些问题会造成交换机转发引擎收到这种类型的 IP 数据包:

  • 网络接口卡 (NIC) 驱动程序出错

  • NIC 驱动程序 bug

  • 应用程序出错

交换机仅报告收到了这些“错误”数据包,并打算将其丢弃。

解决方法

问题根源来自于交换机外部。遗憾的是,转发引擎并不记录这些错误数据包发送设备的源 IP 地址。检测该设备的唯一方式是使用嗅探器找到源,然后替换该设备。

%EARL_L3_ASIC-SP-3-INTR_WARN :EARL L3 ASIC:Non-fatal interrupt [chars]

问题

交换机报告以下错误消息:

  • EARL_L3_ASIC-SP-3-INTR_WARN :EARL L3 ASIC:Non-fatal interrupt [chars]

以下示例显示了发生该问题时所显示的控制台输出:

Apr 20 17:53:38: %EARL_L3_ASIC-SP-3-INTR_WARN: EARL L3 ASIC: 
           Non-fatal interrupt Packet Parser block interrupt
Apr 20 19:13:05: %EARL_L3_ASIC-SP-3-INTR_WARN: EARL L3 ASIC:
           Non-fatal interrupt Packet Parser block interrupt

说明

错误消息 %EARL_L3_ASIC-SP-3-INTR_WARN 表示增强地址识别逻辑 (EARL) 第 3 层 (L3) 专用集成电路 (ASIC) 检测到非致命意外情况。这表示已收到并丢弃错误数据包,其中可能包含第 3 层 IP 校验和错误。这一问题的原因是网络上的设备发送了错误数据包。以下这些问题及其他问题可能会导致产生错误数据包:

  • NIC 出错

  • NIC 驱动程序出错

  • 应用程序出错

在旧的 Cisco IOS 软件版本中,通常会丢弃这些数据包,不进行日志记录。Cisco IOS 软件版本 12.2SX 及更高版本提供记录有关该平台错误消息的功能。

解决方法

该消息仅用于提供信息。请使用以下两个选项之一作为解决方法:

  • 使用网络嗅探器识别发送错误数据包的源。然后,解决源设备或源应用程序的问题。

  • 在交换机硬件中禁用针对以下错误的第 3 层错误检查:

    • 数据包校验和错误

    • 数据包长度错误

    • 数据包源 IP 地址和目标 IP 地址相同

    如以下示例所示,使用 no mls verify 命令停止这些错误检查:

    • Switch(config)#no mls verify ip checksum
      
      !--- This configures the switch to discontinue checks for packet 
      !--- checksum errors.
      
      
    • Switch(config)#no mls verify ip length {consistent | minimum}
      
      !--- This configures the switch to discontinue checks for packet 
      !--- length errors.
      
      
    • Switch(config)#no mls verify ip same-address
      
      
      !--- This configures the switch to discontinue checks for packets that have the 
      !--- same source and destination IP addresses.
      
      

%EARL_NETFLOW-4-TCAM_THRLD :Netflow TCAM threshold exceeded, TCAM Utilization [[dec]%]

问题

交换机报告以下错误消息:

  • EARL_NETFLOW-4-TCAM_THRLD :Netflow TCAM threshold exceeded, TCAM Utilization [[dec]%]

以下示例显示了发生该问题时所显示的控制台输出:

Aug 24 12:30:53: %EARL_NETFLOW-SP-4-TCAM_THRLD: Netflow TCAM threshold exceeded, 
TCAM Utilization [97%]
Aug 24 12:31:53: %EARL_NETFLOW-SP-4-TCAM_THRLD: Netflow TCAM threshold exceeded, 
TCAM Utilization [97%]

注意: 如果要过滤此特定错误信息,请注意与同样严重级别的所有错误消息将被过滤。特定日志消息不可能被过滤不影响其他日志下,在同一严重级别下

说明

该消息表示 NetFlow 三重内容可寻址存储器 (TCAM) 几乎已满。将临时启用主动老化。如果将 NetFlow 掩码更改为完整模式,则 NetFlow 的 TCAM 会因为有过多条目而溢出。发出 show mls netflow ip count 命令查看此信息。

Supervisor 引擎 720 会每 30 秒钟检查一次 NetFlow 表的占用情况。当表大小几乎达到 90% 时,Supervisor 引擎会打开主动老化。主动老化的原理是,表即将全满,所以无法创建新的活动流。因此,应该对表内的低活动流(或非活动流)进行主动老化,为高活动流创造空间。

对于 PFC3a 和 PFC3b,每个 Policy Feature Card (PFC) NetFlow 表 (IPv4) 的容量是 128,000 个流。对于 PFC3bXL,容量是 256,000 个流。

解决方法

要防止此问题,请禁用完整 NetFlow 模式。发出 no mls flow ip 命令。

注意: 通常情况下,no mls flow ip 命令不影响数据包转发,因为用于数据包转发的 TCAM 和用于 NetFlow 记账的 TCAM 是分开的。

要从此问题恢复为正常状态,请启用 MLS 快速老化。启用 MLS 快速老化时间时,最初请设置值为 128 秒。如果 MLS 缓存的大小继续增长至超过 32K 个条目,请减小设置,直至缓存大小小于 32 K。如果缓存继续增长至超过 32K 个条目,请减小正常的 MLS 老化时间。任何不是 8 秒倍数的老化时间值都会调整到最接近的 8 秒倍数值。

Switch#configure terminal
Switch(config)#mls aging fast threshold 64 time 30

另一应急方案将禁用service internal,万一,如果启用和删除MLS interface-full流的ip,万一,如果不需要完整流。

Switch(config)#no service internal
Switch(config)#mls flow ip interface-full

%ETHCNTR-3-LOOP_BACK_DETECTED :Keepalive packet loop-back detected on [chars]

问题

交换机报告以下错误消息,且端口被强制执行链路关闭:

  • %ETHCNTR-3-LOOP_BACK_DETECTED :Keepalive packet loop-back detected on [chars]

以下示例显示了发生该问题时所显示的控制台输出:

Oct 2 10:40:13: %ETHCNTR-3-LOOP_BACK_DETECTED: Keepalive packet loop-back detected on 
GigabitEthernet0/1
Oct 2 10:40:13: %PM-4-ERR_DISABLE: loopback error detected on Gi0/1, putting Gi0/1 in 
err-disable state

说明

发生该问题的原因是 keepalive 数据包环回到了发送 keepalive 数据包的端口。Keepalive 数据包在 Catalyst 交换机上发送,目的是防止网络中形成环路。默认情况下,在所有接口上启用 Keepalive。您会在检测到并中断环路的设备上发现此问题,而不是在引起环路的设备上。

解决方法

发出 no keepalive 接口命令以禁用 keepalive。禁用 Keepalive 可以防止因错误而禁用接口,但是不能删除环路。

注意: 在基于 Cisco IOS 软件版本 12.2(x)SE 的版本及更高版本中,默认情况下不会在光纤接口和上行链路接口上发送 keepalive 数据包。

loadprog :error - on file open boot:cannot load "cisco2-Cat6k-MSFC"

问题

交换机报告以下错误消息:

  • loadprog :error - on file open boot:cannot load "bootflash:c6msfc2-boot-mz.121-8a.EX"

说明

该问题仅在向设备非对齐写入(接近 64 字节内部边界)时发生。以下情况下可能会发生该问题:

  • 在写入崩溃转储文件期间

    由于某些原因,导致系统在写入文件时发生崩溃。

  • 从 CatOS 迁移到 Cisco IOS 软件过程中代码损坏时

解决方法

解决方法是修改设备驱动程序,使其能够正确处理非对齐访问。如果发生错误的原因是从 CatOS 迁移到 Cisco IOS 软件过程中代码损坏,请清除闪存并下载新的有效 CatOS 软件映像。

%L3_ASIC-DFC3-4-ERR_INTRPT :Interrupt TF_INT:FI_DATA_INT

问题

交换机报告以下错误消息:

  • %L3_ASIC-DFC3-4-ERR_INTRPT :Interrupt TF_INT:FI_DATA_INT occurring in EARL %Layer 3 ASIC

说明

该错误消息表示在第 3 层 (L3) 转发专用集成电路 (ASIC) 中出现错误。基本上,交换机会在某些瞬时数据流通过 ASIC 时显示这一消息,而软件仅报告发生中断情况。一旦遇到这一情况,通过 show earl statistics 命令显示的计数器会有所增加。每次软件尝试从这样的状态中恢复时,交换机都会生成该 syslog 消息。通常情况下,如果发生率一直较低,则该消息仅为提供信息之用。但若错误消息频繁出现,则可能是硬件出现问题。

检查 show earl statistics 命令输出中的计数器值。如果计数器迅速增加,表明硬件可能出现了问题。

%MLS_STAT-SP-4-IP_LEN_ERR :MAC/IP length inconsistencies

问题

交换机报告以下错误消息:

  • %MLS_STAT-SP-4-IP_LEN_ERR :MAC/IP length inconsistencies

以下示例显示了发生该问题时所显示的控制台输出:

May 29 21:54:14 JST: %MLS_STAT-SP-4-IP_LEN_ERR: MAC/IP length inconsistencies
May 29 23:10:44 JST: %MLS_STAT-SP-4-IP_LEN_ERR: MAC/IP length inconsistencies

说明

这些消息表示收到的数据包中,IP 长度与该数据包的 MAC 长度不匹配。Supervisor 引擎丢弃了这些数据包。因为交换机丢弃了数据包,因此对交换机没有负面影响。交换机报告这一消息是用于提供信息。这一问题的原因是网络上的设备发送了错误数据包。以下这些问题及其他问题可能会导致产生错误数据包:

  • NIC 出错

  • NIC 驱动程序出错

  • 应用程序出错

使用网络嗅探器找到发送错误数据包的源。然后,解决源设备或源应用程序的问题。

另一种解决方法是将交换机配置为停止检查以下内容:

  • 数据包校验和错误

  • 数据包长度错误

  • 数据包源 IP 地址和目标 IP 地址相同

使用这些命令停止交换机检查:

  • Switch(config)#no mls verify ip checksum
    
    !--- This configures the switch to discontinue checks for packet checksum errors.
    
    
  • Switch(config)#no mls verify ip length
    
    !--- This configures the switch to discontinue checks for packet length errors.
    
    
  • Switch(config)#no mls verify ip same-address
    
    !--- This configures the switch to discontinue checks for packets that have the 
    !--- same source and destination IP addresses.
    
    

%MLS_STAT-SP-4-IP_CSUM_ERR :IP checksum errors

问题

交换机报告以下错误消息:

  • %MLS_STAT-SP-4-IP_CSUM_ERR :IP checksum errors

以下示例显示了发生该问题时所显示的控制台输出:

Jan 20 12:48:52: %MLS_STAT-SP-4-IP_CSUM_ERR: IP checksum errors
Jan 20 14:49:53: %MLS_STAT-SP-4-IP_CSUM_ERR: IP checksum errors

说明

这些消息表示交换机收到的 IP 数据包具有无效校验和值。因为交换机丢弃了数据包,因此对交换机没有负面影响。交换机报告这一消息是用于提供信息。这一问题的原因是网络上的设备发送了错误数据包。以下这些问题及其他问题可能会导致产生错误数据包:

  • NIC 出错

  • NIC 驱动程序出错

  • 应用程序出错

解决方法

请使用以下两个选项之一作为解决方法:

  • 使用网络嗅探器识别发送错误数据包的源。然后,解决源设备或源应用程序的问题。

  • 在交换机硬件中禁用针对以下内容的第 3 层错误检查:

    • 数据包校验和错误

    • 数据包长度错误

    要停止这些错误检查,请使用 no mls verify 命令,如以下示例所示:

    • Switch(config)#no mls verify ip checksum
      
      !--- This configures the switch to discontinue checks for packet 
      !--- checksum errors.
      
      
    • Switch(config)#no mls verify ip length {consistent | minimum}
      
      !--- This configures the switch to discontinue checks for packet 
      !--- length errors.
      
      

%MCAST-SP-6-ADDRESS_ALIASING_FALLBACK

问题

交换机报告以下错误消息:

  • %MCAST-SP-6-ADDRESS_ALIASING_FALLBACK :

以下示例显示了发生该问题时所显示的控制台输出:

%MCAST-SP-6-ADDRESS_ALIASING_FALLBACK: Address Aliasing detected for 
group 0100.5e00.0001 on vlan 632 from possible source ip 10.158.132.185 source 
mac 0000.bea6.82e0

说明

该消息表示交换机收到过量多播数据流,且数据流目标地址为 01-00-5e-00-00-xx 范围内的多播 MAC 地址。该多播地址范围是预留给 Internet 组管理协议 (IGMP) 控制数据流的,例如:

  • 分支

  • 加入

  • 一般查询

通常,交换机 CPU 处理所有的 IGMP 控制数据流。因此,Cisco IOS 软件提供了一种机制,用于忽略发往预留地址的过量 IGMP 多播数据流。该机制确保了 CPU 不会过度使用。这一机制的使用称为“后退模式”。

找到非法多播数据流的源。然后停止传输或修改流特性,使传输不再侵占 IGMP 控制数据空间。此外,可利用问题部分中的错误消息,通过该消息可找到引起该问题的潜在网络源。

c6k_pwr_get_fru_present() :can't find fru_info for fru type 6, #

问题

交换机报告以下错误消息:

  • c6k_pwr_get_fru_present() :can't find fru_info for fru type 6, #

以下示例显示了发生该问题时所显示的控制台输出:

Mar 10 08:30:53: SP: c6k_pwr_get_fru_present(): can't find fru_info for fru type 6, #38
Mar 10 08:30:53: SP: c6k_pwr_get_fru_present(): can't find fru_info for fru type 6, #38
Mar 10 08:30:53: SP: c6k_pwr_get_fru_present(): can't find fru_info for fru type 6, #43
Mar 10 08:30:53: SP: c6k_pwr_get_fru_present(): can't find fru_info for fru type 6, #43

说明

出现该错误消息的原因是,交换机向 Flex WAN 模块所使用端口适配器的简单网络管理协议 (SNMP) 轮询发出了错误的响应。该错误消息本质上为表面问题,并无有害的交换机性能问题。有关详细信息,请参阅 Cisco bug ID CSCdx41473仅限注册用户)。 该问题已在以下版本中得到修复:

  • Cisco IOS 软件版本 12.1(11b)E4

  • Cisco IOS 软件版本 12.1(12c)E1

  • Cisco IOS 软件版本 12.1(13)E

  • Cisco IOS 软件版本 12.1(13)EC

  • 更高版本

%MROUTE-3-TWHEEL_DELAY_ERR

问题

交换机报告以下错误消息:

  • %MROUTE-3-TWHEEL_DELAY_ERR :

以下示例显示了发生该问题时所显示的控制台输出:

%MROUTE-3-TWHEEL_DELAY_ERR: Exceeded maximum delay (240000 ms) requested: 7200000

说明

当交换机收到通告高保持时间值的独立于协议的多播 (PIM) 加入/修剪数据包时,会出现该消息。该数据包通告的保持时间值高于交换机 OS 允许的最大延迟,即 4 分钟。这些数据包为多播控制数据包,如 PIM、距离矢量多播路由协议 (DVMRP) 以及其他类型。

用于 Catalyst 6500/6000 的 Cisco IOS 软件的更高版本已将这一最大延迟增加至 65,535 秒。有关详细信息,请参阅 Cisco bug ID CSCdw50542仅限注册用户)。 该问题已在以下版本中得到修复:

  • Cisco IOS 软件版本 12.1(12c)E

  • Cisco IOS 软件版本 12.2(12)T01

  • Cisco IOS 软件版本 12.1(13)E

  • Cisco IOS 软件版本 12.1(13)EC

  • 更高版本

解决方法

对生成 PIM 数据包的第三方设备进行配置,使其使用协议标准推荐的计时器。

%MCAST-SP-6-GC_LIMIT_EXCEEDED

问题

交换机报告以下错误消息:

  • %MCAST-SP-6-GC_LIMIT_EXCEEDED

以下示例显示了发生该问题时所显示的控制台输出:

%MCAST-SP-6-GC_LIMIT_EXCEEDED: IGMP snooping was trying to allocate 
more Layer 2 entries than what=allowed (13000)

说明

当交换机上的 IGMP 监听功能创建的第 2 层 (L2) 条目达到允许的最大数量时,将会记录该错误消息。默认情况下,交换机可以为多播组创建的 L2 条目最大数量为 15,488。在 Cisco IOS 软件的更高版本中,只有安装了硬件的 L2 多播条目才会计入这一限制。有关详细信息,请参阅 Cisco bug ID CSCdx89380仅限注册用户)。 在 Cisco IOS 软件版本 12.1(13)E1 和更高版本中该问题已得到修复。

解决方法

可以手动提高 L2 限制。发出 ip igmp l2-entry-limit 命令。

%MISTRAL-SP-3-ERROR :Error condition detected:TM_NPP_PARITY_ERROR

问题

交换机报告以下错误消息:

  • %MISTRAL-SP-3-ERROR :Error condition detected:TM_NPP_PARITY_ERROR

以下示例显示了发生该问题时所显示的控制台输出:

Apr 19 22:14:18.237 EDT: %MISTRAL-SP-3-ERROR: Error condition detected: 
TM_NPP_PARITY_ERROR
Apr 19 22:14:25.050 EDT: %MISTRAL-SP-3-ERROR: Error condition detected: 
TM_NPP_PARITY_ERROR
Apr 19 22:15:20.171 EDT: %MISTRAL-SP-3-ERROR: Error condition detected: 
TM_NPP_PARITY_ERROR

说明

该错误消息表示在内部表管理器的下一页指针中存在奇偶校验错误。如果交换机运行的是 Cisco IOS 软件版本 12.1(8)E 或更高版本,则交换机会检测到奇偶校验错误并重置 Mistral ASIC。然后交换机就可以继续运行,无须重新加载。随机的静电放电或其他外部因素即可导致存储器奇偶校验错误。如果该错误消息仅出现一次或很少出现,请监控交换机 syslog,确认该错误是否为孤立事件。如果这些错误消息重复出现,请向 Cisco 技术支持提出服务请求。

%MLS_STAT-4-IP_TOO_SHRT :Too short IP packets received

问题

交换机报告以下错误消息:

  • %MLS_STAT-4-IP_TOO_SHRT :Too short IP packets received

以下示例显示了发生该问题时所显示的控制台输出:

*Apr  1 10:30:35 EST: %MLS_STAT-SP-4-IP_TOO_SHRT: Too short IP packets received

说明

该消息表示交换机转发引擎收到的 IP 数据包长度比允许的最短长度还短。交换机丢弃了该数据包。在旧版本中,这样的数据包都会被静默丢弃,并计入转发引擎统计数据中。这一情况适用于早于 7.x 或早于 Cisco IOS 软件版本 12.1(13E) 的软件版本。7.x 之后或 Cisco IOS 软件版本 12.1(13E) 之后的软件版本中,会每隔 30 分钟在 syslog 中记录一次该消息。

对交换机这一方面没有影响。交换机会丢弃错误数据包,接收设备最终也会丢弃此类数据包。唯一需要关注的是发送错误数据包的设备。可能的原因包括:

  • NIC 驱动程序出错

  • NIC 驱动程序 bug

  • 应用程序出错

由于硬件限制,Supervisor 引擎不会记录发送错误数据包的源 IP 地址、MAC 地址或设备端口。要检测这些设备并找到源地址,必须使用数据包嗅探应用程序。

问题部分中的消息只是交换机提供的警告/信息性消息。消息中不包含有关源端口、MAC 地址或 IP 地址的任何信息。

在网络内部使用数据包嗅探应用程序。尝试关闭网络内的某个端口或从中删除某个设备,确定是否可以查明发生故障的设备。

Processor [number] of module in slot [number] cannot service session requests

问题

交换机报告以下错误消息:

  • Processor [number] of module in slot [number] cannot service session requests

说明

下列情况下,当您发出 session slot number processor number 命令尝试建立会话时会发生这一错误:

  • 在登录到交换机的同时,尝试与一个其中已建立有会话的模块建立会话。

  • 尝试为插槽中不可用的模块建立会话。

  • 尝试为模块中不可用的处理器建立会话。

%PM_SCP-1-LCP_FW_ERR :System resetting module [dec] to recover from error:[chars]

问题

交换机报告以下错误消息:

  • %PM_SCP-1-LCP_FW_ERR :System resetting module [dec] to recover from error:[chars]

这些示例显示了发生这一问题时所显示的控制台输出:

  • %PM_SCP-SP-1-LCP_FW_ERR :System resetting module 13 to recover from error:Linecard received system exception

  • %PM_SCP-SP-1-LCP_FW_ERR :System resetting module 4 to recover from error:Coil Pb Rx Parity Error - Port #14

说明

该消息表示指定模块的固件已检测到错误。系统自动重置模块以从该错误中恢复。[dec] 为模块编号,[chars] 为错误。

解决方法

重新安装模块或将模块放入不同的插槽中,并允许模块完成整个启动诊断测试。有关 Catalyst 6500 系列交换机联机诊断的详细信息,请参阅配置联机诊断。模块通过诊断测试后,请监控该错误消息是否再次出现。如果错误再次出现或诊断测试发现了任何问题,请向 Cisco 技术支持提出服务请求,以进行进一步的故障排除。

%PM_SCP-2-LCP_FW_ERR_INFORM :模块[dec]经历以下错误:[chars]

问题

交换机报告以下错误消息:

  • %PM_SCP-2-LCP_FW_ERR_INFORM :模块[dec]经历以下错误:[chars]

以下示例显示了发生该问题时所显示的控制台输出:

  • %PM_SCP-SP-2-LCP_FW_ERR_INFORM :模块4经历以下错误:总线Asic #0瞬变铅错误

说明

模块报告错误情况, [dec]是模块号,并且[chars]是错误。此情况通常是由一不正确地供以座位的线卡或硬件故障导致的。如果错误消息在所有被看到线卡,原因不正确地是一个插入的模块。

解决方法

重新安装并且重置线卡或模块。然后请发出show diagnostic result module module_-命令”

如果错误消息仍然存在,在模块重置后,请创建与为做进一步的故障排除思科技术支持的一服务请求。

%PM_SCP-SP-2-LCP_FW_ERR_INFORM :模块[dec]经历以下错误:[chars]

问题

交换机报告以下错误消息:

%PM_SCP-SP-2-LCP_FW_ERR_INFORM :模块4经历以下错误:波尔特#36瞬变TX铅错误

说明

此错误消息指示在模块号4的一个临时错误在数据路径端口36。在大多数情况下,这是一个一次/瞬变问题。

解决方法

  1. 为问题的循环关闭和unshut端口Gi4/36,并且监控。

  2. 如果错误再发生,请设置诊断用diagnostic bootup level完整命令完成。然后,请物理的重装线路卡。

  3. 如果错误消息仍然存在,在模块重新安装后,请创建与思科技术支持的一服务请求为做进一步的故障排除与这些命令输出:

%PM_SCP-SP-4-UNK_OPCODE :Received unknown unsolicited message from module [dec], opcode [hex]

问题

交换机报告以下错误消息:

  • %PM_SCP-SP-4-UNK_OPCODE :Received unknown unsolicited message from module [dec], opcode [hex]

这些示例显示了发生这一问题时所显示的控制台输出:

  • Dec 10 12:44:18.117:%PM_SCP-SP-4-UNK_OPCODE :Received unknown unsolicited message from module 2, opcode 0x330

  • Dec 10 12:44:25.210:%PM_SCP-SP-4-UNK_OPCODE :Received unknown unsolicited message from module 2, opcode 0x114

说明

该错误消息仅表示,由于交换机 Cisco IOS 软件版本不支持某些功能,Supervisor 引擎无法识别来自板卡的控制消息。

板卡向活动的 Supervisor 引擎发送控制消息,其中表明了软件支持的功能。但若软件不支持板卡的任何功能,将无法识别这些控制消息,从而显示该错误消息。该消息的出现是无害的,并不会影响 Supervisor 引擎或板卡的任何功能。

解决方法

将 Supervisor 引擎软件升级到支持最多功能的最新版本。因为该错误消息并不影响生产或数据流,因此可以忽略该消息。

%PM_SCP-SP-3-TRANSCEIVER_BAD_EEPROM :在收发器的完整性检查在5/2失败的局域网端口:坏密钥

问题

交换机报告以下错误消息:

  • %PM_SCP-SP-3-TRANSCEIVER_BAD_EEPROM :在收发器的完整性检查在5/2失败的局域网端口:坏密钥

说明

此错误消息的原因是非Cisco的SFP GBIC使用情况,不支持。

思科SFP GBIC有一个唯一已加密代码(质量ID)识别思科可插入的零件的该enable (event)思科IOS/CAT OS。正常GBIC没有此并且他们能可能运作。参考的%PM_SCP-SP-3-TRANSCEIVER_BAD_EEPROM欲知更多信息。

%PM_SCP-SP-3-LCP_FW_ABLC :从模块[dec]的延迟冲突消息, port:035

问题

交换机报告以下错误消息:

  • %PM_SCP-SP-3-LCP_FW_ABLC :从模块3的延迟冲突消息, port:035

说明

延迟冲突—延迟冲突发生,当两个设备同时传输,并且都连接的侧不检测冲突。发生这种冲突的原因是从网络的一端向另一端传播信号的时间长于将整个数据包放在网络上的时间。导致延迟冲突的两台设备互相看不到对方正在发送数据,直至将整个数据包放在网络上。在第一个 64 字节时隙之前,发射器未检测到延迟冲突。这是因为只有在传输大于 64 字节的数据包时才会检测到这种冲突。

可能的原因—,当有双工不匹配、不正确接线或者集线器一个固执的编号在网络时的延迟冲突是结果。NIC 损坏也可能导致延迟冲突。

%PM-3-INVALID_BRIDGE_PORT :网桥端口号是超出范围

问题

交换机报告以下错误消息:

%PM-3-INVALID_BRIDGE_PORT: Bridge Port number is out of range

说明

此问题看上去化妆用品并且是由于MIB dot1dTpFdbEntry的SNMP投票。

解决方法

您在此设备能阻塞从轮询的OID。此缺陷从Cisco IOS版本12.2(33)SRD04和以上修复。

%QM-4-TCAM_ENTRY :Hardware TCAM entry capacity exceeded

问题

交换机报告以下错误消息:

  • %QM-4-TCAM_ENTRY :Hardware TCAM entry capacity exceeded

说明

TCAM 是供 ACL 和 QoS 引擎用于快速表查询的专用存储器。该消息表示 TCAM 资源耗尽,软件正在交换数据包。这意味着每个端口在 TCAM 中都有自己对应的 ID,因此占用了更多的 TCAM 资源。此问题很有可能是由 mls qos marking statistics 命令引起的,或是在硬件 TCAM 没有容量处理所有已配置 ACL 时发生的。

解决方法

  • 请禁用 mls qos marking statistics 命令,因为默认情况下该命令处于启用状态。

  • 尝试在多个接口间共享同样的 ACL,以减少 TCAM 资源争用。

%slot_earl_icc_shim_addr:Slot [num] is neither SuperCard nor Supervisor - Invalid slot

问题

交换机报告以下错误消息:

  • %slot_earl_icc_shim_addr:Slot [num] is neither SuperCard nor Supervisor - Invalid slot

说明

当 SNMP 管理器向没有任何 TCAM 信息的板卡轮询 TCAM 数据时,会出现该消息。这一情况仅会发生在运行 Cisco IOS 软件的 Catalyst 6500 交换机板卡上。在 SNMP 轮询期间,如果板卡有 TCAM 信息,则数据将提供给网络管理系统 (NMS) 进行进一步的处理。有关详细信息,请参阅 Cisco bug ID CSCec39383仅限注册用户)。 该问题已在 Cisco IOS 软件版本 12.2(18) 中得到修复。

作为解决方法,您可以通过 NMS 阻止 TCAM 数据查询。提供 TCAM 使用数据的 MIB 对象为 cseTcamUsageTable。要避免反向追踪,请在路由器上完成这些步骤:

  1. 发出 snmp-server view tcamBlock cseTcamUsageTable exclude 命令。

  2. 发出 snmp-server view tcamBlock iso included 命令。

  3. 发出 snmp-server community public view tcamBlock ro 命令。

  4. 发出 snmp-server community private view tcamBlock rw 命令。

%SYSTEM_CONTROLLER-SP-3-ERROR :Error condition detected:TM_NPP_PARITY_ERROR

问题

交换机报告以下错误消息:

  • %SYSTEM_CONTROLLER-SP-3-ERROR :Error condition detected:TM_NPP_PARITY_ERROR

以下示例显示了发生该问题时所显示的控制台输出:

Feb 23 21:55:00: %SYSTEM_CONTROLLER-SP-3-ERROR: Error condition detected: TM_NPP_PARITY_ERROR
Feb 23 22:51:32: %SYSTEM_CONTROLLER-SP-3-ERROR: Error condition detected: TM_NPP_PARITY_ERROR
Feb 23 23:59:01: %SYSTEM_CONTROLLER-SP-3-ERROR: Error condition detected: TM_NPP_PARITY_ERROR

说明

在 MSFC 上来自 Mistral ASIC 的最常见错误是 TM_DATA_PARITY_ERROR、SYSDRAM_PARITY_ERROR、SYSAD_PARITY_ERROR 和 TM_NPP_PARITY_ERROR。导致这些奇偶校验错误的可能原因是随机静电放电或其他外部因素。该错误消息表示存在奇偶检验错误。处理器内存奇偶校验错误 (PMPE) 分为以下两种类型:单事件干扰 (SEU) 和重复错误。

当数据字中的某一位因为外部事件(例如导致 0 自发更改为 1 的事件)发生意外更改时,就会发生此类单个位错误。SEU 是一种与供应商和技术无关的普遍现象。SEU 发生频率很低,但所有计算机和网络系统,甚至是 PC 都有可能发生这样的问题。SEU 也称为软错误,它由噪声产生,会在数据中导致瞬时、不一致的错误,这与组件故障无关 - 大多数情况下是宇宙辐射产生的结果。

重复错误(常称为硬错误)是由故障组件造成的。硬错误是由故障组件或电路板级问题造成的,例如制造不当的印刷电路板会导致同一错误的重复发生。

解决方法

如果该错误消息仅出现一次或很少出现,请监控交换机 syslog,确认该错误是否为孤立事件。如果这些错误消息重复出现,请重新安装 Supervisor 引擎刀片。如果错误停止,则这是硬奇偶校验错误。如果这些错误消息继续重复出现,请通过技术支持中心建立案例。

%SYSTEM_CONTROLLER-SW2_SPSTBY-3-ERROR :Error condition detected:TM_NPP_PARITY_ERROR

问题

交换机报告以下错误消息:

  • %SYSTEM_CONTROLLER-SW2_SPSTBY-3-ERROR :Error condition detected:TM_NPP_PARITY_ERROR

说明

此错误消息指示有奇偶校验错误,并且可能的原因是随机的静电或其他外部要素,导致内存奇偶错误,例如一瞬变Back面板连接或也许发生由于电源问题,并且有时线卡不是可以访问序列PROM (SPROM)内容在模块为了确定线卡的识别。

所有计算机和网络系统是易受作为奇偶校验错误单个事件翻倒(SEU),有时描述的少见的事件。这些个别位错误在数据字出现,当有点意外地更改由于外部事件和因而原因,例如,零本能地更改到那个。SEUs是一种通用现象不考虑供应商和技术。SEU 发生频率很低,但所有计算机和网络系统,甚至是 PC 都有可能发生这样的问题。SEUs也呼叫软件错误,是由噪声造成的并且导致在数据的一个瞬变,不一致错误,并且与组件故障是无关的。

重复错误,经常是指的硬错误,是由发生故障的组件造成的。硬错误由一个发生故障的组件或者一板级别问题造成例如导致同一个错误的被重复的出现的不正确地被制造的印刷电路板。

解决方法

如果这些错误消息再发生,在维护窗口期间,请重新安装Supervisor模块。

SP :Linecard endpoint of Channel 14 lost Sync.to Lower fabric and trying to recover now!

问题

交换机报告以下错误消息:

  • SP :Linecard endpoint of Channel 14 lost Sync.to Lower fabric and trying to recover now!

说明

错误消息通常指向一个安装不当的板卡。大多数情况下,您可以实际重新安装这一板卡以解决该问题。在某些情况下,模块存在故障。

  1. 发出 show fabric fpoe map 命令,以识别导致该错误消息的模块。

    Switch#configure terminal
    Switch(config)#service internal
    Switch(config)#end
    Switch#show fabric fpoe map
    Switch#configure terminal
    Switch(config)#no service internal
    Switch(config)#end
    

    以下示例是 show fabric fpoe map 命令的结果。从输出信息中,您可以确定此错误消息是由插槽 12 中的模块导致的。

    switch#show fabric fpoe map 
    
    slot channel   fpoe 
    
      12     0    14  <<
    
    
    There are also related errors in "show fabric channel-counters" :
    
    slot channel   rxErrors   txErrors    txDrops  lbusDrops
        1       0          1          0          0          0
        2       0         16          0          0          0
        3       0         16          0          0          0
  2. 重新安装导致错误消息的模块。

%SYSTEM-1-INITFAIL :Network boot is not supported

问题

Cisco Catalyst 6000/6500 交换机启动时,它会给出类似以下的错误消息:

%SYSTEM-1-INITFAIL: Network boot is not supported.

Invalid device specified
Booting from default device
Initializing ATA monitor library...
monlib.open(): Open Error = -13
loadprog: error - on file open
boot: cannot load "bootdisk:s72033-ipservicesk9-mz.122-18.SXF7.bin"

说明

在未正确配置启动变量以从有效闪存设备中启动交换机时,通常会出现此错误。

注意以上示例消息的最后一行:

boot: cannot load "bootdisk:s72033-ipservicesk9-mz.122-18.SXF7.bin"

其中提及的闪存设备名称为 bootdisk,并且通过 IOS 文件名的第一部分 s72033 可以看出,该 IOS 用于 Supervisor 模块 720。Supervisor 720 模块没有或不支持名为 bootdisk 的闪存设备。因为 Supervisor 720 模块没有符合该名称的本地闪存,交换机认为您希望从网络启动,所以它显示了这一错误消息。

解决方法

使用正确的闪存设备名称和有效的软件文件名配置启动变量。

Supervisor 模块支持以下这些闪存设备:

  • Supervisor 引擎 1 和 Supervisor 引擎 2

    闪存设备名称 说明
    Bootflash : 板载闪存
    slot0: 线性闪存 PC 卡(PCMCIA 插槽)
    disk0: ATA 闪存 PC 卡(PCMCIA 插槽)

  • Supervisor 引擎 720

    闪存设备名称 说明
    Bootflash : 板载闪存
    disk0: 仅 CompactFlash II 型卡(disk 0 插槽)
    disk1 : CompactFlash II 型卡(disk 1 插槽)

  • Supervisor 引擎 32

    闪存设备名称 说明
    启动盘: 板载闪存
    disk0: 仅 CompactFlash II 型卡(disk 0 插槽)

如果该方法无法解决问题,请参阅从损坏或丢失的启动加载程序映像或 ROMmon 模式中恢复运行 Cisco IOS 系统软件的 Catalyst 6500/6000

CPU_MONITOR-3-TIMED_OUT 或 CPU_MONITOR-6-NOT_HEARD

问题

交换机报告以下错误消息:

CPU_MONITOR-3-TIMED_OUT: CPU monitor messages have failed, resetting system
CPU_MONITOR-6-NOT_HEARD: CPU monitor messages have not been heard for [dec] seconds

说明

这些消息表示已有很长时间未侦听 CPU 监控消息。很可能发生了超时,使得系统重置。[[dec] 为秒数。

问题的发生可能是由于以下这些原因:

  • 板卡或模块安装不当

  • ASIC 或底板受损

  • 软件 Bug

  • 奇偶校验错误

  • 以太网带外信道 (EOBC) 信道中流量过高

    EOBC 信道是一种半双工信道,供其他多种功能使用,其中包括发往交换机的简单网络管理协议 (SNMP) 数据流和数据包。如果因 SNMP 流量激增而导致 EOBC 信道充满消息,便会发生信道冲突。发生这种情况时,EOBC 可能会无法传输 IPC 消息。这就导致交换机显示该错误消息。

解决方法

重新安装板卡或模块。如果可以安排维护窗口,请重置交换机以清除所有瞬时问题。

% Invalid IDPROM image for linecard

问题

运行 Cisco IOS 系统软件的 Catalyst 6500 系列交换机会收到 %Invalid IDPROM image for linecard 错误消息。

该错误消息看起来可能会与这些消息类似:

% Invalid IDPROM image for daughterboard 1 in slot 4 (error = 4)
% Invalid IDPROM image for linecard in slot 5 (error = 4)
% Invalid IDPROM image for daughterboard 1 in slot 5 (error = 4)

说明

该错误消息表示由于 Supervisor 在控制总线上生成了错误信号,导致安装的板卡未得到正确启动。某些情况下可以看到,安装不当也会导致 Cat6500 机箱无法识别 Supervisor 或板卡。有关详细信息,请参阅 Cisco bug ID CSCdz65855仅限注册用户)。

解决方法

如果冗余 Supervisor 设置可用,请执行强制切换并且重新安装原始活动 Supervisor。

如果是单个 Supervisor 设置,请安排停机时间,并且完成这些步骤:

  1. 将 Supervisor 模块移到另一个插槽中。

  2. 重新安装所有的板卡,并确保板卡安装到位。

    有关模块在线插拔的详细信息,请参阅 Cisco Catalyst 交换机中模块的在线插拔 (OIR)

%CPU_MONITOR-SP-6-NOT_HEARD或%CPU_MONITOR-SP-3-TIMED_OUT

问题

交换机报告以下错误消息:

%CPU_MONITOR-SP-6-NOT_HEARD: CPU_MONITOR messages have not been heard for 61 seconds [2/0]
%CPU_MONITOR-SP-6-NOT_HEARD: CPU_MONITOR messages have not been heard for 151 seconds [2/0]
%CPU_MONITOR-SP-3-TIMED_OUT: CPU_MONITOR messages have failed, resetting module [2/0]
%OIR-SP-3-PWRCYCLE: Card in module 1, is being power cycled off (Module not responding to Keep Alive polling)
%OIR-SP-3-PWRCYCLE: Card in module 2, is being power-cycled off (Heartbeat Messages Not Received From Module)

说明

Supervisor发送一次SCP ping每2秒对每线卡。如果无响应在3 ping (6秒)以后接收,算作是第一失败。在25个这样连续故障以后,或者在150秒不接收之后从线卡的一答复, Supervisor重新通电线卡。在每30秒之后,此错误消息在交换机被看到:

%CPU_MONITOR-SP-6-NOT_HEARD: CPU_MONITOR messages have not been heard for 61 seconds [2/0]
%CPU_MONITOR-SP-6-NOT_HEARD: CPU_MONITOR messages have not been heard for 151 seconds [2/0]

在150秒之后,模块获得重新通电与这些Syslog :

%CPU_MONITOR-SP-3-TIMED_OUT: CPU_MONITOR messages have failed, resetting module [2/0]
%OIR-SP-3-PWRCYCLE: Card in module 1, is being power-cycled off (Module not responding to Keep Alive polling)
%OIR-SP-3-PWRCYCLE: Card in module 2, is being power-cycled off (Heartbeat Messages Not Received From Module)

%C6KPWR-4-DISABLED :Power to module in slot [dec] set [chars]

问题

交换机报告以下错误消息:

%C6KPWR-4-DISABLED: Power to module in slot [dec] set [chars]

以下示例显示了发生该问题时所显示的控制台输出:

%C6KPWR-SP-4-DISABLED: power to module in slot 10 set off (Fabric channel errors)
%C6KPWR-SP-4-DISABLED: power to module in slot 2 set off (Module Failed SCP dnld)
%C6KPWR-SP-4-DISABLED: power to module in slot 9 set off (Module not responding to Keep Alive polling)

说明

该消息表示在所示插槽中的模块由于所示原因而被断电。[dec] 为插槽编号,[chars] 表示电源状态。

交换机存在正常振动,随着时间的推移,这些振动会导致模块轻微脱离底板。发生这一情况时,Supervisor keepalive 轮询将无法在分配的时间内收到来自该模块的响应,Supervisor 会重新启动该模块以尝试获得与该模块建立更好的连接。如果模块仍然不响应轮询,Supervisor 将连续重新启动模块,并最终将其置为 error disable,且不允许为该模块提供电源。

解决方法

简单地重新安装该模块可在 90% 的时间修复这一问题。如果重新安装该模块,则可重新对齐交换矩阵并确保与底板稳固连接。

如果有问题的模块是内容交换模块 (CSM),请考虑将 CSM 软件升级至版本 4.1(7) 或更高版本。此问题记录在 Cisco bug ID CSCei85928(针对 CSM 软件)仅限注册用户)和 Cisco bug ID CSCek28863(针对 Cisco IOS 软件)(仅限注册用户)中。

最新的 CSM 软件可以从 Cisco Catalyst 6000 内容交换模块软件下载页下载。

ONLINE-SP-6-INITFAIL :Module [dec]:Failed to [chars]

问题

交换机报告以下错误消息:

ONLINE-SP-6-INITFAIL: Module [dec]: Failed to [chars]

以下示例显示了发生该问题时所显示的控制台输出:

%ONLINE-SP-6-INITFAIL: Module 5: Failed to synchronize Port asic

说明

崩溃的原因是 Pinnacle ASIC 同步失败。这通常是由于接触不良或卡安装不当造成的。

解决方法

无需用户干涉,系统将会恢复。如果该错误消息重复出现,请重新安装有问题的板卡或模块。

FM_EARL7-4-FLOW_FEAT_FLOWMASK_REQ_FAIL

问题

交换机报告以下错误消息:

%FM_EARL7-4-FLOW_FEAT_FLOWMASK_REQ_FAIL: Flowmask request for the flow based 
feature [chars] for protocol [chars] is unsuccessful, hardware acceleration may be disabled 
for the feature

以下示例显示了发生该问题时所显示的控制台输出:

%FM_EARL7-4-FLOW_FEAT_FLOWMASK_REQ_FAIL: Flowmask request for the flow based 
feature Reflexive ACL for protocol IPv4 is unsuccessful, hardware acceleration may be disabled 
for the feature

说明

基于流的功能的流掩码请求不成功。发生这种情况的原因可能是 TCAM 资源异常、流掩码寄存器资源异常,或与其他基于 NetFlow 的功能存在无法解决的流掩码冲突。在这种情况下,可能会禁用该功能的 NetFlow 快捷方式安装和硬件加速,并在软件中应用该功能。

如果仅有入口自反 ACL,并在不同接口的入口方向配置反射和评估,则自反 ACL 流掩码要求将基于入口自反 ACL。只要配置自反 ACL 的接口与 QoS 微流策略不同,或在同一接口上但自反 ACL 与微流策略策略 ACL 无重叠,两者就可以在硬件中共存。如果两者在同一接口上,且自反 ACL 和 QoS 策略重叠,则自反 ACL 将禁用 NetFlow 快捷方式安装,流量匹配自反 ACL 将使用软件进行交换。这是因为流掩码请求相互冲突。

对于出口自反 ACL,因为只有入口 NetFlow,所以自反 ACL 流掩码请求在所有接口上是全局性的。如果在这种情况下配置基于 QoS 用户的微流策略,自反 ACL 将禁用 NetFlow 快捷方式安装,流量匹配自反 ACL 将使用软件进行交换。

解决方法

发出 show fm fie flowmask 命令,确定该功能的 NetFlow 快捷方式安装启用/禁用状态。如果该功能的 NetFlow 快捷方式安装和硬件加速处于禁用状态,请仅使用入口自反访问列表和微流策略,确保微流监察器与自反访问列表无重叠。重新应用该功能,以使流掩码请求成功,并重新启用该功能的 NetFlow 快捷方式安装。

MCAST-2-IGMP_SNOOP_DISABLE

问题

交换机报告以下错误消息:

%MCAST-2-IGMP_SNOOP_DISABLE:IGMP Snooping disabled due to excessive events/packets, 
[dec]/[dec]; auto reenable in about 2 mins

以下示例显示了发生该问题时所显示的控制台输出:

%MCAST-2-IGMP_SNOOP_DISABLE:IGMP Snooping disabled due to excessive events/packets, 
0/19880; auto reenable in about 2 mins

说明

IGMP 监听已禁用,但是系统收到了多播数据流。这种情况将强制多播数据包发往路由处理器,可能会导致路由处理器泛洪。IGMP 监听会因为多播数据流过量而自动禁用。基本上,IGMP 监听会查看在路由器和主机之间交换的这些控制数据包,并根据加入、离开和查询更新收到多播数据流的端口。

出现该消息的原因通常是,路由处理器收到的发往预留第 3 层/第 2 层多播地址范围的 IGMP 加入数据包或正常多播数据包远远高于预期比率。因此交换机耗尽了资源,正如日志消息所报告的,交换机将在短时期内减少和禁用 IGMP 监听。

解决方法

可以启用多播速度限制功能,并将阈值设置为更大的数值。

速度限制是一个较理想的方法,它使队列无法溢出,同时也意味着有效 IGMP 数据包被丢弃的机会更小,因此交换机上的监听进程仍可以适当更新。

要对此问题进行故障排除,请执行以下步骤:

  1. 使用命令 no ip igmp snooping 禁用 IGMP 监听。

  2. 在 Catalyst 6500 的管理 VLAN 接口上设置 SPAN 会话,以确定 MAC 地址属于过量数据流源。

  3. 查看 CAM 表,以识别并删除该源。

  4. 重新启用 IGMP 监听。

C6KERRDETECT-2-FIFOCRITLEVEL :System detected an unrecoverable resources error on the active supervisor pinnacle

问题

交换机报告以下错误消息。错误消息可以是以下两种类型之一:

C6KERRDETECT-2-FIFOCRITLEVEL: System detected an unrecoverable resources error on the active supervisor pinnacle
C6KERRDETECT-2-FIFOCRITLEVEL: System detected unrecoverable resources error on active supervisor port-asic 

说明

该错误的根本原因可能是有缺陷的模块或安装不当的模块。也可能是该特定插槽有问题的机箱。如果是因为模块安装不当,则该问题可能是个瞬时问题。

这些消息表明系统检测到了不可恢复的资源,原因在于所示 Pinnacle ASIC 或指定端口 ASIC 上存在先进先出 [FIFO] 问题。

解决方法

发出 remote command switch show platform hardware asicreg pinnacle slot 1 port 1 err 命令解决此错误,并使用以下这些步骤对交换机进行配置以运行增强型硬件测试:

注意: 键入整个命令并按 Enter 键。您无法使用 Tab 键写入命令。

  1. 发出 diagnostic bootup level complete 命令将诊断级别设置为完成,并保存配置。

  2. 重新安装 Supervisor 并将其牢固插入

  3. 一旦 Supervisor 联机,请发出 show diagnostic 命令监控交换机,检查错误消息是否仍然存在

%C6KERRDETECT-SP-4-SWBUSSTALL :交换总线体验停转3秒

问题

交换机报告以下错误消息:

  • %C6KERRDETECT-SP-4-SWBUSSTALL :交换总线体验停转3秒

  • %C6KERRDETECT-SP-4-SWBUSSTALL_RECOVERED :交换总线停转被恢复,并且数据流交换继续

说明

%C6KERRDETECT-SP-4-SWBUSSTALL消息指示交换总线停止,并且数据流丢失。

%C6KERRDETECT-SP-4-SWBUSSTALL_RECOVERED消息表明交换总线不再停止,并且数据流能继续。

基本上,如果在系统总线的任何一个模块暂停然后Supervisor检测超时并且设法独自地恢复。如果是这些消息的一个非常可能的原因的模块是在那么安装过程中,因为这能导致总线停转,当模块获得供以座位到背板时。

SP-RP Ping Test[7]:Test skipped due to high traffic/CPU utilization

问题

当带内测试 ping 由于 CPU 使用率过高而失败时,就会收到这一错误消息:

SP-RP Ping Test[7]: Test skipped due to high traffic/CPU utilization

说明

SP-RP 带内 ping 是一种联机诊断测试,SP-RP ping test failed 消息纯粹用于提供信息。它表示 CPU 使用率过高,可能是过量数据流通过路由处理器的结果,或是交换数据流流向交换机处理器的结果。这也可能在任何路由更新时发生。有时候路由处理器 CPU 使用率达到 100% 是正常的。

解决方法

该错误消息纯粹用于提供信息,不会对设备性能产生任何影响。

SW_VLAN-4-MAX_SUB_INT

问题

交换机报告以下错误消息:

%SW_VLAN-4-MAX_SUB_INT : The number of sub-interfaces allocated for interface [chars] has 
exceeded recommended limits of [dec]

以下示例显示了发生该问题时所显示的控制台输出:

%SW_VLAN-4-MAX_SUB_INT: The number of sub-interfaces allocated for interface Gi1/1 has
exceeded recommended limits of 1000

说明

第 3 层子接口的数量受到交换机内部 VLAN 的限制。Catalyst 6500 系列有 4094 个 VLAN,用于多种目的。发出 show platform hardware capacity vlan 命令,以了解当前 VLAN 的可用性状态。

Switch#show platform hardware capacity vlan

VLAN Resources
  VLANs: 4094 total, 9 VTP, 0 extended, 17 internal, 4068 free

解决方法

推荐每个接口限制 1000 个子接口,每个模块限制 2000 个子接口。超出推荐的限制时,请减少为接口所分配的子接口数量。

注意: 控制台会因为交换机重新加载时显示大量的这些消息而锁定。此问题记录在 Cisco bug ID CSCek73741仅限注册用户)中,并已在 Cisco IOS 软件版本 12.2(18)SXF10 和 Cisco IOS 软件版本 12.2(33)SXH 或更高版本中得到解决。

MCAST-6-L2_HASH_BUCKET_COLLISION

问题

交换机报告以下错误消息:

MCAST-6-L2_HASH_BUCKET_COLLISION: Failure installing (G,C)->index: 
([enet],[dec])->[hex] Protocol :[dec] Error:[dec]

以下示例显示了发生该问题时所显示的控制台输出:

%MCAST-SP-6-L2_HASH_BUCKET_COLLISION: Failure installing (G,C)->index: 
(0100.5e31.d522,802)->0xDA4 Protocol :0 Error:3

该错误消息通常与以下消息一同出现:

%MCAST-SP-6-GC_LIMIT_EXCEEDED: IGMP snooping was trying to allocate 
more Layer 2 entries than what allowed (15488)

说明

该消息表示第 2 层条目未在硬件中安装,因为 Hash Bucket 内没有足够的空间。多播数据包在传入 VLAN 中泛洪,因为第 2 层条目安装失败。当超过限制时,其他的组 MAC 也将发生泛洪。

解决方法

如果未使用多播,则可以禁用 IGMP 监听。否则,请使用 ip igmp snooping l2-entry-limit 命令提高散列条目限制。

%QM-4-AGG_POL_EXCEEDED :QoS Hardware Resources Exceeded:Out of Aggregate policers

问题

交换机报告以下错误消息:

%QM-4-AGG_POL_EXCEEDED: QoS Hardware Resources Exceeded : Out of Aggregate policers

说明

仅有限数量的聚合监察器可得到支持。在基于 EARL7 的交换机上,该限制为 1023。

解决方法

您可以配置基于 VLAN 的 QoS,而不是基于端口的 QoS。完成这些步骤:

  1. 对第 2 层交换机端口上配置的每个 VLAN 应用服务策略。

  2. 从属于特定 VLAN 的每个端口上删除服务策略。

  3. 使用 mls qos vlan-based 命令为每个第 2 层交换机端口配置基于 VLAN 的 QoS。

%EC-SP-5-CANNOT_BUNDLE2 :不是与Gi2/1兼容,并且被暂停(Gi2/2 MTU是1500, Gi2/1是9216)

问题

交换机报告以下错误消息:

  • %EC-SP-5-CANNOT_BUNDLE2 :不是与Gi2/1兼容,并且被暂停(Gi2/2 MTU是1500, Gi2/1是9216)

说明

此错误消息指示端口通道成员的MTU不是同样,因此添加失败的原因端口通道。默认情况下所有接口使用了MTU大小作为1500。由于不匹配MTU值,端口不能添加到端口通道。

解决方法

在那些成员端口配置同样MTU。

%EC-SP-5-CANNOT_BUNDLE2 :Gi1/4不是与Gi6/1兼容,并且被暂停(Gi1/4流量控制发送关闭, Gi6/1打开)

问题

交换机报告以下错误消息:

  • %EC-SP-5-CANNOT_BUNDLE2 :Gi1/4不是与Gi6/1兼容,并且被暂停(Gi1/4流量控制发送关闭, Gi6/1打开)

说明

此错误消息指示速度或一流量控制不匹配,因此原因是添加失败的端口信道。

解决方法

验证接口配置参加端口通道。

%CFIB-7-CFIB_EXCEPTION :FIB TCAM exception, Some entries will be software switched

问题

交换机报告以下错误消息:

%CFIB-7-CFIB_EXCEPTION: FIB TCAM exception, Some entries will be software switched

说明

错误消息表明安装路由条目的编号将到达硬件FIB产能或最大路由限制设置为指定的协议。如果限制达到,一些前缀丢弃。

解决方法

重新加载路由器为了退出例外模式。输入MLS CEF maximum routes命令在全局配置模式为了增加路由最大协议的。默认情况下,在SUP的一个PFC3有192K条目产能,但是,如果使用MLS CEF最大数量路由239命令,这给出选项使用最大可用的TCAM条目。请使用show mls cef maximum-routes命令为了检查最大数量路由。请使用show mls cef summary命令,显示CEF表信息摘要,为了检查当前使用情况。

模块失败TestMatchCapture测验

问题

模块5(supervisor)如从show diagnostic result module module_-的此输出所示失败TestMatchCapture诊断测试:

TestMatchCapture ----------------> F


          Error code ------------------> 59 (DIAG_L2_INDEX_MISMATCH_ERROR)

          Total run count -------------> 1

          Last test execution time ----> Jun 25 2011 04:49:10

          First test failure time -----> Jun 25 2011 04:49:10

          Last test failure time ------> Jun 25 2011 04:49:10

          Last test pass time ---------> n/a

          Total failure count ---------> 1

          Consecutive failure count ---> 1

说明

TestMatchCapture测验是TestProtocolMatchChannelTestCapture测验的组合如描述此处:

  • TestProtocolMatchChannel — TestProtocolMatchChannel测验在Layer2转发引擎里验证能力匹配特定Layer2协议。当您运行在Supervisor引擎时的测验,诊断程序包从Supervisor引擎的带内端口发送并且用Layer2转发引擎执行数据包查找。对于支持DFC的模块,诊断程序包从Supervisor引擎的带内端口发送通过交换矩阵并且从其中一个是循环DFC端口。匹配功能验证在诊断程序包查找期间乘Layer2转发引擎。

  • TestCapture — TestCapture测验验证Layer2转发引擎捕获功能是工作正常。捕获功能使用组播复制。当您运行在Supervisor引擎时的测验,诊断程序包从Supervisor引擎的带内端口发送并且用Layer2转发引擎执行数据包查找。对于支持DFC的模块,诊断程序包从Supervisor引擎的带内端口发送通过交换矩阵并且从其中一个是循环DFC端口。捕获功能验证在诊断程序包查找期间乘Layer2转发引擎。

解决方法

执行模块的重新安装,每当您获得机会。因为这些是较小错误,他们可以忽略,如果看不到在性能的任何影响。

%CONST_DIAG-SP-3-HM_PORT_ERR :在模块2的Port5失败10连续的倍。禁用端口

问题

交换机报告以下错误消息:

%CONST_DIAG-SP-3-HM_PORT_ERR: Port [dec] on module [dec] failed [dec]
	 consecutive times. Disabling the port.

以下示例显示了发生该问题时所显示的控制台输出:

%CONST_DIAG-SP-3-HM_PORT_ERR: Port 5 on module 2 failed 10 consecutive
	 times. Disabling the port.

说明

错误消息表明对应于端口的数据路径失败。端口被放到errDisable状态

解决方法

重置线卡为了发现问题是否解决自己。

%CONST_DIAG-SP-4-ERROR_COUNTER_WARNING :模块7错误计数器超出阈值,系统操作继续

问题

交换机报告以下错误消息:

%CONST_DIAG-SP-4-ERROR_COUNTER_WARNING: Module 7 Error counter 
exceeds threshold, system operation continue.
%CONST_DIAG-SP-4-ERROR_COUNTER_DATA: ID:42 IN:0 PO:255 RE:200 RM:255 DV:2 EG:2 CF:10 TF:117

说明

检查诊断结果:

TestErrorCounterMonitor ---------> .

    Error code ------------------> 0 (DIAG_SUCCESS)
    Total run count -------------> 33658
    Last test execution time ----> Apr 15 2012 11:17:46
    First test failure time -----> Apr 03 2012 20:11:36
    Last test failure time ------> Apr 08 2012 19:24:47
    Last test pass time ---------> Apr 15 2012 11:17:46
    Total failure count ---------> 5
    Consecutive failure count ---> 0
    Error Records ---------------> n/a

TestErrorCounterMonitor通过周期地轮询监控错误/中断在每个模块在系统在线卡维护的错误计数器的。

当在线卡的ASIC收到有坏CRC的时,数据包此错误消息冒出。问题是本地对此模块或可以由在机箱的一些其他有故障的模块触发。这可以也归结于有从DBUS的Pinnacle ASIC接收的坏CRC的帧。即错误消息暗示坏数据包在模块7.的总线间接收。

其中一个错误消息的原因能发生是正确通信的模块的无法与机箱的背板由于MIS装置模块。问题是线卡(误定位的模块), Supervisor或者数据总线。然而,说是不可能的什么组件破坏数据并且导致坏CRC。

解决方法

  • 首先请进行再置模块7并且确保螺丝很好被拉紧。并且,在重新安装,请设置诊断用diagnostic bootup level完整命令前完成。

  • 一旦再置完成,全双工诊断在模块将运行。然后,您能确认没有在模块7.的硬件问题。

%SYS-3-PORT_RX_BADCODE :波尔特3/43检测7602在为时的坏代码错误30分钟

问题

交换机报告以下错误消息:

%SYS-3-PORT_RX_BADCODE:Port [dec]/[chars] detected [dec] bad code errors in last 30 minutes

以下示例显示了发生该问题时所显示的控制台输出:

%SYS-3-PORT_RX_BADCODE: Port 3/43 detected 7602 bad code error(s) in last 30 minutes

说明

此错误消息表明端口受影响与未知协议错误。例如,不已知亦不识别的Catalyst 6500系列交换机接收有协议的帧。第一[dec]是模块号, [chars]是端口号,并且第二[dec]是入站数据包数量有在最后30分钟内遇到的未知协议的。

这些是错误消息的可能的原因:

  • 由于不匹配的速度和双工设置。

  • CDP启用在一端和不在另一端。

  • 默认情况下由于DTP,这在交换机接口启用。因为路由器不了解DTP,这能导致一些问题。

解决方法

检查在接口的不全计数器。如果它增加,则可能有在接口的双工不匹配。

相关的思科支持社区讨论

思科支持社区是您提问、解答问题、分享建议以及与工作伙伴协作的论坛。


相关信息


Document ID: 41265