本文档介绍如何对Cisco Nexus 7000系列交换机上的单向链路检测(UDLD)错误消息进行故障排除。
思科建议您对以下主题有基本的了解:
本文档中的信息基于以下软件和硬件版本:
本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。
端口在UDLD检测过程中交换UDLD数据包,以包括发起方交换机ID和发起方端口ID。收到UDLD数据包后,交换机将对等交换机ID和端口ID回传到对等设备。交换机交换回声数据包后,便形成双向关系。
当交换机未从其UDLD对等体接收预期信息时,存在UDLD错误情况。
本文档介绍以下UDLD错误情况以及如何对其进行故障排除:
本节介绍各种类型的UDLD错误情况和一些可能的原因。
当交换机A从交换机B收到UDLD帧时,不会出现Switch-A交换机ID和端口ID的预期回声。
当检测到空回声时,UDLD执行以下操作:
模式
|
操作
|
---|---|
正常模式 | err-disable端口 |
积极模式 | err-disable端口 |
然后生成以下系统日志消息:
2015 Mar 19 11:57:56.155 N7kA ETHPORT-2-IF_DOWN_ERROR_DISABLED Interface Ethernet1/2
is down (Error disabled. Reason:UDLD empty echo)
2015 Mar 19 11:57:56.186 N7kA ETH_PORT_CHANNEL-5-PORT_INDIVIDUAL_DOWN individual port
Ethernet1/2 is down
2015 Mar 19 11:57:56.336 N7kA ETHPORT-2-IF_DOWN_ERROR_DISABLED Interface Ethernet1/2
is down (Error disabled. Reason:UDLD empty echo)
以下是导致此情况的一些可能原因
当从发送UDLD帧的同一端口上收到UDLD帧时,会发生这种情况。
当检测到Tx-Rx环路时,UDLD执行以下操作:
模式
|
操作
|
---|---|
正常模式 | err-disable端口 |
积极模式 | err-disable端口 |
然后生成以下系统日志消息:
2015 Mar 20 14:52:30 N7kA %ETHPORT-2-IF_DOWN_ERROR_DISABLED: Interface Ethernet17/5
is down (Error disabled. Reason:UDLD Tx-Rx Loop)
2015 Mar 20 14:52:30 N7kA %ETHPORT-2-IF_DOWN_ERROR_DISABLED: Interface Ethernet17/5
is down (Error disabled. Reason:UDLD Tx-Rx Loop)
以下是导致此情况的一些可能原因:
当交换机A上的端口A从端口接收帧时,就会出现此情况,该端口不是它已经形成UDLD双向关系的端口。
当检测到邻居不匹配时,UDLD执行以下操作:
模式
|
操作
|
---|---|
正常模式 | err-disable端口 |
积极模式 | err-disable端口 |
然后生成以下系统日志消息:
2015 Mar 21 10:23:05.598 N7kA %ETHPORT-2-IF_DOWN_ERROR_DISABLED: Interface Ethernet3/21
is down (Error disabled. Reason:UDLD Neighbor mismatch)
2015 Mar 21 10:24:07.065 N7kA %ETHPORT-2-IF_DOWN_ERROR_DISABLED: Interface Ethernet3/21
is down (Error disabled. Reason:UDLD Neighbor mismatch)
以下是导致此情况的一些可能原因:
当已形成双向关系的端口在超时间隔(默认为50秒)内未收到UDLD帧时,会出现此情况。
检测到此情况时,UDLD会执行以下操作:
模式
|
操作
|
---|---|
正常模式 | UDLD将端口标记为未确定,并且该端口根据其生成树端口状态继续运行 |
积极模式 | err-disable端口 |
本节介绍在遇到UDLD错误禁用端口时应完成的一般故障排除步骤。
由于UDLD错误表示物理层故障,因此在物理层进行故障排除是合适的。遇到UDLD错误消息时,请考虑以下问题:
使用此命令可恢复UDLD已进入错误禁用模式的所有端口:
N7KA(config)# udld reset
使用此命令可验证双向关系:
N7KA-NORTH-AGG(config-if)# show udld eth 3/4
Interface Ethernet3/4
--------------------------------
Port enable administrative configuration setting: enabled
Port enable operational state: enabled
Current bidirectional state: bidirectional
Current operational state: advertisement - Single neighbor detected
Message interval: 7
Timeout interval: 5
Entry 1
----------------
Expiration time: 39
Cache Device index: 1
Current neighbor state: bidirectional
Device ID: JAF1620ABAB
Port ID: Ethernet3/12
Neighbor echo 1 devices: JAF1617BACD
Neighbor echo 1 port: Ethernet3/4
Message interval: 15
Timeout interval: 5
CDP Device name: N7KB-SOUTH-AGG(JAF1620ABAB)
Last pkt send on: 400096, Aug 6 13:58:52 2014
Probe pkt send on: 400096, Aug 6 13:58:52 2014
Echo pkt send on: 395799, Aug 6 13:58:43 2014
Flush pkt send on: None.
Last pkt recv on: 740333, Aug 6 13:58:52 2014
Probe pkt recv on: 740333, Aug 6 13:58:52 2014
Echo pkt recv on: 730454, Aug 6 13:58:43 2014
Flush pkt recv on: None.
Deep pkt inspections done: None.
Mismatched if index found: None.
Deep pkt inspection drops: None.
使用此命令可验证物理接口上的错误计数器,该计数器确定UDLD帧是否因物理层硬件故障而被丢弃:
RTP-Agg1# show interface ethernet 4/1 | i error|CRC|discard|drop
0 runts 0 giants 0 CRC/FCS 0 no buffer
0 input error 0 short frame 0 overrun 0 underrun 0 ignored
0 watchdog 0 bad etype drop 0 bad proto drop 0 if down drop
0 input with dribble 0 input discard
0 output error 0 collision 0 deferred 0 late collision
0 lost carrier 0 no carrier 0 babble 0 output discard
使用此命令可检查CPU利用率,CPU利用率确定高CPU利用率是否会阻止处理UDLD帧:
N7K-A# show system resources
Load average: 1 minute: 0.17 5 minutes: 0.25 15 minutes: 0.20
Processes : 1993 total, 1 running
CPU states : 0.18% user, 0.81% kernel, 98.99% idle
本节介绍在恢复链路之前(如果情况允许)应收集的输出,以便为思科技术支持中心(TAC)提供最佳机会,以诊断UDLD将链路置于错误禁用模式的根本原因:
版本 | 发布日期 | 备注 |
---|---|---|
1.0 |
22-Apr-2015 |
初始版本 |