思科接口和模块 : Cisco Nexus 7000 M1-Series 32-Port 10 Gigabit Ethernet Module

根据错误日志的连结7000系列M132XP-12模块故障排除

2016 年 10 月 24 日 - 机器翻译
其他版本: PDFpdf | 英语 (2015 年 8 月 22 日) | 反馈

简介

本文描述使用为了确定的进程Cisco连结7000系列(N7K) M132XP-12或N7K-M132XP-12L模块是否需要为退货授权(RMA)发送。

贡献用Yogesh Ramdoss,罗伯特Hurst,文森特Ng, Cisco TAC工程师。

先决条件

要求

思科建议您有连结操作系统CLI的知识。

使用的组件

本文档中的信息根据N7K M132XP-12线路卡。

本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。

背景信息

一旦N7K-M132XP-12模块的怀疑的硬件故障,原因可能是从RMA没有要求的软件缺陷。

本文列出出现的症状,并且提供要求的故障排除步骤为了确定模块的健康。

情形 1:失败的N7K-M132XP-12诊断“波尔特环回”测验

症状

模块体验诊断失败,并且此Syslog被观察:
%DIAG_PORT_LB-2-PORTLOOPBACK_TEST_FAIL: Module:18 Test:
PortLoopback failed 10 consecutive times. Faulty module:
Module 18 affected ports:23 Error:Loopback test failed.
Packets lost on the LC at the Queueing engine ASIC

N7k# show diagnostic result module 18


Current bootup diagnostic level: complete
Module 18: 10 Gbps Ethernet Module


        Test results: (. = Pass, F = Fail, I = Incomplete,
        U = Untested, A = Abort, E = Error disabled)


         1) EOBCPortLoopback--------------> .
         2) ASICRegisterCheck-------------> E
         3) PrimaryBootROM----------------> .
         4) SecondaryBootROM--------------> .
         5) PortLoopback:


          Port   1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16
          -----------------------------------------------------
                 U  U  I  I  I  I  I  I  U  U  I  .  I  .  I  .


          Port  17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
          -----------------------------------------------------
                 U  U  .  .  U  U  E  .  U  U  I  I  I  I  I  I


         6) RewriteEngineLoopback:


          Port   1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16
          -----------------------------------------------------
                 .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .


          Port  17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
          -----------------------------------------------------
                 .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .


"show module"
N7k# show module
Mod  Ports  Module-Type                      Model              Status
---  -----  -------------------------------- ------------------ ------------
16   32     10 Gbps Ethernet Module          N7K-M132XP-12      ok
17   32     10 Gbps Ethernet Module          N7K-M132XP-12      ok
18   32     10 Gbps Ethernet Module          N7K-M132XP-12      ok

        
Mod  Sw              Hw
---  --------------  ------
16   4.2(6E5)        2.0    
17   4.2(6E5)        1.7    
18   4.2(6E5)        1.7    


Mod  MAC-Address(es)                         Serial-Num
---  --------------------------------------  ----------
16   50-3d-e5-b8-5e-10 to 50-3d-e5-b8-5e-34  JAF1504CPAR
17   88-43-e1-c7-0b-90 to 88-43-e1-c7-0b-b4  JAF1405BJLJ
18   88-43-e1-c7-60-c0 to 88-43-e1-c7-60-e4  JAF1405CLML


Mod  Online Diag Status
---  ------------------
16   Fail
17   Pass
18   Fail

核对清单

此方案可能归结于Cisco Bug ID CSCtn81109CSCti95293

为了验证问题引起的由软件缺陷或是由需要RMA的实际硬件故障,请完成这些步骤:

  1. 确认NX-OS版本是否配比与分布式缺陷跟踪系统(DDTS)版本。两DDTS在版本5.2.4修复并且验证。

  2. 当诊断消息观察为了查看诊断测试失败的时间戳时,请输入show log命令。确定是否有在同一时间附近发生的任何CPU问题。有时,当CPU被淹没时,它造成诊断端口环回测试失败。这是收集的好数据点,即使它也许不是问题的原因。

  3. 与这些命令的收集的另外的CLI数据:

    tac-pac bootflash:tech.txt
    show tech module 1
    show tech gold
    show hardware internal errors module 1 | diff - issue this a few times
  4. 而CPU没有用这些命令,淹没请清除诊断结果并且重新运行它:

    # show diagnostic result module 1
    # diagnostic clear result module all
    (config)# no diagnostic monitor module 1 test 5

    注意:您也许需要检查测验编号为了保证它是PortLoopback测验。5.x基代码可能是test5,而6.0基代码可能是测试6。


    (config)# diagnostic monitor module 1 test 5
    # diagnostic start module 1 test 5
    # show diagnostic result module 1 test 5

    注意:在测验完成前,它可能花费几分钟。


    # show module internal exceptionlog module 1
    # show module internal event-history errors
    # show hardware internal errors module 1

    如果模块恢复,并且诊断测试通过,很可能这归结于以上提到的DDTS,因为实际硬件故障应该一致使诊断失效。

    注意:如果模块一致失败诊断测试,您也许有一个实际硬件故障,因此请与进一步帮助的Cisco技术支持中心(TAC)联系。

方案 2:M1模块获得重置并且/或者连接飘荡

症状

N7k %$ VDC-1 %$ %DIAG_PORT_LB-2-PORTLOOPBACK_TEST_FAIL: Module:3
Test:PortLoopback failed 10 consecutive times. Faulty module:
affected ports:3,5,7,11,13,15,19,21,23,27,29,31  Error:Loopback test failed.
Packets lost on the LC at the MAC ASIC

N7k %$ VDC-1 %$ %DIAG_PORT_LB-2-PORTLOOPBACK_TEST_FAIL:  Module:3
Test:PortLoopback failed 10 consecutive times. Faulty module:
affected ports:4,6,8,12,14,16,20,22,24,26,28,30,32  Error:Loopback test failed.
Packets lost on the LC at the Queueing engine ASIC

核对清单

此问题可能归结于Cisco Bug ID CSCtt43115。它不是硬件故障,并且更换没有要求。

收集发生的所有日志报告的和事件顺序。

show tech detail
show accounting log
show logging

保证配置,特别地交换端口分析器(SPAN)和症状匹配在DDTS版本注释封入物提及的那些。

注意:此问题适用于所有M1模块类型。

情形 3:所有M1模块失败特定诊断测试,类似PortLoopback或RewriteEngineLoopback测验

症状

此问题发生,当有在激活的Supervisor (Sup)引擎和Xbar模块之间的一个问题,导致诊断程序包的损坏。N7K交换机也许报道多个/所有端口多个/所有模块的失败这些测验。

此问题要求有故障Sup引擎的手工的调查和隔离。

造成测验进入ErrDisabled状态的情况也许瞬变。思科建议您运行测验根据要求为了确定情况是否仍然存在。

为了清除ErrDisabled状态测验,回车:

N7K# diagnostic clear result module 1 test ?
  <1-6>  Test ID(s)
  all    Select all

为了运行根据要求测验,回车:

N7K# diagnostic start module <mod#> test <test#>

为了终止测验,回车:

N7K# diagnostic stop module <mod#> test <test#>

作为纠正措施, Sup引擎不触发故障切换或重置为了从此condtion恢复。为了请求纠正措施,提出了增强请求:Cisco Bug ID CSCth03474 - N7K-GOLD n7k/GOLD:Improve故障隔离。

相关信息



Document ID: 116227