Módulos e interfaces de Cisco : Cisco Nexus 7000 M1-Series 32-Port 10 Gigabit Ethernet Module

Troubleshooting del módulo de las 7000 Series M132XP-12 del nexo basado en los registros de error

17 Octubre 2016 - Traducción Automática
Otras Versiones: PDFpdf | Inglés (22 Agosto 2015) | Comentarios

Introducción

Este documento describe el proceso que se utiliza para determinar si las 7000 Series de un nexo de Cisco (N7K) M132XP-12 o un módulo N7K-M132XP-12L necesita ser enviadas para la Autorización de devolución de materiales (RMA).

Contribuido por Yogesh Ramdoss, Roberto Hurst, Ng de Vincent, ingenieros de Cisco TAC.

Prerrequisitos

Requisitos

Cisco recomienda que usted tiene conocimiento del sistema operativo CLI del nexo.

Componentes Utilizados

La información en este documento se basa en el linecard N7K M132XP-12.

La información que contiene este documento se creó a partir de los dispositivos en un ambiente de laboratorio específico. Todos los dispositivos que se utilizan en este documento se pusieron en funcionamiento con una configuración verificada (predeterminada). Si la red está funcionando, asegúrese de haber comprendido el impacto que puede tener cualquier comando.

Antecedentes

En el caso de la falla de hardware sospechosa en el módulo N7K-M132XP-12, la causa podría ser de un defecto del software donde un RMA no se requiere.

Este documento enumera los síntomas experimentados, y proporciona los pasos de Troubleshooting requeridos para determinar la salud del módulo.

Escenario 1: “Prueba de diagnóstico del loopback del puerto N7K-M132XP-12” fallada

Síntomas

El módulo experimenta la falla de diagnóstico, y se observa este Syslog:
%DIAG_PORT_LB-2-PORTLOOPBACK_TEST_FAIL: Module:18 Test:
PortLoopback failed 10 consecutive times. Faulty module:
Module 18 affected ports:23 Error:Loopback test failed.
Packets lost on the LC at the Queueing engine ASIC

N7k# show diagnostic result module 18


Current bootup diagnostic level: complete
Module 18: 10 Gbps Ethernet Module


        Test results: (. = Pass, F = Fail, I = Incomplete,
        U = Untested, A = Abort, E = Error disabled)


         1) EOBCPortLoopback--------------> .
         2) ASICRegisterCheck-------------> E
         3) PrimaryBootROM----------------> .
         4) SecondaryBootROM--------------> .
         5) PortLoopback:


          Port   1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16
          -----------------------------------------------------
                 U  U  I  I  I  I  I  I  U  U  I  .  I  .  I  .


          Port  17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
          -----------------------------------------------------
                 U  U  .  .  U  U  E  .  U  U  I  I  I  I  I  I


         6) RewriteEngineLoopback:


          Port   1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16
          -----------------------------------------------------
                 .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .


          Port  17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
          -----------------------------------------------------
                 .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .


"show module"
N7k# show module
Mod  Ports  Module-Type                      Model              Status
---  -----  -------------------------------- ------------------ ------------
16   32     10 Gbps Ethernet Module          N7K-M132XP-12      ok
17   32     10 Gbps Ethernet Module          N7K-M132XP-12      ok
18   32     10 Gbps Ethernet Module          N7K-M132XP-12      ok

        
Mod  Sw              Hw
---  --------------  ------
16   4.2(6E5)        2.0    
17   4.2(6E5)        1.7    
18   4.2(6E5)        1.7    


Mod  MAC-Address(es)                         Serial-Num
---  --------------------------------------  ----------
16   50-3d-e5-b8-5e-10 to 50-3d-e5-b8-5e-34  JAF1504CPAR
17   88-43-e1-c7-0b-90 to 88-43-e1-c7-0b-b4  JAF1405BJLJ
18   88-43-e1-c7-60-c0 to 88-43-e1-c7-60-e4  JAF1405CLML


Mod  Online Diag Status
---  ------------------
16   Fail
17   Pass
18   Fail

Lista de Verificación

Este escenario es probablemente a causa al Id. de bug Cisco CSCtn81109 o CSCti95293.

Para verificar que el problema sea causado por el defecto del software o por la falla de hardware real que requiere el RMA, complete estos pasos:

  1. Marque para ver si la versión NX-OS hace juego con la versión del Distributed Defect Tracking System (DDTS). El DDTS se repara y se verifica en la versión 5.2.4.

  2. Ingrese el comando show log cuando el mensaje de diagnóstico se observa para ver el sello de fecha/hora del incidente de la prueba de diagnóstico. Determine si hay algunos problemas CPU que ocurrieran cerca del mismo tiempo. A veces cuando se abruma el CPU, hace la prueba de Loopback del puerto de diagnóstico fallar. Esto es un buen punto de datos a recoger aunque puede ser que no sea la causa del problema.

  3. Recoja los datos CLI adicionales con estos comandos:

    tac-pac bootflash:tech.txt
    show tech module 1
    show tech gold
    show hardware internal errors module 1 | diff - issue this a few times
  4. Borre el resultado del diagnóstico y vuélvalo a efectuar mientras que el CPU no se abruma con estos comandos:

    # show diagnostic result module 1
    # diagnostic clear result module all
    (config)# no diagnostic monitor module 1 test 5

    Nota: Usted puede ser que necesite marcar el número de la prueba para asegurarse de que es la prueba de PortLoopback. El código base 5.x podría ser la prueba 5, mientras que el código base 6.0 podría ser la prueba 6.


    (config)# diagnostic monitor module 1 test 5
    # diagnostic start module 1 test 5
    # show diagnostic result module 1 test 5

    Nota: Podría tardar algunos minutos antes de que se complete la prueba.


    # show module internal exceptionlog module 1
    # show module internal event-history errors
    # show hardware internal errors module 1

    Si se recupera el módulo y los pasos de la prueba de diagnóstico, es probable que esto sea debido al DDTS mencionado anteriormente, porque la falla de hardware real debe fallar los diagnósticos constantemente.

    Nota: Si el módulo falla la prueba de diagnóstico constantemente, usted puede ser que tenga una falla de hardware real, así que entre en contacto el Centro de Asistencia Técnica de Cisco (TAC) para la ayuda adicional.

Escenario 2: Los módulos M1 consiguen las aletas de la restauración y/o del link

Síntomas

N7k %$ VDC-1 %$ %DIAG_PORT_LB-2-PORTLOOPBACK_TEST_FAIL: Module:3
Test:PortLoopback failed 10 consecutive times. Faulty module:
affected ports:3,5,7,11,13,15,19,21,23,27,29,31  Error:Loopback test failed.
Packets lost on the LC at the MAC ASIC

N7k %$ VDC-1 %$ %DIAG_PORT_LB-2-PORTLOOPBACK_TEST_FAIL:  Module:3
Test:PortLoopback failed 10 consecutive times. Faulty module:
affected ports:4,6,8,12,14,16,20,22,24,26,28,30,32  Error:Loopback test failed.
Packets lost on the LC at the Queueing engine ASIC

Lista de Verificación

Este problema es probablemente a causa al Id. de bug Cisco CSCtt43115. No es una falla de hardware, y no se requiere ningún reemplazo.

Recoja todos los registros señalados y la Secuencia de eventos que ocurrieron.

show tech detail
show accounting log
show logging

Asegúrese de que las configuraciones, específicamente Switched Port Analyzer (SPAN), y los síntomas hagan juego ésos mencionados en el recinto de los Release Note DDTS.

Nota: Este problema se aplica a todos los tipos de módulo M1.

Escenario 3: Todos los módulos M1 fallan las pruebas de diagnóstico específicas, como las pruebas de PortLoopback o de RewriteEngineLoopback

Síntomas

Este problema sucede cuando hay un problema entre el motor del supervisor activo (Sup) y el módulo de Xbar, que da lugar a la corrupción del paquete de diagnóstico. El Switch N7K pudo señalar que el múltiplo/todos los puertos en el múltiplo/todos los módulos falla en estas pruebas.

Este problema requiere la investigación y el aislamiento manuales del motor defectuoso del Sup.

La condición que hizo las pruebas entrar el estado errdisabled pudo ser transitoria. Cisco recomienda que usted funciona con las pruebas a pedido para determinar si persiste la condición.

Para borrar el estado de ErrDisabled de la prueba, ingrese:

N7K# diagnostic clear result module 1 test ?
  <1-6>  Test ID(s)
  all    Select all

Para funcionar con la prueba a pedido, ingrese:

N7K# diagnostic start module <mod#> test <test#>

Para parar la prueba, ingrese:

N7K# diagnostic stop module <mod#> test <test#>

Como acción correctiva, el motor del Sup no acciona la Conmutación por falla o la restauración para recuperarse de esta condición. Para pedir la acción correctiva, se ha clasifiado un pedido de mejora: Id. de bug Cisco CSCth03474 - aislamiento de falla n7k/GOLD:Improve del N7K-GOLD.

Información Relacionada



Document ID: 116227