Cisco Interfaces and Modules : Cisco Nexus 7000 M1-Series 32-Port 10 Gigabit Ethernet Module

Troubleshooting do módulo do 7000 Series M132XP-12 do nexo baseado em log de erros

19 Setembro 2015 - Tradução por Computador
Outras Versões: Versão em PDFpdf | Inglês (22 Agosto 2015) | Feedback

Introdução

Este documento descreve o processo que está usado a fim determinar se o 7000 Series de um nexo de Cisco (N7K) M132XP-12 ou um módulo N7K-M132XP-12L precisam de ser enviados para a autorização de material do retorno (RMA).

Contribuído por Yogesh Ramdoss, Robert Hurst, Ng de Vincent, engenheiros de TAC da Cisco.

Pré-requisitos

Requisitos

Cisco recomenda que você tem o conhecimento do sistema operacional CLI do nexo.

Componentes Utilizados

A informação neste documento é baseada na placa de linha N7K M132XP-12.

As informações neste documento foram criadas a partir de dispositivos em um ambiente de laboratório específico. Todos os dispositivos utilizados neste documento foram iniciados com uma configuração (padrão) inicial. Se a sua rede estiver ativa, certifique-se de que entende o impacto potencial de qualquer comando.

Informações de Apoio

No caso da falha do hardware suspeitada no módulo N7K-M132XP-12, a causa poderia ser de um defeito do software onde um RMA não fosse exigido.

Este documento alista os sintomas experimentados, e fornece os passos de Troubleshooting exigidos a fim determinar a saúde do módulo.

Cenário 1: Da “teste diagnóstico do laço de retorno porta N7K-M132XP-12” falhado

Sintomas

O módulo experimenta a falha de diagnóstico, e este Syslog é observado:
%DIAG_PORT_LB-2-PORTLOOPBACK_TEST_FAIL: Module:18 Test:
PortLoopback failed 10 consecutive times. Faulty module:
Module 18 affected ports:23 Error:Loopback test failed.
Packets lost on the LC at the Queueing engine ASIC

N7k# show diagnostic result module 18


Current bootup diagnostic level: complete
Module 18: 10 Gbps Ethernet Module


        Test results: (. = Pass, F = Fail, I = Incomplete,
        U = Untested, A = Abort, E = Error disabled)


         1) EOBCPortLoopback--------------> .
         2) ASICRegisterCheck-------------> E
         3) PrimaryBootROM----------------> .
         4) SecondaryBootROM--------------> .
         5) PortLoopback:


          Port   1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16
          -----------------------------------------------------
                 U  U  I  I  I  I  I  I  U  U  I  .  I  .  I  .


          Port  17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
          -----------------------------------------------------
                 U  U  .  .  U  U  E  .  U  U  I  I  I  I  I  I


         6) RewriteEngineLoopback:


          Port   1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16
          -----------------------------------------------------
                 .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .


          Port  17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
          -----------------------------------------------------
                 .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .


"show module"
N7k# show module
Mod  Ports  Module-Type                      Model              Status
---  -----  -------------------------------- ------------------ ------------
16   32     10 Gbps Ethernet Module          N7K-M132XP-12      ok
17   32     10 Gbps Ethernet Module          N7K-M132XP-12      ok
18   32     10 Gbps Ethernet Module          N7K-M132XP-12      ok

        
Mod  Sw              Hw
---  --------------  ------
16   4.2(6E5)        2.0    
17   4.2(6E5)        1.7    
18   4.2(6E5)        1.7    


Mod  MAC-Address(es)                         Serial-Num
---  --------------------------------------  ----------
16   50-3d-e5-b8-5e-10 to 50-3d-e5-b8-5e-34  JAF1504CPAR
17   88-43-e1-c7-0b-90 to 88-43-e1-c7-0b-b4  JAF1405BJLJ
18   88-43-e1-c7-60-c0 to 88-43-e1-c7-60-e4  JAF1405CLML


Mod  Online Diag Status
---  ------------------
16   Fail
17   Pass
18   Fail

Lista de verificação

Esta encenação é provavelmente devido a à identificação de bug Cisco CSCtn81109 ou CSCti95293.

A fim verificar que o problema está causado pelo defeito do software ou pela falha do hardware real que exige o RMA, termine estas etapas:

  1. Verifique para ver se a versão NX-OS combina com a versão do Distributed Defect Tracking System (DDTS). o DDTS é fixo e verificado na versão 5.2.4.

  2. Inscreva o comando show log quando o mensagem de diagnóstico é observado a fim ver o selo de tempo da falha do teste diagnóstico. Determine se há alguma edição CPU que ocorra perto do mesmo tempo. Às vezes quando o CPU é oprimido, faz com que o teste de loopback da porta de diagnóstico falhe. Este é um bom ponto de dados a recolher mesmo que não possa ser a causa do problema.

  3. Recolha dados de CLI adicionais com estes comandos:

    tac-pac bootflash:tech.txt
    show tech module 1
    show tech gold
    show hardware internal errors module 1 | diff - issue this a few times
  4. Cancele o resultado de diagnóstico e torne-o a colocar em funcionamento quando o CPU não for oprimido com estes comandos:

    # show diagnostic result module 1
    # diagnostic clear result module all
    (config)# no diagnostic monitor module 1 test 5

    Nota: Você pôde precisar de verificar o número do teste a fim assegurar-se de que fosse o teste de PortLoopback. O código de base 5.x poderia ser o teste 5, visto que o código de base 6.0 poderia ser o teste 6.


    (config)# diagnostic monitor module 1 test 5
    # diagnostic start module 1 test 5
    # show diagnostic result module 1 test 5

    Nota: Poderia tomar alguns minutos antes que o teste esteja terminado.


    # show module internal exceptionlog module 1
    # show module internal event-history errors
    # show hardware internal errors module 1

    Se o módulo é recuperado e as passagens do teste diagnóstico, é provável que este é devido ao DDTS mencionado acima, porque a falha do hardware real deve falhar diagnósticos consistentemente.

    Nota: Se o módulo falha o teste diagnóstico consistentemente, você pôde ter uma falha do hardware real, assim que contacte o centro de assistência técnica da Cisco (TAC) para uma ajuda mais adicional.

Cenário 2: Os módulos M1 obtêm aletas da restauração e/ou do link

Sintomas

N7k %$ VDC-1 %$ %DIAG_PORT_LB-2-PORTLOOPBACK_TEST_FAIL: Module:3
Test:PortLoopback failed 10 consecutive times. Faulty module:
affected ports:3,5,7,11,13,15,19,21,23,27,29,31  Error:Loopback test failed.
Packets lost on the LC at the MAC ASIC

N7k %$ VDC-1 %$ %DIAG_PORT_LB-2-PORTLOOPBACK_TEST_FAIL:  Module:3
Test:PortLoopback failed 10 consecutive times. Faulty module:
affected ports:4,6,8,12,14,16,20,22,24,26,28,30,32  Error:Loopback test failed.
Packets lost on the LC at the Queueing engine ASIC

Lista de verificação

Este problema é provavelmente devido a à identificação de bug Cisco CSCtt43115. Não é uma falha do hardware, e nenhuma substituição é exigida.

Recolha todos os logs relatados e sequência de evento que ocorreram.

show tech detail
show accounting log
show logging

Assegure-se de que as configurações, especificamente Switched Port Analyzer (SPAN), e sintomas combinem aquelas mencionadas no cerco dos Release Note DDTS.

Nota: Esta edição aplica-se a todos os tipos de módulo M1.

Cenário 3: Todos os módulos M1 falham testes diagnósticos específicos, como os testes de PortLoopback ou de RewriteEngineLoopback

Sintomas

Esta edição acontece quando há uma edição entre o motor do supervisor ativo (Sup) e o módulo de Xbar, que conduz à corrupção do pacote de diagnósticos. O interruptor N7K pôde relatar que múltiplo/todas as portas em múltiplo/todos os módulos falha estes testes.

Esta edição exige a investigação e o isolamento manuais do motor defeituoso do Sup.

A circunstância que fez com que os testes entrassem no estado errdisabled pôde ser transiente. Cisco recomenda que você executa os testes por encomenda a fim determinar se a circunstância persiste.

A fim cancelar o estado errdisabled do teste, entre:

N7K# diagnostic clear result module 1 test ?
  <1-6>  Test ID(s)
  all    Select all

A fim executar o teste por encomenda, entre:

N7K# diagnostic start module <mod#> test <test#>

A fim parar o teste, entre:

N7K# diagnostic stop module <mod#> test <test#>

Como uma ação corretiva, o motor do Sup não provoca o Failover ou a restauração a fim recuperar desta circunstância. A fim pedir a ação corretiva, uma requisição de aprimoramento foi arquivada: Identificação de bug Cisco CSCth03474 - isolamento de falha n7k/GOLD:Improve do N7K-GOLD.

Informações Relacionadas


Discussões relacionadas da comunidade de suporte da Cisco

A Comunidade de Suporte da Cisco é um fórum onde você pode perguntar e responder, oferecer sugestões e colaborar com colegas.


Document ID: 116227