Contenu

Introduction

Ce document décrit le processus utilisé pour déterminer si un module Cisco Nexus 7000 (N7K) M132XP-12 ou N7K-M132XP-12L doit être envoyé pour autorisation de retour de matériel (RMA).

Conditions préalables

Conditions requises

Cisco vous recommande de connaître l'interface de ligne de commande du système d'exploitation Nexus.

Components Used

Les informations de ce document sont basées sur la carte de ligne N7K M132XP-12.

The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. If your network is live, make sure that you understand the potential impact of any command.

Informations générales

En cas de défaillance matérielle suspectée sur le module N7K-M132XP-12, la cause peut provenir d'un défaut logiciel où une RMA n'est pas requise.

Ce document répertorie les symptômes rencontrés et fournit les étapes de dépannage nécessaires pour déterminer l'état du module.

Scénario 1 : Échec du test de bouclage de port du diagnostic N7K-M132XP-12

Symptômes

Le module connaît une défaillance de diagnostic et ce syslog est observé :
%DIAG_PORT_LB-2-PORTLOOPBACK_TEST_FAIL: Module:18 Test:
PortLoopback failed 10 consecutive times. Faulty module:
Module 18 affected ports:23 Error:Loopback test failed.
Packets lost on the LC at the Queueing engine ASIC

N7k# show diagnostic result module 18


Current bootup diagnostic level: complete
Module 18: 10 Gbps Ethernet Module


        Test results: (. = Pass, F = Fail, I = Incomplete,
        U = Untested, A = Abort, E = Error disabled)


         1) EOBCPortLoopback--------------> .
         2) ASICRegisterCheck-------------> E
         3) PrimaryBootROM----------------> .
         4) SecondaryBootROM--------------> .
         5) PortLoopback:


          Port   1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16
          -----------------------------------------------------
                 U  U  I  I  I  I  I  I  U  U  I  .  I  .  I  .


          Port  17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
          -----------------------------------------------------
                 U  U  .  .  U  U  E  .  U  U  I  I  I  I  I  I


         6) RewriteEngineLoopback:


          Port   1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16
          -----------------------------------------------------
                 .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .


          Port  17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
          -----------------------------------------------------
                 .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .


"show module"
N7k# show module
Mod  Ports  Module-Type                      Model              Status
---  -----  -------------------------------- ------------------ ------------
16   32     10 Gbps Ethernet Module          N7K-M132XP-12      ok
17   32     10 Gbps Ethernet Module          N7K-M132XP-12      ok
18   32     10 Gbps Ethernet Module          N7K-M132XP-12      ok

        
Mod  Sw              Hw
---  --------------  ------
16   4.2(6E5)        2.0    
17   4.2(6E5)        1.7    
18   4.2(6E5)        1.7    


Mod  MAC-Address(es)                         Serial-Num
---  --------------------------------------  ----------
16   50-3d-e5-b8-5e-10 to 50-3d-e5-b8-5e-34  JAF1504CPAR
17   88-43-e1-c7-0b-90 to 88-43-e1-c7-0b-b4  JAF1405BJLJ
18   88-43-e1-c7-60-c0 to 88-43-e1-c7-60-e4  JAF1405CLML


Mod  Online Diag Status
---  ------------------
16   Fail
17   Pass
18   Fail

Liste de vérification 

Ce scénario est probablement dû à l'ID de bogue Cisco CSCtn81109 ou CSCti95293.

Afin de vérifier que le problème est dû à un défaut logiciel ou à une défaillance matérielle réelle nécessitant une RMA, procédez comme suit :

  1. Vérifiez si la version de NX-OS correspond à la version DDTS (Distributed Defect Tracking System). Les deux DDTS sont corrigés et vérifiés dans la version 5.2.4.

  2. Entrez la commande show log lorsque le message de diagnostic est observé afin d'afficher l'horodatage de l'échec du test de diagnostic. Déterminez s'il y a des problèmes de CPU qui se sont produits presque au même moment. Parfois, lorsque le processeur est submergé, le test de bouclage du port de diagnostic échoue. Il s'agit d'un bon point de données à collecter, même si ce n'est pas la cause du problème.

  3. Collectez des données CLI supplémentaires à l'aide des commandes suivantes :

    tac-pac bootflash:tech.txt
    show tech module 1
    show tech gold
    show hardware internal errors module 1 | diff - issue this a few times
  4. Effacez le résultat du diagnostic et réexécutez-le alors que le processeur n'est pas submergé par ces commandes :

    # show diagnostic result module 1
    # diagnostic clear result module all
    (config)# no diagnostic monitor module 1 test 5

    Note: Vous devrez peut-être vérifier le numéro de test afin de vous assurer qu'il s'agit du test PortLoopback. Le code de base 5.x peut être le test 5, alors que le code de base 6.0 peut être le test 6.


    (config)# diagnostic monitor module 1 test 5
    # diagnostic start module 1 test 5
    # show diagnostic result module 1 test 5

    Note: Quelques minutes peuvent s'écouler avant la fin du test.


    # show module internal exceptionlog module 1
    # show module internal event-history errors
    # show hardware internal errors module 1

    Si le module est récupéré et que le test de diagnostic réussit, il est probable que cela soit dû au DDTS mentionné ci-dessus, parce que la défaillance matérielle réelle devrait échouer de manière cohérente aux diagnostics.

    Note: Si le test de diagnostic échoue régulièrement sur le module, vous risquez d'avoir une défaillance matérielle réelle. Contactez donc le centre d'assistance technique Cisco (TAC) pour obtenir de l'aide.

Scénario 2 : Réinitialisation des modules M1 et/ou déroutement des liaisons

Symptômes

N7k %$ VDC-1 %$ %DIAG_PORT_LB-2-PORTLOOPBACK_TEST_FAIL: Module:3
Test:PortLoopback failed 10 consecutive times. Faulty module:
affected ports:3,5,7,11,13,15,19,21,23,27,29,31  Error:Loopback test failed.
Packets lost on the LC at the MAC ASIC

N7k %$ VDC-1 %$ %DIAG_PORT_LB-2-PORTLOOPBACK_TEST_FAIL:  Module:3
Test:PortLoopback failed 10 consecutive times. Faulty module:
affected ports:4,6,8,12,14,16,20,22,24,26,28,30,32  Error:Loopback test failed.
Packets lost on the LC at the Queueing engine ASIC

Liste de vérification 

Ce problème est probablement dû à l'ID de bogue Cisco CSCtt43115. Il ne s'agit PAS d'une défaillance matérielle et aucun remplacement n'est nécessaire.

Collectez tous les journaux signalés et la séquence des événements qui se sont produits.

show tech detail
show accounting log
show logging

Assurez-vous que les configurations, en particulier SPAN (Switched Port Analyzer), et les symptômes correspondent à ceux mentionnés dans le boîtier des notes de version DDTS.

Note: Ce problème s'applique à tous les types de modules M1.

Scénario 3 : Tous les modules M1 échouent lors de tests de diagnostic spécifiques, tels que les tests PortLoopback ou RewriteEngineLoopback

Symptômes

Ce problème se produit lorsqu'il y a un problème entre le moteur Sup (Active Supervisor) et le module Xbar, ce qui entraîne une corruption du paquet de diagnostic. Le commutateur N7K peut signaler que plusieurs/tous les ports de plusieurs/tous les modules échouent à ces tests.

Ce problème nécessite une enquête manuelle et l'isolation du moteur Sup défectueux.

La condition qui a entraîné l'activation des tests dans l'état errdisabled peut être transitoire. Cisco vous recommande d'exécuter les tests à la demande afin de déterminer si la condition persiste.

Afin d'effacer l'état ErrDisabled du test, saisissez :

N7K# diagnostic clear result module 1 test ?
  <1-6>  Test ID(s)
  all    Select all

Pour exécuter le test à la demande, saisissez :

N7K# diagnostic start module 
     
     
     
     
     
      
      
      
       test 
      
      
      
       
     
     
     
     

Pour arrêter le test, saisissez :

N7K# diagnostic stop module 
     
     
     
     
     
      
      
      
       test 
      
      
      
       
     
     
     
     

Comme mesure corrective, le moteur Sup ne déclenche pas de basculement ou de réinitialisation afin de récupérer de cette condition. Afin de demander des mesures correctives, une demande d'amélioration a été déposée : ID de bogue Cisco CSCth03474 - n7k/GOLD : amélioration de l'isolation des pannes de N7K-GOLD.

Informations connexes