Interfaces et modules Cisco : Cisco Nexus 7000 M1-Series 32-Port 10 Gigabit Ethernet Module

Dépannage de module de la gamme M132XP-12 de Nexus 7000 basé sur des journaux des erreurs

16 décembre 2015 - Traduction automatique
Autres versions: PDFpdf | Anglais (22 août 2015) | Commentaires

Introduction

Ce document décrit le processus qui est utilisé afin de déterminer si la gamme 7000 de Cisco Nexus (N7K) M132XP-12 ou un module N7K-M132XP-12L doit être envoyée pour l'autorisation de contenu de retour (RMA).

Contribué par Yogesh Ramdoss, Robert Hurst, NG de Vincent, ingénieurs TAC Cisco.

Conditions préalables

Conditions requises

Cisco recommande que vous ayez la connaissance du système d'exploitation CLI de Nexus.

Composants utilisés

Les informations dans ce document sont basées sur le Linecard N7K M132XP-12.

Les informations contenues dans ce document ont été créées à partir des périphériques d'un environnement de laboratoire spécifique. Tous les périphériques utilisés dans ce document ont démarré avec une configuration effacée (par défaut). Si votre réseau est opérationnel, assurez-vous que vous comprenez l'effet potentiel de toute commande.

Informations générales

Dans le cas de la défaillance matérielle suspectée sur le module N7K-M132XP-12, la cause pourrait être d'une erreur de logiciel où un RMA n'est pas exigé.

Ce document répertorie les symptômes éprouvés, et fournit les étapes de dépannage exigées afin de déterminer les santés du module.

Scénario 1 : Le test diagnostique « de bouclage du port » N7K-M132XP-12 a manqué

Symptômes

Le module éprouve la panne diagnostique, et ce Syslog est observé :
%DIAG_PORT_LB-2-PORTLOOPBACK_TEST_FAIL: Module:18 Test:
PortLoopback failed 10 consecutive times. Faulty module:
Module 18 affected ports:23 Error:Loopback test failed.
Packets lost on the LC at the Queueing engine ASIC

N7k# show diagnostic result module 18


Current bootup diagnostic level: complete
Module 18: 10 Gbps Ethernet Module


        Test results: (. = Pass, F = Fail, I = Incomplete,
        U = Untested, A = Abort, E = Error disabled)


         1) EOBCPortLoopback--------------> .
         2) ASICRegisterCheck-------------> E
         3) PrimaryBootROM----------------> .
         4) SecondaryBootROM--------------> .
         5) PortLoopback:


          Port   1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16
          -----------------------------------------------------
                 U  U  I  I  I  I  I  I  U  U  I  .  I  .  I  .


          Port  17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
          -----------------------------------------------------
                 U  U  .  .  U  U  E  .  U  U  I  I  I  I  I  I


         6) RewriteEngineLoopback:


          Port   1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16
          -----------------------------------------------------
                 .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .


          Port  17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
          -----------------------------------------------------
                 .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .


"show module"
N7k# show module
Mod  Ports  Module-Type                      Model              Status
---  -----  -------------------------------- ------------------ ------------
16   32     10 Gbps Ethernet Module          N7K-M132XP-12      ok
17   32     10 Gbps Ethernet Module          N7K-M132XP-12      ok
18   32     10 Gbps Ethernet Module          N7K-M132XP-12      ok

        
Mod  Sw              Hw
---  --------------  ------
16   4.2(6E5)        2.0    
17   4.2(6E5)        1.7    
18   4.2(6E5)        1.7    


Mod  MAC-Address(es)                         Serial-Num
---  --------------------------------------  ----------
16   50-3d-e5-b8-5e-10 to 50-3d-e5-b8-5e-34  JAF1504CPAR
17   88-43-e1-c7-0b-90 to 88-43-e1-c7-0b-b4  JAF1405BJLJ
18   88-43-e1-c7-60-c0 to 88-43-e1-c7-60-e4  JAF1405CLML


Mod  Online Diag Status
---  ------------------
16   Fail
17   Pass
18   Fail

Liste de contrôle

Ce scénario est vraisemblablement dû à l'ID de bogue Cisco CSCtn81109 ou CSCti95293.

Afin de vérifier que le problème est provoqué par par l'erreur de logiciel ou par la défaillance matérielle réelle qui a besoin du RMA, terminez-vous ces étapes :

  1. Vérifiez pour voir si les correspondances de version NX-OS avec la version distribuée du système de recherche de défaut (DDTS). Les deux DDTS sont réparés et vérifiés dans la version 5.2.4.

  2. Sélectionnez le show log command quand on observe le message de diagnostic afin de visualiser le groupe date/heure de la panne de test de diagnostic. Déterminez s'il y a des questions CPU qui se sont produites près du même temps. Parfois quand la CPU est accablée, il fait échouer le test de bouclage diagnostique de port. C'est un bon point d'informations à collecter quoique ce ne pourrait pas être la cause du problème.

  3. Collectez les données CLI supplémentaires avec ces commandes :

    tac-pac bootflash:tech.txt
    show tech module 1
    show tech gold
    show hardware internal errors module 1 | diff - issue this a few times
  4. Effacez le résultat diagnostique et réexécutez-le alors que la CPU n'est pas accablée avec ces commandes :

    # show diagnostic result module 1
    # diagnostic clear result module all
    (config)# no diagnostic monitor module 1 test 5

    Remarque: Vous pourriez devoir vérifier le nombre de test afin de s'assurer que c'est le test de PortLoopback. Le code de la base 5.x pourrait être le test 5, tandis que le code 6.0 de base pourrait être le test 6.


    (config)# diagnostic monitor module 1 test 5
    # diagnostic start module 1 test 5
    # show diagnostic result module 1 test 5

    Remarque: Il pourrait prendre quelques minutes avant que le test soit terminé.


    # show module internal exceptionlog module 1
    # show module internal event-history errors
    # show hardware internal errors module 1

    Si le module est récupéré et les passages de test de diagnostic, il est probable que ce soit dû au DDTS mentionné ci-dessus, parce que la défaillance matérielle réelle devrait échouer des diagnostics uniformément.

    Remarque: Si le module échoue le test de diagnostic uniformément, vous pourriez avoir une défaillance matérielle réelle, ainsi entrez en contact avec le centre d'assistance technique Cisco (TAC) pour davantage d'aide.

Scénario 2 : Les modules M1 obtiennent des instabilités de remise et/ou de lien

Symptômes

N7k %$ VDC-1 %$ %DIAG_PORT_LB-2-PORTLOOPBACK_TEST_FAIL: Module:3
Test:PortLoopback failed 10 consecutive times. Faulty module:
affected ports:3,5,7,11,13,15,19,21,23,27,29,31  Error:Loopback test failed.
Packets lost on the LC at the MAC ASIC

N7k %$ VDC-1 %$ %DIAG_PORT_LB-2-PORTLOOPBACK_TEST_FAIL:  Module:3
Test:PortLoopback failed 10 consecutive times. Faulty module:
affected ports:4,6,8,12,14,16,20,22,24,26,28,30,32  Error:Loopback test failed.
Packets lost on the LC at the Queueing engine ASIC

Liste de contrôle

Ce problème est vraisemblablement dû à l'ID de bogue Cisco CSCtt43115. Ce n'est pas une défaillance matérielle, et aucun remplacement n'est exigé.

Collectez tous les logs signalés et séquence d'opérations qui se sont produites.

show tech detail
show accounting log
show logging

Assurez-vous que les configurations, spécifiquement Fonction Switched Port Analyzer (SPAN), et symptômes apparient ceux mentionnés dans la rubrique de description de notes de mise à jour DDTS.

Remarque: Cette question s'applique à tous les types du module M1.

Scénario 3 : Tous les tests de diagnostic spécifiques d'échouer des modules M1, comme les tests de PortLoopback ou de RewriteEngineLoopback

Symptômes

Cette question se produit quand il y a une question entre l'engine active de superviseur (petite gorgée) et le module de Xbar, qui a comme conséquence la corruption du paquet de diagnostic. Le commutateur N7K pourrait signaler que multiple/tous les ports dans le multiple/tout l'échouer de modules ces tests.

Cette question exige l'enquête et l'isolation manuelles de l'engine défectueuse de petite gorgée.

La condition qui a fait entrer les tests dans l'état errdisabled pourrait être passagère. Cisco recommande que vous exécutiez le à la demande de tests afin de déterminer si la condition persiste.

Afin d'effacer l'état d'ErrDisabled du test, entrez :

N7K# diagnostic clear result module 1 test ?
  <1-6>  Test ID(s)
  all    Select all

Afin d'exécuter le test sur demande, entrez :

N7K# diagnostic start module <mod#> test <test#>

Afin d'arrêter le test, entrez :

N7K# diagnostic stop module <mod#> test <test#>

Comme action corrective, l'engine de petite gorgée ne déclenche pas le Basculement ou la remise afin de récupérer de cette condition. Afin de demander l'action corrective, une demande d'amélioration a été classée : ID de bogue Cisco CSCth03474 - isolation des erreurs n7k/GOLD:Improve de N7K-GOLD.

Informations connexes


Conversations connexes de la communauté de soutien de Cisco

Le site Cisco Support Community est un forum où vous pouvez poser des questions, répondre à des questions, faire part de suggestions et collaborer avec vos pairs.


Document ID: 116227