Cisco インターフェイスとモジュール : Cisco Nexus 7000 M1 シリーズ 32 ポート 10 ギガビット イーサネット モジュール

エラー ログに基づく Nexus 7000 シリーズ M132XP-12 モジュールのトラブルシューティング

2016 年 10 月 27 日 - 機械翻訳について
その他のバージョン: PDFpdf | 英語版 (2015 年 8 月 22 日) | フィードバック

概要

このドキュメントは、Cisco Nexus 7000 シリーズ(N7K)M132XP-12 または N7K-M132XP-12L モジュールが Return Material Authorization(RMA)に送信される必要があるかを判断するために使用するプロセスについて説明します。

著者:Cisco TAC エンジニア、Yogesh Ramdoss、Robert Hurst、Vincent Ng

前提条件

要件

Nexus オペレーティング システム CLI に関する知識があることが推奨されます。

使用するコンポーネント

このドキュメントの情報は、N7K M132XP-12 ラインカードに基づくものです。

このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されたものです。 このドキュメントで使用するすべてのデバイスは、クリアな(デフォルト)設定で作業を開始しています。 ネットワークが稼働中の場合は、コマンドが及ぼす潜在的な影響を十分に理解しておく必要があります。

背景説明

N7K-M132XP-12 モジュールでハードウェア障害が疑われる場合、原因は、RMA が不要なソフトウェア障害の可能性があります。

このドキュメントは、発生している症状をリストし、モジュールの状態を判断するために必要なトラブルシューティング ステップについて説明します。

シナリオ 1: N7K-M132XP-12 診断「ポート ループバック」テストに失敗

症状

モジュールに診断障害が発生し、次の syslog が表示される。
%DIAG_PORT_LB-2-PORTLOOPBACK_TEST_FAIL: Module:18 Test:
PortLoopback failed 10 consecutive times. Faulty module:
Module 18 affected ports:23 Error:Loopback test failed.
Packets lost on the LC at the Queueing engine ASIC

N7k# show diagnostic result module 18


Current bootup diagnostic level: complete
Module 18: 10 Gbps Ethernet Module


        Test results: (. = Pass, F = Fail, I = Incomplete,
        U = Untested, A = Abort, E = Error disabled)


         1) EOBCPortLoopback--------------> .
         2) ASICRegisterCheck-------------> E
         3) PrimaryBootROM----------------> .
         4) SecondaryBootROM--------------> .
         5) PortLoopback:


          Port   1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16
          -----------------------------------------------------
                 U  U  I  I  I  I  I  I  U  U  I  .  I  .  I  .


          Port  17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
          -----------------------------------------------------
                 U  U  .  .  U  U  E  .  U  U  I  I  I  I  I  I


         6) RewriteEngineLoopback:


          Port   1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16
          -----------------------------------------------------
                 .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .


          Port  17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
          -----------------------------------------------------
                 .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .


"show module"
N7k# show module
Mod  Ports  Module-Type                      Model              Status
---  -----  -------------------------------- ------------------ ------------
16   32     10 Gbps Ethernet Module          N7K-M132XP-12      ok
17   32     10 Gbps Ethernet Module          N7K-M132XP-12      ok
18   32     10 Gbps Ethernet Module          N7K-M132XP-12      ok

        
Mod  Sw              Hw
---  --------------  ------
16   4.2(6E5)        2.0    
17   4.2(6E5)        1.7    
18   4.2(6E5)        1.7    


Mod  MAC-Address(es)                         Serial-Num
---  --------------------------------------  ----------
16   50-3d-e5-b8-5e-10 to 50-3d-e5-b8-5e-34  JAF1504CPAR
17   88-43-e1-c7-0b-90 to 88-43-e1-c7-0b-b4  JAF1405BJLJ
18   88-43-e1-c7-60-c0 to 88-43-e1-c7-60-e4  JAF1405CLML


Mod  Online Diag Status
---  ------------------
16   Fail
17   Pass
18   Fail

チェックリスト

この状況は Cisco Bug ID CSCtn81109 または CSCti95293 が原因だと思われます。

問題がソフトウェアの不具合によって発生したか、RMA を必要とするハードウェアそのものの障害によって発生したかを判断するには次の手順を実行します。

  1. NX-OS のバージョンが Distributed Defect Tracking System(DDTS)のバージョンと一致していることを確認します。 DDTS は両方ともバージョン 5.2.4 で修正および検証されています。

  2. 診断メッセージが表示されたら、show log コマンドを入力して、診断テスト失敗のタイムスタンプを表示します。 同じ時間帯に CPU の問題が発生してないか確認してください。 CPU が過負荷になると、診断ポート ループバック テストが失敗する場合があります。 CPU が問題の原因でない場合でもこのデータを収集しておくことは有効です。

  3. 次のコマンドで追加の CLI データを収集します。

    tac-pac bootflash:tech.txt
    show tech module 1
    show tech gold
    show hardware internal errors module 1 | diff - issue this a few times
  4. 診断結果をクリアし、これらのコマンドで CPU が過負荷状態にならないうちに戻します。

    # show diagnostic result module 1
    # diagnostic clear result module all
    (config)# no diagnostic monitor module 1 test 5

    : PortLoopback テストであることを検証するために、テスト番号を確認する必要があります。 5.x ベースのコードはテスト 5、6.0 ベースのコードはテスト 6 になります。


    (config)# diagnostic monitor module 1 test 5
    # diagnostic start module 1 test 5
    # show diagnostic result module 1 test 5

    : テストが完了するまでに数分かかる可能性があります。


    # show module internal exceptionlog module 1
    # show module internal event-history errors
    # show hardware internal errors module 1

    ハードウェア自体に障害がある場合、診断は常に失敗するため、モジュールが回復し診断テストにパスするのであれば、前述の DDTS が原因である可能性があります。

    : モジュールが一貫して診断テストに失敗する場合、ハードウェアそのものの障害が疑われるため、Cisco Technical Assistance Center(TAC)に連絡してサポートを受けてください。

シナリオ 2: M1 モジュールでリセットとリンク フラップの両方またはいずれか一方が発生

症状

N7k %$ VDC-1 %$ %DIAG_PORT_LB-2-PORTLOOPBACK_TEST_FAIL: Module:3
Test:PortLoopback failed 10 consecutive times. Faulty module:
affected ports:3,5,7,11,13,15,19,21,23,27,29,31  Error:Loopback test failed.
Packets lost on the LC at the MAC ASIC

N7k %$ VDC-1 %$ %DIAG_PORT_LB-2-PORTLOOPBACK_TEST_FAIL:  Module:3
Test:PortLoopback failed 10 consecutive times. Faulty module:
affected ports:4,6,8,12,14,16,20,22,24,26,28,30,32  Error:Loopback test failed.
Packets lost on the LC at the Queueing engine ASIC

チェックリスト

この問題は Cisco Bug ID CSCtt43115 が原因の可能性があります。 これはハードウェア障害ではないため、交換は必要ありません。

レポートされたすべてのログおよび発生したイベントのシーケンスを収集します。

show tech detail
show accounting log
show logging

設定、特にスイッチド ポート アナライザ(SPAN)、および症状が、DDTS リリース ノート エンクロージャに記載されているものと一致することを確認してください。

: この問題は、すべての M1 モジュール タイプに該当します。

シナリオ 3: すべての M1 モジュールが PortLoopback または RewriteEngineLoopback テストなどの特定の診断テストに失敗

症状

この問題は、アクティブ スーパーバイザ(Sup)エンジンと Xbar モジュールとの間に問題がある場合に発生し、診断パケットが破損します。 N7K スイッチは、複数(またはすべて)のモジュールの複数(またはすべて)のポートでこれらのテストに失敗したとレポートする場合があります。

この問題では、障害のある Sup エンジンを手動で調査して問題の切り分けをする必要があります。

テストが errdisabled 状態になった原因は一時的なものである場合があります。 状態が永続的なものかどうかを判断するために、オンデマンドでテストを実行することをお勧めします。

テストの ErrDisabled 状態をクリアするには次のコマンドを入力します。

N7K# diagnostic clear result module 1 test ?
  <1-6>  Test ID(s)
  all    Select all

オンデマンド テストを実行するには次のコマンドを入力します。

N7K# diagnostic start module <mod#> test <test#>

テストを停止するには次のコマンドを入力します。

N7K# diagnostic stop module <mod#> test <test#>

Sup エンジンは、この状態を回復するために、解決策としてフェールオーバーまたはリセットすることはありません。 解決策をリクエストするために、機能拡張要求が発行されています。 Cisco Bug ID CSCth03474 - n7k/GOLD:N7K-GOLD の障害の切り分けの改善要求。

関連情報



Document ID: 116227