スイッチ : Cisco Nexus 7000 シリーズ スイッチ

Nexus 7000 シリーズの Xbar 同期化障害を切り替えます解決して下さい

2016 年 10 月 27 日 - 機械翻訳について
その他のバージョン: PDFpdf | 英語版 (2016 年 4 月 21 日) | フィードバック

概要

モジュールが Cisco Nexus 7000 シリーズの Xbar 同期化障害が原因での下に切り替えるあるときこの資料に不良なクロスバー(Xbar)を識別する方法を記述されています。 この問題におけるトラブルシューティング 手順は資料収集、データ 解析および問題コンポーネントを隔離するために除去プロセスを含みます。

Abhishek Soni によって貢献される、Cisco TAC エンジニア。

前提条件

要件

Nexus オペレーティング システム(NX-OS)CLI に関する知識があることが推奨されます。

使用するコンポーネント

この文書に記載されている情報は Cisco Nexus 7000 シリーズに実行 NX-OS バージョン 6.1(2)、またあらゆる NX-OS バージョンを使用できること切り替えます基づいています。

このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されたものです。 このドキュメントで使用するすべてのデバイスは、クリアな(デフォルト)設定で作業を開始しています。 ネットワークが稼働中の場合は、コマンドが及ぼす潜在的な影響を十分に理解しておく必要があります。

問題

N7K-F248XP-25E モジュールはモジュールブートに Xbar 同期化失敗が原因での下にあります。 モジュールは chasis の Slot1 に挿入されたときに、電源を切りました。 これはこれらの原因の 1 つが原因で発生する場合があります:

  • 悪いモジュール

  • 悪い Xbar

  • バックプレーンの悪い状態か曲がったピン

解決策

N7K-F248XP-25E モジュールの疑われたハードウェア障害の場合には、ログオンします失敗のための原因が障害のあるモジュールが原因である、または Xbar 同期化失敗が原因でかどうか判別するために順序を表示して下さい。

更にこの例の問題を特定するために、モジュールは別のスロットに挿入され、予想通りアクティブになりました。 これはモジュールが不良ではない、従って問題は Xbar ファブリックまたはシャーシとありますことを示します。

この例外 ログはモジュールが Slot1:で電源がオフになっていたときに現われました

show module internal exceptionlog module 1
********* Exception info for module 1 ********

exception information --- exception instance 1 ----
Module Slot Number: 1
Device Id : 88
Device Name : XbarComplex
Device Errorcode : 0x00000008
Device ID : 00 (0x00)
Device Instance : 00 (0x00)
Dev Type (HW/SW) : 00 (0x00)
ErrNum (devInfo) : 08 (0x08)

System Errorcode : 0x40240012 xbar sync failed during module bringup
(DevErr is LinkNum)
Error Type : Informational
PhyPortLayer : Unknown
Port(s) Affected : none
DSAP : 0 (0x0)
UUID : 0 (0x0)
Time : Thu Mar 20 15:55:19 2014
(Ticks: 532B0F67 jiffies)

exception information --- exception instance 2 ----
Module Slot Number: 1
Device Id : 88
Device Name : XbarComplex
Device Errorcode : 0x00000008
Device ID : 00 (0x00)
Device Instance : 00 (0x00)
Dev Type (HW/SW) : 00 (0x00)
ErrNum (devInfo) : 08 (0x08)

System Errorcode : 0x40240012 xbar sync failed during module bringup
(DevErr is LinkNum)
Error Type : Informational
PhyPortLayer : Unknown
Port(s) Affected : none
DSAP : 0 (0x0)
UUID : 0 (0x0)
Time : Thu Mar 20 15:53:12 2014
(Ticks: 532B0EE8 jiffies)

これらの例外ログによって、問題は Xbar または Slot1 のシャーシと明確にあります。 

問題なしで電源投入にできるまで Slot1 のモジュールを監視する間、問題を更に特定するために、各 Xbar をそれぞれ取除いて下さい。 これは障害のあるハードウェアのための Return Material Authorization (RMA)を続行したら Xbar 特定のファブリック モジュールにおいての問題があることを確認します。

ただし、これは長いプロシージャであり、長い Maintenance ウィンドウを必要とします。 モジュールにおいての同期に関する問題を引き起こしている正確な Xbar ファブリック スロットを見つけるために、ここに示されているように続行できます:

show system internal xbar event-history errors
-----------------------------------------------------

7) Event:E_DEBUG, length:67, at 384460 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_perform_error_action(1413): MTS_OPC_LC_INSERTED error 0x1

8) Event:E_DEBUG, length:104, at 384347 usecs after Thu Mar 20 15:55:19 2014
[102] send_exception_log_msg_to_lcm(1101): module 1 DevId 88 dev_err 0x8 sys
_err 0x40240012 err_type 0x4

9) Event:E_DEBUG, length:59, at 384343 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_mod_ac_error(221): Sync fail for module 1 link 8

10) Event:E_DEBUG, length:66, at 384341 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_mod_ac_error(210): Error for Slot 0 error_code 0x877660c

11) Event:E_DEBUG, length:62, at 384298 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_sync_seq_failed(1169): Sync fail for module 1 link 8

これらのログでは、モジュール 1 リンク 8 メッセージについては同期化失敗を表示できます。 それからリンク 8 が準であるファブリック スロットを識別して下さい。 これを判別するために、show system 内部 xbar sw コマンドの出力をチェックして下さい:

show system internal xbar sw

Module in slot 1 (present = 0)
 
Dedicated X-link 255
rid 0x2000000 type 0 state 0 sub_type 0 node_id 0x0
sw_card_id 0x0 lc_node_addr 0x0 feature_bits 0x0
timer: hdl 0x86fcc20 rid 0x2000000 ev_id 0xffff timer_id 0x41a tim_type 0x2
Link_Info:: Num Links 10 max Edp 10
    Link_num 0
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 1
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 2
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 3
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 4
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 5
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 6
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 7
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 8
        is_synced 0 is_edp 0 num_sync_try 3
    Link_num 9
        is_synced 0 is_edp 0 num_sync_try 0
Link_Map:: Num Links 10 max Edp 10
    Link_num 0
        connected to fab [10.0] active_lnk 1
        fi_to_mon 0 fi_to_use 0
    Link_num 1
        connected to fab [10.0] active_lnk 1
        fi_to_mon 0 fi_to_use 0
    Link_num 2
        connected to fab [11.0] active_lnk 1
        fi_to_mon 1 fi_to_use 1
    Link_num 3
        connected to fab [11.0] active_lnk 1
        fi_to_mon 1 fi_to_use 1
    Link_num 4
        connected to fab [12.0] active_lnk 1
        fi_to_mon 2 fi_to_use 2
    Link_num 5
        connected to fab [12.0] active_lnk 1
        fi_to_mon 2 fi_to_use 2
    Link_num 6
        connected to fab [13.0] active_lnk 1
        fi_to_mon 3 fi_to_use 3
    Link_num 7
        connected to fab [13.0] active_lnk 1
        fi_to_mon 3 fi_to_use 3
    Link_num 8
        connected to fab [14.0] active_lnk 1
        fi_to_mon 4 fi_to_use 4
    Link_num 9
        connected to fab [14.0] active_lnk 1
        fi_to_mon 4 fi_to_use 4

出力では、ことが Link_num 8 わかります(リンクはすてきな [14.0] (Xbar 5.である 14) ファブリック スロットに 8)接続されます。

: ゼロ ベース 番号付与システムは Xbar のために使用されます。

すてきな [14.0] を識別するため(スロットのファブリックは 5) show module コマンドを入力します:

show module

Xbar Ports Module-Type Model Status
--- ----- -------------------------------- ----------------- ------
4 0 Fabric Module 2 N7K-C7010-FAB-2 ok

Xbar MAC-Address(es) Serial-Num
--- -------------------------------------- ----------
1 NA JAF1739AQTP
2 NA JAF1739AJAA
3 NA JAF1739AQDG
4 NA JAF1739ATHG
5 NA JAF1739AQEF

show module コマンドの出力では、スロット 5.の Xbar ファブリック モジュールを表示できます。 

今 Slot1 でモジュールに同期化失敗を引き起こしたファブリックの正しい識別があるはずです。 この例では、ファブリックはスロット 5 から取除かれ、Slot1 にあったモジュールはエラーなしで起動しました。 不良な Xbar は今取り替えることができます。

関連情報

 



Document ID: 118970