スイッチ : Cisco Nexus 5000 シリーズ スイッチ

Nexus 5010/5020 スイッチ %NOHMS-2-NOHMS_DIAG_ エラーメッセージ解釈

2013 年 8 月 21 日 - 機械翻訳について
その他のバージョン: PDFpdf | 英語版 (2013 年 7 月 5 日) | フィードバック

概要

この資料は ALTO ASIC (エラーメッセージ %NOHMS-2-NOHMS_DIAG_ERROR でハードウェア上の問題によって原因になられる Nexus 5010/5020 スイッチによって直面する問題を記述したものです: モジュール 1: 動作時 diag によって検出する 主要なイベント: ポート障害はまた問題に)、ソリューションを提供し。

Alejandro Eguiarte および Shelley Bhalla によって貢献される、Cisco TAC エンジニア。

前提条件

要件

Cisco は Nexus CLI のナレッジがあることを推奨します。

使用するコンポーネント

この文書に記載されている情報は Cisco Nexus 5010/5020 スイッチだけに基づいています。 それは Cisco Nexus 5548/5596 スイッチに影響を与えません。

このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されたものです。 このドキュメントで使用するすべてのデバイスは、クリアな(デフォルト)設定で作業を開始しています。 ネットワークが稼働中の場合は、コマンドが及ぼす潜在的な影響を十分に理解しておく必要があります。

問題

カード 2 のマルチプルインターフェイスはダウンし、このアラートを見ます:

N5020 %$ VDC-1 %$ %NOHMS-2-NOHMS_DIAG_ERROR: Module 1: Runtime diag detected major event

アラートはカード障害を提案しますが、いくつかのポートは稼働しています。 Nexus 5020 スイッチがオンラインであるのに、スロット 2 のファイバ チャネル(FC)モジュールはオフ・ラインです。 モジュールのステータスを表示するために show module コマンドを入力して下さい:

Mod Ports  Module-Type                      Model                  Status
--- ----- -------------------------------- ---------------------- ------------
1 40 40x10GE/Supervisor N5K-C5020P-BF-SUP active *
2 8 8x1/2/4G FC Module N5K-M1008 offline <<<<<<

Mod Sw Hw World-Wide-Name(s) (WWN)
--- -------------- ------ --------------------------------------------------
1 4.2(1)N2(1) 1.3 --
2 4.2(1)N2(1) 1.0 77:9f:b7:62:2f:6c:69:62 to 00:00:00:b8:27:0a:08:2c

モジュール 環境 データを表示するために show environment コマンドを入力して下さい。

Mod Model                   Power     Power       Power     Power       Status
                            Requested Requested   Allocated Allocated
                           (Watts)   (Amp)       (Watts)   (Amp)              
--- ----------------------  -------   ----------  --------- ----------  ----------
1    N5K-C5020P-BF-SUP      625.20    52.10       625.20    52.10       powered-up
2    N5K-M1008              9.96      0.83        9.96      0.83       fail/shutdown

この出力を表示するために show logging nvram コマンドを入力して下さい:

N5020 %$ VDC-1 %$ %NOHMS-2-NOHMS_DIAG_ERROR: Module 1: Runtime diag detected major event:
Port failure: Ethernet1/1
N5020 %$ VDC-1 %$ last message repeated 2 times
N5020 %$ VDC-1 %$ %NOHMS-2-NOHMS_DIAG_ERROR: Module 1: Runtime diag detected major event:
Port failure: Ethernet1/2 N5020 %$ VDC-1 %$ last message repeated 7 times
N5020 %$ VDC-1 %$ %NOHMS-2-NOHMS_DIAG_ERROR: Module 1: Runtime diag detected major event:
Port failure: Ethernet1/5 N5020 %$ VDC-1 %$ last message repeated 3 times
N5020 %$ VDC-1 %$ %NOHMS-2-NOHMS_DIAG_ERROR: Module 1: Runtime diag detected major event:
Port failure: Ethernet1/13

ログからわかるように複数のポートは動作時診断失敗しました。 また、各 Gatos ASIC からの 2 つのポートはファブリックがダウンしているので「ハードウェア障害」を報告します。 この出力を表示するために show interface 要約コマンドを入力して下さい:

--------------------------------------------------------------------------------
Ethernet VLAN Type Mode Status Reason Speed Port
Interface Ch #
--------------------------------------------------------------------------------
Eth1/1 1 eth fabric down Hardware failure 10G(D) 138
Eth1/2 1 eth fabric down Hardware failure 10G(D) 138
Eth1/3 1 eth fabric up none 10G(D) 138
Eth1/4 1 eth fabric up none 10G(D) 138
Eth1/5 1 eth fabric down Hardware failure 10G(D) 140
Eth1/6 1 eth fabric down Hardware failure 10G(D) 140
Eth1/7 1 eth fabric up none 10G(D) 140
Eth1/8 1 eth fabric up none 10G(D) 140

Gatos ASIC はいくつかのポートのための失敗を報告し、ディセーブルにします。 この出力を表示するために show hardware 内部 gatos イベント履歴エラー コマンドを入力して下さい:

1)  Event:E_DEBUG, length:81, at 775734 usecs after Fri May 24 15:28:10 2013
[101] xcvr_set_port_to_hw_failure(): Sending nohms failure notif for port xgb1/13
2) Event:E_DEBUG, length:44, at 775726 usecs after Fri May 24 15:28:10 2013[100] CODE-PATH:
xcvr_set_port_to_hw_failure
935) Event:E_DEBUG, length:34, at 434695 usecs after Fri May 24 15:28:06 2013[100] CODE-PATH:
xcvr_port_disable
936) Event:E_DEBUG, length:38, at 434653 usecs after Fri May 24 15:28:06 2013[100] CODE-PATH:
xcvr_set_port_disable
937) Event:E_DEBUG, length:81, at 408233 usecs after Fri May 24 15:28:06 2013
[101] xcvr_set_port_to_hw_failure(): Sending nohms failure notif for port xgb1/30
938) Event:E_DEBUG, length:44, at 408224 usecs after Fri May 24 15:28:06 2013
[100] CODE-PATH:
xcvr_set_port_to_hw_failure

ALTO ASIC から、ファブリックを相互接続する(FI)リセットを引き起こす同期に関する問題による多数の「エラー 割り込み」メッセージがあります。 show hardware 内部 ALTO を入力して下さいこの出力を表示するためにイベント履歴エラーが命じる:

1)  Event:E_DEBUG, length:131, at 959201 usecs after Fri May 24 14:19:20 2013
[100] Threshold reached for error interrupt - ALT_FIC3_INT_3_XGXS_rx2_loss_of_sync, flags:
0xa8, fabric port: 15, Action: fi-reset
2) Event:E_DEBUG, length:122, at 372727 usecs after Fri May 24 14:15:05 2013
[100] Threshold reached for interrupt - ALT_FIC6_INT_0_XGXS_EXT_serdes_rx2_sync, masking it
(threshold=3 period=10 msecs)
453) Event:E_DEBUG, length:122, at 658189 usecs after Fri May 24 03:38:48 2013
[100] Threshold reached for interrupt - ALT_FIC6_INT_1_XGXS_EXT_serdes_rx0_sync, masking it
(threshold=3 period=10 msecs)
454) Event:E_DEBUG, length:129, at 658137 usecs after Fri May 24 03:38:48 2013

[100] Threshold reached for error interrupt - ALT_FIC6_INT_1_XGXS_rx2_code_eerror, flags:
0xa8, fabric port: 25, Action: fi-reset

解決策

問題は ALTO ASIC のハードウェア上の問題が原因です。 Nexus 5000 シリーズ スイッチを取り替えるために Cisco Technical Assistance Center (TAC)に連絡して下さい。


関連するシスコ サポート コミュニティ ディスカッション

シスコ サポート コミュニティは、どなたでも投稿や回答ができる情報交換スペースです。


Document ID: 116247