ストレージ ネットワーキング : ファイバ チャネル

MDS 9000 シリーズ Fibre Channel ポート リンク イベント「LR Rcvd B2B" は解決します

2016 年 10 月 27 日 - 機械翻訳について
その他のバージョン: PDFpdf | 英語版 (2015 年 8 月 22 日) | フィードバック

概要

この資料は Cisco マルチレイヤ データ スイッチ(MD) 9000 シリーズ Fibre Channel (FC) ポートで直面する問題を記述し、問題にソリューションを提供したものです。

著者:Cisco TAC エンジニア、Edward Mazurek

問題

このリンク イベント ログは下記のものを表示します:

*************** Port Config Link Events Log ***************
----                           ------    -----  -----  ------
Time                        PortNo    Speed  Event  Reason
----                         ------    -----  -----  ------
...
Jul 28 00:46:39 2012  00670297  fc11/25   ---   DOWN   LR Rcvd B2B      

LR Rcvd B2B (かリセットされた空でない recv キューはリンク障害 リンク失敗しました)メッセージは再設定されるポートにリンクを接続されるデバイスが(LR)送信するが MD に、MD はポートの内部 輻輳によるリンク リセット応答(LRR)と応答しませんことを示します。 ポートにキューに入る接続デバイスから受信される、MD は適切な出力ポートにそれらを渡すことができませんパケットがあります。 彼らがまだ入力ポートで並べられるので、MD は LRR を送返すことができないしリンクは失敗します。

これらのエラーメッセージは前のイベントログに伴います:

%PORT-2-IF_DOWN_LINK_FAILURE: %$VSAN 93%$ 
Interface fc11/25 is down (Link failure)

%PORT-5-IF_DOWN_LINK_FAILURE: %$VSAN 100%$
Interface fc5/32 is down (Link failure Link Reset
failed nonempty recv queue
)

: このシナリオはバッファ 番号クレジットが FC デバイス 3 であること、そして FC device パケットが出力 FC ポートに交換されるという想定の下で MD が与えること掲載されます。

                MDS
   FC Port                FC Port
   (Egress)   Arbiter    (Ingress)      FC device
   --------   -------    ---------      ---------
 1)                           <------- FC packet 1
 2)             <--- Grant Request
 3)             Grant------------>
 4)    <---------------FC packet 1
 5)                            R_Rdy-------->       Tx B2B=3
 6)                           <------- FC packet 2  Tx B2B=2
  7)             <---- Grant Request
 8)                           <------- FC packet 3  Tx B2B=1
  9)             <---- Grant Request
10)                           <------- FC packet 4  Tx B2B=0
11)             <---- Grant Request
12) Time lapses - Variable depending on attached HBA type
13)                           <--------Link Reset(LR)
14)          Start 90ms "LR Rcvd B2B" timer
15)          "LR Rcvd B2B" timer expires
16)                            <--------NOS-------->

説明

このセクションは前の出力を説明します:

  1. FC デバイスは出力ポートに送信される入力ポートに FC パケットで送信します。
  2. MD 入力 ラインカード(LC)ポートは宛先インデックス(DI)を判別し、アクティブ監視プログラムのアービタ(Bellagio2)にアクセス許可要求を送信します。
  3. アービタは XBAR によって出力ポートに FC パケット 1 を送信するためにそれに権限を与える入力ポートにアクセス許可を送ります。
  4. 入力 LC は出力ポートに FC パケットを 1 直通 XBAR 送信します。 これは入力 バッファを使用できるようにします。
  5. 入力ポートはクレジットを補充する FC デバイスに戻って R_RDY を送信します。

    : 最初の 5 つのステップは輻輳がないとき典型的です。 出力ポート キューが充満し、もうパケットを受信できないとこの時点で仮定して下さい。


  6. FC デバイスは出力ポートに向かう入力ポートに FC パケット 2 を送信します。
  7. MD 入力 LC ポートは DI を判別し、アクティブ監視プログラムのアービタ(Bellagio2)にアクセス許可要求を送信します。
  8. FC デバイスは出力ポートに向かう入力ポートに FC パケット 3 を送信します。
  9. MD 入力 LC ポートは DI を判別し、アクティブ監視プログラムのアービタ(Bellagio2)にアクセス許可要求を送信します。
  10. FC デバイスは出力ポートに向かう入力ポートに FC パケット 4 を送信します。
  11. MD 入力 LC ポートは DI を判別し、アクティブ監視プログラムのアービタ(Bellagio2)にアクセス許可要求を送信します。
  12. 時間経過、接続された HBA 型に基づいて変わる。
  13. Tx B2B=0 の時間以降に、FC デバイスは貸倒損失リカバリを始め、リンク リセット(LR)を送信します。
  14. 入力ポートは LR を受け取るとき、入力 バッファを確認し、キューに入る少なくとも 1 パケットがあることを判別します。 それはそれから 90 ms LR Rcvd B2B タイマーを開始します。
  15. アクセス許可が受け取られ、3 つの FC パケットが出力ポートに送信されれば場合、LR Rcvd B2B タイマーは取り消され、リンク リセット応答(LRR)は FC デバイスに送られます。 この場合しかし出力ポートは混雑させて残り、3 つの FC パケットは入力ポートで並べられて残ります。 LR Rcvd B2B タイマーは切れ、LRR は FC デバイスに戻って送信されません。
  16. 入力ポートおよび FC デバイスは両方ない操作 順序の伝達でリンク障害を始めます。

解決策

リンクが LR Rcvd B2B と失敗するかまたはリセットされた空でない recv キュー メッセージ リンク障害 リンクが失敗したら、失敗したポートは遅下水管の原因でし、遅いの/問題が発生したポートからだけ影響を受けました。 リンク障害を引き起こした問題が発生したポート/遅いを識別するために、これらのステップを完了して下さい:

  1. 複数のリンクがあったかどうか確認して下さい以前に述べられた問題が原因で失敗する。 複数のリンクがほぼ同時に失敗する場合、問題はポートすべてがよくある出力ポートにパケットを送信するように試みるので起こるかもしれません。
  2. どのデバイスをによって VSAN ゾーニング データベースを隣接した FC デバイスが区分されるかチェックして下さい。 出力 Eローカル F ポートにこれらをマッピング して下さい。 出力 E にマッピング するために、ポートは提示 fspf 内部ルート vsan <vsan> ドメイン <dom> コマンドを使用します。 ローカル F ポートにマッピング するために、<vsan show flogi database vsan を > コマンド使用して下さい。 複数のリンクがある場合 LR Rcvd B2B メッセージと失敗する、出力 E を結合すればローカル F ポートはオーバーラップがあるかどうか見つけ、点検します。 オーバーラップは遅い/問題が発生したポートの考えられる原因です。
  3. ステップ 2 で検出される遅下水管の示す値があるようにポートを確認して下さい。 例は、

    • 貸倒損失(AK_FCP_CNTR_CREDIT_LOSS/FCP_SW_CNTR_CREDIT_LOSS)
    • 100 ms Tx B2B ゼロ(AK_FCP_CNTR_TX_WT_AVG_B2B_ZERO/FCP_SW_CNTR_TX_WT_AVG_B2B_ZERO)
    • タイムアウトは廃棄します(AK_FCP_CNTR_LAF_TOTAL_TIMEOUT_FRAMES/THB_TMM_TOLB_TIMEOUT_DROP_CNT/F16_TMM_TOLB_TIMEOUT_DROP_CNT)

  4. 遅いポートは出力 E ポートであることを判別したら、遅下水管を解決します FSPF ネクストホップインターフェイスによって示される隣接 スイッチで続けて下さい。
  5. 遅いの/問題が発生したポートは FCIP リンクまたは port-channel であることを判別したら、リンク障害のような IP 再送信または他の問題のサインがあるように FCIP リンクを、確認して下さい。 問題があるかどうか点検するために show ips 統計をすべてのコマンド入力して下さい。

設定オプション

2 つの可能性のある システム構成 オプションはここにあります:

  • このタイマーは帯送信できないタイムアウトする前にシステムがどの位待っているか判別します。 デフォルトは 500 ミリ秒です

    system timeout congestion-drop <ms> mode E|F
  • このタイマーはクレジットが受け取られるまで行比率でフレーム ドロップを開始する Tx ゼロ クレジットがあるポイント間の時間を判別します。

    system timeout no-credit-drop <ms> mode E|F

関連情報



Document ID: 116400