はじめに
このドキュメントでは、Cisco nfnicドライバの動作とBroadcomの新しいFPIN(ファブリックパフォーマンスの影響の通知)アーキテクチャ(リリース8.0)に関連して、シスコとBroadcomの両方で記録される増加したサービスリクエストの数について説明します。この記事は、問題に対処するために作成されています。
問題
FPIN(Fabric Performance Impact Notifications)機能がESXi 8.0 U2に追加され、ファブリック関連の問題をより詳細に把握できるようになりました。StorageFPINコードの不具合により、FPINがメモリを割り当てようとしてパスの参照カウントを保持し、Cisco NFNICドライバが新しいパスを割り当てたり、既存のパスを再確立したりするのを防ぐことができます。
参考資料
「Broadcom KB」を参照
FPIN(Fabric Performance Impact Notifications)機能がESXi 8.0に追加され、ファブリック関連の問題をより詳細に把握できるようになりました。StorageFPINコードの不具合により、FPINがメモリを割り当てようとしてパスの参照カウントを保持し、Cisco NFNICドライバが新しいパスを割り当てたり、既存のパスを再確立したりするのを防ぐことができます。
これはFPINの既知の問題であり、パス損失が発生した場合にCisco NFNICドライバがどのように動作するようにコーディングされているかも問題です。NFNICドライバはストレージポートバインディングを保存しないため、停止またはパス損失の後でストレージパスが再確立された場合、新しいパスを作成し、ターゲット番号を増やすだけです。FPINがこれらのパスの参照カウントを保持するというバグのため、Cisco NFNICドライバは最終的に新しいパスを確立できません。
今後のESXi 8.xリリースでは、FPINのオープンリファレンス数の動作を変更するコード修正が利用可能になる予定です。
解決方法
回避策の修正については、Broadcom KBの記事を参照してください。 ESXiパッチが利用可能になったら、そのパッチを長期修正のソリューションとして適用します。
回避策
この問題を回避するには、特にCisco UCSとNFNICを使用する場合、ESXi 8.0ホストでFPINを無効にすることを推奨します。
esxcliストレージfpin情報セット – e false
設定を確認するには、次の手順を実行します。
esxcliストレージfpin情報取得
このBroadcom推奨の変更とは別に、ストレージが正常に動作している場合は、ホストを再起動してすべてのストレージパスをリカバリします。
注:この変更では、自動的にリブートする必要はありません。 ただし、ESXiホストがすでにstorageFPINHeapのメモリヒープを使い果たした状態である場合は、この設定の変更後にホストを再起動する必要があります。
シスコの対応
nfnicドライバは、ターゲットの切断や接続のたびにターゲットID番号を増分します。 現在および以前のNFNICドライババージョンでは、このターゲットID番号の増加により、新しいESXi FPIN機能のメモリリーク状態が発生しました。
また、記事に記載されている問題はESXi OSのバグであり、今後のESXIリリースで修正される予定です。この記事では、別の問題を追跡するCisco Bug ID CSCwn00553についても説明しています。Broadcom KBの記事に記載されているESXiの問題を解決するために、Cisco Bug ID CSCwn00553に対するnfnicドライバの修正を推奨しません。
VMwareのサポート技術情報には、FPINの修正に加えてCiscoバグ修正が必要なことが記載されています。これは正しくないため、次の追加ステートメントを指定できます。
Broadcomは、8.0.U3パッチの今後のリリースで利用可能になる予定のFPIN問題の修正を提供する予定です。BroadcomがFPINの修正をリリースすると、現在のVICドライバはFPINで動作します。
注:その間、NFNICドライバおよびターゲットIDの作成に関する動作。ターゲットIDに関するNFNICでのこの実装はVIC 1日目の動作であり、VMwareの修正が利用可能になった後は、この動作の変更はFPIN機能には必要ありません。
Cisco Bug ID CSCwn00553を参照してください