简介
本文档针对思科和Broadcom上记录的与Cisco nfnic驱动程序行为和8.0版中的Broadcom新FPIN(交换矩阵性能影响通知)架构相关的增加案例数量,本文旨在解决相关问题。
问题
FPIN(交换矩阵性能影响通知)功能已添加到ESXi 8.0 U2,以便更好地了解交换矩阵相关问题。由于StorageFPIN代码中的错误,当FPIN尝试分配内存但无法分配时,它可以保持对路径的参考计数,从而阻止Cisco NFNIC驱动程序分配新路径或重新建立现有路径。
参考:
参见Broadcom KB
FPIN(交换矩阵性能影响通知)功能已添加到ESXi 8.0,以便更好地了解与交换矩阵相关的问题。由于StorageFPIN代码中的错误,当FPIN尝试分配内存但无法分配时,它可以保持对路径的参考计数,从而阻止Cisco NFNIC驱动程序分配新路径或重新建立现有路径。
这是FPIN和Cisco NFNIC驱动程序在路径丢失时如何编码的已知问题。NFNIC驱动程序不会保存存储端口绑定,因此,在出现停机或路径丢失后重新建立存储路径时,它只是创建全新的路径并递增目标数量。由于FPIN存在缺陷,在这些路径上保持参考计数,Cisco NFNIC驱动程序最终无法建立新路径。
在即将发布的ESXi 8.x版本中将提供用于更改FPIN开放参考计数行为的代码修复。
解决方案
有关解决方法修复程序,请参阅Broadcom KB文章。 当ESXi修补程序可用时,请应用该修补程序作为长期修复的解决方案。
解决方法
要解决此问题,建议在ESXi 8.0主机上禁用FPIN,特别是在使用Cisco UCS和NFNIC时:
esxcli storage fpin info set -e false
要确认设置,请执行以下操作:
esxcli storage fpin info get
除了此Broadcom建议的更改外,如果存储运行正常,请重新启动主机以恢复所有存储路径。
注意:此更改本身不需要重新启动。 但是,如果ESXi主机已处于storageFPINHeap的内存堆耗尽状态,则需要在更改此设置后重新启动主机。
思科的回应
我们的nfnic驱动程序始终在每次目标断开连接/连接时增加目标ID号。 当前和先前NFNIC驱动程序版本上的目标ID号递增正是新ESXi FPIN功能中内存泄漏情况的暴露原因。
此外,文章中提到的问题是ESXi OS漏洞,将在即将发布的ESXI版本中修复。本文还提到Cisco Bug ID CSCwn00553,它会跟踪其他问题,建议不要使用nfnic驱动程序修复到Cisco Bug ID CSCwn00553,以解决Broadcom知识库文章中提到的ESXi问题。
VMware KB文章表示需要思科漏洞修复以及其FPIN修复。不正确,可以提供此附加语句。
Broadcom将提供FPIN问题的修复程序,在即将推出的8.0.U3补丁中将提供该修复程序。一旦Broadcom发布FPIN修复,当前的VIC驱动程序将适用于FPIN。
注意:同时,NFNIC驱动程序及其创建目标ID的行为。 NFNIC上有关目标ID的此实施是VIC第一天行为,并且一旦VMware修复可用,FPIN功能无需更改此行为。
参考Cisco Bug ID CSCwn00553