Einleitung
In diesem Dokument wird die Anzahl der Fälle beschrieben, die sowohl bei Cisco als auch bei Broadcom im Zusammenhang mit dem Verhalten von Cisco nfnic-Treibern und der neuen Broadcom FPIN-Architektur (Fabric Performance Impact Notifications) in Version 8.0 gemeldet wurden. Dieser Artikel wurde verfasst, um auf Bedenken einzugehen.
Problem
Die Funktion FPIN (Fabric Performance Impact Notifications) wurde zu ESXi 8.0 U2 hinzugefügt, um Fabric-bezogene Probleme besser zu verstehen. Aufgrund eines Fehlers im StorageFPIN-Code kann die FPIN, wenn sie versucht, Speicher zuzuweisen, und nicht in der Lage ist, einen Referenzzähler auf den Pfaden zu erhalten, wodurch verhindert wird, dass der Cisco NFNIC-Treiber neue Pfade zuweisen oder vorhandene Pfade wiederherstellen kann.
Referenz:
Siehe Broadcom KB
Die Funktion FPIN (Fabric Performance Impact Notifications) wurde zu ESXi 8.0 hinzugefügt, um Fabric-bezogene Probleme besser verstehen zu können. Aufgrund eines Fehlers im StorageFPIN-Code kann die FPIN, wenn sie versucht, Speicher zuzuweisen, und nicht in der Lage ist, einen Referenzzähler auf den Pfaden zu erhalten, wodurch verhindert wird, dass der Cisco NFNIC-Treiber neue Pfade zuweisen oder vorhandene Pfade wiederherstellen kann.
Dies ist ein bekanntes Problem sowohl mit der FPIN als auch mit der Codierung des Cisco NFNIC-Treibers für das Verhalten bei Pfadverlusten. Der NFNIC-Treiber speichert keine Speicher-Port-Bindungen. Wenn ein Speicherpfad nach einem Ausfall oder einem Pfadverlust wiederhergestellt wird, erstellt er einfach neue Pfade und erhöht die Zielnummern. Aufgrund des Fehlers, bei dem die FPIN einen Referenzwert für diese Pfade beibehält, kann der Cisco NFNIC-Treiber schließlich keine neuen Pfade erstellen.
Eine Code-Korrektur zur Änderung des FPIN-Verhaltens bei offenen Verweisen wird in einer kommenden ESXi 8.x-Version verfügbar sein.
Lösung
Weitere Informationen zur Problemumgehung finden Sie im Broadcom KB-Artikel. Wenn der ESXi-Patch verfügbar ist, sollten Sie diesen Patch als Lösung für langfristige Probleme anwenden.
Problemumgehung
Um dieses Problem zu umgehen, wird empfohlen, FPIN auf ESXi 8.0-Hosts zu deaktivieren, insbesondere bei Verwendung von Cisco UCS und NFNIC:
esxcli speicher fpin info set -e false
So bestätigen Sie die Einstellung:
esxcli-Speicher-FPIN-Info abrufen
Neben dieser von Broadcom empfohlenen Änderung muss der Server neu gestartet werden, um alle Speicherpfade wiederherzustellen, wenn der Speicher ordnungsgemäß funktioniert.
Anmerkung: Diese Änderung erfordert keinen Neustart für sich. Wenn sich ein ESXi-Host jedoch bereits im Erschöpfungszustand des Speicher-Heaps für storageFPINHeap befindet, muss der Host nach dieser Änderung der Einstellung neu gestartet werden.
Antwort von Cisco
Unser nfnic-Treiber hat die Ziel-ID-Nummer bei jedem Ziel-Trennen/Verbinden immer erhöht. Durch diese Erhöhung der Ziel-ID-Nummer in der aktuellen und früheren NFNIC-Treiberversion wurde die Speicherverlustbedingung in der neuen ESXi FPIN-Funktion aufgedeckt.
Darüber hinaus handelt es sich bei dem in diesem Artikel erwähnten Problem um einen ESXi OS-Fehler, der in einer kommenden ESXI-Version behoben werden wird. Der Artikel erwähnt auch die Cisco Bug-ID CSCwn00553, die ein anderes Problem nachverfolgt, und die Behebung des nfnic-Treibers für die Cisco Bug-ID CSCwn00553 wird nicht empfohlen, um das im Broadcom KB-Artikel erwähnte ESXi-Problem zu lösen.
Im VMware KB-Artikel wird darauf hingewiesen, dass eine Fehlerbehebung von Cisco erforderlich ist und auch die entsprechende FPIN. Dies ist falsch, und diese zusätzliche Anweisung kann angegeben werden.
Broadcom wird eine Korrektur für das FPIN-Problem liefern, die in der kommenden Version eines 8.0.U3 Patches verfügbar sein wird. Sobald Broadcom den FPIN-Fix veröffentlicht hat, funktionieren die aktuellen VIC-Treiber für FPIN.
Anmerkung: Inzwischen, NFNIC-Treiber, und sein Verhalten rund um die Erstellung von Ziel-ID. Diese Implementierung auf NFNIC in Bezug auf die Ziel-ID war das Verhalten von Tag 1 für VIC, und eine Änderung dieses Verhaltens ist für die FPIN-Funktion nicht erforderlich, sobald VMware Fix verfügbar ist.
Referenz Cisco Bug-ID CSCwn00553