Inleiding
In dit document wordt ingegaan op het aantal gevallen dat zowel bij Cisco als bij Broadcom is geregistreerd in verband met het gedrag van Cisco-nfnic-stuurprogramma's en de nieuwe Broadcom FPIN-architectuur (Fabric Performance Impact Notifications) in versie 8.0. Dit artikel is geschreven om problemen aan te pakken.
Probleem
De FPIN-functie (Fabric Performance Impact Notifications) is toegevoegd aan ESXi 8.0 U2 om een beter inzicht te krijgen in problemen met verbindingen. Als gevolg van een fout in de StorageFPIN-code, wanneer FPIN probeert geheugen toe te wijzen en dit niet kan, kan het een referentietelling op de paden behouden waardoor het Cisco NFNIC-stuurprogramma geen nieuwe paden kan toewijzen of bestaande paden opnieuw kan instellen.
Referentie:
Zie Broadcom KB
De FPIN-functie (Fabric Performance Impact Notifications) is toegevoegd aan ESXi 8.0 om een beter inzicht te krijgen in problemen met verbindingen. Als gevolg van een fout in de StorageFPIN-code, wanneer FPIN probeert geheugen toe te wijzen en dit niet kan, kan het een referentietelling op de paden behouden waardoor het Cisco NFNIC-stuurprogramma geen nieuwe paden kan toewijzen of bestaande paden opnieuw kan instellen.
Dit is een bekend probleem met zowel FPIN als hoe het Cisco NFNIC-stuurprogramma is gecodeerd om zich te gedragen wanneer er padverliezen zijn. Het NFNIC-stuurprogramma slaat geen bindingen van de opslagpoort op, dus wanneer een opslagpad opnieuw wordt ingesteld na een storing of padverlies, maakt het gewoon gloednieuwe paden en verhoogt het de doelnummers. Vanwege de bug met FPIN die een referentietelling op die paden houdt, is het Cisco NFNIC-stuurprogramma uiteindelijk niet in staat om nieuwe paden vast te stellen.
Een code fix om het open referentietelling gedrag van de FPIN te veranderen zal beschikbaar zijn in een aankomende ESXi 8.x release.
Oplossing
Raadpleeg het artikel Broadcom KB voor de oplossing van de tijdelijke oplossing. En wanneer de ESXi-pleister beschikbaar is, brengt u die pleister aan als de oplossing voor langetermijnherstel.
Tijdelijke oplossing
Om dit probleem op te lossen, is het raadzaam om FPIN uit te schakelen op ESXi 8.0-hosts, vooral bij gebruik van Cisco UCS en NFNIC:
ESXCLI-opslag FPIN-informatieset -E false
De instelling bevestigen:
ESXCLI-opslag FPIN-info ophalen
Afgezien van deze door Broadcom aanbevolen wijziging, start u de host opnieuw op om alle opslagpaden te herstellen als de opslag zich correct gedraagt.
Opmerking: voor deze wijziging hoeft u alleen niet opnieuw op te starten. Als een ESXi-host zich echter al in de uitputtingsstatus van de geheugenheap voor StorageFPINHeap bevindt, moet de host opnieuw worden opgestart nadat deze instelling is gewijzigd.
De reactie van Cisco
Onze nfnic-driver heeft altijd het doel-ID-nummer verhoogd bij elke doelverbinding verbreken / verbinden. Dit toenemende doel-ID-nummer op huidige en eerdere NFNIC-stuurprogrammaversies is wat de toestand van het geheugenlek in de nieuwe ESXi FPIN-functie blootlegde.
Bovendien is het probleem dat in het artikel wordt genoemd een ESXi OS-bug die zal worden opgelost in een aankomende ESXI-release. Het artikel vermeldt ook Cisco bug ID CSCwn00553 die een ander probleem volgt en de nfnic driver fix naar Cisco bug ID CSCwn00553 wordt niet aanbevolen om de ESXi probleem vermeld in de Broadcom KB artikel op te lossen.
Het VMware KB-artikel geeft aan dat een Cisco-bugfix vereist is, evenals hun FPIN-fix. Dit is onjuist en deze aanvullende verklaring kan worden verstrekt.
Broadcom gaat een oplossing bieden voor het FPIN-probleem dat beschikbaar zal zijn in de aankomende release van een 8.0.U3-patch. Zodra Broadcom de FPIN-fix heeft vrijgegeven, werken de huidige VIC-stuurprogramma's voor FPIN.
Opmerking: ondertussen is het NFNIC-stuurprogramma en het gedrag ervan rond het maken van doel-ID. Deze implementatie op NFNIC met betrekking tot doel-ID is VIC-gedrag op de eerste dag geweest en een verandering in dit gedrag is niet vereist voor de FPIN-functionaliteit zodra VMware-fix beschikbaar is.
Referentie Cisco bug ID CSCwn00553