Introduction
Ce document traite du nombre croissant de cas enregistrés à la fois chez Cisco et Broadcom concernant le comportement du pilote Cisco nfnic et la nouvelle architecture FPIN (Fabric Performance Impact Notifications) Broadcom dans la version 8.0. Cet article est rédigé pour répondre aux préoccupations.
Problème
La fonctionnalité FPIN (Fabric Performance Impact Notifications) a été ajoutée à ESXi 8.0 U2 pour mieux comprendre les problèmes liés au fabric. En raison d'un bogue dans le code StorageFPIN, lorsque FPIN tente d'allouer de la mémoire et qu'il ne peut pas le faire, il peut conserver un comptage de référence sur les chemins qui empêche le pilote de carte réseau sans fil Cisco d'allouer de nouveaux chemins ou de rétablir les chemins existants.
Référence:
Voir Broadcom Ko
La fonctionnalité FPIN (Fabric Performance Impact Notifications) a été ajoutée à ESXi 8.0 pour mieux comprendre les problèmes liés au fabric. En raison d'un bogue dans le code StorageFPIN, lorsque FPIN tente d'allouer de la mémoire et qu'il ne peut pas le faire, il peut conserver un comptage de référence sur les chemins qui empêche le pilote de carte réseau sans fil Cisco d'allouer de nouveaux chemins ou de rétablir les chemins existants.
Il s'agit d'un problème connu à la fois avec FPIN et avec la façon dont le pilote de la carte NFNIC Cisco est codé pour se comporter en cas de perte de chemin. Le pilote NFNIC n'enregistre pas les liaisons de port de stockage. Ainsi, lorsqu'un chemin de stockage se rétablit après une panne ou une perte de chemin, il crée simplement de nouveaux chemins et incrémente les numéros cibles. En raison du bogue avec FPIN qui conserve un décompte de référence sur ces chemins, le pilote de la carte NFNIC Cisco est finalement incapable d'établir de nouveaux chemins.
Un correctif de code destiné à modifier le comportement du nombre de références ouvertes FPIN sera disponible dans une prochaine version d'ESXi 8.x.
Solution
Reportez-vous à l'article Broadcom KB pour le correctif de contournement. Et lorsque le correctif ESXi est disponible, appliquez-le comme solution de correction à long terme.
Solution de contournement
Pour contourner ce problème, il est recommandé de désactiver FPIN sur les hôtes ESXi 8.0, en particulier lors de l'utilisation de Cisco UCS et de la carte NFNIC :
esxcli storage fpin info set -e false
Pour confirmer le paramètre :
esxcli storage fpin info get
Outre cette modification recommandée par Broadcom, redémarrez l'hôte et récupérez tous les chemins de stockage si le stockage se comporte correctement.
Remarque : Cette modification ne nécessite pas un redémarrage en tant que tel. Toutefois, si un hôte ESXi est déjà en état d'épuisement du tas de mémoire pour storageFPINHeap, le redémarrage de l'hôte est requis après cette modification de paramètre.
Réponse de Cisco
Notre pilote nfnic a toujours incrémenté le numéro d'ID cible à chaque déconnexion/connexion cible. Cette incrémentation du numéro d'ID cible sur les versions actuelles et antérieures des pilotes de carte réseau sans fil est ce qui a exposé la condition de fuite de mémoire dans la nouvelle fonctionnalité FPIN d'ESXi.
En outre, le problème mentionné dans l'article est un bogue du système d'exploitation ESXi qui sera corrigé dans une prochaine version d'ESXI. L'article mentionne également l'ID de bogue Cisco CSCwn00553 qui suit un problème différent et le correctif du pilote nfnic pour l'ID de bogue Cisco CSCwn00553 n'est pas recommandé pour résoudre le problème ESXi mentionné dans l'article de la Base de connaissances Broadcom.
L'article de la base de connaissances VMware indique qu'une correction de bogue Cisco est requise, ainsi que leur correction FPIN. Cette affirmation est incorrecte et vous pouvez la compléter.
Broadcom va fournir un correctif pour le problème FPIN qui sera disponible dans la prochaine version d'un correctif 8.0.U3. Une fois que Broadcom a publié le correctif FPIN, les pilotes VIC actuels fonctionnent pour FPIN.
Remarque : Pendant ce temps, pilote NFNIC, et son comportement autour de la création de target-ID. Cette mise en oeuvre sur la carte NFNIC en ce qui concerne l'ID de cible a été le comportement de la carte d'interface virtuelle dès le premier jour et il n'est pas nécessaire de modifier ce comportement pour la fonctionnalité FPIN une fois que le correctif VMware est disponible.
Référence ID de bogue Cisco CSCwn00553