Introdução
Este documento aborda o número de casos mais frequentes registrados na Cisco e na Broadcom relacionados ao comportamento do driver de NFN da Cisco e à nova arquitetura FPIN (Fabric Performance Impact Notifications) da Broadcom na versão 8.0. Este artigo foi escrito para lidar com as preocupações.
Problema
O recurso FPIN (Fabric Performance Impact Notifications) foi adicionado ao ESXi 8.0 U2 para compreender melhor os problemas relacionados à malha. Devido a um bug no código StorageFPIN, quando o FPIN tenta alocar memória e não consegue, ele pode manter uma contagem de referência nos caminhos, o que impede que o driver NFNIC da Cisco possa alocar novos caminhos ou restabelecer os existentes.
Referência:
Consulte KB da Broadcom
O recurso FPIN (Fabric Performance Impact Notifications) foi adicionado ao ESXi 8.0 para compreender melhor os problemas relacionados à malha. Devido a um bug no código StorageFPIN, quando o FPIN tenta alocar memória e não consegue, ele pode manter uma contagem de referência nos caminhos, o que impede que o driver NFNIC da Cisco possa alocar novos caminhos ou restabelecer os existentes.
Esse é um problema conhecido com o FPIN, bem como com a forma como o driver NFNIC da Cisco é codificado para se comportar quando há perdas de caminho. O driver NFNIC não salva as vinculações de porta de armazenamento, de modo que, quando um caminho de armazenamento é restabelecido após uma interrupção ou perda de caminho, ele simplesmente cria novos caminhos e aumenta os números de destino. Devido ao bug com o FPIN mantendo uma contagem de referência nesses caminhos, o driver NFNIC da Cisco é, eventualmente, incapaz de estabelecer novos caminhos.
Uma correção de código para alterar o comportamento de contagem de referência aberta do FPIN estará disponível em uma próxima versão do ESXi 8.x.
Solução
Consulte o artigo Broadcom KB para obter a correção temporária. E quando o patch do ESXi estiver disponível, aplique-o como a solução para correção a longo prazo.
Solução
Para contornar esse problema, é recomendável desabilitar o FPIN em hosts ESXi 8.0, especialmente ao usar o Cisco UCS e o NFNIC:
esxcli storage fpin info set -e false
Para confirmar a configuração:
esxcli storage fpin info get
Além dessa alteração recomendada pela Broadcom, reinicialize o host e recupere todos os caminhos de armazenamento de dados se o armazenamento de dados estiver se comportando corretamente.
Note: Essa alteração não requer uma reinicialização independente. No entanto, se um host ESXi já estiver em um estado de esgotamento de heap de memória para storageFPINHeap, será necessário reinicializar o host após essa alteração de configuração.
Resposta da Cisco
Nosso driver nfnic sempre aumentou o número de ID de destino em cada desconexão/conexão de destino. Esse número de ID de destino de incremento nas versões atual e anterior do driver NFNIC é o que expôs a condição de vazamento de memória no novo recurso FPIN do ESXi.
Além disso, o problema mencionado no artigo é um bug do ESXi OS que será corrigido em uma próxima versão do ESXI. O artigo também menciona o bug da Cisco ID CSCwn0553 que rastreia um problema diferente e a correção do driver nfnic para o bug da Cisco ID CSCwn00553 não é recomendada para resolver o problema do ESXi mencionado no artigo Broadcom KB.
O artigo da Base de conhecimento da VMware está indicando que uma correção de bug da Cisco é necessária, bem como sua correção FPIN. Isso está incorreto e essa instrução adicional pode ser fornecida.
A Broadcom vai fornecer uma correção para o problema do FPIN, que estará disponível na próxima versão de um patch 8.0.U3. Quando a Broadcom liberar a correção FPIN, os drivers VIC atuais funcionarão para o FPIN.
Note: Enquanto isso, o driver NFNIC e seu comportamento em torno da criação de target-ID. Essa implementação no NFNIC com relação ao ID de destino tem sido um comportamento VIC no primeiro dia, e uma alteração nesse comportamento não é necessária para a funcionalidade FPIN quando o reparo do VMware estiver disponível.
Consulte o ID de bug da Cisco CSCwn00553