Rede de armazenamento : Fiber Channel

O rcvd B2B" LR do evento do link da porta do Fibre Channel da série MDS9000 “pesquisa defeitos

14 Outubro 2016 - Tradução por Computador
Outras Versões: Versão em PDFpdf | Inglês (22 Agosto 2015) | Feedback

Introdução

Este documento descreve um problema encontrado em portas Multilayer do Fibre Channel do 9000 Series do switch de dados de Cisco (MDS) (FC) e fornece uma solução ao problema.

Contribuído por Edward Mazurek, engenheiro de TAC da Cisco.

Problema

Indicadores deste log de eventos do link:

*************** Port Config Link Events Log ***************
----                           ------    -----  -----  ------
Time                        PortNo    Speed  Event  Reason
----                         ------    -----  -----  ------
...
Jul 28 00:46:39 2012  00670297  fc11/25   ---   DOWN   LR Rcvd B2B      

A mensagem de B2B do rcvd LR (ou fila nonempty falhada restauração do recv do link da falha do link) indica que o dispositivo anexado à porta transmite um link restaurado (LR) ao MDS, mas o MDS não responde com uma resposta de restauração do link (LRR) devido à congestão interna na porta. A porta tem os pacotes enfileirados que são recebidos do dispositivo anexo, mas o MDS não pode entregá-los à porta de saída apropriada. Desde que são enfileirados ainda na porta de ingresso, o MDS não pode enviar para trás um LRR, e o link falha.

Estes Mensagens de Erro acompanham o log de eventos precedente:

%PORT-2-IF_DOWN_LINK_FAILURE: %$VSAN 93%$ 
Interface fc11/25 is down (Link failure)

%PORT-5-IF_DOWN_LINK_FAILURE: %$VSAN 100%$
Interface fc5/32 is down (Link failure Link Reset
failed nonempty recv queue
)

Nota: Esta encenação é dada sob as suposições que os créditos do número de buffer que o MDS concede o dispositivo FC são três, e que os pacotes do device FC estão comutados à porta da saída FC.

                MDS
   FC Port                FC Port
   (Egress)   Arbiter    (Ingress)      FC device
   --------   -------    ---------      ---------
 1)                           <------- FC packet 1
 2)             <--- Grant Request
 3)             Grant------------>
 4)    <---------------FC packet 1
 5)                            R_Rdy-------->       Tx B2B=3
 6)                           <------- FC packet 2  Tx B2B=2
  7)             <---- Grant Request
 8)                           <------- FC packet 3  Tx B2B=1
  9)             <---- Grant Request
10)                           <------- FC packet 4  Tx B2B=0
11)             <---- Grant Request
12) Time lapses - Variable depending on attached HBA type
13)                           <--------Link Reset(LR)
14)          Start 90ms "LR Rcvd B2B" timer
15)          "LR Rcvd B2B" timer expires
16)                            <--------NOS-------->

Explicação

Esta seção explica a saída precedente:

  1. O dispositivo FC transmite em um pacote FC à porta de ingresso, destinada à porta de saída.
  2. A porta do line card (LC) do ingresso MDS determina o deslocamento predeterminado do destino (DI), e transmite o pedido de Grant ao árbitro (Bellagio2) no supervisor ativo.
  3. O árbitro envia para trás um Grant à porta de ingresso, que lhe dá a permissão transmitir o pacote 1 FC à porta de saída com o XBAR.
  4. O ingresso LC transmite o pacote 1 XBAR direto FC à porta de saída. Isto faz o buffer de ingresso disponível.
  5. A porta de ingresso transmite um R_RDY de volta ao dispositivo FC, que reabastece o crédito.

    Nota: As primeiras cinco etapas são típicas quando não há nenhuma congestão. Supõe neste momento que as filas da porta de saída estão completas e não podem receber any more pacotes.


  6. O dispositivo FC transmite o pacote 2 FC à porta de ingresso, destinada à porta de saída.
  7. A porta do ingresso LC MDS determina o DI, e transmite o pedido de Grant ao árbitro (Bellagio2) no supervisor ativo.
  8. O dispositivo FC transmite o pacote 3 FC à porta de ingresso, destinada à porta de saída.
  9. A porta do ingresso LC MDS determina o DI, e transmite o pedido de Grant ao árbitro (Bellagio2) no supervisor ativo.
  10. O dispositivo FC transmite o pacote 4 FC à porta de ingresso, destinada à porta de saída.
  11. A porta do ingresso LC MDS determina o DI, e transmite o pedido de Grant ao árbitro (Bellagio2) no supervisor ativo.
  12. Lapsos de tempo, que varia baseado no tipo anexado HBA.
  13. Após alguma hora em Tx B2B=0, o dispositivo FC inicia a recuperação da perda de crédito, e transmite uma restauração do link (LR).
  14. Quando a porta de ingresso recebe o LR, verifica seus bufferes de ingresso e determina que há pelo menos um pacote enfileirado. Começa então um temporizador de B2B do rcvd de 90 Senhoras LR.
  15. Se as concessões estão recebidas, e os três pacotes FC estão transmitidos à porta de saída, a seguir o temporizador de B2B do rcvd LR está cancelado, e uma resposta de restauração do link (LRR) é enviada para trás ao dispositivo FC. Neste caso, contudo, as sobras da porta de saída congestionadas, e os três pacotes FC permanecem enfileirados na porta de ingresso. O temporizador de B2B do rcvd LR expira, e um LRR não é transmitido de volta ao dispositivo FC.
  16. A porta de ingresso e o dispositivo FC iniciam uma falha do link através da transmissão não de uma sequência operacional.

Solução

Se o link falhado com um rcvd B2B LR ou uma restauração do link da falha do link falharam a mensagem nonempty da fila do recv, a seguir a porta que falhou não é a causa do lento-dreno e foi afetada somente pelo lento/porta travada. A fim identificar o lento/porta travada que causaram a falha do link, termine estas etapas:

  1. Determine se há mais de um link que falha devido à edição precedente-mencionada. Se mais de um link falha aproximadamente no mesmo tempo, a seguir o problema pôde elevarar porque todas as portas tentam transmitir pacotes a uma porta de saída comum.
  2. Verifique o base de dados do Zoneamento VSAN a fim ver com que dispositivos o dispositivo adjacente FC é dividido. Trace estes à saída E ou às portas locais F. A fim traçar à saída E, as portas usam o comando vsan do <dom> do domínio do <vsan> da rota interna do fspf da mostra. A fim traçar às portas locais F, use o <vsan vsan do base de dados do flogi da mostra > comando. Se há mais de um link que falha com a mensagem de B2B do rcvd LR, a seguir combine a saída E ou as portas locais F encontraram, e verificam para ver se há sobreposições. As sobreposições são causas prováveis de lento/portas travadas.
  3. Verifique as portas encontradas em etapa 2 para ver se há indicações do lento-dreno. Exemplos são:

    • Perda de crédito (AK_FCP_CNTR_CREDIT_LOSS/FCP_SW_CNTR_CREDIT_LOSS)
    • 100 Senhora Tx B2B zero (AK_FCP_CNTR_TX_WT_AVG_B2B_ZERO/FCP_SW_CNTR_TX_WT_AVG_B2B_ZERO)
    • O intervalo rejeita (AK_FCP_CNTR_LAF_TOTAL_TIMEOUT_FRAMES/THB_TMM_TOLB_TIMEOUT_DROP_CNT/F16_TMM_TOLB_TIMEOUT_DROP_CNT)

  4. Se você determina que a porta lenta é uma porta da saída E, a seguir continue o lento-dreno pesquisa defeitos no switch adjacente indicado pela interface de próximo salto FSPF.
  5. Se você determina que o lento/porta travada é um link ou canal de porta FCIP, a seguir verifique os links FCIP para ver se há sinais de retransmissões IP ou de outros problemas, tais como falhas do link. Inscreva o comando all dos ips stat da mostra a fim verificar para ver se há problemas.

Opções de configuração

Estão aqui duas opções de configuração do possível sistema:

  • Este temporizador determina quanto tempo o sistema espere antes que ele os quadros dos intervalos que não podem transmitir. O padrão é a Senhora 500.

    system timeout congestion-drop <ms> mode E|F
  • Este temporizador determina o tempo entre o ponto em que há uns créditos zero de Tx para começar gotas do quadro na linha taxa, até que os créditos estejam recebidos.

    system timeout no-credit-drop <ms> mode E|F

Informações Relacionadas



Document ID: 116400