Сети хранения данных : Fiber Channel

MDS устранение неполадок "LR Rcvd B2B" события канала порта Fibre Channel серии 9000

20 октября 2016 - Машинный перевод
Другие версии: PDF-версия:pdf | Английский (22 августа 2015) | Отзыв

Введение

Этот документ описывает проблему, с которой встречаются на многоуровневом коммутаторе данных (MDS) Cisco порты Fibre Channel (FC) серии 9000, и предоставляет решение проблемы.

Внесенный Эдвардом Мэзуреком, специалистом службы технической поддержки Cisco.

Проблема

Эта Ссылка События регистрирует показы:

*************** Port Config Link Events Log ***************
----                         ------    ----- ----- ------
Time                       PortNo    Speed Event Reason
----                        ------    ----- ----- ------
...
Jul 28 00:46:39 2012 00670297 fc11/25  ---  DOWN  LR Rcvd B2B      

LR Rcvd B2B (или Сброс Ссылки Отказа соединения отказал непустую очередь recv) сообщение указывает, что устройство, подключенное к порту, передает сброс канала (LR) к MDS, но MDS не отвечает Ответом сброса ссылки (LRR) из-за внутренней перегрузки на порту. Порту поместили в очередь пакеты, которые получены от подключенного устройства, но MDS не может отправить им соответствующему выходному порту. Так как они все еще помещены в очередь во входном порту, MDS не может передать обратно LRR и сбои ссылки.

Эти сообщения об ошибках сопровождают предыдущий журнал событий:

%PORT-2-IF_DOWN_LINK_FAILURE: %$VSAN 93%$ 
Interface fc11/25 is down (Link failure)

%PORT-5-IF_DOWN_LINK_FAILURE: %$VSAN 100%$
Interface fc5/32 is down (Link failure Link Reset
failed nonempty recv queue
)

Примечание: Этот сценарий дан под предположениями, что кредиты номера буфера, что MDS предоставляет устройство FC, равняются трем, и что пакеты' устройства FC коммутированы к выходному порту FC.

            MDS
  FC Port            FC Port
  (Egress)  Arbiter   (Ingress)     FC device
  --------  -------   ---------     ---------
 1)                          <------- FC packet 1
 2)            <--- Grant Request
 3)            Grant------------>
 4)   <---------------FC packet 1
 5)                           R_Rdy-------->      Tx B2B=3
 6)                          <------- FC packet 2 Tx B2B=2
  7)            <---- Grant Request
 8)                          <------- FC packet 3 Tx B2B=1
  9)            <---- Grant Request
10)                          <------- FC packet 4 Tx B2B=0
11)            <---- Grant Request
12) Time lapses - Variable depending on attached HBA type
13)                          <--------Link Reset(LR)
14)         Start 90ms "LR Rcvd B2B" timer
15)         "LR Rcvd B2B" timer expires
16)                           <--------NOS-------->

Пояснение

Этот раздел объясняет предыдущие выходные данные:

  1. Устройство FC передает в пакете FC к входному порту, предназначенному к выходному порту.
  2. Входная линейная плата MDS (LC) порт определяет Целевой индекс (DI) и передает Запрос Предоставления арбитру (Bellagio2) на Активном управляющем модуль.
  3. Арбитр передает Предоставление обратно во входной порт, который дает ему разрешения для передачи пакета FC 1 к выходному порту через XBAR.
  4. Входной LC передает пакет FC 1 через XBAR к выходному порту. Это делает входной буфер доступным.
  5. Входной порт передает R_RDY назад к устройству FC, которое пополняет кредит.

    Примечание: Когда нет никакой перегрузки, первые пять шагов типичны. Предположите на этом этапе, что очереди выходного порта полны и не могут больше получать пакеты.


  6. Устройство FC передает пакет FC 2 к входному порту, предназначенному к выходному порту.
  7. Входной порт LC MDS определяет DI и передает Запрос Предоставления арбитру (Bellagio2) на Активном управляющем модуль.
  8. Устройство FC передает пакет FC 3 к входному порту, предназначенному к выходному порту.
  9. Входной порт LC MDS определяет DI и передает Запрос Предоставления арбитру (Bellagio2) на Активном управляющем модуль.
  10. Устройство FC передает пакет FC 4 к входному порту, предназначенному к выходному порту.
  11. Входной порт LC MDS определяет DI и передает Запрос Предоставления арбитру (Bellagio2) на Активном управляющем модуль.
  12. Промежутки времени, который варьируется на основе подключенного типа HBA.
  13. Через какое-то время в Tx B2B=0, устройство FC инициирует Восстановление Потери Кредита и передает сброс канала (LR).
  14. Когда входной порт получает LR, он проверяет свои входные буфера и решает, что существует по крайней мере один помещенный в очередь пакет. Это тогда запускает таймер LR Rcvd B2B на 90 мс.
  15. Если Предоставления получены, и три пакета FC переданы к выходному порту, то таймер LR Rcvd B2B отменен, и Ответ сброса ссылки (LRR) передают обратно в устройство FC. В этом случае, однако, выходной порт остается переполненным, и три пакета FC остаются с очередями во входном порту. Таймер LR Rcvd B2B истекает, и LRR не передан назад к устройству FC.
  16. И входной порт и устройство FC инициируют отказ соединения через передачу Не Последовательности.

Решение

Если ссылка, подведенная с LR Rcvd B2B или Сбросом Ссылки Отказа соединения, отказала непустое сообщение очереди recv, то порт , который отказал, не является причиной медленного дренажа и только влиялся медленным / зависшим портом. Для определения медленного / зависшего порта, который вызвал отказ соединения, выполните эти шаги:

  1. Определите, существует ли несколько ссылок, которые отказывают из-за ранее упомянутой проблемы. Если несколько сбоев ссылки в приблизительно то же время, то проблема могла бы возникнуть, потому что все порты пытаются передать пакеты к общему выходному порту.
  2. Проверьте базу данных зонирования VSAN для наблюдения, с которыми устройствами зонируется смежное устройство FC. Сопоставьте их с выходом E или локальными портами F. Для сопоставления с выходом E, порты используют показ fspf vsan внутреннего маршрута <vsan> команда <dom> домена. Для сопоставления с локальными портами F используйте команду <vsan> базы данных VSAN flogi показа. Если существует несколько ссылок, которые отказывают с сообщением LR Rcvd B2B, то объедините выход E или локальные порты F, найденные, и проверьте для наложений. Наложения являются возможными причинами медленных / зависших портов.
  3. Проверьте порты, найденные в Шаге 2 для индикаций относительно медленного дренажа. Примеры:

    • Потеря кредита (AK_FCP_CNTR_CREDIT_LOSS / FCP_SW_CNTR_CREDIT_LOSS)
    • Нуль Tx B2B на 100 мс (AK_FCP_CNTR_TX_WT_AVG_B2B_ZERO / FCP_SW_CNTR_TX_WT_AVG_B2B_ZERO)
    • Сброс таймаута (AK_FCP_CNTR_LAF_TOTAL_TIMEOUT_FRAMES / THB_TMM_TOLB_TIMEOUT_DROP_CNT / F16_TMM_TOLB_TIMEOUT_DROP_CNT)

  4. Если вы решаете, что медленный порт является выходом E порт, то продолжите устранение неполадок медленного дренажа на смежном маршрутизаторе, обозначенном интерфейсом следующего маршрутизатора FSPF.
  5. Если вы решаете, что медленной / зависшим портом является ссылка FCIP или port-channel, то проверьте ссылки FCIP для знаков повторных передач IP или других проблем, таких как отказы соединения. Введите ips stat показа вся команда для проверки для проблем.

Параметры настройки

Вот два параметра конфигурации возможных системных комбинаций:

  • Этот таймер определяет, сколько времени система ждет, прежде чем это вызовет таймаут кадров, которые не в состоянии передать. По умолчанию составляет 500 мс.

    system timeout congestion-drop <ms> mode E|F
  • Этот таймер определяет время между точкой, в которой существуют нулевые кредиты Tx для начала сбросов кадров в скорости линии, непока не получены кредиты.

    system timeout no-credit-drop <ms> mode E|F

Дополнительные сведения



Document ID: 116400