Коммутаторы : Коммутаторы Cisco Nexus серии 5000

Nexus 5010/5020 Коммутаторы %NOHMS-2-NOHMS_DIAG_ Интерпретация Сообщения об ошибках

28 июля 2013 - Машинный перевод
Другие версии: PDF-версия:pdf | Английский (5 июля 2013) | Отзыв

Введение

Этот документ описывает проблему, с которой встречаются с Nexus 5010/5020 коммутаторы, вызванные проблемой аппаратных средств в ASIC Альтов (сообщение об ошибках %NOHMS-2-NOHMS_DIAG_ERROR: Модуль 1 diag во время выполнения обнаружил важное событие: Отказ порта), и также предоставляет решение к проблеме.

Внесенный Алехандро Эгиарте и Шелли Бхаллой, специалистами службы технической поддержки Cisco.

Предварительные условия

Требования

Cisco рекомендует иметь знание CLI Nexus.

Используемые компоненты

Сведения в этом документе основываются на Cisco Nexus 5010/5020 коммутаторы только. Это не влияет на Cisco Nexus 5548/5596 коммутаторы.

Сведения, представленные в этом документе, были получены от устройств, работающих в специальной лабораторной среде. Все устройства, описанные в этом документе, были запущены с чистой (стандартной) конфигурацией. В рабочей сети необходимо изучить потенциальное воздействие всех команд до их использования.

Проблема:

Несколько интерфейсов на Карте 2 не работают, и вы видите это предупреждение:

N5020 %$ VDC-1 %$ %NOHMS-2-NOHMS_DIAG_ERROR: Module 1: Runtime diag detected major event

Предупреждение предлагает ошибку карты, но некоторые порты возросли. Даже при том, что Nexus, 5020 коммутаторов являются онлайновыми, модуль Оптоволоконного канала (FC) в Слоте 2, является офлайновым. Введите команду show module, чтобы просмотреть статус модулей:

Mod Ports  Module-Type                      Model                  Status
--- ----- -------------------------------- ---------------------- ------------
1 40 40x10GE/Supervisor N5K-C5020P-BF-SUP active *
2 8 8x1/2/4G FC Module N5K-M1008 offline <<<<<<

Mod Sw Hw World-Wide-Name(s) (WWN)
--- -------------- ------ --------------------------------------------------
1 4.2(1)N2(1) 1.3 --
2 4.2(1)N2(1) 1.0 77:9f:b7:62:2f:6c:69:62 to 00:00:00:b8:27:0a:08:2c

Введите команду show environment, чтобы просмотреть данные среды модуля.

Mod Model                  Power    Power      Power    Power      Status
                           Requested Requested  Allocated Allocated
                         (Watts)  (Amp)      (Watts)  (Amp)              
--- ---------------------- -------  ---------- --------- ---------- ----------
1   N5K-C5020P-BF-SUP     625.20   52.10      625.20   52.10      powered-up
2   N5K-M1008             9.96     0.83       9.96     0.83      fail/shutdown

Введите команду show logging nvram, чтобы просмотреть эти выходные данные:

N5020 %$ VDC-1 %$ %NOHMS-2-NOHMS_DIAG_ERROR: Module 1: Runtime diag detected major event:
Port failure: Ethernet1/1
N5020 %$ VDC-1 %$ last message repeated 2 times
N5020 %$ VDC-1 %$ %NOHMS-2-NOHMS_DIAG_ERROR: Module 1: Runtime diag detected major event:
Port failure: Ethernet1/2 N5020 %$ VDC-1 %$ last message repeated 7 times
N5020 %$ VDC-1 %$ %NOHMS-2-NOHMS_DIAG_ERROR: Module 1: Runtime diag detected major event:
Port failure: Ethernet1/5 N5020 %$ VDC-1 %$ last message repeated 3 times
N5020 %$ VDC-1 %$ %NOHMS-2-NOHMS_DIAG_ERROR: Module 1: Runtime diag detected major event:
Port failure: Ethernet1/13

Как вы можете видеть от журналов, несколько портов отказали диагностику во время выполнения. Кроме того, два порта от каждого ASIC Gatos сообщают об "Отказе оборудования", потому что матрица не работает. Введите укороченную команду show interface, чтобы просмотреть эти выходные данные:

--------------------------------------------------------------------------------
Ethernet VLAN Type Mode Status Reason Speed Port
Interface Ch #
--------------------------------------------------------------------------------
Eth1/1 1 eth fabric down Hardware failure 10G(D) 138
Eth1/2 1 eth fabric down Hardware failure 10G(D) 138
Eth1/3 1 eth fabric up none 10G(D) 138
Eth1/4 1 eth fabric up none 10G(D) 138
Eth1/5 1 eth fabric down Hardware failure 10G(D) 140
Eth1/6 1 eth fabric down Hardware failure 10G(D) 140
Eth1/7 1 eth fabric up none 10G(D) 140
Eth1/8 1 eth fabric up none 10G(D) 140

ASIC Gatos сообщает о сбоях для некоторых портов и отключает их. Введите аппаратные средства показа внутренняя gatos ошибочная команда истории события, чтобы просмотреть эти выходные данные:

1)  Event:E_DEBUG, length:81, at 775734 usecs after Fri May 24 15:28:10 2013
[101] xcvr_set_port_to_hw_failure(): Sending nohms failure notif for port xgb1/13
2) Event:E_DEBUG, length:44, at 775726 usecs after Fri May 24 15:28:10 2013[100] CODE-PATH:
xcvr_set_port_to_hw_failure
935) Event:E_DEBUG, length:34, at 434695 usecs after Fri May 24 15:28:06 2013[100] CODE-PATH:
xcvr_port_disable
936) Event:E_DEBUG, length:38, at 434653 usecs after Fri May 24 15:28:06 2013[100] CODE-PATH:
xcvr_set_port_disable
937) Event:E_DEBUG, length:81, at 408233 usecs after Fri May 24 15:28:06 2013
[101] xcvr_set_port_to_hw_failure(): Sending nohms failure notif for port xgb1/30
938) Event:E_DEBUG, length:44, at 408224 usecs after Fri May 24 15:28:06 2013
[100] CODE-PATH:
xcvr_set_port_to_hw_failure

От ASIC Альтов существуют многочисленные сообщения в связи с "прерывания по сигналу об ошибке" к Проблемам синхронизации та причина сброс Фабрик интерконнектов (FI). Введите аппаратные средства показа внутренняя ошибочная команда истории события альтов, чтобы просмотреть эти выходные данные:

1)  Event:E_DEBUG, length:131, at 959201 usecs after Fri May 24 14:19:20 2013
[100] Threshold reached for error interrupt - ALT_FIC3_INT_3_XGXS_rx2_loss_of_sync, flags:
0xa8, fabric port: 15, Action: fi-reset
2) Event:E_DEBUG, length:122, at 372727 usecs after Fri May 24 14:15:05 2013
[100] Threshold reached for interrupt - ALT_FIC6_INT_0_XGXS_EXT_serdes_rx2_sync, masking it
(threshold=3 period=10 msecs)
453) Event:E_DEBUG, length:122, at 658189 usecs after Fri May 24 03:38:48 2013
[100] Threshold reached for interrupt - ALT_FIC6_INT_1_XGXS_EXT_serdes_rx0_sync, masking it
(threshold=3 period=10 msecs)
454) Event:E_DEBUG, length:129, at 658137 usecs after Fri May 24 03:38:48 2013

[100] Threshold reached for error interrupt - ALT_FIC6_INT_1_XGXS_rx2_code_eerror, flags:
0xa8, fabric port: 25, Action: fi-reset

Решение:

Проблема вследствие проблемы аппаратных средств в ASIC Альтов. Обратитесь Центр технической поддержки Cisco (TAC), чтобы заменить Nexus 5000 коммутаторов Серии.


Связанные обсуждения сообщества поддержки Cisco

В рамках сообщества поддержки Cisco можно задавать и отвечать на вопросы, обмениваться рекомендациями и совместно работать со своими коллегами.


Document ID: 116247