Switches : Switches Cisco Nexus 5000 Series

Nexo 5010/5020 de interpretação do Mensagem de Erro do Switches %NOHMS-2-NOHMS_DIAG_

29 Julho 2013 - Tradução por Computador
Outras Versões: Versão em PDFpdf | Inglês (5 Julho 2013) | Feedback

Introdução

Este documento descreve um problema encontrado com nexo 5010/5020 de Switches causado por um problema de hardware nos altos ASIC (Mensagem de Erro %NOHMS-2-NOHMS_DIAG_ERROR: Módulo 1: Evento principal detetado diag do Runtime: A falha de porta), e igualmente fornece uma solução ao problema.

Contribuído por Alejandro Eguiarte e por Shelley Bhalla, engenheiros de TAC da Cisco.

Pré-requisitos

Requisitos

Cisco recomenda que você tem o conhecimento do nexo CLI.

Componentes Utilizados

A informação neste documento é baseada no nexo de Cisco 5010/5020 de Switches somente. Não afeta o nexo de Cisco 5548/5596 de Switches.

As informações neste documento foram criadas a partir de dispositivos em um ambiente de laboratório específico. Todos os dispositivos utilizados neste documento foram iniciados com uma configuração (padrão) inicial. Se a sua rede estiver ativa, certifique-se de que entende o impacto potencial de qualquer comando.

Problema

As interfaces múltiplas no cartão 2 estão para baixo, e você vê este alerta:

N5020 %$ VDC-1 %$ %NOHMS-2-NOHMS_DIAG_ERROR: Module 1: Runtime diag detected major event

O alerta sugere uma falha de placa, mas algumas portas estão acima. Mesmo que o 5020 Switch do nexo seja em linha, o módulo do Fiber Channel (FC) em Slot2 é autónomo. Inscreva o comando show module a fim ver o estado dos módulos:

Mod Ports  Module-Type                      Model                  Status
--- ----- -------------------------------- ---------------------- ------------
1 40 40x10GE/Supervisor N5K-C5020P-BF-SUP active *
2 8 8x1/2/4G FC Module N5K-M1008 offline <<<<<<

Mod Sw Hw World-Wide-Name(s) (WWN)
--- -------------- ------ --------------------------------------------------
1 4.2(1)N2(1) 1.3 --
2 4.2(1)N2(1) 1.0 77:9f:b7:62:2f:6c:69:62 to 00:00:00:b8:27:0a:08:2c

Inscreva o comando show environment a fim ver os dados do ambiente do módulo.

Mod Model                   Power     Power       Power     Power       Status
                            Requested Requested   Allocated Allocated
                           (Watts)   (Amp)       (Watts)   (Amp)              
--- ----------------------  -------   ----------  --------- ----------  ----------
1    N5K-C5020P-BF-SUP      625.20    52.10       625.20    52.10       powered-up
2    N5K-M1008              9.96      0.83        9.96      0.83       fail/shutdown

Incorpore o comando de registo do nvram da mostra a fim ver esta saída:

N5020 %$ VDC-1 %$ %NOHMS-2-NOHMS_DIAG_ERROR: Module 1: Runtime diag detected major event:
Port failure: Ethernet1/1
N5020 %$ VDC-1 %$ last message repeated 2 times
N5020 %$ VDC-1 %$ %NOHMS-2-NOHMS_DIAG_ERROR: Module 1: Runtime diag detected major event:
Port failure: Ethernet1/2 N5020 %$ VDC-1 %$ last message repeated 7 times
N5020 %$ VDC-1 %$ %NOHMS-2-NOHMS_DIAG_ERROR: Module 1: Runtime diag detected major event:
Port failure: Ethernet1/5 N5020 %$ VDC-1 %$ last message repeated 3 times
N5020 %$ VDC-1 %$ %NOHMS-2-NOHMS_DIAG_ERROR: Module 1: Runtime diag detected major event:
Port failure: Ethernet1/13

Como você pode ver dos registros, diversas portas falharam os diagnósticos de runtime. Também, duas portas de cada Gatos ASIC relatam uma “falha do hardware” porque a tela está para baixo. Incorpore o comando do resumo da relação da mostra a fim ver esta saída:

--------------------------------------------------------------------------------
Ethernet VLAN Type Mode Status Reason Speed Port
Interface Ch #
--------------------------------------------------------------------------------
Eth1/1 1 eth fabric down Hardware failure 10G(D) 138
Eth1/2 1 eth fabric down Hardware failure 10G(D) 138
Eth1/3 1 eth fabric up none 10G(D) 138
Eth1/4 1 eth fabric up none 10G(D) 138
Eth1/5 1 eth fabric down Hardware failure 10G(D) 140
Eth1/6 1 eth fabric down Hardware failure 10G(D) 140
Eth1/7 1 eth fabric up none 10G(D) 140
Eth1/8 1 eth fabric up none 10G(D) 140

O Gatos ASIC relata falhas para algumas das portas e desabilita-as. Inscreva o comando error interno da evento-história dos gatos do hardware da mostra a fim ver esta saída:

1)  Event:E_DEBUG, length:81, at 775734 usecs after Fri May 24 15:28:10 2013
[101] xcvr_set_port_to_hw_failure(): Sending nohms failure notif for port xgb1/13
2) Event:E_DEBUG, length:44, at 775726 usecs after Fri May 24 15:28:10 2013[100] CODE-PATH:
xcvr_set_port_to_hw_failure
935) Event:E_DEBUG, length:34, at 434695 usecs after Fri May 24 15:28:06 2013[100] CODE-PATH:
xcvr_port_disable
936) Event:E_DEBUG, length:38, at 434653 usecs after Fri May 24 15:28:06 2013[100] CODE-PATH:
xcvr_set_port_disable
937) Event:E_DEBUG, length:81, at 408233 usecs after Fri May 24 15:28:06 2013
[101] xcvr_set_port_to_hw_failure(): Sending nohms failure notif for port xgb1/30
938) Event:E_DEBUG, length:44, at 408224 usecs after Fri May 24 15:28:06 2013
[100] CODE-PATH:
xcvr_set_port_to_hw_failure

Dos altos ASIC, há mensagem devido numeroso da “interrupção de erro” às questões de sincronização que causam a tela interconectam as restaurações (FI). Entre nos altos internos do hardware da mostra os erros da evento-história que comandam a fim ver esta saída:

1)  Event:E_DEBUG, length:131, at 959201 usecs after Fri May 24 14:19:20 2013
[100] Threshold reached for error interrupt - ALT_FIC3_INT_3_XGXS_rx2_loss_of_sync, flags:
0xa8, fabric port: 15, Action: fi-reset
2) Event:E_DEBUG, length:122, at 372727 usecs after Fri May 24 14:15:05 2013
[100] Threshold reached for interrupt - ALT_FIC6_INT_0_XGXS_EXT_serdes_rx2_sync, masking it
(threshold=3 period=10 msecs)
453) Event:E_DEBUG, length:122, at 658189 usecs after Fri May 24 03:38:48 2013
[100] Threshold reached for interrupt - ALT_FIC6_INT_1_XGXS_EXT_serdes_rx0_sync, masking it
(threshold=3 period=10 msecs)
454) Event:E_DEBUG, length:129, at 658137 usecs after Fri May 24 03:38:48 2013

[100] Threshold reached for error interrupt - ALT_FIC6_INT_1_XGXS_rx2_code_eerror, flags:
0xa8, fabric port: 25, Action: fi-reset

Solução

O problema é devido a um problema de hardware nos altos ASIC. Contacte o centro de assistência técnica da Cisco (TAC) a fim substituir o 5000 Series Switch do nexo.


Discussões relacionadas da comunidade de suporte da Cisco

A Comunidade de Suporte da Cisco é um fórum onde você pode perguntar e responder, oferecer sugestões e colaborar com colegas.


Document ID: 116247