Switches : Switches Cisco Nexus de la serie 5000

Nexo 5010/5020 interpretación del mensaje de error del Switches %NOHMS-2-NOHMS_DIAG_

31 Julio 2013 - Traducción Automática
Otras Versiones: PDFpdf | Inglés (5 Julio 2013) | Comentarios

Introducción

Este documento describe un problema encontrado con el nexo 5010/5020 Switches causado por los problemas del hardware en los altos ASIC (mensaje de error %NOHMS-2-NOHMS_DIAG_ERROR: Módulo 1: Evento importante detectado diag del Runtime: La falla de puerto), y también proporciona una solución al problema.

Contribuido por Alejandro Eguiarte y Shelley Bhalla, ingenieros de Cisco TAC.

Prerrequisitos

Requisitos

Cisco recomienda que usted tiene conocimiento del nexo CLI.

Componentes Utilizados

La información en este documento se basa en el nexo de Cisco 5010/5020 Switches solamente. No afecta al nexo de Cisco 5548/5596 Switches.

La información que contiene este documento se creó a partir de los dispositivos en un ambiente de laboratorio específico. Todos los dispositivos que se utilizan en este documento se pusieron en funcionamiento con una configuración verificada (predeterminada). Si la red está funcionando, asegúrese de haber comprendido el impacto que puede tener cualquier comando.

Problema

Las interfaces múltiples en el indicador luminoso LED amarillo de la placa muestra gravedad menor 2 están abajo, y usted ve esta alerta:

N5020 %$ VDC-1 %$ %NOHMS-2-NOHMS_DIAG_ERROR: Module 1: Runtime diag detected major event

La alerta sugiere una falla de placa, pero algunos puertos están para arriba. Aunque el 5020 Switch del nexo está en línea, el módulo del Canal de fibra (FC) en el Slot2 es offline. Ingrese el comando show module para ver el estatus de los módulos:

Mod Ports  Module-Type                      Model                  Status
--- ----- -------------------------------- ---------------------- ------------
1 40 40x10GE/Supervisor N5K-C5020P-BF-SUP active *
2 8 8x1/2/4G FC Module N5K-M1008 offline <<<<<<

Mod Sw Hw World-Wide-Name(s) (WWN)
--- -------------- ------ --------------------------------------------------
1 4.2(1)N2(1) 1.3 --
2 4.2(1)N2(1) 1.0 77:9f:b7:62:2f:6c:69:62 to 00:00:00:b8:27:0a:08:2c

Ingrese el comando show environment para ver los datos del entorno del módulo.

Mod Model                   Power     Power       Power     Power       Status
                            Requested Requested   Allocated Allocated
                           (Watts)   (Amp)       (Watts)   (Amp)              
--- ----------------------  -------   ----------  --------- ----------  ----------
1    N5K-C5020P-BF-SUP      625.20    52.10       625.20    52.10       powered-up
2    N5K-M1008              9.96      0.83        9.96      0.83       fail/shutdown

Ingrese el comando de registración del nvram de la demostración para ver esta salida:

N5020 %$ VDC-1 %$ %NOHMS-2-NOHMS_DIAG_ERROR: Module 1: Runtime diag detected major event:
Port failure: Ethernet1/1
N5020 %$ VDC-1 %$ last message repeated 2 times
N5020 %$ VDC-1 %$ %NOHMS-2-NOHMS_DIAG_ERROR: Module 1: Runtime diag detected major event:
Port failure: Ethernet1/2 N5020 %$ VDC-1 %$ last message repeated 7 times
N5020 %$ VDC-1 %$ %NOHMS-2-NOHMS_DIAG_ERROR: Module 1: Runtime diag detected major event:
Port failure: Ethernet1/5 N5020 %$ VDC-1 %$ last message repeated 3 times
N5020 %$ VDC-1 %$ %NOHMS-2-NOHMS_DIAG_ERROR: Module 1: Runtime diag detected major event:
Port failure: Ethernet1/13

Como usted puede ver de los registros, varios puertos fallaron los diagnósticos de ejecución. También, dos puertos de cada Gatos ASIC señalan una “falla de hardware” porque la tela está abajo. Ingrese el comando de la descripción de la interfaz de la demostración para ver esta salida:

--------------------------------------------------------------------------------
Ethernet VLAN Type Mode Status Reason Speed Port
Interface Ch #
--------------------------------------------------------------------------------
Eth1/1 1 eth fabric down Hardware failure 10G(D) 138
Eth1/2 1 eth fabric down Hardware failure 10G(D) 138
Eth1/3 1 eth fabric up none 10G(D) 138
Eth1/4 1 eth fabric up none 10G(D) 138
Eth1/5 1 eth fabric down Hardware failure 10G(D) 140
Eth1/6 1 eth fabric down Hardware failure 10G(D) 140
Eth1/7 1 eth fabric up none 10G(D) 140
Eth1/8 1 eth fabric up none 10G(D) 140

El Gatos ASIC señala los errores para algunos de los puertos y los inhabilita. Ingrese el comando error interno del historial de eventos de los gatos del hardware de la demostración para ver esta salida:

1)  Event:E_DEBUG, length:81, at 775734 usecs after Fri May 24 15:28:10 2013
[101] xcvr_set_port_to_hw_failure(): Sending nohms failure notif for port xgb1/13
2) Event:E_DEBUG, length:44, at 775726 usecs after Fri May 24 15:28:10 2013[100] CODE-PATH:
xcvr_set_port_to_hw_failure
935) Event:E_DEBUG, length:34, at 434695 usecs after Fri May 24 15:28:06 2013[100] CODE-PATH:
xcvr_port_disable
936) Event:E_DEBUG, length:38, at 434653 usecs after Fri May 24 15:28:06 2013[100] CODE-PATH:
xcvr_set_port_disable
937) Event:E_DEBUG, length:81, at 408233 usecs after Fri May 24 15:28:06 2013
[101] xcvr_set_port_to_hw_failure(): Sending nohms failure notif for port xgb1/30
938) Event:E_DEBUG, length:44, at 408224 usecs after Fri May 24 15:28:06 2013
[100] CODE-PATH:
xcvr_set_port_to_hw_failure

De los altos ASIC, hay mensajes debido numerosos de la “interrupción por error” a los problemas de sincronización que causan la tela interconectan las restauraciones (FI). Ingrese los altos internos del hardware de la demostración que los errores del historial de eventos ordenan para ver esta salida:

1)  Event:E_DEBUG, length:131, at 959201 usecs after Fri May 24 14:19:20 2013
[100] Threshold reached for error interrupt - ALT_FIC3_INT_3_XGXS_rx2_loss_of_sync, flags:
0xa8, fabric port: 15, Action: fi-reset
2) Event:E_DEBUG, length:122, at 372727 usecs after Fri May 24 14:15:05 2013
[100] Threshold reached for interrupt - ALT_FIC6_INT_0_XGXS_EXT_serdes_rx2_sync, masking it
(threshold=3 period=10 msecs)
453) Event:E_DEBUG, length:122, at 658189 usecs after Fri May 24 03:38:48 2013
[100] Threshold reached for interrupt - ALT_FIC6_INT_1_XGXS_EXT_serdes_rx0_sync, masking it
(threshold=3 period=10 msecs)
454) Event:E_DEBUG, length:129, at 658137 usecs after Fri May 24 03:38:48 2013

[100] Threshold reached for error interrupt - ALT_FIC6_INT_1_XGXS_rx2_code_eerror, flags:
0xa8, fabric port: 25, Action: fi-reset

Solución

El problema es debido a los problemas del hardware en los altos ASIC. Entre en contacto el Centro de Asistencia Técnica de Cisco (TAC) para substituir el 5000 Series Switch del nexo.


Discusiones relacionadas de la comunidad de soporte de Cisco

La Comunidad de Soporte de Cisco es un foro donde usted puede preguntar y responder, ofrecer sugerencias y colaborar con colegas.


Document ID: 116247