Switches : Switches Cisco Nexus de la serie 7000

Fallas de la sincronización de Xbar del Troubleshooting en un 7000 Series Switch del nexo

18 Junio 2016 - Traducción Automática
Otras Versiones: PDFpdf | Inglés (21 Abril 2016) | Comentarios

Introducción

Este documento describe cómo identificar una barra transversal defectuosa (Xbar) cuando un módulo está abajo de debido a una falla de la sincronización de Xbar en un 7000 Series Switch del nexo de Cisco. El procedimiento deTroubleshooting para este problema implica la obtención de datos, la análisis de datos, y un proceso de la eliminación para aislar el componente del problema.

Contribuido por Abhishek Soni, ingeniero de Cisco TAC.

Prerrequisitos

Requisitos

Cisco recomienda que usted tiene conocimiento del sistema operativo del nexo de Cisco (NX-OS) CLI.

Componentes Utilizados

La información en este documento se basa en el 7000 Series Switch del nexo de Cisco que funciona con la versión 6.1(2) NX-OS, pero puede también trabajar con cualquier versión NX-OS.

La información que contiene este documento se creó a partir de los dispositivos en un ambiente de laboratorio específico. Todos los dispositivos que se utilizan en este documento se pusieron en funcionamiento con una configuración verificada (predeterminada). Si la red está funcionando, asegúrese de haber comprendido el impacto que puede tener cualquier comando.

Problema

El módulo N7K-F248XP-25E está abajo de debido a una falla de la sincronización de Xbar sobre el arranque del módulo. Cuando el módulo fue insertado en el slot1 en el chasis, accionó abajo. Esto puede ocurrir debido a una de estas razones:

  • Mún módulo

  • Mún Xbar

  • Malo o pin doblado en el backplane

Solución

En el caso de una falla de hardware sospechosa en el módulo N7K-F248XP-25E, usted debe ver abre una sesión la orden para determinar si la razón del incidente es debido a un módulo defectuoso, o debido a la falla de la sincronización de Xbar.

Para aislar más lejos el problema en este ejemplo, el módulo fue insertado en un diverso slot y llegó a ser activo como se esperaba. Esto indica que el módulo no es defectuoso, así que el problema está con la tela de Xbar o con el chasis.

Este registro de la excepción apareció cuando el módulo fue accionado abajo en el slot1:

show module internal exceptionlog module 1
********* Exception info for module 1 ********

exception information --- exception instance 1 ----
Module Slot Number: 1
Device Id : 88
Device Name : XbarComplex
Device Errorcode : 0x00000008
Device ID : 00 (0x00)
Device Instance : 00 (0x00)
Dev Type (HW/SW) : 00 (0x00)
ErrNum (devInfo) : 08 (0x08)

System Errorcode : 0x40240012 xbar sync failed during module bringup
(DevErr is LinkNum)
Error Type : Informational
PhyPortLayer : Unknown
Port(s) Affected : none
DSAP : 0 (0x0)
UUID : 0 (0x0)
Time : Thu Mar 20 15:55:19 2014
(Ticks: 532B0F67 jiffies)

exception information --- exception instance 2 ----
Module Slot Number: 1
Device Id : 88
Device Name : XbarComplex
Device Errorcode : 0x00000008
Device ID : 00 (0x00)
Device Instance : 00 (0x00)
Dev Type (HW/SW) : 00 (0x00)
ErrNum (devInfo) : 08 (0x08)

System Errorcode : 0x40240012 xbar sync failed during module bringup
(DevErr is LinkNum)
Error Type : Informational
PhyPortLayer : Unknown
Port(s) Affected : none
DSAP : 0 (0x0)
UUID : 0 (0x0)
Time : Thu Mar 20 15:53:12 2014
(Ticks: 532B0EE8 jiffies)

Según estos registros de la excepción, el problema está claramente con el Xbar o con el chasis en el slot1. 

Para aislar el problema más lejos, usted debe quitar cada Xbar individualmente mientras que usted monitorea el módulo en el slot1 hasta que pueda accionar para arriba sin los problemas. Esto confirma que hay un problema con un módulo de recursos físicos determinado de Xbar, en este caso usted procedería con una Autorización de devolución de materiales (RMA) para el hardware defectuoso.

Sin embargo, esto es un procedimiento largo y requiere una ventana de mantenimiento larga. Para encontrar la tela exacta de Xbar ranure que causa el problema de sincronización con el módulo, usted puede proceder como se muestra aquí:

show system internal xbar event-history errors
-----------------------------------------------------

7) Event:E_DEBUG, length:67, at 384460 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_perform_error_action(1413): MTS_OPC_LC_INSERTED error 0x1

8) Event:E_DEBUG, length:104, at 384347 usecs after Thu Mar 20 15:55:19 2014
[102] send_exception_log_msg_to_lcm(1101): module 1 DevId 88 dev_err 0x8 sys
_err 0x40240012 err_type 0x4

9) Event:E_DEBUG, length:59, at 384343 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_mod_ac_error(221): Sync fail for module 1 link 8

10) Event:E_DEBUG, length:66, at 384341 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_mod_ac_error(210): Error for Slot 0 error_code 0x877660c

11) Event:E_DEBUG, length:62, at 384298 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_sync_seq_failed(1169): Sync fail for module 1 link 8

En estos registros, usted puede ver el fall del sincronizar para el mensaje del link 8 del módulo 1. Usted debe entonces identificar el slot de la tela con el cual el link 8 es asociado. Para determinar esto, usted debe marcar la salida del comando xbar interno interruptor del sistema de la demostración:

show system internal xbar sw

Module in slot 1 (present = 0)
 
Dedicated X-link 255
rid 0x2000000 type 0 state 0 sub_type 0 node_id 0x0
sw_card_id 0x0 lc_node_addr 0x0 feature_bits 0x0
timer: hdl 0x86fcc20 rid 0x2000000 ev_id 0xffff timer_id 0x41a tim_type 0x2
Link_Info:: Num Links 10 max Edp 10
    Link_num 0
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 1
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 2
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 3
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 4
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 5
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 6
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 7
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 8
        is_synced 0 is_edp 0 num_sync_try 3
    Link_num 9
        is_synced 0 is_edp 0 num_sync_try 0
Link_Map:: Num Links 10 max Edp 10
    Link_num 0
        connected to fab [10.0] active_lnk 1
        fi_to_mon 0 fi_to_use 0
    Link_num 1
        connected to fab [10.0] active_lnk 1
        fi_to_mon 0 fi_to_use 0
    Link_num 2
        connected to fab [11.0] active_lnk 1
        fi_to_mon 1 fi_to_use 1
    Link_num 3
        connected to fab [11.0] active_lnk 1
        fi_to_mon 1 fi_to_use 1
    Link_num 4
        connected to fab [12.0] active_lnk 1
        fi_to_mon 2 fi_to_use 2
    Link_num 5
        connected to fab [12.0] active_lnk 1
        fi_to_mon 2 fi_to_use 2
    Link_num 6
        connected to fab [13.0] active_lnk 1
        fi_to_mon 3 fi_to_use 3
    Link_num 7
        connected to fab [13.0] active_lnk 1
        fi_to_mon 3 fi_to_use 3
    Link_num 8
        connected to fab [14.0] active_lnk 1
        fi_to_mon 4 fi_to_use 4
    Link_num 9
        connected to fab [14.0] active_lnk 1
        fi_to_mon 4 fi_to_use 4

En la salida, usted puede ver que Link_num 8 (el link 8) está conectado con el fab [14.0] (slot 14 de la tela), que es Xbar 5.

Nota: Un sistema de numeración basado en cero se utiliza para el Xbar.

Para identificar el fab [14.0] (la tela en el slot 5) ingresa el comando show module:

show module

Xbar Ports Module-Type Model Status
--- ----- -------------------------------- ----------------- ------
4 0 Fabric Module 2 N7K-C7010-FAB-2 ok

Xbar MAC-Address(es) Serial-Num
--- -------------------------------------- ----------
1 NA JAF1739AQTP
2 NA JAF1739AJAA
3 NA JAF1739AQDG
4 NA JAF1739ATHG
5 NA JAF1739AQEF

En la salida del comando show module, usted puede ver el módulo de recursos físicos de Xbar en el slot 5. 

Usted debe ahora tener la identificación correcta de la tela que causó la falla de la sincronización al módulo en el slot1. En este ejemplo, la tela fue quitada del slot 5 y el módulo que estaba en el slot1 arrancó sin ningún error. El Xbar defectuoso puede ahora ser substituido.

Información Relacionada

 


Discusiones relacionadas de la comunidad de soporte de Cisco

La Comunidad de Soporte de Cisco es un foro donde usted puede preguntar y responder, ofrecer sugerencias y colaborar con colegas.


Document ID: 118970