Switches : Switches Cisco Nexus 7000 Series

Pesquise defeitos falhas de sincronização de Xbar em um 7000 Series Switch do nexo

14 Outubro 2016 - Tradução por Computador
Outras Versões: Versão em PDFpdf | Inglês (21 Abril 2016) | Feedback

Introdução

Este documento descreve como identificar uma barra transversal defeituosa (Xbar) quando um módulo é abaixo de devido a uma falha de sincronização de Xbar em um 7000 Series Switch do nexo de Cisco. O procedimento de Troubleshooting para este problema envolve o levantamento de dados, a análise de dados, e um processo da eliminação a fim isolar o componente do problema.

Contribuído por Abhishek Soni, engenheiro de TAC da Cisco.

Pré-requisitos

Requisitos

Cisco recomenda que você tem o conhecimento do sistema operacional do nexo de Cisco (NX-OS) CLI.

Componentes Utilizados

A informação neste documento é baseada no 7000 Series Switch do nexo de Cisco que executa a versão 6.1(2) NX-OS, mas pode igualmente trabalhar com toda a versão NX-OS.

As informações neste documento foram criadas a partir de dispositivos em um ambiente de laboratório específico. Todos os dispositivos utilizados neste documento foram iniciados com uma configuração (padrão) inicial. Se a sua rede estiver ativa, certifique-se de que entende o impacto potencial de qualquer comando.

Problema

O módulo N7K-F248XP-25E é abaixo de devido a uma falha de sincronização de Xbar em cima da inicialização de módulo. Quando o módulo foi introduzido no slot1 no chasis, pôs para baixo. Isto pode ocorrer devido a uma destas razões:

  • Módulo ruim

  • Xbar ruim

  • Mau ou pino de curvatura no backplane

Solução

No caso de uma falha do hardware suspeitada no módulo N7K-F248XP-25E, você deve ver entra a ordem para determinar se a razão para a falha é devido a um módulo defeituoso, ou devido à falha de sincronização de Xbar.

A fim isolar mais a edição neste exemplo, o módulo foi introduzido em um entalhe diferente e tornou-se ativo como esperado. Isto indica que o módulo não é defeituoso, assim que a edição é com a tela de Xbar ou com o chassi.

Este log da exceção apareceu quando o módulo foi posto para baixo no slot1:

show module internal exceptionlog module 1
********* Exception info for module 1 ********

exception information --- exception instance 1 ----
Module Slot Number: 1
Device Id : 88
Device Name : XbarComplex
Device Errorcode : 0x00000008
Device ID : 00 (0x00)
Device Instance : 00 (0x00)
Dev Type (HW/SW) : 00 (0x00)
ErrNum (devInfo) : 08 (0x08)

System Errorcode : 0x40240012 xbar sync failed during module bringup
(DevErr is LinkNum)
Error Type : Informational
PhyPortLayer : Unknown
Port(s) Affected : none
DSAP : 0 (0x0)
UUID : 0 (0x0)
Time : Thu Mar 20 15:55:19 2014
(Ticks: 532B0F67 jiffies)

exception information --- exception instance 2 ----
Module Slot Number: 1
Device Id : 88
Device Name : XbarComplex
Device Errorcode : 0x00000008
Device ID : 00 (0x00)
Device Instance : 00 (0x00)
Dev Type (HW/SW) : 00 (0x00)
ErrNum (devInfo) : 08 (0x08)

System Errorcode : 0x40240012 xbar sync failed during module bringup
(DevErr is LinkNum)
Error Type : Informational
PhyPortLayer : Unknown
Port(s) Affected : none
DSAP : 0 (0x0)
UUID : 0 (0x0)
Time : Thu Mar 20 15:53:12 2014
(Ticks: 532B0EE8 jiffies)

Conforme estes logs da exceção, a edição é claramente com o Xbar ou com o chassi no slot1. 

A fim isolar mais a edição, você deve remover cada Xbar individualmente quando você monitorar o módulo no slot1 até que possa pôr acima sem edições. Isto confirma que há uma edição com um módulo de construção particular de Xbar, neste caso você continuaria com uma autorização de material do retorno (RMA) para o hardware defeituoso.

Contudo, este é um procedimento longo e exige uma janela de manutenção longa. A fim encontrar a tela exata de Xbar entalhe que causa a questão de sincronização com o módulo, você pode continuar como mostrado aqui:

show system internal xbar event-history errors
-----------------------------------------------------

7) Event:E_DEBUG, length:67, at 384460 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_perform_error_action(1413): MTS_OPC_LC_INSERTED error 0x1

8) Event:E_DEBUG, length:104, at 384347 usecs after Thu Mar 20 15:55:19 2014
[102] send_exception_log_msg_to_lcm(1101): module 1 DevId 88 dev_err 0x8 sys
_err 0x40240012 err_type 0x4

9) Event:E_DEBUG, length:59, at 384343 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_mod_ac_error(221): Sync fail for module 1 link 8

10) Event:E_DEBUG, length:66, at 384341 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_mod_ac_error(210): Error for Slot 0 error_code 0x877660c

11) Event:E_DEBUG, length:62, at 384298 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_sync_seq_failed(1169): Sync fail for module 1 link 8

Nestes logs, você pode ver a falha da sincronização para a mensagem do link 8 do módulo 1. Você deve então identificar o entalhe da tela com que o link 8 é associado. A fim determinar isto, você deve verificar a saída do comando xbar interno interruptor do sistema da mostra:

show system internal xbar sw

Module in slot 1 (present = 0)
 
Dedicated X-link 255
rid 0x2000000 type 0 state 0 sub_type 0 node_id 0x0
sw_card_id 0x0 lc_node_addr 0x0 feature_bits 0x0
timer: hdl 0x86fcc20 rid 0x2000000 ev_id 0xffff timer_id 0x41a tim_type 0x2
Link_Info:: Num Links 10 max Edp 10
    Link_num 0
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 1
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 2
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 3
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 4
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 5
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 6
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 7
        is_synced 0 is_edp 0 num_sync_try 0
    Link_num 8
        is_synced 0 is_edp 0 num_sync_try 3
    Link_num 9
        is_synced 0 is_edp 0 num_sync_try 0
Link_Map:: Num Links 10 max Edp 10
    Link_num 0
        connected to fab [10.0] active_lnk 1
        fi_to_mon 0 fi_to_use 0
    Link_num 1
        connected to fab [10.0] active_lnk 1
        fi_to_mon 0 fi_to_use 0
    Link_num 2
        connected to fab [11.0] active_lnk 1
        fi_to_mon 1 fi_to_use 1
    Link_num 3
        connected to fab [11.0] active_lnk 1
        fi_to_mon 1 fi_to_use 1
    Link_num 4
        connected to fab [12.0] active_lnk 1
        fi_to_mon 2 fi_to_use 2
    Link_num 5
        connected to fab [12.0] active_lnk 1
        fi_to_mon 2 fi_to_use 2
    Link_num 6
        connected to fab [13.0] active_lnk 1
        fi_to_mon 3 fi_to_use 3
    Link_num 7
        connected to fab [13.0] active_lnk 1
        fi_to_mon 3 fi_to_use 3
    Link_num 8
        connected to fab [14.0] active_lnk 1
        fi_to_mon 4 fi_to_use 4
    Link_num 9
        connected to fab [14.0] active_lnk 1
        fi_to_mon 4 fi_to_use 4

Na saída, você pode ver que Link_num 8 (link 8) está conectado a [14.0] fabuloso (entalhe 14 da tela), que é Xbar 5.

Nota: Um sistema de numeração zero-baseado é usado para o Xbar.

A fim identificar [14.0] fabuloso (a tela no entalhe 5) inscreva o comando show module:

show module

Xbar Ports Module-Type Model Status
--- ----- -------------------------------- ----------------- ------
4 0 Fabric Module 2 N7K-C7010-FAB-2 ok

Xbar MAC-Address(es) Serial-Num
--- -------------------------------------- ----------
1 NA JAF1739AQTP
2 NA JAF1739AJAA
3 NA JAF1739AQDG
4 NA JAF1739ATHG
5 NA JAF1739AQEF

Na saída do comando show module, você pode ver o módulo de construção de Xbar no entalhe 5. 

Você deve agora ter a identificação correta da tela que causou a falha de sincronização ao módulo no slot1. Neste exemplo, a tela foi removida do entalhe 5 e o módulo que estava no slot1 carreg acima sem nenhum erro. O Xbar defeituoso pode agora ser substituído.

Informações Relacionadas

 



Document ID: 118970