Коммутаторы : Коммутаторы Cisco Nexus серии 7000

Устраните неполадки сбоев синхронизования Xbar на коммутаторе Cisco Nexus серии 7000

20 октября 2016 - Машинный перевод
Другие версии: PDF-версия:pdf | Английский (21 апреля 2016) | Отзыв

Введение

Этот документ описывает, как определить неисправную перемычку (Xbar), когда модуль не работает из-за сбоя синхронизования Xbar на коммутаторе Cisco Nexus серии 7000. Процедура устранения проблем для этой проблемы включает набор данных, анализ данных и процесс устранения для изоляции проблемного компонента.

Внесенный Abhishek Soni, специалистом службы технической поддержки Cisco.

Предварительные условия

Требования

Cisco рекомендует ознакомиться с Операционной системой Cisco Nexus (NX-OS) CLI.

Используемые компоненты

Сведения в этом документе основываются на коммутаторе Cisco Nexus серии 7000, который выполняет Версию 6.1 (2) NX-OS, но это может также работать с любой версией NX-OS.

Сведения, представленные в этом документе, были получены от устройств, работающих в специальной лабораторной среде. Все устройства, описанные в этом документе, были запущены с чистой (стандартной) конфигурацией. В рабочей сети необходимо изучить потенциальное воздействие всех команд до их использования.

Проблема

N7K-F248XP-25E модуль не работает из-за сбоя синхронизования Xbar на загрузку модуля. Когда модуль был вставлен в Слот 1 на шасси, это выключилось. Это может произойти из-за одной из этих причин:

  • Плохой модуль

  • Плохой Xbar

  • Плохо или изогнутый шип на объединительной плате

Решение

В случае подозреваемого отказа оборудования на N7K-F248XP-25E модуле необходимо просмотреть журналы, чтобы определить, является ли причина для сбоя из-за неисправного модуля, или из-за сбоя синхронизования Xbar.

Для дальнейшей изоляции проблемы в данном примере модуль был вставлен в другой слот и стал активным как ожидалось. Это указывает, что модуль не неисправен, таким образом, проблема или с матрицей Xbar или с шасси.

Когда модуль был выключен в Слоте 1, этот журнал исключения появился:

show module internal exceptionlog module 1
********* Exception info for module 1 ********

exception information --- exception instance 1 ----
Module Slot Number: 1
Device Id : 88
Device Name : XbarComplex
Device Errorcode : 0x00000008
Device ID : 00 (0x00)
Device Instance : 00 (0x00)
Dev Type (HW/SW) : 00 (0x00)
ErrNum (devInfo) : 08 (0x08)

System Errorcode : 0x40240012 xbar sync failed during module bringup
(DevErr is LinkNum)
Error Type : Informational
PhyPortLayer : Unknown
Port(s) Affected : none
DSAP : 0 (0x0)
UUID : 0 (0x0)
Time : Thu Mar 20 15:55:19 2014
(Ticks: 532B0F67 jiffies)

exception information --- exception instance 2 ----
Module Slot Number: 1
Device Id : 88
Device Name : XbarComplex
Device Errorcode : 0x00000008
Device ID : 00 (0x00)
Device Instance : 00 (0x00)
Dev Type (HW/SW) : 00 (0x00)
ErrNum (devInfo) : 08 (0x08)

System Errorcode : 0x40240012 xbar sync failed during module bringup
(DevErr is LinkNum)
Error Type : Informational
PhyPortLayer : Unknown
Port(s) Affected : none
DSAP : 0 (0x0)
UUID : 0 (0x0)
Time : Thu Mar 20 15:53:12 2014
(Ticks: 532B0EE8 jiffies)

Согласно этим журналам исключения, проблема ясно с Xbar или с шасси в Слоте 1. 

Для изоляции проблемы далее, необходимо удалить каждый Xbar индивидуально при мониторинге модуля в Слоте 1, пока это не в состоянии включиться без проблем. Это подтверждает, что существует проблема с определенным структурным модулем Xbar, в этом случае вы продолжили бы Разрешение на возврат материалов (RMA) для неисправного оборудования.

Однако это - длинная процедура, и она требует длинного периода технического обслуживания. Для обнаружения точного слота матрицы Xbar, который вызывает синхронизирующую проблему с модулем, можно продолжиться как показано здесь:

show system internal xbar event-history errors
-----------------------------------------------------

7) Event:E_DEBUG, length:67, at 384460 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_perform_error_action(1413): MTS_OPC_LC_INSERTED error 0x1

8) Event:E_DEBUG, length:104, at 384347 usecs after Thu Mar 20 15:55:19 2014
[102] send_exception_log_msg_to_lcm(1101): module 1 DevId 88 dev_err 0x8 sys
_err 0x40240012 err_type 0x4

9) Event:E_DEBUG, length:59, at 384343 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_mod_ac_error(221): Sync fail for module 1 link 8

10) Event:E_DEBUG, length:66, at 384341 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_mod_ac_error(210): Error for Slot 0 error_code 0x877660c

11) Event:E_DEBUG, length:62, at 384298 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_sync_seq_failed(1169): Sync fail for module 1 link 8

В этих журналах вы видите, что Синхронизирующий сбой для модуля 1 связывает 8 сообщений. Необходимо тогда определить оптоволоконный слот, к которому привязана Ссылка 8. Для определения этого необходимо проверить выходные данные show system внутренняя xbar коротковолновая команда:

show system internal xbar sw

Module in slot 1 (present = 0)
 
Dedicated X-link 255
rid 0x2000000 type 0 state 0 sub_type 0 node_id 0x0
sw_card_id 0x0 lc_node_addr 0x0 feature_bits 0x0
timer: hdl 0x86fcc20 rid 0x2000000 ev_id 0xffff timer_id 0x41a tim_type 0x2
Link_Info:: Num Links 10 max Edp 10
   Link_num 0
       is_synced 0 is_edp 0 num_sync_try 0
   Link_num 1
       is_synced 0 is_edp 0 num_sync_try 0
   Link_num 2
       is_synced 0 is_edp 0 num_sync_try 0
   Link_num 3
       is_synced 0 is_edp 0 num_sync_try 0
   Link_num 4
       is_synced 0 is_edp 0 num_sync_try 0
   Link_num 5
       is_synced 0 is_edp 0 num_sync_try 0
   Link_num 6
       is_synced 0 is_edp 0 num_sync_try 0
   Link_num 7
       is_synced 0 is_edp 0 num_sync_try 0
   Link_num 8
       is_synced 0 is_edp 0 num_sync_try 3
   Link_num 9
       is_synced 0 is_edp 0 num_sync_try 0
Link_Map:: Num Links 10 max Edp 10
   Link_num 0
       connected to fab [10.0] active_lnk 1
       fi_to_mon 0 fi_to_use 0
   Link_num 1
       connected to fab [10.0] active_lnk 1
       fi_to_mon 0 fi_to_use 0
   Link_num 2
       connected to fab [11.0] active_lnk 1
       fi_to_mon 1 fi_to_use 1
   Link_num 3
       connected to fab [11.0] active_lnk 1
       fi_to_mon 1 fi_to_use 1
   Link_num 4
       connected to fab [12.0] active_lnk 1
       fi_to_mon 2 fi_to_use 2
   Link_num 5
       connected to fab [12.0] active_lnk 1
       fi_to_mon 2 fi_to_use 2
   Link_num 6
       connected to fab [13.0] active_lnk 1
       fi_to_mon 3 fi_to_use 3
   Link_num 7
       connected to fab [13.0] active_lnk 1
       fi_to_mon 3 fi_to_use 3
   Link_num 8
       connected to fab [14.0] active_lnk 1
       fi_to_mon 4 fi_to_use 4
   Link_num 9
       connected to fab [14.0] active_lnk 1
       fi_to_mon 4 fi_to_use 4

В выходных данных вы видите, что Link_num 8 (Ссылка 8) связан с fab [14.0] (Оптоволоконный Слот 14), который является Xbar 5.

Примечание: Основанная на нуле система нумерации используется для Xbar.

Для определения fab [14.0] (матрица в Слоте 5) вводят команду show module:

show module

Xbar Ports Module-Type Model Status
--- ----- -------------------------------- ----------------- ------
4 0 Fabric Module 2 N7K-C7010-FAB-2 ok

Xbar MAC-Address(es) Serial-Num
--- -------------------------------------- ----------
1 NA JAF1739AQTP
2 NA JAF1739AJAA
3 NA JAF1739AQDG
4 NA JAF1739ATHG
5 NA JAF1739AQEF

В выходных данных команды show module можно просмотреть структурный модуль Xbar в Слоте 5. 

У вас должна теперь быть корректная идентификация матрицы, которая вызвала синхронизирующий сбой к модулю в Слоте 1. В данном примере матрица была удалена из Слота 5 и модуля, который был в Слоте 1, загруженном без любой ошибки. Неисправный Xbar может теперь быть заменен.

Дополнительные сведения

 



Document ID: 118970