Коммутаторы : ??????????? Cisco Nexus ????? 3500

Nexus процесс проверки состояния системы платформы коммутатора серии 3500

5 апреля 2016 - Машинный перевод
Другие версии: PDF-версия:pdf | Отзыв

Введение

Этот документ описывает общий процесс, который используется для выполнения, состояние системы проверяют Cisco Nexus платформы коммутатора серии 3500, которые выполняют Операционную систему Nexus (NX-OS) Выпуск 6.0 (2). 

Внесенный Йоджешем Рэмдоссом и Мэттом Блэншардом, специалистами службы технической поддержки Cisco.

ЦПУ монитора и использование памяти

Для получения обзора ЦПУ и использования памяти системы, введите команду ресурсов show system:

switch# show system resources 
Load average: 1 minute: 0.32 5 minutes: 0.13
  15 minutes: 0.10
Processes: 366 total, 2 running
CPU states: 5.5% user, 12.0% kernel, 82.5% idle
 CPU0 states: 10.0% user, 18.0% kernel,
  72.0% idle
 CPU1 states: 1.0% user, 6.0% kernel, 93.0% idle
Memory usage: 4117064K total, 2614356K used,
  1502708K free
Switch#

Если вы требуете большего количества подробных данных о процессах, которые используют циклы ЦПУ или память, вводят вид ЦПУ покажите процесс и show system внутренние команды usage памяти ядра:

switch# show process cpu sort
PID   Runtime(ms) Invoked  uSecs 1Sec   Process
----- ----------- -------- ----- ------ -----------
 3239    55236684 24663045  2239   6.3% mtc_usd
 3376         776     7007   110   2.7% netstack
  15    26592500 178719270   148  0.9% kacpid
 3441     4173060 29561656   141   0.9% cfs
 3445     7646439  6391217  1196   0.9% lacp
 3507    13646757 34821232   391   0.9% hsrp_engine
   1       80564   596043   135   0.0% init
   2           6      302    20   0.0% kthreadd
   3        1064   110904     9   0.0% migration/0
<snip>
switch# show system internal kernel memory usage 
MemTotal:     4117064 kB
MemFree:      1490120 kB
Buffers:          332 kB
Cached:       1437168 kB
ShmFS:        1432684 kB
Allowed:      1029266 Pages
Free:          372530 Pages
Available:     375551 Pages
SwapCached:         0 kB
Active:       1355724 kB
Inactive:      925400 kB
HighTotal:    2394400 kB
HighFree:      135804 kB
LowTotal:     1722664 kB
LowFree:      1354316 kB
SwapTotal:          0 kB
SwapFree:           0 kB
Dirty:             12 kB
Writeback:          0 kB
AnonPages:     843624 kB
Mapped:        211144 kB
Slab:           98524 kB
SReclaimable:    7268 kB
SUnreclaim:     91256 kB
PageTables:     19604 kB
NFS_Unstable:       0 kB
Bounce:             0 kB
WritebackTmp:       0 kB
CommitLimit:  2058532 kB
Committed_AS: 10544480 kB
VmallocTotal:  284664 kB
VmallocUsed:   174444 kB
VmallocChunk:  108732 kB
HugePages_Total:    0
HugePages_Free:     0
HugePages_Rsvd:     0
HugePages_Surp:     0
Hugepagesize:    2048 kB
DirectMap4k:     2048 kB
DirectMap2M:  1787904 kB
switch#

Выходные данные показывают, что область Верхней области памяти используется NX-OS, и область Нижней области памяти используется ядром.  Значения MemTotal и MemFree предоставляют общую память, которая доступна для коммутатора.

Для генерации предупреждений использования памяти настройте коммутатор, подобный этому:

switch(config)# system memory-thresholds minor 50 severe 70 critical 90

Примечание: Для этого документа значения 50, 70, и 90 используются только в качестве примеров; выберите пороговые пределы на основе потребностей.

Проверьте аппаратный статус диагностики

Для проверки аппаратного статуса диагностики введите show diagnostic result вся команда. Гарантируйте, что весь тестовый проход, и что Полные Результаты диагностики являются ПРОХОДОМ.

switch# show diagnostic result all 
Current bootup diagnostic level: complete
Module 1: 48x10GE Supervisor SerialNo : <serial #>
 Overall Diagnostic Result for Module 1 : PASS
 Diagnostic level at card bootup: complete
 Test results: (. = Pass, F = Fail, I = Incomplete, U = Untested, A = Abort)
    1) TestUSBFlash ------------------------> .
    2) TestSPROM ---------------------------> .
    3) TestPCIe ----------------------------> .
    4) TestLED -----------------------------> .
    5) TestOBFL ----------------------------> .
    6) TestNVRAM ---------------------------> .
    7) TestPowerSupply ---------------------> .
    8) TestTemperatureSensor ---------------> .
    9) TestFan -----------------------------> .
   10) TestVoltage -------------------------> .
   11) TestGPIO ----------------------------> .
   12) TestInbandPort ----------------------> .
   13) TestManagementPort ------------------> .
   14) TestMemory --------------------------> .
   15) TestForwardingEngine ----------------> .
<snip>

Обзорный профиль оборудования

Введите команду status профиля оборудования показа для проверки текущего профиля оборудования, который настроен на коммутаторе и аппаратном использовании таблицы:

switch# show hardware profile status 
Hardware table usage:
Max Host Entries = 65535, Used = 341
Max Unicast LPM Entries = 24576, Used = 92
Max Multicast LPM Entries = 8192, Used (L2:L3) = 1836 (1:1835)
Switch#

Гарантируйте, что использование Записей хоста и Записей Совпадения с наибольшей длиной префикса (LPM) Индивидуальной рассылки/Групповой адресации в указанном пределе.

Примечание: Для оптимальной производительности коммутатора важно выбрать надлежащий шаблон профиля оборудования.

Если вы хотите, чтобы коммутатор генерировал системный журнал в определенном пороговом уровне, настройте коммутатор, подобный этому:

switch(config)# hardware profile multicast syslog-threshold ?
 <1-100> Percentage

switch(config)# hardware profile unicast syslog-threshold ?
 <1-100> Percentage

Примечание: Пороговое значение по умолчанию составляет 90 процентов и для индивидуальной рассылки и для групповой адресации.

Для получения дополнительной информации сошлитесь на статью Configuring PIM Cisco, которая предоставляет элементы конфигурации на основе установленной лицензии, и функции включили. Кроме того, если вы хотите оптимизировать таблицу пересылки, обратитесь к Cisco Nexus Коммутаторы серии 3000: Поймите, Настройте и Мелодия статья Forwarding Table Cisco.

Активный буферный мониторинг

Активный буферный мониторинг (ABM) предоставляет гранулированные данные заполнения буфера, которые позволяют лучшее понимание хот-спотов перегрузки. Это поддержки характеристик два режима работы: Индивидуальная рассылка и режим многоадресной рассылки.

В Одноадресном режиме ABM контролирует и поддерживает данные использования буфера на буферный блок и использование буфера индивидуальной рассылки для всех 48 портов. В режиме многоадресной рассылки это контролирует и поддерживает данные использования буфера на буферный блок и использование буфера групповой адресации на буферный блок.

Примечание: Для получения дополнительной информации сошлитесь на статью Cisco Nexus 3548 Active Buffer Monitoring Cisco. Рисунок 4 статьи показывает, что использование буфера достигло пика в 22:15:32 и продлившийся до 22:15:37. Кроме того, гистограмма представляет свидетельства внезапных скачков в использовании и показывает скорость, на которой высушивает буфер. Если существует медленный получатель (такой как получатель на 1 Гбит/с среди приемников на 10 Гбит/с), то во избежание отбрасывания пакета, необходимо включать конфигурацию, подобную этому: профиль оборудования передал порт медленного получателя в многоадресном режиме <x>.

Счетчики/Статистика Monitor Interface

Для мониторинга потери трафика введите ethernet show interface x/y команда. Выходные данные от этой команды предоставляют основную информацию о скорости трафика, и также отбрасывания/ошибки уровня порта.

switch# show interface eth1/10
Ethernet1/10 is up
 Dedicated Interface
 Belongs to Po1
 Hardware: 100/1000/10000 Ethernet, address: 30f7.0d9c.3b51
  (bia 30f7.0d9c.3b51)
 MTU 1500 bytes, BW 10000000 Kbit, DLY 10 usec
 reliability 255/255, txload 1/255, rxload 1/255
 Encapsulation ARPA
 Port mode is trunk
 full-duplex, 10 Gb/s, media type is 10G
 Beacon is turned off
 Input flow-control is off, output flow-control is off
 Rate mode is dedicated
 Switchport monitor is off
 EtherType is 0x8100
 Last link flapped 3d21h
 Last clearing of "show interface" counters never
 14766 interface resets
 30 seconds input rate 47240 bits/sec, 68 packets/sec
 30 seconds output rate 3120720 bits/sec, 3069 packets/sec
 Load-Interval #2: 5 minute (300 seconds)
   input rate 50.18 Kbps, 52 pps; output rate 3.12 Mbps, 3.05 Kpps
 RX
   4485822 unicast packets 175312538 multicast packets 388443 broadcast
    packets
   180186040 input packets 9575683853 bytes
   0 jumbo packets 0 storm suppression bytes
   1 runts 0 giants 1 CRC 0 no buffer
   2 input error 0 short frame 0 overrun  0 underrun 0 ignored
   0 watchdog 0 bad etype drop 0 bad proto drop 0 if down drop
   0 input with dribble  260503 input discard
   0 Rx pause
 TX
   159370439 unicast packets 6366799906 multicast packets 1111 broadcast
    packets
   6526171456 output packets 828646014117 bytes
   0 jumbo packets
   0 output errors 0 collision 0 deferred 0 late collision
   0 lost carrier 0 no carrier 0 babble 0 output discard
   0 Tx pause

switch#

Если сброс ввода или вывода показывает ненулевые значения, определяет, одноадресно переданы ли отброшенные пакеты и/или переданы в многоадресном режиме:

switch# show queuing interface ethernet 1/10
Ethernet1/10 queuing information:
 TX Queuing
   qos-group sched-type oper-bandwidth
       0      WRR           100

 RX Queuing
   Multicast statistics:
       Mcast pkts dropped                     : 0
   Unicast statistics:
   qos-group 0
   HW MTU: 1500 (1500 configured)
   drop-type: drop, xon: 0, xoff: 0
   Statistics:
       Ucast pkts dropped                     : 0
switch#

Выходные данные указывают, что отбрасываемый трафик не происходит из-за Качества обслуживания (QoS). Теперь необходимо проверить статистику аппаратного MAC - адреса:

switch# show hardware internal statistics device mac ?
 all        Show all stats
 congestion Show congestion stats
 control    Show control stats
 errors     Show error stats
 lookup     Show lookup stats
 pktflow    Show packetflow stats
 qos        Show qos stats
 rates      Show packetflow stats
 snmp       Show snmp stats

При выполнении устранения неполадок для отбрасываний трафика ключевые опции для проверки являются перегрузкой, ошибками и qos. pktflow опция предоставляет статистику трафика в RX и направлениях TX с определенными диапазонами размера пакета.

switch# show hardware internal statistics device mac errors port 10
|------------------------------------------------------------------------|
| Device: L2/L3 forwarding ASIC  Role:MAC                              |
|------------------------------------------------------------------------|
Instance:0
ID  Name                                         Value             Ports
--  ----                                         -----             -----
198 MTC_MB_CRC_ERR_CNT_PORT9                     0000000000000002  10 -
508 MTC_PP_CNT_PORT1_RCODE_CHAIN3                0000000000000002  10 -
526 MTC_RW_EG_PORT1_EG_CLB_DROP_FCNT_CHAIN3      000000000054da5a  10 -
3616 MTC_NI515_P1_CNT_TX                          0000000000000bed  10 -
6495 TTOT_OCT                                     000000000005f341  10 -
7365 RTOT                                         0000000000000034  10 -
7366 RCRC                                         0000000000000001  10 -
7374 RUNT                                         0000000000000001  10 -
9511 ROCT                                         00000000000018b9  10 -
10678 PORT_EXCEPTION_ICBL_PKT_DROP                000000000003f997  10 -

Примечание: 0x3f997 шестнадцатеричное значение равняется 260503 в десятичном формате.

switch# show interface eth1/10
Ethernet1/10 is up
<snip>  0 input with dribble  
260503 input discard
<snip>

В выходных данных сообщение об ошибках PORT_EXCEPTION_ICBL_PKT_DROP указывает, что трафик, полученный на порту, имеет метку Dot1Q для VLAN, которая не включена на коммутаторе.

Вот другой пример, где отбрасывание трафика замечено из-за QoS:

switch# show interface ethernet 1/11

Ethernet1/11 is up
<snip>
 TX

<snip>
  0 output errors 0 collision 0 deferred 0 late collision
   0 lost carrier 0 no carrier 0 babble 6153699 output discard
   0 Tx pause
switch#
switch# show queuing interface ethernet 1/11

Ethernet1/11 queuing information:
 TX Queuing
   qos-group sched-type oper-bandwidth
       0      WRR           100

 RX Queuing
   Multicast statistics:
       Mcast pkts dropped                     : 0
   Unicast statistics:
   qos-group 0
   HW MTU: 1500 (1500 configured)
   drop-type: drop, xon: 0, xoff: 0
   Statistics:
       Ucast pkts dropped                     : 6153699

Примечание: Выходные данные указывают, что 6153699 пакетов были отброшены в receive-направлении, который вводит в заблуждение. Обратитесь к идентификатору ошибки Cisco CSCuj20713.

switch# show hardware internal statistics device mac all | i 11|Port

(result filtered for relevant port)
ID  Name          Value             Ports
<snip>
5596 TX_DROP       00000000005de5e3  11 - <--- 6153699 Tx Drops in Hex
<snip>
10253 UC_DROP_VL0  00000000005de5e3  11 - <--- Drops for QoS Group 0 in Hex
<snip>

Таким образом, вот команды, которые используются для получения отбрасывания пакета:

  • ethernet show interface x/y
  • ethernet show queuing interface x/y
  • порт ошибок МАС устройства show hardware internal statistics <порт #>

Статистика контроля уровня управления монитора

Контроль уровня управления (CoPP) защищает уровень управления для обеспечения устойчивости сети. Для дополнительных сведений сошлитесь на статью Configuring Control Plane Policing Cisco.

Для мониторинга статистики CoPP введите команду show policy-map interface control-plane:

switch# show policy-map interface control-plane 
Control Plane
 service-policy input: copp-system-policy

   class-map copp-s-ping (match-any)
     match access-group name copp-system-acl-ping
     police pps 100 , bc 0 packets
       HW Matched Packets  30
       SW Matched Packets  30
   class-map copp-s-l3destmiss (match-any)
     police pps 100 , bc 0 packets
       HW Matched Packets  76
       SW Matched Packets  74
   class-map copp-s-glean (match-any)
     police pps 500 , bc 0 packets
       HW Matched Packets  103088
       SW Matched Packets  51544
<snip>

В выходных данных Аппаратные средства (HW) и программное обеспечение (SW) Соответствующие счетчики пакетов для copp-s-ping являются тем же. Это означает, что сумма пакетов, которая посчитана HW, равняется 30 (все передаваемые к Внутриполосному Драйверу ЦПУ), и SW считает то же количество пакетов, прежде чем это передаст им к ЦПУ. Это указывает, что никакие пакеты не отброшены CoPP, потому что это в настроенном пределе 100 p/s.

Когда вы посмотрели на copp-s-glean класс, который совпадает с пакетами, которые предназначены к IP-адресу, для которого не присутствует запись в кэше Протокола ARP, количество пакетов, которое замечено HW, 103,088, в то время как SW совпадает с только 51544. Это указывает, что CoPP понизился 51544 (103088-51544) пакеты, потому что скорость этих пакетов превышает 500 p/s.

SW счетчики получены из ЦПУ Внутриполосный Драйвер, и счетчики HW прибывают из Списка контроля доступа (ACL), который запрограммирован в HW. Если вы встречаетесь с ситуацией, где Соответствующие счетчики пакетов HW, равный ноль и ненулевое значение присутствуют для SW Соответствующих счетчиков пакетов, то никакой ACL не присутствует в HW для того определенного class-map, который может быть обычным. Также важно обратить внимание, что эти два счетчика не могли бы быть опрошены в то же время, и необходимо только использовать значения счетчика, чтобы к troubelshoot, если различие является значительным.

Статистика CoPP не могла бы быть непосредственно отнесена к коммутируемым пакетам HW, но все еще необходимо, если пакеты, которые должны быть переданы через коммутатор, плывутся на плоскодонке к ЦПУ. Пакетное избыточное направление вызвано различными причинами, такой как тогда, когда вы выполняете подобранную смежность.

Знайте, что существует три типа политики CoPP: По умолчанию, Уровень 2 (L2) и Уровень 3 (L3). Выберите соответствующую политику на основе сценария развертывания и модифицируйте политику CoPP на основе наблюдений. Для подстраивания CoPP проверяйте регулярно, и проверка после получения новых сервисов/приложений или после сетевой модернизации.

Примечание: Для очистки счетчиков введите команду clear copp statistics.

Выполните медицинский осмотр файловой системы загрузочной флэш-памяти

Для выполнения медицинский осмотра на файловой системе загрузочной флэш-памяти введите команду загрузочной флэш-памяти проверки состояния системы:

switch# system health check bootflash 
Unmount successful...
Checking any file system errors...Please be patient...
Result: bootflash filesystem has no errors
done.
Remounting bootflash ...done.
switch#

Внимание.  : Файловая система размонтирована, когда вы запускаете тест, и это повторно установлено, как только тест завершен. Гарантируйте, что к файловой системе не обращаются, в то время как вы запускаете тест.

Соберите System Cores и обработайте журналы

Внимание.  : Гарантируйте, что система не испытывает сброса процесса или сбоев, и не генерирует ключевых файлов или обрабатывает журналы, когда вы пытаетесь использовать команды, которые упомянуты в этом разделе.

Введите эти команды для сбора журналов процесса и system cores:

switch# show cores
Module Instance Process-name    PID      Date(Year-Month-Day Time)
------ -------- --------------- -------- -------------------------
switch#

switch# show process log
Process         PID    Normal-exit Stack Core  Log-create-time
--------------- ------ ----------- ----- ----- ---------------
ethpc           4217             N     N     N Tue Jun 4 01:57:54 2013

Примечание: Сошлитесь на Ключевые файлы Получения от статьи Cisco платформ коммутации Cisco Nexus для получения дополнительной информации об этом процессе.

Дополнительные сведения


Связанные обсуждения сообщества поддержки Cisco

В рамках сообщества поддержки Cisco можно задавать и отвечать на вопросы, обмениваться рекомендациями и совместно работать со своими коллегами.