Коммутаторы : ??????????? Cisco Catalyst ????? 4500

Сведения о таймаутах Astro/Lemans/NiceR и устранение их неполадок на Catalyst 4000/4500 Series Switches

20 октября 2016 - Машинный перевод
Другие версии: PDF-версия:pdf | Английский (7 октября 2015) | Отзыв


Содержание


Введение

В серии коммутаторов Catalyst 4000/4500 применена архитектура с использованием микросхем Stub ASIC. Коммутатор управляет этими микросхемами stub ASIC линейной платы (Astro/Leman/NiceR) через внутренний протокол контроля управления. При утере или задержке этих внутренних административных запросов и ответов на них генерируются сообщения console и syslog. Поскольку причины таких потерь соединения могут быть разными, с помощью этих сообщений об ошибках нельзя определить основную причину.

Цель настоящего документа – дать общие сведения о сообщениях о простое Astro/Leman/Nicer, создаваемый на платформах Cat4000 и разрешить их при помощи центра технической поддержки Cisco. Последующие версии CatOS и Cisco, которую IOS� предложит улучшенным сообщениям об ошибках, и, если возможно, определяют основную причину проблемы.

То, когда время ожидания специализированной интегральной схемы заглушки (ASTRO/LEMANS/NICER) происходит, обменивается сообщениями подобный придерживающемуся, сообщаются относительно основанного Catalyst CatOS 4000/4500 коммутатор:

%SYS-4-P2_WARN: 1/Astro(4/3) - timeout occurred
%SYS-4-P2_WARN: 1/Astro(4/3) - timeout is persisting

В зависимости от версий ПО формулировка сообщения об ошибках может меняться. Astro, Lemans и Nicer указывали другой тип заглушки ASIC. Дополнительные сведения см. в разделе "Теоретические основы" данного документа.

В управляющих программах на основе Cisco IOS (Supervisor II+, III и IV) сообщение об ошибках выглядит следующим образом:

%C4K_LINECARDMGMTPROTOCOL-4-INITIALTIMEOUTWARNING: Astro 5-2(Fa5/9-16) - management 
request timed out. 
%C4K_LINECARDMGMTPROTOCOL-4-ONGOINGTIMEOUTWARNING: Astro 5-2(Fa5/9-16) - consecutive 
management requests timed out.

Примечание: В этом документе речь идет в основном об устранении неполадок супервизоров или коммутаторов на основе CatOS. Часть информации применима к основанному Супервизору Cisco IOS, когда обращено внимание.

Примечание: Этот документ также рассматривает Astro stub ASIC, но большая часть разделов применимы к другому типу stub ASIC (Lemans или Nicer), которые будут указаны в соответствующих разделах.

После изучения этого документа читатель узнает следующее:

  • Функция микросхемы Stub ASIC на Catalyst 4000/4500.

  • Условия, которые могут привести к появлению сообщений об истечении времени ожидания пакетов внутреннего управления.

  • Необходимые действия и команды для Cisco TAC при устранении данной неполадки.

Разделы о времени ожидания Astro и устранении связанных с этим проблем, дают общие сведения и подробное объяснение каждой проблемы. Кроме того, можно перейти непосредственно к разделу "Простые способы устранения неполадок" этого документа.

Перед началом работы

Условные обозначения

Дополнительные сведения об условных обозначениях в документах см. Cisco Technical Tips Conventions.

Предварительные условия

Для данного документа отсутствуют предварительные условия.

Используемые компоненты

Этот документ является определенным для Catalyst 4000/4500 Супервизор или линейные платы, использующие тупиковый ASIC.

Теоретические сведения

Специализированная интегральная микросхема Astro stub ASIC представляет собой набор специализированных интегральных микросхем 10/100, которые управляют группой из восьми смежных 10/100 портов, общающихся с диспетчером по гигабитному соединению на системной плате коммутатора, как показано на рисунке ниже.

http://www.cisco.com/c/dam/en/us/support/docs/switches/catalyst-4000-series-switches/45640-astroe5.gif

Супервизоры передают данные на ASIC заглушку линейной платы через компонент SERDES (СЕРиализатор-ДЕСериализатор). На стороне супервизора есть компонент SERDES, подключающийся к объединительной плате, и другой компонент SERDES на линейной плате для каждой микросхемы Stub ASIC для соединения с объединительной платой.

Вышеупомянутая схема может использоваться в целом для устранения проблем разного типа линейных карт. Тупиковый ASIC, отнесенный в сообщениях о времени ожидания, был бы другим в зависимости от типа линейной карты. Посмотрите таблицу ниже для списка названий ASIC и их описания.

Микросхемы Stub ASIC Описание Пример
Astro Заглушка ASIC контроллера на 8 портов 10/100 WS-X4148-RJ45V
NiceR 4 ASIC фиктивного модуля контроллера порта 1000 WS-X4418-GB(порты 3-18)
Lemans 8 ASIC фиктивного модуля контроллера порта 10/100/1000 WS-X4448-GB-RJ

Внутренний трафик управления течет через обоих компонент SERDES наряду с нормальным трафиком данных. Внутренний трафик управления используется к чтению-записи тупиковый ASIC и регистры Phy. Наиболее распространенные операции включают чтение состояния канала и статистики.

Простые способы устранения неполадок

Следующие разделы объясняют значение и возможные причины %SYS-4-P2_WARN: 1 / (Фиктивный модуль) (module_number/) Stub_reference – таймаут произошел сообщение об ошибках на Catalyst 4000/4500.

Сообщения истечения времени Astro (stub) были добавлены в версию программного обеспечения, начиная с 6.2.3 и 6.3.1, и впоследствии улучшены в 6.4.4 (CSCea73908) и свидетельствуют о потере управляющим модулем контрольных пакетов внутреннего управления при соединении с Astro stub ASIC на линейных картах 10/100. Существует масса причин такой потери соединения, которые подробно объяснены ниже в разделе "Устранение неполадок".

Следующая блок-схема устранения неполадок предоставляет быстрый и простой путь выделения проблемы из возможных причин неисправности:

http://www.cisco.com/c/dam/en/us/support/docs/switches/catalyst-4000-series-switches/45640-astroe8.gif

** Различные основные причины могут показать подобные признаки. Свяжитесь с TAC для дальнейшего устранения проблем.

Время ожидания ASIC для заглушки (Astro/Lemans/NiceR)

Когда Программное обеспечение управляющего модуля не получает множественные отклики внутреннего управления от ASIC фиктивного модуля линейной карты, о таймаутах Astro/Lemans/Nicer сообщают. Это может случиться, если:

  • Запрос управления потерян или задержан

  • Ответ на управление потерян или задержен

“Таймаут произошел, …” сообщение распечатан, как только программное обеспечение испытало таймаут 10 раз подряд при ожидании ответа используемого для управления пакет. Последовательные таймауты приводят к печати “последовательного управления ….” or “..timeout сохранение..” сообщения, в зависимости от версии программного обеспечения.

Данное сообщение журнала имеет ограничение частоты: 1 сообщение каждые 10 минут. Когда таймауты происходят, пересылка пакетов к тупиковому ASIC, на которое влияют, продолжается. Однако, любые изменения к ссылке / скорость autoneg / дуплекс не замечен, поскольку программное обеспечение не получает ответы используемого для управления пакет. Во время ожидания также затрагивается процесс обновления статистики трафика для группы интерфейсов.

Устранение неисправностей

Существуют различные причины для Astro/Lemans/Nicer сообщений о времени ожидания для появления. Каждая из них описана ниже.

Причина 1: Высокая загрузка трафиком, петля на уровне 2 или лишний сетевой трафик к CPU

Придерживающееся может вызвать тупиковые условия таймаута:

  • Проблемы сети

  • Проблемы настройки

  • Соседние элементы

  • Другие факторы, не относящиеся к коммутатору Catalyst

Цикл на втором уровне или широковещательный шторм, который приводит к высокой нагрузке по трафику, может вызвать потерю контрольных пакетов внутреннего управления. Это обычно происходит вследствие занятости CPU (CPU hog) и его неспособности обрабатывать очередь.

Контрольный трафик внутреннего управления использует тот же путь данных к Supervisor, что и обычный трафик от Astro (или любой другой Stub микросхемы). Таким образом управляющие пакеты могут потеряться из-за перегрузки.

После исправления ошибки Cisco с идентификатором CSCea73908 (только для зарегистрированных пользователей) период времени ожидания внутреннего запроса на управление лучше обрабатывается в CatOS версии 6.4(4) и более поздних версиях. Это усовершенствование может предотвратить многие кратковременные простои управляющих пакетов, вызванные занятостью CPU.

Действие: Устраните неполадки Петли Уровня 2; или конфигурация изменения для решения структур трафика.

Обходной путь: Переместите интерфейс управления коммутаторами (sc0) во VLAN с неабонентским трафиком на коммутаторах под управлением CatOS. используйте команду <vlan-id> sc0 set interface для перемещения vlan интерфейсного sc0.

Примечание: Начиная с Cisco IOS 12.1(20)EW программы Supervisor на базе Cisco IOS вводят выполняемый CPU механизм обработки, расширенный в части внутреннего управления пакетами. Это усовершенствование поможет предотвратить потерю внутренних пакетов контроля управления непреднамеренной загрузки CPU трафиком с низким приоритетом.

Решение: См. описанный выше метод.

Причина 2: Полудуплексный/ Кабельное подключение типа 1A

Порты пользователя на передней панели настраиваются на полудуплексный режим. Эти коллизии исходящего трафика с входящими на микросхеме Stub ASIC могут сильно замедлить работу stub-буфера. Это может привести к переполнению tx-очередей на супервизоре, и новые внутренние запросы управления могут быть отброшены, что приведет к появлению сообщений об ошибках времени ожидания.

Сеть с разводкой кабеля типа 1А также может вызывать эту проблему. Когда рабочая станция соединилась с Type1A, Симметрирующие трансформаторы с кабелем RJ-45 разъединены, петли Симметрирующего трансформатора назад внутренне и заставляют исходящий поток данных возвращаться. При этом моделируется подключение внешней возвратной петли к порту на передней панели. Прежде чем порт перейдет в состояние блокирования, исходящий трафик отправляется обратно на коммутатор. Это может заставить тупиковые буферы переполняться, в зависимости от скорости трафика.

Действие: См. обходной путь.

Обходной путь: Применение полудуплексной конфигурации не рекомендуется. в случае кабельного подключения Type1A избегите включать провод кабеля RJ-45 от Симметрирующего трансформатора Типа 1A, чтобы избежать формировать внутреннюю обратную связь в Симметрирующем трансформаторе.

Решение: См. обходной путь.

Причина 3: Сбой компонента SERDES

Если ошибки замечены только на одном Astro (или другой тупиковый ASIC) на одном модуле, и петля уровня 2 не происходит, проблема наиболее вероятна неисправный компонент SERDES или на Супервизоре или на Линейной карте. Например, если сообщение об ошибках всегда находится на Astro 4 на Модуле 3 как показано ниже, то или компонент SERDES на модуле 3 или компонент SERDES на неисправных Supervisor I.

%SYS-4-P2_WARN: 1/Astro(3/4) – timeout occurred

В вышеупомянутом сообщении об ошибках номер "4" в круглой скобке обращается к Astro #, а не фактический порт 3/4. Этот номер ссылается на группу из восьми порты (3/33-3/40), поскольку это - четвертый Astro на модуле 3.

Неисправность компонента SERDES может привести к периодической потере соединения для управляющего трафика и трафика данных в направлении Astro/Lemans/NiceR, т. е. к истечению времени ожидания. Как правило, однако, если SERDES будет неисправен, сообщение об ошибках будет постоянно отображаться.

Действие: Чтобы определить, какой SERDES (Supervisor или линейной платы) неисправен, выполните следующие действия:

  1. Переместите линейную плату в свободное гнездо корпуса или другого корпуса. Если свободный слот доступен, слоты подкачки с известным рабочим модулем.

  2. Если вы продолжаете получать Astro/Lemans/Nicer таймауты на том же Astro/Lemans/Nicer в новом слоте, то, скорее всего, SERDES или Astro/Lemans/Nicer на линейной плате отказали, и линейная плата должна быть заменена

    Примечание: Путем перевставки модуля в свободный слот оперативная диагностика выполнена на линейной карте. Если неисправный SERDES или Astro/Lemans/Nicer будут найдены, то коммутатор отметит порт как неисправный.

  3. Если блокировки по времени не продолжают возникать на оригинальной линейной плате Astro/Lemans/Nicer, возможно, что управляющая программа SERDES повреждена. Чтобы проверить это, вставьте заведомо рабочий модуль в исходный слот и посмотрите, будут ли возникать временные задержки при использовании нового модуля.

    Если это действительно работает, это - возможно SERDES, находится на Супервизоре. См. приложения Супервизора WS-X4013 Catalyst Частичное уведомление о дефекте Потери подключения для списка серийных номеров, на которые влияют, с отказывающим компонентом SERDES.

Обходной путь: Нет

Решение: Если проблема не устранена, обратитесь в центр технической поддержки (TAC).

Причина 4: Незначительные / серьезные сбои SRAM

Устройства соединились с Catalyst 4000 с Supervisor I или II или III или Механизм IV или Catalyst 2948G, Cat2980G может испытать частичную или полную потерю сетевого подключения. На некоторых или все порты можно было влиять. Данным признакам будет сопутствовать резкое возрастание отброшенных пакетов с ошибкой CRC на модуле Supervisor на основе CatOS, а также сообщения об ошибках времени ожидания микросхемы Stub ASIC.

Проблема происходит из-за Буферной памяти пакетов (SRAM) сбой, который является или твердым или переходным типом.

Действие: Выберите курс действий, в зависимости от которого из этих двух Подписей временной ошибки памяти буфера пакетов ниже произошли:

  1. Подпись ошибки буферной памяти для временного хранения пакетов для SUP I , SUP II, 2948G, 2980G

    Симптомы этой проблемы:

    • InvalidPktBufferCRC Ђ™s быстро увеличивается вместе с сообщением примерно следующего содержания

      %SYS-4-P2_WARN: 1/Invalid crc, dropped packet, count = xxxx
    • При мягком сбросе с помощью команды reset происходит сбой самотестирования при включении питания (POST) модуля Supervisor.

    • Если выполняется жесткая перезагрузка (выключение и немедленное включение), управляющий модуль передает POST и выходит из состояния сбоя.

    Примечание: Если в Supervisor I, II, 2948G, 2980G наблюдается устойчивый отказ пакетной буферной памяти, то жесткая перезагрузка не решит проблему, и Supervisor или коммутатор по-прежнему не смогут пройти диагностику POST..

    Для получения дополнительных сведений по этому вопросу обратитесь к разделам "Ошибка Cisco ID CSCdy46288" (только для зарегистрированных пользователей) для Supervisor II, "Ошибка Cisco ID CSCeb56266" (только для зарегистрированных пользователей) для Supervisor I/2948G/2980G и "Ошибка Cisco ID CSCeb56325" (только для зарегистрированных пользователей) для WS-C2980G-A.

  2. Подпись временной ошибки памяти буфера пакетов для SUP III, SUP IV

    Симптомы этой проблемы:

    • Счетчик VlanZeroBadCrc быстро увеличивается и отображается в выводе команды:

      show platform cpuport all (prior to 12.1(11b)EW1 ) 
      or  show platform cpu packet statistics all (Since 12.1(11b)EW1) 
      depending upon the software version. Starting from 12.1(19)EW, 
      you should also see the following error message rapidly incrementing errors: 
      
      %C4K_SWITCHINGENGINEMAN-2-PACKETMEMORYERROR3: Persistent Errors in 
      Packet Memory xxxx
      
    • Программный сброс заставил бы Супервизор отказывать POST. Используйте команду show diagnostics power-on для проверки сбоя.

    • Жесткая перезагрузка (включение и выключение питания) позволит восстановить супервизор, и он пройдет POST.

    Примечание: В случае серьезного сбоя SRAM для Supervisor III / IV жесткая перезагрузка не поможет восстановить супервизор и он не пройдет POST.

    Для получения дополнительных сведений по данному вопросу по Supervisor III/IV следует обратиться к Cisco bug ID CSCdz57255 (только для зарегистрированных клиентов)

Обходной путь: Включите и выключите питание маршрутизатора или выполните его жесткую перезагрузку при возникновении неустойчивой проблемы SRAM. Обойти проблему жесткой памяти SRAM невозможно.

Решение: Если проблема не устранена, обратитесь в центр технической поддержки (TAC).

Причина 5: Сбой синхронизации модуля Supervisor

Если Astro/Lemans/NiceR сообщения об ошибках времени ожидания замечены, которые обращаются к номерам несколька номеров модулей или множественному Astro/Lemans/Nicer, то это могло указать на возможный сбой синхронизации на Супервизоре. В общем случае сбой синхронизации сопровождается сообщением об ошибке времени ожидания Astro/Lemans/Nicer и сообщениями об ошибках BlockTXQueue и BlockedGigaport, как показано ниже:

%SYS-4-P2_WARN: 1/Blocked queue on gigaport ...

Действие: Обратитесь в TAC для получения дальнейших сведений по устранению ошибки Cisco с идентификатором CSCdp89537 (только для зарегистрированных клиентов) и CSCdp93187 (только для зарегистрированных клиентов).

Обходной путь: Нет

Решение: Если проблема не устранена, обратитесь в центр технической поддержки (TAC).

Причина 6: Краткий перерыв в электроснабжении

Коммутатор серии Catalyst 4000 с Supervisor II (WS-X4013) может ввести состояние, в котором Супервизор и линейные карты неспособны связаться должным образом друг с другом. Когда коммутатор введет это состояние, светодиоды состояния модуля будут красными (не мигающий), и/или светодиодные индикаторы порта будут мигать в последовательности, подобной сбросу модуля или сбросу настроек коммутатора. Это сопровождается сообщениями о задержке Astro/Lemans/NiceR.

Эта проблема вызвана кратковременным (менее 500 мс) сбоем электропитания коммутатора. Временный перебой в электроснабжении может произойти из-за нестабильного кабеля питания в производственной среде.

Действие: Ниже приводится метод обхода.

Обходной путь: Сброс (мягкий или твердый (выключают)), коммутатор.

Решение: Обновите образ ПО до версии с исправленной ошибкой CSCea14710 (доступно только для зарегистрированных клиентов) или более поздней версии.


Дополнительные сведения


Document ID: 45640