Коммутаторы : Коммутаторы Cisco Catalyst серии 6500

Руководство по поиску и устранению проблем ошибок контроля четности

20 октября 2016 - Машинный перевод
Другие версии: PDF-версия:pdf | Английский (21 апреля 2016) | Отзыв

Введение

Этот документ описывает мягкий и фатальные ошибки четности, объясняют распространенные сообщения об ошибках и рекомендуют методы, которые помогают вам избегать или минимизировать ошибки контроля четности. Недавние улучшения дизайна программного и аппаратного обеспечения уменьшают паритетные проблемы также.

Внесенный Шоном Варго, разработкой Cisco.

Общие сведения

Что такое процессор или ошибка контроля четности памяти?

Проверка четности является хранилищем дополнительного двоичного знака (бит) для представления паритета (нечетный или даже) малой величины компьютерных данных (как правило, один байт), в то время как те данные хранятся в памяти. Паритетное значение, вычисленное от Сохраненных данных, тогда по сравнению с заключительным паритетным значением. Если эти два значения отличаются, это указывает на ошибку данных, и по крайней мере один бит, должно быть, был изменен из-за нарушения целостности данных.

В компьютерной системе электрическая или магнитная интерференция от внутренних или внешних причин может заставить одиночный бит памяти спонтанно зеркально отражать к противоположному состоянию. Это событие делает биты исходных данных недопустимыми и известно как ошибка контроля четности.

Такие ошибки памяти, если необнаруженный, могут иметь необнаруживаемые и несущественные результаты или могут вызвать постоянное повреждение Сохраненных данных или катастрофического отказа машины.

Существует много причин ошибок контроля четности памяти, которые классифицированы или как ошибки мягкого контроля четности или как фатальные ошибки четности.

Устранимые ошибки

Большинство ошибок контроля четности вызвано электростатическими или магнитно-связанными условиями среды.

Большинство одиночных ошибок события в модулях памяти вызвано фоновым излучением (таким как нейтроны от космических лучей), электромагнитные помехи (EMI) или разряд статического электричества (ЭСР). Эти события могут случайным образом изменить электрическое состояние одной или более ячеек памяти или могут вмешаться в схему, используемую для чтения и ячейки write memory.

Известный как ошибки мягкого контроля четности, эти события являются, как правило, переходными или случайными и обычно имеют место однажды. Устранимые ошибки могут быть незначительными или серьезными:

  • Незначительные устранимые ошибки, которые могут быть исправлены без сброса компонента, являются Single Event Upset (SEU).
  • Серьезные устранимые ошибки, которые требуют компонента или сброса системы, являются одиночными фиксациями события (SELs).

Устранимые ошибки не вызваны аппаратной неисправностью; они являются переходными и нечастыми, являются главным образом вероятными SEU и вызваны связанным со средой разрушением данных памяти.

Если вы встречаетесь с ошибками мягкого контроля четности, анализируете недавние изменения среды, которые произошли в местоположении системы, на которую влияют. Общие источники ЭСР и EMI, который может вызвать ошибки мягкого контроля четности, включают:

  • Шнуры питания и предоставления
  • Блоки распределения питания
  • Источники бесперебойного питания
  • Системы освещения
  • Генераторы мощности
  • Ядерные установки (излучение)
  • Солнечные вспышки (излучение)

Постоянные ошибки

Другие ошибки контроля четности вызваны физическим неправильным функционированием аппаратных средств памяти, или схемой использовал читать и ячейки write memory.

Производители оборудования принимают обширные меры, чтобы предотвратить и протестировать на дефекты аппаратного обеспечения. Однако дефекты все еще возможны; например, если какая-либо из ячеек памяти, используемых для хранения битов данных, неправильно сформирована, они могут быть неспособны держать плату или могут быть более уязвимы для условий среды.

Точно так же, в то время как сама память может работать обычно, любое физическое или электрическое повреждение схемы использовало читать, и ячейки write memory могут также заставить биты данных быть измененными во время передачи, которая приводит к ошибке контроля четности.

Известный как фатальные ошибки четности, эти события являются, как правило, очень частыми и повторными и имеют место каждый раз, когда используются память, на которую влияют, или схема. Точная частота зависит от степени неправильного функционирования и как часто используется поврежденное оборудование.

Помните, что фатальные ошибки четности являются результатом аппаратной неисправности и повторно происходят каждый раз, когда компонент, на который влияют, используется.

Если вы встречаетесь с фатальными ошибками четности, анализируете физические изменения, которые произошли в местоположении системы, на которую влияют. Общие источники аппаратной неисправности, которая может привести к фатальным ошибкам четности, включают:

  • Скачки напряжения (никакая основа)
  • ЭСР
  • Перегрев или охлаждение
  • Неправильная или частичная установка
  • Несовместимость компонента
  • Производственный дефект

Стандартные сообщения об ошибках

Программное обеспечение Cisco IOS предоставляет множество сообщений об ошибках четности, которые меняются в зависимости от компонента, на который влияют, и его относительного влияния на систему.

Процессор

Ошибка кэша обнаружена!
 CP0_CAUSE  (reg 13/0): 0x00000400
 CPO_ECC    (reg 26/0): 0x000000B3
 CPO_BUSERRDPA (reg 26/1): 0x000000B3
 CPO_CACHERI (reg 27/0): 0x20000000

Реальная ошибка кэша обнаружена. Система будет остановлена.

Ошибка: Primary, instr cache, fields: данные,
Фактический физический адрес 0x00000000,
виртуальный адрес неточен.

 Ошибка контроля четности неточных данных

ПояснениеЭто - результат ошибки контроля четности в кэше Уровня 2 (L2) (статическое оперативное запоминающее устройство или SRAM) используемый ЦП процессора маршрута (RP) или процессора коммутации (SP) Функциональной Карты Многоуровневого Коммутатора (MSFC) 3 (MSFC3).
РекомендацияКонтролируйте систему регулярно для повторного происхождения. Если никакие дальнейшие события не наблюдаются, это - устранимая ошибка. Если ошибка часто происходит, запросите Разрешение на возврат материалов (RMA), чтобы заменить Supervisor Engine и отметить модуль для анализа неисправности оборудования (EFA).
%SYSTEM_CONTROLLER-3-ERROR: Обнаружено состояние ошибки: SYSAD_PARITY_ERROR
ПояснениеЭто - результат ошибки контроля четности в системном адресе (шина данных), используемая Внутриполосным контроллером (IBC) MSFC3.
РекомендацияКонтролируйте систему регулярно для повторного происхождения. Если никакие дальнейшие события не наблюдаются, это - устранимая ошибка. Если ошибка часто происходит, запросите RMA, чтобы заменить Supervisor Engine и отметить модуль для EFA.
%SYSTEM_CONTROLLER-3-ERROR: Обнаружено состояние ошибки: TM_DATA_PARITY_ERROR
ПояснениеЭто - результат ошибки контроля четности в менеджере таблицы данные, используемые IBC MSFC3.
РекомендацияКонтролируйте систему регулярно для повторного происхождения. Если никакие дальнейшие события не наблюдаются, это - устранимая ошибка. Если ошибка часто происходит, запросите RMA, чтобы заменить Supervisor Engine и отметить модуль для EFA.
%SYSTEM_CONTROLLER-3-ERROR: Обнаружено состояние ошибки: TM_NPP_PARITY_ERROR
ПояснениеЭто - результат ошибки контроля четности в менеджере таблицы 'указатель следующей страницы', используемый IBC MSFC3.
Рекомендация

Контролируйте систему регулярно для повторного происхождения. Если никакие дальнейшие события не наблюдаются, это - устранимая ошибка. Если ошибка часто происходит, запросите RMA, чтобы заменить Supervisor Engine и отметить модуль для EFA.

В версиях программного обеспечения Cisco IOS между 12.1 (8) E и 12.2 (33) SXI3, поведение по умолчанию в ответ на SYSTEM_CONTROLLER-3-ERROR должно было перезагрузить IBC и регистрировать сообщение об ошибках.

Однако это корректирующее действие привело к некоторым задокументированным случаям IBC (и таким образом, ЦП) больше способность передать или получить данные. Таким образом поведение было изменено в версиях программного обеспечения Cisco IOS позже, чем 12.2 (33) SXI4, чтобы регистрировать сообщение об ошибках и перезагрузить систему; обратитесь к идентификатору ошибки Cisco CSCtf51541.

Исключение прерывания, сигнал 20 ЦП, ПК = 0x [декабрь]
ПояснениеЭто - результат одноразрядной ошибки контроля четности в ЦП кэш L2 (SRAM), используемый Cisco Catalyst 6700 Документаций по установке и настройке модуля серии.
Рекомендация

Контролируйте систему регулярно для повторного происхождения. Если никакие дальнейшие события не наблюдаются, это - устранимая ошибка. Если ошибка часто происходит, запросите RMA, чтобы заменить 6700 модулей и отметить модуль для EFA.

В версиях программного обеспечения Cisco IOS ранее, чем 12.2 (33) SXI5, ошибка в программном обеспечении (идентификатор ошибки Cisco CSCtj06411) заставила бы даже одноразрядные ошибки контроля четности перезагружать 6700 модулей. Это было решено в Версиях 12.2 (33) SXI6 и 12.2 (33) SXJ для модуля управления Supervisor Engine 720 и в Версии 15.0SY для Supervisor Engine 2T.

ОЗУ

%SYSTEM_CONTROLLER-3-ERROR: Обнаружено состояние ошибки: SYSDRAM_PARITY_ERROR
ПояснениеЭто - результат неисправимой ошибки контроля четности в синхронном DRAM (динамическая память) (SDRAM) модули памяти (DIMM), используемый MSFC3.
РекомендацияКонтролируйте систему регулярно для повторного происхождения. Если никакие дальнейшие события не наблюдаются, это - устранимая ошибка. Если ошибка часто происходит, чистая, и переустановите DIMM и продолжите контролировать. Если ошибка продолжается, запросите RMA, чтобы заменить или обновить DIMM.
%SYSTEM_CONTROLLER-3-COR_MEM_ERR: Корректируемая ошибка памяти DRAM. Количество [декабрь], журнал [hex]
ПояснениеЭто - результат корректируемой ошибки контроля четности в SDRAM (DIMM), используемый MSFC3.
РекомендацияКонтролируйте систему регулярно для повторного происхождения. Если никакие дальнейшие события не наблюдаются, это - устранимая ошибка. Если ошибка часто происходит, чистая, и переустановите DIMM и продолжите контролировать. Если ошибка продолжается, запросите RMA, чтобы заменить или обновить DIMM.
%MWAM-DFC [декабрь] - 0-CORRECTABLE_ECC_ERR: корректируемая ошибка ECC произошла, A_BUS_L2_ERRORS: 0x10000, A_BUS_MEMIO_ERRORS: 0x0, A_SCD_BUS_ERR_STATUS: 0x80983000
Пояснение

Это - результат одноразрядной ошибки контроля четности в DRAM, используемом 6700 Документациями по установке и настройке модуля серии.

Рекомендация

Контролируйте систему регулярно для повторного происхождения. Если никакие дальнейшие события не наблюдаются, это - устранимая ошибка. Если ошибка часто происходит, чистая, и переустановите DIMM и продолжите контролировать. Если ошибка продолжается, запросите RMA, чтобы заменить или обновить DIMM.

%PM_SCP-SP-2-LCP_FW_ERR_INFORM: Модуль [декабрь] испытывает ошибку слежения: Ошибка контроля четности LTL, обнаруженная на Обмотке # [декабрь].
ПояснениеЭто - результат ошибки контроля четности в SRAM, используемом Cisco Catalyst 6100 и Cisco Catalyst 6300 Документаций по установке и настройке модуля серии.
Рекомендация

Контролируйте систему регулярно для повторного происхождения. Если никакие дальнейшие события не наблюдаются, это - устранимая ошибка. Если ошибка часто происходит, запросите RMA, чтобы заменить 6100 или 6300 модулей и отметить модуль для EFA.

%SYS-4-SYS_LCPERR4: Module [dec]: Ошибка контроля четности LTL, обнаруженная на Обмотке # [декабрь]
ПояснениеЭто - результат ошибки контроля четности в SRAM, используемом 6100 и 6300 Документациями по установке и настройке модуля серии.
РекомендацияКонтролируйте систему регулярно для повторного происхождения. Если никакие дальнейшие события не наблюдаются, это - устранимая ошибка. Если ошибка часто происходит, запросите RMA, чтобы заменить 6100 или 6300 модулей и отметить модуль для EFA.

ASIC

%PM_SCP-SP-2-LCP_FW_ERR_INFORM: Модуль [декабрь] испытывает ошибку слежения: ASIC Порта ([название]) сбой буфера пакетов обнаружен на портах [декабрь]
ПояснениеЭто - результат ошибки контроля четности в буфере пакетов ASIC порта (SRAM), используемый модулями Серий Ethernet Cisco Catalyst 6148 А.
Рекомендация

Контролируйте систему регулярно для повторного происхождения. Если никакие дальнейшие события не наблюдаются, это - устранимая ошибка. Если ошибка часто происходит, запросите RMA, чтобы заменить модуль на 6148 А и отметить модуль для EFA.

%LTL-SP-2-LTL_PARITY_CHECK: проверка четности LTL запрашивает на 0x [hex]
ПояснениеЭто - результат ошибки контроля четности в таблице индекса порта ASIC порта (SRAM), используемый Catalyst 6100-6500 и 6700 Документаций по установке и настройке модуля серии.
РекомендацияКонтролируйте систему регулярно для повторного происхождения. Если никакие дальнейшие события не наблюдаются, это - устранимая ошибка. Если ошибка часто происходит, запросите RMA, чтобы заменить модуль и отметить модуль для EFA.

См. эти документы программного обеспечения Cisco IOS для полного списка сообщений об ошибках:

Средство интерпретации выходных данных (только зарегистрированные клиенты) поддерживает некоторые команды show. Используйте Средство интерпретации выходных данных, чтобы просмотреть анализ выходных данных команды show.

Последние продвижения

Исследование поля ошибок контроля четности является продолжающимся, и не каждый сценарий может быть обращен, но Cisco Catalyst, 6500 организаций разработки программного и аппаратного обеспечения продолжают представлять новые пути, такие как защита кода исправления ошибки (ECC), минимизировать и смягчать возникновение ошибок контроля четности.

В то время как этот документ начался с обсуждения третьего поколения (WS-XSUP720 и рано 6700 Серий) продуктов Catalyst 6500, этот раздел суммирует улучшения, начатые с четвертого поколения (VS-S720-10G и более поздние 6700 Серий) и пятое поколение (VS-SUP2T-10G и серии 6900).

Процессор

Функции модуля VS-S720-10G более новая дочерняя плата MSFC3, с новым IBC и обновленным RP вычислений с ограниченным набором команд (RISC) SR7010A и ЦПУ SP, которые управляют в 600 МГц каждым. Уровень 1 (L1), L2 и кэши Уровня 3 (L3) способны к обнаружению ошибок четности. Более новый IBC имеет всю функциональность более ранней генерации и добавляет защиту ECC (одноразрядное исправление, мультибитовое обнаружение) к подключенным SRAM.

Эти 6700 Документаций по установке и настройке модуля серии поддерживают ЦП с защищенным ECC кэшем L2 (кэш L1 является способным обнаружением ошибок четности), который может исправить одноразрядные ошибки контроля четности без потребности перезагрузить. Если одноразрядная ошибка контроля четности кэша ЦП происходит, Однако из-за идентификатора ошибки Cisco CSCsz39222, Версия 12.2SXI программного обеспечения Cisco IOS (модуль управления Supervisor Engine 720) перезагружает модуль так или иначе. Это решено в Версиях 12.2SXJ (модуль управления Supervisor Engine 720) и 15.0SY (Supervisor Engine 2T) программного обеспечения Cisco IOS.

Функции VS-SUP2T-10G новая дочерняя плата MSFC5 с интегрированным IBC и новым одиночным, двухъядерным ЦП MPC8572 PPC RP (с защищенным ECC L2 и кэшем L3, кэш L1 является способным обнаружением ошибок четности), который работает в 1.5 ГГц за ядро. Это также обладает новым, отдельным, Процессором управления возможности внеполосного подключения (CMP) ЦП и защищенный ECC DRAM, который доступен, даже если ЦП RP в настоящее время недоступен.

Новый IBC имеет всю функциональность более ранних поколений и поддерживает защиту ECC для подключенных SRAM и улучшения обработки ошибки контроля четности. Новый MSFC5 также обладает Встроенной Регистрацией отказов (OBFL) ПЗУ, которое хранит всю инициализацию модуля и события диагностики. Новый один CPU дизайн также уменьшает статистическую вероятность событий ошибки контроля четности.

Модули серии 6900 поддерживают более новый ЦП с защищенным ECC L1 и кэшем L2, который может исправить одноразрядные ошибки контроля четности без потребности перезагрузить. Новое поколение поддерживает тот же IBC, и обработка программного обеспечения для одноразрядного исправления ошибки контроля четности была включена.

ОЗУ

VS-S720-10G с SDRAM двойной скорости передачи данных (DDR) функций MSFC3 с защитой ECC, работающей в 266 МГц.

Эти 6700 Документаций по установке и настройке модуля серии поддерживают SDRAM DDR с защитой ECC, работающей в 266 МГц.

По сравнению с SDRAM одиночной скорости передачи данных (SDR) Интерфейс SDRAM DDR делает более высокие скорости передачи возможными большим количеством строгого контроля синхронизации электрических данных и сигналов тактовой частоты. Интерфейс DDR использует дважды качающий (передача данных и на нарастающих и на убывающих фронтах сигнала тактовой частоты) для понижения частоты синхронизации. Более низкая частота синхронизации уменьшает требования целостности сигнала на печатной плате, которая подключает память контроллеру.

VS-SUP2T-10G с функциями DDR3 SDRAM MSFC5 с защитой ECC, работающей в 667 МГц.

Модули серии 6900 поддерживают DDR3 SDRAM с защитой ECC, работающей в 667 МГц.

Основное преимущество DDR3 SDRAM по его непосредственным предшественникам (DDR2 и DDR) является своей способностью передать данные на дважды скорости (восемь раз скорость ее массивов внутренней памяти), который включает более высокую пропускную способность или пиковые скорости передачи данных. Память DDR3 также уменьшает потребляемую мощность на 30%, даже при том, что это использует тот же электрический стандарт передачи сигналов в качестве DDR и DDR2.

ASIC

VS-S720-10G с буферами пакетов SRAM функций PFC3C с защитой ECC. Это предоставляет одноразрядное исправление ошибки контроля четности без сброса модуля, а также обнаружение мультибитовой ошибки при контроле четности.

6700 Серий с буферами пакетов SRAM функций DFC3C с защитой ECC. Это предоставляет одноразрядное исправление ошибки контроля четности без сброса модуля, а также обнаружение мультибитовой ошибки при контроле четности.

VS-SUP2T-10G с буферами пакетов SRAM функций PFC4 с защитой ECC. Это предоставляет одноразрядное исправление ошибки контроля четности без сброса модуля, а также обнаружение мультибитовой ошибки при контроле четности.

Серии 6900 с буферами пакетов SRAM функций DFC4 с защитой ECC. Это предоставляет одноразрядное исправление ошибки контроля четности без сброса модуля, а также обнаружение мультибитовой ошибки при контроле четности.

Программное обеспечение

Программное обеспечение Cisco IOS разработано для поддержки защиты ECC. Если аппаратный компонент, который поддерживает защиту ECC, испытывает SEU, код должен исправить поврежденные данные или перезагрузить компонент, на который влияют, и не потребовать полной перенастройки оборудования модуля, на который влияют. 

Однако в более ранних версиях программного обеспечения Cisco IOS, существует несколько исключений, где поведение было преднамеренно изменено или неправильное функционирование из-за ошибки в программном обеспечении. Вот два исключения.

Сброс IBC MSFC

В версиях программного обеспечения Cisco IOS между 12.1 (8) E и 12.2 (33) SXI3, поведение по умолчанию в ответ на SEU SYSTEM_CONTROLLER-3-ERROR должен был перезагрузить IBC и регистрировать сообщение об ошибках. Однако это корректирующее действие привело к некоторым задокументированным случаям IBC (и таким образом, ЦП) больше способность передать или получить данные.

Таким образом поведение было изменено после Версии 12.2 (33) SXI4 (идентификатор ошибки Cisco CSCtf51541), чтобы регистрировать сообщение об ошибках и перезагрузить систему. В то время как эта реакция может казаться более серьезной, предпочтительно перезагрузить систему и исправить структуру памяти, чем иметь безразличную систему.

Функция теперь в разработке (идентификатор ошибки Cisco CSCtr89859) добавит новую команду интерфейса командной строки (CLI), которая позволяет вам коммутировать поведение по умолчанию. Это усовершенствование является самым применимым к системам, которые используют одиночный супервизор и таким образом не имеют никакого резервирования управляющей программы.

6700 серий 'одноразрядная ошибка контроля четности' сброс

В версиях программного обеспечения Cisco IOS более ранний than12.2 (33) SXI5, ошибка в программном обеспечении (идентификатор ошибки Cisco CSCtj06411) заставила бы даже одноразрядные ошибки контроля четности перезагружать 6700 модулей. Это обычно было бы корректируемой ошибкой контроля четности и не требовало бы, чтобы был перезагружен модуль.

Этот дефект был решен в Версиях 12.2 (33) SXI6 + и 12.2SXJ для модуля управления Supervisor Engine 720 и в Версии 15.0SY для Supervisor Engine 2T. После обновления к соответствующей версии 6700 модулей просто регистрируют сообщение об ошибках и продолжают работать.

Рекомендации

Этой точкой вы, вероятно, определили, встретились ли вы с мягким или фатальной ошибкой четности. В то время как это может обратиться к одиночному инциденту, другие уязвимости ошибки контроля четности могут все еще существовать, таким образом, необходимо проявить больше комплексного подхода ко всей сети.

Таким образом Cisco и служебное подразделение Catalyst 6500 рекомендуют, чтобы вы рассмотрели эти процедуры смягчения и приняли соответствующие меры по ликвидации последствий, чтобы устранить или уменьшить будущие ошибки контроля четности.

Устранимые ошибки (SEU)

Одиночное событие (мягкие) ошибки контроля четности вызваны условиями среды и могут произойти только однажды (SEU) или очень нечасто, такой как ежемесячно или ежегодно. Несмотря на то, что вы не должны заменять аппаратные средства, вы действительно хотите смягчить возникновения в будущем.

Эти оптимальные методы значительно уменьшают вероятность ошибок мягкого контроля четности.

Экологический аудит

Cisco рекомендует выполнить экологический аудит сетевых расположений, на которые влияют. Можно выполнить этот аудит сами или при взаимодействии с представителем Cisco с командой Cisco (такой как Расширенные сервисы Cisco), или через стороннего консультанта.

Точное покрытие и сложность экологического аудита зависят от многих других переменных, таких как географическое местоположение, построение и размер помещения и дизайн, электрический дизайн и план и другие связанные факторы.

Рассмотрите, какие связанные со средой источники ЭСР и EMI могут существовать в или вокруг вашей сети. Это общие источники интерференции, которая может привести к ошибке мягкого контроля четности:

  • Шнуры питания и предоставления
  • Блоки распределения питания
  • Источники бесперебойного питания
  • Системы освещения
  • Генераторы мощности
  • Ядерные установки (излучение)
  • Солнечные вспышки (излучение)

Размещение шасси

SEU могут произойти, если блоки распределения питания, генераторы мощности или системы освещения слишком близки к шасси или если множественные шнуры питания работают или около шасси.

Важно предоставить достаточное расстояние между шасси Catalyst 6500 и этими электрическими и магнитными источниками. Рекомендуемые расстояния варьируются компонентом и доступны от таблиц данных компонента.

В целом Cisco рекомендует определить местоположение систем, по крайней мере, в трех - шести дюймах от общих источников электрической и магнитной интерференции. Шнуры питания должны маршрутизироваться вниз и далеко от шасси, по мере возможности, и не должны быть положены в плотно упакованных связках (bundle) или в больших числах через или около шасси.

Заземление

Колебания питания и скачки напряжения относительно распространены, и источники питания Catalyst 6500 разработаны для размещения незначительных отклонений в текущем напряжении.

Однако важно предоставить надлежащее заземление для шасси и стойки, таким образом, любое избыточное электрическое напряжение отвлечено далеко от системы. Без правильного заземления скачки напряжения могут привести к повреждению или неправильному функционированию в различных ASIC-схемах и компонентах памяти. См. Руководство по установке Коммутатора серии Catalyst 6500, Устанавливая Коммутатор, Устанавливая Заземление системы, для получения дополнительной информации.

ЭСР

ЭСР может легко повредить критически важные компоненты без любого видимого ухудшения. Соответствующие превентивные меры должны быть включены в политику операции лабораторной работы, но такие меры часто и к сожалению игнорируются из-за целесообразности и ограничили упущение.

Cisco рекомендует, чтобы ваш операционный менеджмент лабораторной работы, наряду с Cisco Systems, выполнил экологический аудит всех областей сети или, как минимум, всех областей, которые показали отказы оборудования или определялись как важная миссия. Как только аудит завершен, Cisco рекомендует внедрить стандартизированного связанного со средой чек-листа для всех недавно установленных систем во избежание будущих событий parity SEU.

Последние версии микропрограммного обеспечения (Rommon)

Компоненты оборудования Catalyst используют микропрограммное обеспечение (также известный как Rommon) код, чтобы инициализировать, связаться, и запуск диагностики. Как только эти функции завершены, работа системы передана в программное обеспечение Cisco IOS. Это редко для испытания проблем с микропрограммным обеспечением, но могут быть проблемы при использовании другого кода версий микропрограмм для Супервизоров и модулей.

Таким образом это - оптимальный метод, чтобы гарантировать, что все составляющие используют код последних версий микропрограммного обеспечения для обеспечения инициализации правильного модуля и связи. Cisco рекомендует, чтобы ваш операционный менеджмент выполнил проверку сети и аппаратные компоненты upgrade all с версией последних версий микропрограммного обеспечения.

Известные микропрограммные проблемы и процедуры обновления задокументированы в:

Загрузите версии последних версий микропрограммного обеспечения от веб-сайта Cisco:

Винты с насеченной головкой

Все модульные сетевые системы разработаны для вставки в заднюю панель шасси с рядом контактов физического интерфейса. Сама задняя панель шасси является по существу серией соединенных проводов. Контакты в каждом слоте шасси формируют соединение физических данных между Супервизором и Модулями Ethernet. Таким образом соответствующая вставка и выравнивание этих контактов важны.

Catalyst 6500 предоставляет направляющие и установочные штырьки, которые помогают в установке в шасси. Контакты слота (сокеты) и соединительные разъемы модуля разработаны, чтобы легко затронуть и предоставить высокую пропускную способность способное электрическое подключение. После того, как вставленный в шасси, существуют винты с насеченной головкой по обе стороны от модуля, которые полностью затрагивают контакты объединительной платы. См. Примечание Установки модуля Коммутатора серии Catalyst 6500.

Если модуль был должным образом вставлен в слот, и винты с насеченной головкой были правильно сжаты, никакие проблемы связи не ожидаются. Однако несколько условий могут произойти в ежедневной вставке модулей, которые могут привести к неподходящей или даже неполной установке монтажных штырей:

  • Недостаточная сила вставки - Если модуль частично вставлен без использования винтов с насеченной головкой, это может вызвать остановы шины, и модуль может не быть в состоянии связаться с другими модулями. В зависимости от уровня вставки (например, если существует ограниченный физический контакт), модуль может быть в состоянии передать и получить данные, но может испытать ошибки в канале связи тот результат в поврежденных пакетах.
  • Когда только одна сторона модуля находится на направляющих, вертикальное неточное совмещение - Это происходит. Это легко определено, потому что модуль кажется диагональным и обычно не соединяется с контактами объединительной платы.
  • Горизонтальное неточное совмещение - Если винты с насеченной головкой используются только на одной стороне, некоторые контакты, не нанимается должным образом. Это - типичная проблема, потому что модуль, может казаться, должным образом вставлен. Горизонтальное неточное совмещение является фактически формой недостаточной силы вставки.

Cisco рекомендует внедрить процесс управления операции, который передает под мандат использование винтов с насеченной головкой на всех модулях Catalyst 6500 в производственных средах. Это гарантирует надлежащую и полную вставку и выравнивание контактов объединительной платы и предотвращает будущие отказы из-за ошибок в канале связи и отнесенных сбоев связи.

Постоянные ошибки (неправильное функционирование)

Частые или повторимые (твердые) ошибки контроля четности вызваны физическим неправильным функционированием памяти, или схема использовала читать и писать. В таких случаях замените аппаратные средства и попросите, чтобы Центр технической поддержки Cisco (TAC) или ваш Инженер Cisco Systems провел EFA на возвращенных аппаратных средствах.

Эти оптимальные методы значительно уменьшают вероятность фатальных ошибок четности.

Аппаратные средства (MTBF и EOL) аудит

Cisco рекомендует выполнить проверку сети сетевых расположений, на которые влияют. Можно выполнить этот аудит сами или при взаимодействии с представителем Cisco с командой Cisco (такой как Расширенные сервисы Cisco), или через стороннего консультанта.

Все аппаратные средства (от всех поставщиков) подвергаются возможному ухудшению физической целостности, и важно отследить жизненный цикл всех аппаратных компонентов в вашей сети, чтобы полностью понимать вероятность отказа компонента в течение долгого времени.

Надежность аппаратного обеспечения может быть измерена с платформой Mean Time Between Failure (MTBF). Так как MTBF является только статистическим средним числом, это не означает, что сбой определенно произойдет в конце периода времени MTBF. Однако вероятность и уязвимость увеличений отказа компонента, таким образом, такие аппаратные средства должны быть отмечены для обновления. См. Таблицы данных коммутаторов Cisco Catalyst серии 6500 для определенного MTBF оценивает для каждого продукта Catalyst 6500.

Объединенное расчетное значение MTBF 'уровня системы' Catalyst 6500> 7 лет.

В дополнение к платформе MTBF Cisco также служит основой поддержки закончена (EOL), которая определяет ожидаемый жизненный цикл данного продукта и предоставляет применимые объявления, чтобы помочь вам обновлять свое обычное оборудование. См. поддержку закончена и Предупреждения окончания продаж для различных устаревших продуктов Catalyst 6500.

В результате этого аппаратного аудита Cisco рекомендует внедрить собственный MTBF и процесс EOL, который определяет и отслеживает аппаратные средства для потенциального обновления. Это гарантирует, что последние аппаратные средства выполняют и минимизируют вероятность аппаратной неисправности.

Аппаратная диагностика

Серия Catalyst 6500 и программное обеспечение Cisco IOS предоставляют (ЗОЛОТУЮ) Оперативную диагностику Общего назначения и диагностика Контроля исправности (HM) для всех аппаратных компонентов, используемых в системе. Два базовых типа диагностики, которая может быть включена, по требованию и начальная загрузка. См. Оперативную диагностику Общего назначения на коммутаторе Cisco Catalyst серии 6500 для дополнительных сведений.

Cisco рекомендует, чтобы 'завершенная' диагностика начальной загрузки была включена для всех аппаратных компонентов, чтобы гарантировать, что все диагностические тесты выполняются и подтвердить, что все аппаратные компоненты функционируют как ожидалось после начальной загрузки.

Cisco также рекомендует планировать обычный, по требованию диагностика компонентов важной инфраструктуры на ежедневной газете или еженедельно. Вне диагностики начальной загрузки, которая происходит только во время инициализации, по требованию, диагностика гарантирует, что аппаратные средства продолжают работать как ожидалось. См. Руководство по конфигурации программного обеспечения Выпуска 12.2SX Catalyst 6500, Интерфейс и Аппаратные компоненты, Оперативную диагностику для получения дополнительной информации.

В дополнение к по умолчанию по требованию диагностические тесты, Cisco рекомендует включить им по требованию диагностические тесты для упреждающего определения компонентов памяти, которые могли бы неправильно функционировать:

  • TestLinecardMemory
  • TestAsicMemory


Document ID: 116135