Доступность : Высокая доступность

Управление емкостью и производительностью сети: Рекомендации и Описание технологических решений

20 октября 2016 - Машинный перевод
Другие версии: PDF-версия:pdf | Английский (22 августа 2015) | Отзыв


Содержание


Введение

Высокий уровень доступности сети является критически важным требованием на крупных предприятиях и в сетях поставщиков услуг. Руководители, отвечающие за сети, сталкиваются с растущими трудностями обеспечения повышенной готовности, в числе которых незапланированные простои, отсутствие знаний и опыта, недостаток инструментария, сложные технологии, консолидация деятельности и конкурентные рынки. Управление ресурсами и производительностью помогает руководителям достигнуть целевых показателей деятельности в новых реалиях и обеспечить последовательную доступность и производительность сети.

Этот документ исследует следующие темы:

  • Общая производительность и проблемы производительности, включая риски и потенциальную пропускную способность выходят в сетях.

  • Оптимальные методы управления мощностью и производительностью, включая анализы возможных вариантов, эталонное тестирование, отклонение, управление исключениями и управление QoS.

  • Как разработать стратегию планирования загрузки, включая распространенные методы, программные средства, переменные MIB и пороги, используемые в планировании мощности.

Обзор управления мощностью и производительностью

Планирование мощности является процессом определения сетевых ресурсов, требуемых предотвратить производительность или влияние на доступность на критически важных для бизнеса приложениях. Управление производительностью является практикой управляющего времени отклика сетевой сервиса, непротиворечивости, и качества для индивидуальных служб и полных сервисов.

Примечание: Проблемы производительности обычно относятся к емкости. Приложения медленнее, потому что пропускная способность и данные должны ждать в очередях прежде чем быть переданным через сеть. В голосовых приложениях проблемы как задержка и дрожание непосредственно влияют на качество голосового вызова.

Большинство организаций уже собирает некоторую связанную с емкостью информацию и работает последовательно, чтобы решить проблемы, изменения плана, и внедрить новую емкость и функциональность и производительность. Однако организации обычно не выполняют отклонение и анализы возможных вариантов. Анализ возможных вариантов является процессом определения влияния изменения сети. Отклонение является процессом выполнения, состоят базовые показатели пропускной способности сети и проблем производительности и рассмотрения базовых показателей для сетевых тенденций для понимания будущих требований к обновлению. Управление мощностью и производительностью должно также включать управление исключениями, где проблемы определены и решены, прежде чем пользователи призывают, и управление QoS, где администраторы сети планируют, управляет и определяет проблемы производительности отдельного сервиса. Следующий рисунок иллюстрирует процессы управления мощностью и производительностью.

http://www.cisco.com/c/dam/en/us/support/docs/availability/high-availability/20769-process.gif

У управления мощностью и производительностью также есть свои ограничения, как правило, отнесенные к ЦП и памяти. Ниже приводятся потенциальные области для беспокойства:

  • ЦП

  • Объединительная плата или ввод-вывод

  • Память и буферы

  • Интерфейс и размеры канала

  • Организация очереди, задержка и дрожание

  • Скорость и расстояние

  • Характеристики приложения

Некоторые ссылки на планирование мощности и управление производительностью также упоминают что-то вызванное "плоскость данных" и "уровень управления". В то время как уровень управления означает ресурсы, требуемые поддерживать соответствующую функциональность плоскости данных, плоскость данных является просто емкостью и проблемами производительности, связанными с данными, пересекающими сеть. Функциональность уровня управления включает сервисные издержки, такие как маршрутизация, связующее дерево, интерфейсные пакеты Keepalive и SNMP - управление устройства. Эти требования уровня управления используют ЦП, память, буферизацию, организацию очереди и пропускную способность точно так же, как трафик, который пересекает сеть. Многие требования уровня управления также важны для общих функциональных возможностей системы. Если у них нет ресурсов, им нужно, сетевые сбои.

ЦП

ЦП, как правило, используется и уровнем управления и плоскостью данных на любом сетевом устройстве. В управлении мощностью и производительностью необходимо гарантировать, что устройство и сеть имеют достаточный ЦП для функционирования в любом случае. Недостаточное быстродействие CPU может часто сворачивать сеть, потому что недостаточные ресурсы на одном устройстве могут повлиять на всю сеть. Недостаточное быстродействие CPU может также увеличить задержку, так как данные должны ждать, чтобы быть обработанными, когда нет никакой аппаратной коммутации без основного CPU.

Объединительная плата или ввод-вывод

Объединительная плата или ввод-вывод обращаются к общему объему трафика, который устройство может обработать, обычно описываемый с точки зрения размера ШИНЫ или возможности объединительной платы. Недостаточная объединительная плата обычно приводит к отброшенным пакетам, которые могут привести к повторным передачам и дополнительному трафику.

Память

Память является другим ресурсом, который имеет плоскость данных и требования уровня управления. Память требуется для получения информации, такой как таблицы маршрутизации, таблицы ARP и другие структуры данных. Когда устройства исчерпывают память, некоторые операции на устройстве могут отказать. Операция могла влиять на процессы уровня управления или процессы плоскости данных, в зависимости от ситуации. Если сбой процессов уровня управления, может ухудшиться вся сеть. Например, когда дополнительная память требуется для маршрутизации конвергенции, это может произойти.

Интерфейс и размеры канала

Интерфейс и размеры канала относятся на сумму данных, которые могут быть переданы одновременно на любом соединении. Это часто неправильно упоминается как скорость соединения, но данные действительно не перемещаются на других скоростях от одного устройства до другого. Кремниевая скорость и быстродействие оборудования помогают определять доступную пропускную способность на основе сред. Кроме того, программные механизмы могут "отрегулировать" данные для приспосабливания определенным распределениям пропускной способности для сервиса. Вы, как правило, видите это в обслуживании поставщики сетевых услуг для frame-relay или ATM, которые по сути имеют быстродействия 1.54kpbs к 155mbs и выше. Когда существуют ограничения пропускной способности, данные помещены в очередь в очереди передачи. Очередь передачи может иметь другие программные механизмы для расположения по приоритетам данных в очереди; однако, когда существуют данные в очереди, они должны ждать существующих данных, прежде чем они смогут передать данные интерфейс.

Организация очереди, задержка и дрожание

При организации очереди задержка и дрожание также влияют на производительность. Можно настроить очередь передачи для влияния на производительность по-разному. Например, если очередь является многочисленной, то данные ждут дольше. Когда очереди являются малочисленными, данные отброшены. Это называют taildrop и приемлемо для приложений TCP, так как будут ретранслироваться данные. Однако голос и видео не выполняют хорошо с отбрасыванием очереди или даже значительная задержка очереди, требуя особого внимания к пропускной способности или передают размеры по каналу. Если устройство не имеет достаточных ресурсов для непосредственной передачи пакета, задержка очереди может также произойти с входными очередями. Это может произойти из-за ЦП, памяти или буферов.

Задержка описывает обычное время обработки со времени, это получено до времени передан пакет. Обычные современные коммутаторы данных и маршрутизаторы имеют чрезвычайно низкую задержку (<1 мс) под обычными условиями без ограничений ресурса. Современные устройства с Цифровыми процессорами сигналов, чтобы преобразовать и сжать пакеты аналогового голосового канала могут занять больше времени, сгладить к 20 мс.

Дрожание описывает интервал между пакетами для программ речевой связи, включая голос и видео. Если пакеты поступают в разное время с другой синхронизацией интервала между пакетами, то дрожат, высоко, и качество голосовой связи ухудшается. Дрожание является в основном фактором задержки в очереди.

Скорость и расстояние

Скорость и расстояние являются также фактором в производительности сети. Сети передачи данных имеют последовательную скорость переадресации данных на основе скорости света. Это - приблизительно 100 милей в миллисекунду. Если организация запустит клиент-серверное приложение на международном уровне, то они могут ожидать соответствующую задержку пересылки пакетов. Когда приложения не оптимизированы для производительности сети, скорость и расстояние могут быть огромным фактором в производительности приложения.

Характеристики приложения

Характеристики приложения являются последней областью, которая влияет на емкость и производительность. Проблемы, такие как маленькие размеры окна, пакеты Keepalive приложения и объем данных, передаваемый по сети по сравнению с тем, что требуется, могут влиять на производительность приложения во многих средах, особенно глобальные сети (WAN).

Оптимальные методы управления мощностью и производительностью

В этом разделе рассматриваются пять основных оптимальных методов управления мощностью и производительностью подробно:

Управление уровнями обслуживания

Управление уровнем обслуживания определяет и регулирует другие требуемые процессы управления мощностью и производительностью. Менеджеры сети понимают, что им нужно планирование мощности, но они сталкиваются с составлением бюджета и комплектованием персонала ограничений, которые предотвращают полное решение. Управление уровнем обслуживания является доказанной методологией, которая помогает с проблемами ресурса путем определения поставляемого компонента и создания двустороннего учета для сервиса, связанного к тому поставляемому компоненту. Можно выполнить это двумя способами:

  • Создайте соглашение об уровне обслуживания между пользователями и организацией сети для сервиса, который включает управление мощностью и производительностью. Сервис включал бы отчёты и рекомендации поддержать качество обслуживания. Однако пользователи должны быть подготовлены финансировать сервис и любые требуемые обновления.

  • Организация сети определяет их сервис управления мощностью и производительностью и затем делает попытку финансирования для того сервиса и обновлений в зависимости от конкретного случая.

При любых обстоятельствах организация сети должна запуститься путем определения планирования мощности и службы управления производительностью, которая включает, какие аспекты сервиса они могут в настоящее время предоставлять и что запланировано в будущем. Завершенный сервис включал бы анализ возможных вариантов для изменений сети и изменений приложений, эталонного тестирования и отклоняющийся для определенных переменных производительности, управление исключениями для определенной емкости и переменных производительности и управления QoS.

Сеть и анализ возможных вариантов приложения

Выполните сеть и анализ возможных вариантов приложения для определения результата планового изменения. Без анализа возможных вариантов организации берут на себя значительные риски для успешного изменения и полной доступности сети. Во многих случаях изменения сети привели к сбою связанный с перегрузкой, причиняющему время простоя многих часов производства. Кроме того, поразительное количество сбоя введений приложения и причины влияет другим пользователям и приложениям. Эти сбои продолжаются во многих организациях сети, все же они абсолютно предотвратимы с несколькими программными средствами и некоторыми дополнительными этапами планирования.

Вам обычно нужны несколько новых процессов для выполнения качественного анализа возможных вариантов. Первый шаг должен определить уровни риска для всех изменений и потребовать более всестороннего анализа возможных вариантов для более высоких изменений степени риска. Уровень риска может быть обязательным полем для всех представлений изменения. Более высокие изменения уровня риска тогда потребовали бы определенного анализа возможных вариантов изменения. Сетевой анализ возможных вариантов определяет влияние изменений сети на использовании сети и сетевых проблемах ресурса уровня управления. Анализ возможных вариантов приложения определил бы успех приложения проекта, требования пропускной способности и любые проблемы сетевых ресурсов. Следующие таблицы являются примерами присвоения уровня риска и соответствующих тестовых требований:

Уровень риска Определение Рекомендации планирования изменения
1
  • Высокое потенциальное воздействие к большому числу пользователей (500 +) или критически важный для бизнеса сервис из-за нового продукта, программного обеспечения, топологии или введения функции.
  • Изменение включает ожидаемое сетевое время простоя.
  • Проверьте лабораторную работу нового решения. Проверка в экспериментальной среде включает задокументированное тестирование решения и проверку и влияние показа анализа возможных вариантов к существующей инфраструктуре. Мы рекомендуем пробные решения. Новые решения требуют завершения поддержки документов операций.
  • Выполните обзор проекта NSA Cisco.
  • Создайте план восстановления.
  • Создайте план внедрения.
  • Создайте процесс изменения.
2
  • Высокое потенциальное воздействие к большому числу пользователей (500 +) или критически важный для бизнеса сервис из-за значительного увеличения трафика или пользователей, изменений магистрали или изменений маршрутизации.
  • Изменение может потребовать некоторого времени простоя.
  • Выполните анализ возможных вариантов для определения влияния к существующей среде (должен быть сделан в лабораторной среде).
  • Тест и изменения маршрутизации анализа для функциональности.
  • Создайте план восстановления.
  • Выполните обзор проекта для серьезных изменений параметров маршрутизации или изменений магистрали.
  • Создайте план внедрения.
  • Создайте процесс изменения.
3
  • Среднее потенциальное воздействие к меньшему числу пользователей или бизнес-сервиса из-за любого нестандартного изменения.
  • Включает новый продукт, программное обеспечение, топологию, добавление функций или новых пользователей, увеличения трафика или нестандартной топологии.
  • Изменение может потребовать некоторого времени простоя.
  • Выполните инженерный анализ нового решения (может потребовать проверки в экспериментальной среде).
  • Создайте план внедрения.
  • Создайте процесс изменения.
4
  • Более низкий потенциальный сервис или вмешательство пользователя.
  • Включает добавляющие новые стандартные шаблонные сетевые модули, такие как построение или коммутаторы/концентраторы сервера на маршрутизаторах.
  • Включает внедрение новых узлов глобальной сети (WAN) или дополнительных проверенных служб доступа.
  • Изменения уровня 3 всего риска были технически доказаны в производственной среде.
  • Изменение может потребовать некоторого времени простоя.
  • Создайте план внедрения.
  • Создайте процесс изменения.
5
  • Никакой пользователь или сервисное влияние.
  • Включает добавляющих отдельных пользователей в сеть и изменения стандартной конфигурации, такие как пароль, баннер, SNMP или другие стандартные параметры конфигурации.
  • Никакое время простоя.
  • Дополнительный процесс изменения.

Как только вы определяете, где вам нужен анализ возможных вариантов, можно определить сервис.

Можно выполнить сетевой анализ возможных вариантов со средствами моделирования или с лабораторной работой, которая подражает производственной среде. Средства моделирования ограничены тем, как хорошо приложение понимает проблемы ресурсов устройства и так как большинство изменений сети является новыми устройствами, приложение может не понять эффект изменения. Лучший метод должен создать некоторое представление рабочей сети в лабораторной работе и протестировать необходимое программное обеспечение, функцию, аппаратные средства или конфигурацию под загрузкой при помощи генераторов трафика. Утечка маршрутов (или другая контрольная информация) от рабочей сети в лабораторную работу также улучшает лабораторную среду. Тестовые требования дополнительного ресурса с другими типами трафика, включая SNMP, широковещание, групповую адресацию, зашифрованную, или сжатый трафик. Со всеми этими другими методологиями проанализируйте требования ресурсов устройства во время потенциальных ситуаций высокой нагрузки, таких как схождение маршрутов, колебания связи и перезапуски устройства. Вопросы использования ресурсов включают обычные области ресурса емкости, такие как ЦП, память, использование объединительной платы, буферы и организация очереди.

Новые приложения должны также выполнить анализ возможных вариантов для определения успеха приложения и требований пропускной способности. Вы обычно выполняете этот анализ в лабораторной среде с помощью анализатора протокола и симулятора задержки WAN для понимания эффекта расстояния. Вам только нужны ПК, концентратор, устройство задержки WAN и лабораторный маршрутизатор, связанный в рабочую сеть. Можно моделировать пропускную способность в лабораторной работе путем регулировки трафика с помощью Generic traffic shaping или ограничения скорости на проверке маршрутизатора. Администратор сети может работать в сочетании с группой приложений для понимания требований пропускной способности, проблем работы с окнами и проблем возможной производительности для приложения и в LAN и в средах глобальной сети (WAN).

Выполните анализ возможных вариантов приложения прежде, чем развернуть любой бизнес - приложение. Если вы не делаете этого, группа приложений обвиняет сеть в низкой производительности. Если можно так или иначе потребовать анализа возможных вариантов приложения для новых развертываний через процесс управления изменениями, можно помочь предотвращать неуспешные развертывания и лучше понимать внезапные увеличения потребляемой полосы пропускания и для клиент-сервер и для требования к пакету.

Эталонное тестирование и отклонение

Эталонное тестирование и отклонение позволяют администраторам сети планировать и обновления полной сети, прежде чем проблема емкости вызовет сетевое время простоя или проблемы производительности. Сравните использование ресурса во время последовательных периодов времени или дистиллируйте информацию вниз в течение долгого времени в базе данных и позволяйте планировщикам просматривать параметры использования ресурса в течение прошлого часа, дня, недели, месяца и года. Или в случае, кто-то должен рассмотреть информацию о еженедельнике, каждые две недели, или в ежемесячно. Проблема с эталонным тестированием и отклонением состоит в том, что это требует, чтобы подавляющее количество данных рассмотрело в больших сетях.

Можно решить, что этой проблемой являются несколько путей:

  • Встройте много емкости и переключающийся в среду локальной сети, таким образом, емкость не проблема.

  • Разделите информацию о тенденции на группы и сконцентрируйтесь на высокой доступности или критических областях сети, таких как LAN ЦОД или критические узлы глобальной сети (WAN).

  • Механизмы создания отчетов могут выделить области, которые падают выше определенного порога для особого внимания. При реализации областей критической доступности сначала можно значительно уменьшить количество данных, требуемое для анализа.

Со всеми предыдущими способами все еще необходимо рассмотреть информацию о периодической основе. Эталонное тестирование и отклонение являются упреждающим усилием и если организация только будет иметь ресурсы для поддержки, основанной на реагировании на происшедшие события, то частные лица не считают отчёты.

Много решений для управления сетью предоставляют сведения и графики о переменных ресурса емкости. К сожалению, большинство людей только использует эти программные средства для поддержки, основанной на реагировании на происшедшие события к существующей проблеме; это побеждает цель эталонного тестирования и отклонения. Два программных средства, которые являются эффективными при предоставлении информации о тенденции Емкости для Сетей Cisco, являются продуктом Работоспособности сети Concord и продуктами INS EnterprisePRO. Во многих случаях организации сети выполняют простые языки сценариев для сбора информации емкости. Ниже некоторые примеры отчета, которые были собраны с помощью Сценария для использования соединения, загрузки ЦПУ и производительности эхо-запроса. Другие переменные ресурса, которые могут быть важными для отклонений, включают память, глубину очереди, объем широковещания, буфер, уведомление о перегрузке Frame Relay и использование объединительной платы. См. их представляют в виде таблицы для получения информации об использовании соединения и загрузке ЦПУ:

Использование соединения

Resource Адрес Сегмент Средняя загруженность (%) Пиковое использование (%)
JTKR01S2 10.2.6.1 128 Кбит/с 66.3 97.6
JYKR01S0 10.2.6.2 128 Кбит/с 66.3 97.8
FMCR18S4/4 10.2.5.1 384 кбит/с 51.3 109.7
PACR01S3/1 10.2.5.2 384 кбит/с 51.1 98.4

Использование CPU

Resource Опрашиваемый адрес Средняя загруженность (%) Пиковое использование (%)
FSTR01 10.28.142.1 60.4 80
NERT06 10.170.2.1 47 86
NORR01 10.73.200.1 47 99
RTCR01 10.49.136.1 42 98

Использование соединения

Resource Адрес AvResT (мс) 09.09.98 AvResT (мс) 09.09.98 AvResT (мс) 09.09.98 AvResT (мс) 01.10.98
AADR01 10.190.56.1 469.1 852.4 461.1 873.2
ABNR01 10.190.52.1 486.1 869.2 489.5 880.2
APRR01 10.190.54.1 490.7 883.4 485.2 892.5
ASAR01 10.196.170.1 619.6 912.3 613.5 902.2
ASRR01 10.196.178.1 667.7 976.4 655.5 948.6
ASYR01S         503.4
AZWRT01 10.177.32.1 460.1   444.7  
BEJR01 10.195.18.1 1023.7 1064.6 1184 1021.9

Управление исключениями

Управление исключениями является полезной методикой для определения и разрешающей способности и проблем производительности. Идея состоит в том, чтобы получить уведомление о емкости и нарушения порогового значения производительности, чтобы сразу исследовать и решить проблему. Например, администратор сети мог бы получить сигнал тревоги для высокой загрузки CPU на маршрутизаторе. Администратор сети может войти в маршрутизатор для определения, почему ЦП так высок. Она может тогда выполнить некоторую коррективную настройку, которая уменьшает ЦП, или создайте access-list, предотвращающий трафик, который вызывает проблему, особенно если трафик, кажется, не критически важен для бизнеса.

Можно настроить управление исключениями для большего количества критических проблем справедливо просто использование команд Конфигурации RMON на маршрутизаторе или использования более усовершенствованных программных средств, таких как менеджер уровня Сервиса netsys в сочетании с SNMP, RMON или Данными NetFlow. Большинство средств управления сетью имеет возможность установить пороги и сигналы тревоги на нарушениях. Важный аспект процесса управления исключениями должен предоставить уведомление псевдореального времени о проблеме. В противном случае проблема может исчезнуть, прежде чем любой заметил, что было получено уведомление. Если организация имеет последовательный мониторинг, это может быть сделано в NOC. В противном случае мы рекомендуем уведомление пейджера.

Следующий пример конфигурации предоставляет повышение и уведомление нижнего порога для процессора маршрутизатора к файлу журнала, который может быть рассмотрен на регулярно. Можно установить подобные команды RMON для нарушений порога использования важного звена или других порогов SNMP.

rmon event 1 trap CPUtrap description
  "CPU Util >75%"rmon event 2 trap CPUtrap description
  "CPU Util <75%"rmon event 3 trap CPUtrap description
  "CPU Util >90%"rmon event 4 trap CPUtrap description
  "CPU Util <90%"rmon alarm 75 lsystem.56.0 10 absolute rising-threshold
  75 1 falling-threshold 75 2rmon alarm 90 lsystem.56.0 10 absolute rising-threshold
  90 3 falling-threshold 90 4

Управление QoS

Управление качества обслуживания включает создание и мониторинг определенных классов трафика в сети. Трафик предоставляет больше постоянных показателей производительности для определенных групп приложений (определенный в классах трафика). Параметры формирования трафика предоставляют значительную гибкость в приоритизации и формировании трафика для определенных классов трафика. Эти функции включают возможности, такие как согласованная скорость доступа (CAR), взвешенное произвольное раннее обнаружение (WRED), и класс базировался, ярмарка взвесила организацию очереди. Классы трафика обычно создаются на основе производительности SLA для большего количества критически важных для бизнеса приложений и определенных требований к приложению, таких как голос. Некритический или неделовой трафик также управлялся бы в способе, которым он не может влиять на приложения с более высоким приоритетом и сервисы.

Создание классов трафика требует базового понимания использования сети, определенных требований к приложению и приоритетов бизнеса - приложения. Требования к приложению включают знание размеров пакета, проблем таймаута, требований дрожания, пакетных требований, требований к пакету и проблем общей производительности. С этим знанием администраторы сети могут создать планы формирования трафика и конфигурации, которые предоставляют более согласованную производительность приложений через множество топологии LAN/WAN.

Например, одна организация имеет подключение по каналу ATM на 10 мегабит между двумя основными узлами. Ссылка иногда становится переполненной от больших передач файла, который вызывает снижение производительности для оперативной обработки транзакций и плохого или неприменимого качества голосовой связи.

Организация установила четыре других класса трафика. Голосу дали наивысший приоритет и позволили поддержать тот приоритет, даже если это разорвало по скорости планируемого объема обрабатываемого трафика. Классу критически важного приложения дали следующий наивысший приоритет, но не было позволено разорвать свыше размера общего размера канала меньше предполагаемые требования пропускной способности для речевых данных. Когда это действительно разорвет, это будет отброшено. Трафику передачи файла просто дали более низкий приоритет и всю другую адаптацию трафика где-нибудь в середине.

Организация теперь должна выполнить управление QoS на этой ссылке для определения, сколько трафика каждый класс берет, и измерьте уровень в каждом классе. Если организация не в состоянии делать это, исчерпание ресурсов может произойти для некоторых классов, или производительность SLA не может быть встречена в отдельном классе.

Управление конфигурациями QoS является все еще сложной задачей из-за отсутствия программных средств. Один метод должен использовать Интернет-менеджера производительности (IPM) Cisco для передачи другого трафика через ссылку, которая попадает в каждый из классов трафика. Вы могли тогда контролировать производительность для каждого класса, и IPM предоставляет отклонение, анализ в режиме реального времени и анализ перехода за переходом для точного определения проблемных областей. Другие могут все еще полагаться на большее количество ручного способа как исследование организации очереди и отброшенных пакетов в каждом классе трафика на основе интерфейсной статистики. В некоторых организациях эти данные могут быть собраны через SNMP или проанализированы в базу данных для сравнения показателей и отклонение. Некоторые программные средства также существуют на рынке, которые передают определенные типы трафика по сети для определения производительности для определенного сервиса или приложения.

Сбор и сообщение информации емкости

Сбор и сообщение информации емкости должны быть связаны с тремя рекомендуемыми областями управления мощностью:

  • Анализ возможных вариантов, который центрируется вокруг изменения сети и как изменение влияет на среду

  • Эталонное тестирование и отклонение

  • Управление исключениями

В каждой из этих областей разработайте план сбора сведений. В случае сети или анализов возможных вариантов приложения, вам нужны программные средства, чтобы подражать сетевой среде и понять влияние изменения относительно потенциальных проблем ресурса в плоскости управления устройством или плоскости данных. В случае эталонного тестирования и отклонения, вам нужны снимки для устройств и ссылки, показывая использование текущего ресурса. Вы тогда рассматриваете данные в течение долгого времени для понимания потенциальных требований к обновлению. Это позволяет администраторам сети должным образом планировать обновления перед емкостью, или проблемы производительности возникают. Когда проблемы действительно возникают, вам нужно управление исключениями для предупреждения администраторов сети, таким образом, они могут настроить сеть или решить проблему.

Этот процесс может быть разделен на следующие шаги:

  1. Определите свои потребности.

  2. Определите процесс.

  3. Определите области емкости.

  4. Определите переменные пропускные способности.

  5. Интерпретируйте данные.

Определите свои Потребности

Разработка плана управления мощностью и производительностью требует понимания необходимой информации и цели той информации. Разделите план на три требуемых области: один каждый для анализа возможных вариантов, эталонного тестирования/отклоняться и управления исключениями. В каждой из этих областей обнаружьте, какие ресурсы и программные средства доступны и что необходимо. Многие организационный сбой с развертываниями программного средства, потому что они рассматривают технологию и функции программных средств, но не рассматривают людей и экспертные знания, должны были управлять программными средствами. Включайте требуемых людей и экспертные знания в вашем плане, а также усовершенствования процесса. Среди этих людей могут быть системные администраторы для управления станциями управления сетью, администраторы базы данных, чтобы помочь с администрированием базы данных, обученные администраторы использовать и контролировать программные средства и высокоуровневых администраторов сети для определения политики, порогов и требований сбора сведений.

Определите процесс

Вам также нужен процесс, чтобы гарантировать, что программное средство используется успешно и последовательно. Можно потребовать, чтобы усовершенствования процесса определили то, что должны сделать администраторы сети, когда превышение порогового ограничения происходит или что процесс придержаться для эталонного тестирования, отклонения и обновления сети. Как только вы определяете требования и ресурсы для успешного планирования мощности, можно рассмотреть методологию. Много организаций принимают решение произвести этот тип на стороне функциональности к организации сетевых сервисов, такой как INS или создать экспертные знания, внутрифирменные, потому что они считают сервис основным видом деятельности.

Определите области емкости

План относительно планирования мощности должен также включать определение областей емкости. Это области сети, которая может совместно использовать общую стратегию планирования загрузки: например, корпоративный ЛВС, филиалы глобальной сети (WAN), критические узлы глобальной сети (WAN) и доступ входящих звонков. Определение различных областей полезно по нескольким причинам:

  • Различные области могут иметь другие пороги. Например, пропускная способность LAN является намного более дешевой, чем полоса пропускания глобальной сети (WAN), таким образом, пороги использования должны быть ниже.

  • Различные области могут потребовать контролирующих других переменных MIB. Например, FECN и счетчики BECN в Frame Relay важны в понимании проблем емкости frame-relay.

  • Это может быть более трудным или трудоемким для обновления некоторых областей сети. Например, международные линии могут иметь намного более длинные сроки разработки и нуждаться в соответствующем более высоком уровне планирования.

Определите переменные пропускные способности

Следующая важная область определяет переменные для мониторинга и пороговые значения, которые требуют действия. Определение переменных пропускных способностей значительно зависит от устройств и сред, используемых в сети. В общих параметрах, таких как ЦП, память и использование соединения ценны. Однако другие области могут быть важны для определенных технологий или требований. Они могут включать глубины очереди, производительность, уведомление о перегрузке frame-relay, использование объединительной платы, использование буфера, статистику сетевых потоков, объем широковещания и данные RMON. Следует иметь в виду свои долгосрочные планы, но начните только с нескольких ключевых областей помогать гарантировать успех.

Интерпретируйте данные

Понимание собранных данных является также ключевым для предоставления высококачественного сервиса. Например, много организаций не полностью понимают уровни средней загруженности и пик. Следующая схема показывает пик параметра емкости на основе 5-минутного интервала сбора SNMP, (показанный в зеленом).

http://www.cisco.com/c/dam/en/us/support/docs/availability/high-availability/20769-interpretdata.gif

Даже при том, что значение, о котором сообщают, было меньше, чем порог (показанный в красном), пики все еще могут произойти в интервале сбора, которые являются выше порогового значения (показаны в синем). Это значительно, потому что во время интервала сбора, организация может испытывать пиковые значения, которые влияют на производительность или емкость сети. Старайтесь выбрать значимый интервал сбора, который полезен, и это не вызывает чрезмерные издержки.

Другим примером является средняя загруженность. Если сотрудники находятся только в офисе от восемь до пять, но средняя загруженность 7 дней в неделю, 24 часа в сутки, информация может вводить в заблуждение.


Дополнительные сведения


Document ID: 20769