Disponibilité : Haute disponibilité

Gestion des capacités et des performances : Livre blanc sur les pratiques recommandées

18 octobre 2016 - Traduction automatique
Autres versions: PDFpdf | Anglais (22 août 2015) | Commentaires


Contenu

CPU

Introduction

La haute disponibilité du réseau est une condition requise essentielle dans les grandes entreprises et les réseaux de fournisseur de service. Les responsables réseau doivent faire face à des défis croissants pour fournir une meilleure disponibilité, y compris les défis liés aux temps d’arrêt non programmés, au manque d’expertise, à l’insuffisance des outils, à la complexité des technologies, à la consolidation du marché et à la concurrence. Les outils de gestion de la capacité et des performances aident les responsables réseau à atteindre de nouveaux objectifs d’entreprise ainsi qu’une disponibilité et des performances du réseau homogènes.

Ce document examine les thèmes suivants :

  • Capacité générale et problèmes de performance, y compris les risques et les questions potentielles de capacité dans des réseaux.

  • Pratiques recommandées de capacité et de Gestion des performances, incluant ce qui-si analyses, établissement des références, tendre, gestion d'exception, et gestion QoS.

  • Comment développer une stratégie de planification de capacité, y compris des techniques communes, des outils, des variables MIB, et des seuils utilisés dans la planification de capacité.

Aperçu de capacité et de Gestion des performances

La planification de capacité est le processus de déterminer les ressources de réseau exigées pour empêcher une représentation ou un impact sur la disponibilité sur des applications critiques. La Gestion des performances est la pratique de gérer le temps de réponse du service réseau, la cohérence, et la qualité pour des services individuels et globaux.

Remarque: Des problèmes de performances sont habituellement liés à la capacité. Les applications sont plus lentes parce que la bande passante et les données doivent attendre dans les files d'attente avant d'être transmise par le réseau. Dans les Applications voix, les problèmes comme le retard et instabilité affectent directement la qualité de la communication voix.

La plupart des organismes collectent déjà des certains informations et travail en rapport avec la capacité uniformément pour résoudre des problèmes, prévoient des modifications, et implémentent la nouvelle capacité et la fonctionnalité de représentation. Cependant, les organismes n'exécutent pas par habitude tendre et ce qui-si des analyses. Ce qui-si l'analyse est le processus de déterminer l'affect d'une modification de réseau. Tendre est le processus d'exécuter consistent des spécifications de base de capacité du réseau et problèmes de performance et révision des spécifications de base pour que les tendances de réseau comprennent des conditions requises de future mise à jour. La capacité et la Gestion des performances devraient également inclure la gestion d'exception où des problèmes sont identifiés et résolu avant des utilisateurs appelez dedans, et la gestion QoS où les administrateurs réseau prévoient, gèrent, et identifient des problèmes de performance de service individuel. Le graphique suivant illustre des processus de capacité et de Gestion des performances.

http://www.cisco.com/c/dam/en/us/support/docs/availability/high-availability/20769-process.gif

La capacité et la Gestion des performances a également ses limites, typiquement liées à la CPU et mémoire. Ce qui suit sont des zones potentielles pour le souci :

  • CPU

  • Le fond de panier ou E/S

  • Mémoire et mémoires tampons

  • Tailles d'interface et de canal

  • Mise en file d'attente, latence, et jitter

  • Vitesse et distance

  • Caractéristiques de l'application

Quelques références à la planification de capacité et à la Gestion des performances mentionnent également quelque chose appelée le « plan de données » et le « avion de contrôle ». Le plan de données est simplement capacité et problèmes de performance impliqués des données traversant le réseau tandis que l'avion de contrôle signifie des ressources exigées pour mettre à jour la fonctionnalité appropriée du plan de données. La fonctionnalité plate de contrôle inclut le temps système de service tel que le routage, le spanning-tree, les keeps-alive d'interface, et la gestion SNMP du périphérique. Ceux-ci contrôlent la CPU plate d'utilisation de conditions requises, la mémoire, la mise en mémoire tampon, la Mise en file d'attente, et la bande passante juste comme le trafic qui traverse le réseau. Plusieurs des conditions requises d'avion de contrôle sont également essentielles à la fonctionnalité globale du système. S'ils n'ont pas les ressources qu'ils ont besoin, le réseau échoue.

CPU

La CPU est typiquement utilisée en l'avion et le plan de données de contrôle sur n'importe quel périphérique de réseau. En capacité et Gestion des performances, vous devez s'assurer que le périphérique et le réseau ont la CPU suffisante à fonctionner à tout moment. La CPU insuffisante peut souvent réduire un réseau parce que les ressources insuffisantes sur un périphérique peuvent affecter le tout le réseau. La CPU insuffisante peut également augmenter la latence puisque les données doivent attendre d'être traitées quand il n'y a aucune commutation de matériel sans CPU principale.

Le fond de panier ou E/S

Le fond de panier ou l'E/S se rapporte au trafic total qu'un périphérique peut manipuler, habituellement décrit en termes de taille de BUS ou capacité du fond de panier. Le fond de panier insuffisant a normalement comme conséquence les paquets relâchés, qui peuvent mener aux retransmissions et au trafic supplémentaire.

Mémoire

La mémoire est une autre ressource qui a des conditions requises plates de plan de données et de contrôle. La mémoire est exigée pour les informations telles que des tables de routage, des tables ARP, et d'autres structures de données. Quand les périphériques manqués de mémoire, quelques exécutions sur le périphérique peuvent échouer. L'exécution a pu affecter des procédés plats de contrôle ou des processus de plan de données, selon la situation. Si les procédés plats de contrôle échouent, le tout le réseau peut dégrader. Par exemple, ceci peut se produire quand la mémoire supplémentaire est exigée pour la convergence de routage.

Tailles d'interface et de canal

Les tailles d'interface et de canal se rapportent à la quantité de données qui peuvent être envoyées simultanément sur n'importe quelle une connexion. Ceci souvent désigné inexactement sous le nom de la vitesse d'une connexion, mais les données vraiment ne voyagent pas aux vitesses différentes d'un périphérique à l'autre. La vitesse de silicium et l'aide de capacité matérielle déterminent la bande passante disponible basée sur les medias. En outre, les mécanismes logiciels mettent en boîte des données de « commande de puissance » pour se conformer aux allocations spécifiques de bande passante pour un service. Vous voit typiquement ceci dans les réseaux du fournisseur de service pour le Relais de trames ou les atmosphères qui ont en soi des capacités de vitesse de 1.54kpbs à 155mbs et plus élevé. Quand il y a des limites de bande passante, des données sont alignées dans une file d'attente de transmission. Une file d'attente de transmission peut avoir différents mécanismes logiciels pour donner la priorité à des données dans la file d'attente ; cependant, quand il y a des données dans la file d'attente, il doit attendre des données existantes avant qu'il puisse expédier aux données l'interface.

Mise en file d'attente, latence, et jitter

La Mise en file d'attente, latence, et se trémoussent également représentation d'affect. Vous pouvez accorder la file d'attente de transmission pour affecter la représentation dans différentes manières. Par exemple, si la file d'attente est grande, puis les données attendent plus long. Quand les files d'attente sont petites, des données sont abandonnées. Ceci s'appelle le taildrop et est acceptable pour des applications TCP puisque les données seront retransmises. Cependant, la Voix et le vidéo ne se comportent pas bien avec la baisse de file d'attente ou même la latence significative de file d'attente exigeant la particulière attention à la bande passante ou sifflent des tailles. Le retard de file d'attente peut également se produire avec des files d'attente d'entrée si le périphérique n'a pas les ressources suffisantes pour expédier immédiatement le paquet. Ceci peut être dû à la CPU, à la mémoire, ou aux mémoires tampons.

La latence décrit le temps de traitement normal du temps où elle est reçue jusqu'à ce que le temps le paquet est expédié. Les commutateurs et les Routeurs de données modernes normaux ont extrêmement - le bas dans des conditions normales de latence (< 1ms) sans contraintes de ressource. Les périphériques modernes avec des processeurs de signaux numériques à convertir et des paquets vocaux analogiques de compresse peuvent prendre plus long, même jusqu'à 20ms.

Le jitter décrit l'intervalle de paquet pour des applications de diffusion, y compris la Voix et le vidéo. Si les paquets arrivent aux heures différentes avec la synchronisation différente d'intervalle de paquet, alors le jitter est élevé et la Qualité vocale dégrade. Le jitter est principalement un facteur du retard de mise en file d'attente.

Vitesse et distance

La vitesse et la distance est également un facteur dans les performances du réseau. Les réseaux de données ont une vitesse cohérente d'expédition de données basée sur la vitesse de la lumière. C'est approximativement 100 milles par milliseconde. Si une organisation exécute une application de client-serveur internationalement, alors ils peuvent s'attendre à un retard correspondant de transfert de paquet. La vitesse et la distance peuvent être un facteur énorme dans la performance des applications quand des applications ne sont pas optimisées pour des performances du réseau.

Caractéristiques de l'application

Les caractéristiques de l'application est la dernière zone qui affecte la capacité et la représentation. Les questions telles que de petites tailles de la fenêtre, Keepalives d'application, et la quantité de données transmises au-dessus du réseau contre ce qui est exigé peuvent affecter la représentation d'une application dans beaucoup d'environnements, particulièrement des WAN.

Pratiques recommandées de capacité et de Gestion des performances

Cette section discute les cinq pratiques recommandées principales de capacité et de Gestion des performances en détail :

Gestion des niveaux de service

La Gestion de niveau de service définit et règle d'autres processus exigés de capacité et de Gestion des performances. Les gestionnaires de réseau comprennent qu'ils ont besoin de planification de capacité, mais ils font face à économiser et à fournir les contraintes de personnel qui empêchent une solution complète. La Gestion de niveau de service est une méthodologie éprouvée que les aides avec des questions de ressource en définissant une responsabilité en deux étapes livrable et créante pour un service ont serrée à ce livrable. Vous pouvez accomplir ceci de deux manières :

  • Créez un accord de niveau de service entre les utilisateurs et l'organisme de réseau pour un service qui inclut la capacité et la Gestion des performances. Le service inclurait des états et des recommandations de mettre à jour la qualité de service. Cependant, les utilisateurs doivent être disposés à financer le service et toutes les mises à jour priées.

  • L'organisme de réseau définit leur service de capacité et de Gestion des performances et puis tente le financement pour ce service et l'améliore au cas par cas.

Quoi qu'il arrive, l'organisme de réseau devrait commencer par définir un service de planification de capacité et de Gestion des performances qui inclut quels aspects du service ils peuvent actuellement fournir et ce qui est prévu à l'avenir. Un service complet inclurait ce qui-si l'analyse pour le réseau change et les modifications d'application, l'établissement des références et tendre pour les variables définies de représentation, la gestion d'exception pour la capacité définie et les variables de représentation, et la gestion QoS.

Réseau et application Ce qui-si analyse

Exécutez un réseau et une application ce qui-si analyse pour déterminer les résultats d'une modification prévue. Sans ce qui-si l'analyse, des organismes prennent des risques significatifs pour changer le succès et la Disponibilité globale de réseau. Dans de nombreux cas, les modifications de réseau ont eu comme conséquence l'effondrement congestif entraînant beaucoup d'heures de temps d'arrêt de production. En outre, une quantité surprenante de mises en place d'application échouent et entraînent l'incidence à d'autres utilisateurs et applications. Ces pannes continuent dans beaucoup d'organismes de réseau, pourtant elles sont complètement évitables avec quelques outils et quelques étapes supplémentaires de planification.

Vous avez besoin normalement de quelques nouveaux processus pour exécuter une qualité ce qui-si analyse. La première étape est d'identifier des niveaux de risque pour toutes les modifications et d'exiger un plus en profondeur ce qui-si l'analyse pour un plus gros risque change. Le niveau de risque peut être un champ requis pour tous les envois de modification. Les modifications de niveau de plus gros risque exigeraient alors défini ce qui-si analyse de la modification. Un réseau ce qui-si l'analyse détermine l'affect du réseau change sur des questions de ressource du plan de contrôle en usage du réseau et en réseau. Une application ce qui-si l'analyse déterminerait le succès de l'application de projet, les bandes passantes nécessaires, et toutes les questions de ressources de réseau. Les tableaux suivants sont des exemples des conditions de test requises de transfert et de correspondance de niveau de risque :

Niveau de risque Définition Recommandations de planification de modification
1
  • Effet potentiel élevé au grand nombre d'utilisateurs (500+) ou de service capital pour l'entreprise dû au produit nouveau, au logiciel, à la topologie, ou à l'introduction de caractéristique.
  • La modification implique le temps d'arrêt prévu de réseau.
  • Validez le laboratoire de la nouvelle solution. La validation de laboratoire inclut le test et la validation documentés de solution et ce qui-s'incidence d'apparence d'analyse à l'infrastructure existante. Nous recommandons des solutions pilotes. Les nouvelles solutions exigent la fin d'un document de support d'exécutions.
  • Exécutez l'étude de conception NSA de Cisco.
  • Créez le plan de repli.
  • Créez le plan d'implémentation.
  • Créez le processus de modification.
2
  • Effet potentiel élevé au grand nombre d'utilisateurs (500+) ou service capital pour l'entreprise dû à une grande augmentation du trafic ou utilisateurs, changements principaux, ou modifications de routage.
  • La modification peut avoir besoin d'un certain temps d'arrêt.
  • Exécutez ce qui-si analyse pour déterminer l'incidence à l'environnement existant (devrait être fait dans l'environnement de travaux pratiques).
  • Le routage de test et d'examen change pour la fonctionnalité.
  • Créez le plan de repli.
  • Exécutez l'étude de conception pour le principal routage ou les changements principaux.
  • Créez le plan d'implémentation.
  • Créez le processus de modification.
3
  • Impact potentiel moyen à un plus petit nombre d'utilisateurs ou à un service aux entreprises dû à toute modification non standard.
  • Inclut le produit nouveau, le logiciel, la topologie, l'ajout des caractéristiques ou des nouveaux utilisateurs, l'augmentation du trafic, ou la topologie non standard.
  • La modification peut avoir besoin d'un certain temps d'arrêt.
  • Exécutez l'analyse d'ingénierie de la nouvelle solution (peut exiger la validation de laboratoire).
  • Créez le plan d'implémentation.
  • Créez le processus de modification.
4
  • Service ou impact pour l'utilisateur potentiel inférieur.
  • Includes ajoutant de nouveaux modèles standards de module réseau, tels que le bâtiment ou les commutateurs du serveur/Concentrateurs sur des Routeurs.
  • Includes évoquant de nouveaux sites du WAN ou services d'accès prouvés supplémentaires.
  • Tous les changements du niveau 3 de risque ont été techniquement prouvés de l'environnement de production.
  • La modification peut avoir besoin d'un certain temps d'arrêt.
  • Créez le plan d'implémentation.
  • Créez le processus de modification.
5
  • Aucune incidence d'utilisateur ou de service.
  • Includes ajoutant des utilisateurs individuels au réseau et des modifications de configuration standard telles que le mot de passe, la bannière, le SNMP, ou d'autres paramètres de configuration standard.
  • Aucun temps d'arrêt.
  • Facultatif de processus de modification.

Une fois que vous définissez où vous avez besoin de ce qui-si l'analyse, vous peut définir le service.

Vous pouvez exécuter un réseau ce qui-si analyse avec des outils de modélisation ou avec un laboratoire qui imite l'environnement de production. Des outils de modélisation sont limités par à quel point l'application comprend les questions de ressource du périphérique et puisque la plupart des modifications de réseau sont de nouveaux périphériques, l'application peut ne pas comprendre l'effet de la modification. La meilleure méthode est d'établir une certaine représentation du réseau de production dans un laboratoire et de tester le logiciel, la caractéristique, le matériel, ou la configuration désiré sous le chargement à l'aide des générateurs du trafic. La fuite des artères (ou toute autre information de contrôle) du réseau de production dans le laboratoire améliore également l'environnement de travaux pratiques. Testez les conditions requises de ressource supplémentaire avec différents types de trafic, y compris le SNMP, l'émission, la Multidiffusion, chiffrée, ou le trafic compressé. Avec toutes ces différentes méthodologies, analysez les conditions requises de ressource du périphérique pendant des situations potentielles d'effort telles que la convergence de routes, le lien instable de lien, et les reprises de périphérique. Les problèmes d'utilisation des ressources incluent des zones normales de ressources en capacité telles que la CPU, la mémoire, l'utilisation du fond de panier, les mémoires tampons, et la Mise en file d'attente.

Les nouvelles applications devraient également exécuter ce qui-si analyse pour déterminer le succès de l'application et les bandes passantes nécessaires. Vous exécutez normalement cette analyse dans un environnement de travaux pratiques utilisant un analyseur de protocole et un simulateur BLÊME de retard pour comprendre l'effet de la distance. Vous avez besoin seulement d'un PC, d'un hub, d'un périphérique BLÊME de retard, et d'un routeur de laboratoire connecté dans le réseau de production. Vous pouvez simuler la bande passante dans le laboratoire en étranglant le trafic utilisant le Formatage du trafic générique ou la limitation de débit sur le routeur de test. L'administrateur réseau peut travailler en même temps que le groupe d'applications pour comprendre des bandes passantes nécessaires, des questions de fenêtrage, et des problèmes de performance potentiels pour l'application dans les deux environnements de LAN et WAN.

Exécutez une application ce qui-si analyse avant de déployer n'importe quelle application métier. Si vous ne faites pas ceci, le groupe d'applications blâme le réseau du mauvais fonctionnement. Si vous pouvez d'une certaine manière avoir besoin d'une application ce qui-si l'analyse pour de nouveaux déploiements par l'intermédiaire du processus de gestion du changement, vous peut aider à empêcher des déploiements infructueux et à comprendre mieux des augmentations soudaines de la consommation de bande passante pour le client-serveur et à traiter en lots des conditions requises.

Établissement des références et tendre

L'établissement des références et tendre permettent à des administrateurs réseau pour prévoir et à des mises à jour complètes de réseau avant qu'un problème de capacité pose le temps d'arrêt ou les problèmes de performances de réseau. Comparez l'utilisation de ressource au cours des délais prévus successifs ou distillez les informations vers le bas au fil du temps dans une base de données et permettez aux planificateurs pour visualiser des paramètres d'utilisation de ressource pendant l'heure, le jour, la semaine, le mois, et l'année dernière. Dans l'un ou l'autre de cas, quelqu'un doit examiner les informations sur une base hebdomadaire, bihebdomadaire, ou mensuelle. Le problème avec l'établissement des références et tendre est qu'il exige d'une quantité écrasante d'informations de passer en revue dans de grands réseaux.

Vous pouvez résoudre ce problème est plusieurs manières :

  • L'abondance de construction de la capacité et de la commutation dans l'environnement ainsi la capacité de RÉSEAU LOCAL est pas une question.

  • Divisez les informations de tendance en groupes et concentrez sur facilement disponible ou des zones critiques du réseau, telles que des sites WAN critiques ou des réseaux locaux de Data Center.

  • Signaler des mécanismes peut mettre en valeur les zones qui tombent au-dessus d'un certain seuil pour la particulière attention. Si vous implémentez la Disponibilité essentielle de zones d'abord, vous pouvez de manière significative réduire la quantité d'informations priée pour l'examen.

Avec toutes les méthodes précédentes, vous devez toujours examiner les informations sur une base périodique. L'établissement des références et tendre est un effort proactif et si l'organisation a seulement des ressources pour le support réactif, les personnes ne liront pas les états.

Beaucoup de solutions d'administration de réseaux fournissent les informations et des graphiques sur des variables de ressources en capacité. Malheureusement, la plupart des personnes utilisent seulement ces outils pour le support réactif à un problème existant ; ceci défait le but de l'établissement des références et de tendre. Deux outils qui sont efficaces en fournissant des informations de tendance de capacité pour des réseaux de Cisco sont le produit de Concord Network Health et les Produits Institut central des statistiques EnterprisePRO. Dans de nombreux cas, les organismes de réseau exécutent des langages de script simples pour collecter les informations de capacité. Sont ci-dessous quelques exemples d'état qui ont été collectés par l'intermédiaire du script pour l'utilisation de lien, l'utilisation du processeur, et la représentation de ping. D'autres variables de ressource il peut être importantes tendre qu'incluent la mémoire, la profondeur de la file d'attente, le volume de diffusion, la mémoire tampon, la notification d'encombrement de Relais de trames, et l'utilisation du fond de panier. Référez-vous ces à la table pour les informations sur l'utilisation et l'utilisation du processeur de lien :

Utilisation de lien

Ressource Adresse Segment Utilisation moyenne (%) Utilisation maximale (%)
JTKR01S2 10.2.6.1 128 Kbps 66.3 97.6
JYKR01S0 10.2.6.2 128 Kbps 66.3 97.8
FMCR18S4/4 10.2.5.1 384 Kbps 51.3 109.7
PACR01S3/1 10.2.5.2 384 Kbps 51.1 98.4

Utilisation du processeur

Ressource Adresse de sondage Utilisation moyenne (%) Utilisation maximale (%)
FSTR01 10.28.142.1 60.4 80
NERT06 10.170.2.1 47 86
NORR01 10.73.200.1 47 99
RTCR01 10.49.136.1 42 98

Utilisation de lien

Ressource Adresse AvResT (ms) 09-09-98 AvResT (ms) 09-09-98 AvResT (ms) 09-09-98 AvResT (ms) 10-01-98
AADR01 10.190.56.1 469.1 852.4 461.1 873.2
ABNR01 10.190.52.1 486.1 869.2 489.5 880.2
APRR01 10.190.54.1 490.7 883.4 485.2 892.5
ASAR01 10.196.170.1 619.6 912.3 613.5 902.2
ASRR01 10.196.178.1 667.7 976.4 655.5 948.6
ASYR01S         503.4
AZWRT01 10.177.32.1 460.1   444.7  
BEJR01 10.195.18.1 1023.7 1064.6 1184 1021.9

Gestion d'exception

La gestion d'exception est une importante méthodologie pour identifier et résoudre la capacité et les problèmes de performance. L'idée est de recevoir la notification des violations de seuil de capacité et de représentation afin d'immédiatement étudier et réparer le problème. Par exemple, un administrateur réseau pourrait recevoir une alarme pour la CPU de haute sur un routeur. L'administrateur réseau peut se connecter dans le routeur pour déterminer pourquoi la CPU est si élevée. Elle peut alors exécuter une certaine configuration réparatrice qui réduit la CPU ou crée une liste d'accès empêchant le trafic qui pose le problème, particulièrement si le trafic ne semble pas être critique.

Vous pouvez configurer la gestion d'exception pour plus de problèmes capitaux assez simplement utilisant des commandes de configuration de RMON sur un routeur ou à l'aide des outils plus avancés tels que le gestionnaire de niveau de service de Netsys en même temps que des données SNMP, de RMON ou de NetFlow. La plupart des outils de gestion de réseau ont la capacité pour placer des seuils et des alarmes sur des violations. L'important aspect du procédé de gestion d'exception est de donner notification de temps quasi-réel de la question. Autrement, le problème peut disparaître avant n'importe qui a noté que la notification a été reçue. Ceci peut être fait dans un centre d'exploitation du réseau si l'organisation a à surveillance cohérente. Autrement, nous recommandons la notification de pagineur.

L'exemple suivant de configuration donne notification de montée et de seuil de chute pour la CPU de routeur à un fichier journal qui peut être examiné sur une base cohérente. Vous pouvez installer les commandes semblables de RMON pour des violations essentielles de seuil d'utilisation de lien ou d'autres seuils SNMP.

rmon event 1 trap CPUtrap description
  "CPU Util >75%"rmon event 2 trap CPUtrap description
  "CPU Util <75%"rmon event 3 trap CPUtrap description
  "CPU Util >90%"rmon event 4 trap CPUtrap description
  "CPU Util <90%"rmon alarm 75 lsystem.56.0 10 absolute rising-threshold
  75 1 falling-threshold 75 2rmon alarm 90 lsystem.56.0 10 absolute rising-threshold
  90 3 falling-threshold 90 4

Gestion QoS

La Gestion de qualité de service implique de créer et surveiller les classes spécifiques du trafic dans le réseau. Un trafic fournit plus de performances cohérentes pour les groupes d'applications spécifiques (définis dans des classes du trafic). Les paramètres de formatage du trafic fournissent la flexibilité significative dans la hiérarchisation et la mise en forme du trafic pour les classes du trafic spécifiques. Ces caractéristiques incluent des capacités telles que le Fonction Committed Access Rate (CAR), le Détection précoce directe pondérée (WRED), et la Mise en file d'attente pesée par foire basée par classe. Des classes du trafic sont normalement créées basées sur les performances SLA pour plus d'applications stratégiques d'affaires et de conditions requises d'application spécifiques telles que la Voix. Le trafic non critique ou non ouvrable serait également contrôlé d'une manière qu'il ne peut pas affecter des applications plus prioritaires et des services.

La création des classes du trafic exige une compréhension de spécification de base d'usage du réseau, de conditions requises d'application spécifiques, et de priorités d'application métier. Les conditions requises d'application incluent la connaissance des longueurs de paquet, des questions de minuterie, des conditions requises de jitter, des conditions requises de rafale, des conditions requises en lots, et des questions de performance globale. Avec cette connaissance, les administrateurs réseau peuvent créer les plans et les configurations de mise en forme du trafic qui fournissent une performance des applications plus cohérente à travers un grand choix de topologies LAN/WAN.

Par exemple, une organisation a une connexion atmosphère 10-megabit entre deux sites importants. Le lien devient parfois congestionné de grands transferts de fichiers, qui entraîne la dégradation de représentation pour le traitement de transaction en ligne et la Qualité vocale pauvre ou inutilisable.

L'organisation a installé quatre classes différentes du trafic. La Voix a été accordée le plus prioritaire et laissée mettre à jour cette priorité même si elle a éclaté au-dessus du débit prévu de volume de trafic. La classe d'application stratégique a été accordée le prochain plus prioritaire mais elle n'a pas été permise d'éclater au-dessus de la taille totale de lien moins les bandes passantes nécessaires prévues de Voix. Quand il éclate, il sera relâché. Le trafic de transfert de fichiers a été simplement accordé une priorité plus basse et tout l'autre le trafic s'est adapté vers le milieu.

L'organisation maintenant doit exécuter la gestion QoS sur ce lien pour déterminer combien de trafic chaque classe prend et pour mesurer la représentation dans chaque classe. Si l'organisation ne fait pas ceci, la famine peut se produire pour quelques classes ou la représentation SLA ne peut être rencontrée dans une classe particulière.

Gérer des configurations QoS est toujours une tâche difficile en raison du manque d'outils. Une méthode est d'utiliser le Gestionnaire de performances de l'Internet de Cisco (IPM) pour envoyer le trafic différent à travers le lien qui tombe dans chacune des classes du trafic. Vous pourriez surveillez alors la représentation pour chaque classe et l'IPM fournit tendre, analyse en temps réel, et analyse de saut par saut pour indiquer exactement des zones problématiques. D'autres peuvent encore se fonder sur une méthode plus manuelle comme étudier la Mise en file d'attente et les paquets relâchés dans chaque classe du trafic basée sur la statistique d'interface. Dans quelques organismes, ces données peuvent être collectées par l'intermédiaire du SNMP ou être analysées dans une base de données pour des spécifications de base et tendre. Quelques outils existent également sur le marché qui envoient les types de trafic spécifiques à travers le réseau pour déterminer la représentation pour un service particulier ou une application.

Collectant et signalant les informations de capacité

Collecter et signaler les informations de capacité devraient être liés aux trois domaines recommandés de la Gestion de capacité :

  • Ce qui-si analyse, qui se concentre sur la modification de réseau et comment la modification affecte l'environnement

  • Établissement des références et tendre

  • Gestion d'exception

Dans chacune de ces zones, développez un plan de collecte d'informations. Dans le cas du réseau ou de l'application ce qui-si les analyses, vous ont besoin d'outils pour imiter l'environnement de réseau et pour comprendre l'affect de à questions potentielles relatives de ressource en modification dans l'avion de contrôle des périphériques ou le plan de données. Dans le cas de l'établissement des références et de tendre, vous avez besoin d'instantanés pour des périphériques et de liens affichant l'utilisation en cours de ressource. Vous examinez alors les données au fil du temps pour comprendre des conditions requises potentielles de mise à jour. Ceci permet à des administrateurs réseau pour prévoir correctement des mises à jour avant que la capacité ou les problèmes de performances surgissent. Quand les problèmes surgissent, vous avez besoin de gestion d'exception pour alerter les administrateurs réseau ainsi ils peuvent accorder le réseau ou réparer le problème.

Ce processus peut être divisé en étapes suivantes :

  1. Déterminez vos besoins.

  2. Définissez un processus.

  3. Définissez les zones de capacité.

  4. Définissez les variables Capacité.

  5. Interprétez les données.

Déterminez vos besoins

Développer un plan de capacité et de Gestion des performances exige comprendre les informations que vous avez besoin et le but de ces informations. Coupez le plan en trois zones requises : un pour ce qui-si analyse, établissement des références/tendre, et gestion d'exception. Dans chacune de ces zones, découvrez quels ressources et outils sont disponibles et ce qui est nécessaire. Beaucoup l'échouer d'organisation avec des déploiements d'outil parce qu'ils considèrent la technologie et les caractéristiques des outils mais ne considèrent pas les personnes et l'expertise requises pour gérer les outils. Incluez les personnes et l'expertise dans votre plan, aussi bien que les améliorations du processus requises. Ces personnes peuvent inclure des administrateurs système pour parvenir les stations de Gestion de réseau, des gestionnaires de base de données pour aider avec l'administration de base de données, les administrateurs qualifiés à utiliser-et surveillent les outils, et les administrateurs réseau de plus haut niveau pour déterminer des stratégies, des seuils, et des conditions requises de collecte d'informations.

Définissez un processus

Vous avez besoin également d'un processus pour s'assurer que l'outil est utilisé avec succès et uniformément. Vous pouvez exiger des améliorations du processus pour définir quels administrateurs réseau devraient faire quand les violations de seuil se produisent ou quels processus à suivre pour l'établissement des références, tendant, et améliorant le réseau. Une fois que vous déterminez les conditions requises et les ressources pour la planification de capacité réussie, vous pouvez considérer la méthodologie. Beaucoup d'organismes choisissent d'externaliser ce type de fonctionnalité à une organization de services réseau telle que l'Institut central des statistiques ou d'établir l'expertise intérieurement parce qu'ils considèrent le service une principale compétence.

Définissez les régions de capacité

Le plan pour la planification de capacité devrait également inclure une définition des zones de capacité. Ce sont des zones du réseau qui peut partager une stratégie commune de planification de capacité : par exemple, le RÉSEAU LOCAL entreprise, les bureaux sur site BLÊMES, les sites WAN critiques, et l'accès par appel téléphonique. Définir différentes zones est utile pour plusieurs raisons :

  • Les différentes zones peuvent avoir différents seuils. Par exemple, la bande passante de RÉSEAU LOCAL est beaucoup meilleur marché que la bande passante BLÊME ainsi les seuils d'utilisation devraient être inférieurs.

  • Les différentes zones peuvent exiger surveiller différentes variables MIB. Par exemple, les compteurs FECN et BECN dans le Relais de trames sont essentiels dans des problèmes de compréhension de capacité de Relais de trames.

  • Il peut être plus difficile ou coûteux en temps pour améliorer quelques zones du réseau. Par exemple, les circuits internationaux peuvent avoir des délais d'exécution beaucoup plus longs et avoir besoin d'un niveau supérieur correspondant de la planification.

Définissez les variables Capacité

Le prochain domaine important définit les variables pour surveiller et les valeurs seuil qui exigent l'action. Définir les variables Capacité dépend de manière significative des périphériques et des medias utilisés dans le réseau. En général les paramètres tels que l'utilisation CPU, de mémoire et de lien sont valeur. Cependant, d'autres zones peuvent être importantes pour des Technologies ou des conditions requises spécifiques. Ceux-ci peuvent inclure des profondeurs de la file d'attente, la représentation, la notification d'encombrement de Relais de trames, l'utilisation du fond de panier, l'utilisation de la mémoire tampon, des statistiques Netflow, le volume de diffusion, et des données de RMON. Maintenez dans l'esprit vos plans de long terme, mais le début avec seulement quelques zones clé à aider à assurer le succès.

Interprétez les données

La compréhension des données collectées est également principale à fournir un service de haute qualité. Par exemple, beaucoup d'organismes ne comprennent pas entièrement les niveaux maximaux et moyens d'utilisation. Le diagramme suivant affiche une crête de paramètre de capacité basée sur un intervalle de collecte minute SNMP 5, (affiché dans le vert).

http://www.cisco.com/c/dam/en/us/support/docs/availability/high-availability/20769-interpretdata.gif

Quoique la valeur signalée ait été moins que les crêtes de seuil (affiché en rouge) peuvent encore se produire dans l'intervalle de collecte qui sont au-dessus de la valeur seuil (affichée dans le bleu). C'est significatif parce que pendant l'intervalle de collecte, l'organisation peut éprouver les valeurs de crête qui affectent la représentation ou la capacité du réseau. Faites attention à sélectionner un intervalle de collecte signicatif qui est utile et qui n'entraîne pas le temps système excessif.

Un autre exemple est l'utilisation moyenne. Si les employés sont seulement dans le bureau de huit à cinq, mais l'utilisation moyenne est 7X24, les informations peuvent être fallacieuses.


Informations connexes


Document ID: 20769