Cisco Prime Collaboration Manager 1.2 ユーザ ガイド
障害管理について
障害管理について
発行日;2012/08/29 | 英語版ドキュメント(2012/08/17 版) | ドキュメントご利用ガイド | ダウンロード ; この章pdf , ドキュメント全体pdf (PDF - 3MB) | フィードバック

目次

障害管理について

障害管理について

Cisco Prime Collaboration Manager は、ほぼリアルタイムで、迅速かつ正確な障害検出を実現します。Prime CM は、イベントの特定後に、関連するイベントをグループ化し、障害分析を実行してビデオ コラボレーション ネットワークで障害の根本原因を判別します。

Prime CM では、個々のユーザにとって重要なイベントをモニタできます。また、イベントの重大度をカスタマイズできるほか、その重大度に基づいて Prime CM から通知を受け取るようにすることもできます。

Prime CM でモニタの対象となるのは、エンドポイントおよびサービス インフラストラクチャ デバイス(CTS-Manager、Cisco VCS など)で発生したイベントのみです。ネットワーク デバイスによりトリガーされたイベントはモニタさません。

図 18-1 に、Prime CM 障害管理のフロー図を示します。

図 18-1 Prime CM での障害管理

 

イベント

イベントは、特定の時点で発生する別個の問題です。イベントの例には次のものがあります。

ポート ステータスの変更。

ピア ルータでのルーティング プロトコル プロセス間の接続損失(たとえば、BGP ネイバー損失)。

デバイスのリセット。

デバイスが管理ステーションから到達不能になる。

各イベントは次のいずれかに該当します。

ネットワークにおけるエラー、故障、異常事態など何らかの障害に伴うもの。たとえば、デバイスが到達不能になると、到達不能イベントがトリガーされます。

障害の解消に伴うもの。たとえば、デバイスの状態が到達不能から到達可能に変更されると、到達可能イベントがトリガーされます。

アラーム

アラームは、障害のライフ サイクルを表したものです。アラームには、ポートの停止やポートの起動など、一連の関連するイベントという特徴があります(図 18-2 を参照)。

図 18-2 アラームの順序

 

上の図では、イベントの順序の一部として、イベント A の後にイベント B が発生します。イベントの順序では、重大度が最も高いイベントが、アラームの重大度を決定します。

イベントの作成

Prime CM ではイベント カタログが保持されており、イベントを作成する方法やタイミングのほか、アラームをイベントに関連付けるかどうかが決定されます。複数のイベントを同じアラームに関連付けることができます。

Prime CM は、次の方法でイベントを検出します。

通知イベント(たとえば、Syslog やトラップ)を受信して、分析します。

デバイスを自動的にポーリングして変更を検出します(たとえば、到達不能なデバイス)。

アラームのステータスが変更されると(たとえば、ユーザがアラームを認知するかクリアすると)、イベントを受信します。

Prime CM では、それぞれのユーザにとって重要ではないイベントのモニタリングをディセーブルにできます。モニタリングがディセーブルになったイベントは [Event Browser] のリストに表示されないうえ、Prime CM でもそれに関連付けられたアラームがトリガーされません。

着信イベント通知は、事前に定義されたパターンとイベント データとを照合することにより識別されます。一致するパターンがあり、かつ正しく識別できるイベントは、Prime CM でサポートされていると見なされます。イベント データが事前定義済みのパターンと一致しない場合は、イベントはサポートされないと見なされ、ドロップされます。

エンドポイントおよびインフラストラクチャ デバイスに対して特定のイベントのモニタリングをディセーブルにすると、Prime CM では、着信イベントとディセーブルになったイベントとの照合が行われます。これらのイベントは、Prime CM のデータベースには保持されません。

障害は、ポーリング、トラップ、または Syslog メッセージによって Prime CM に通知されることがあります。Prime CM では、すべての障害のコンテキストが保持される一方、重複するイベントやアラームが Prime CM のデータベースに保持されないような処理が行われます。

 

時刻
イベント
Prime CM の動作

10:00AM PDT June 7, 2010

デバイス A が到達不能になった。

デバイス A で新しい到達不能イベントを作成します。

10:30AM PDT June 7, 2010

デバイス A は引き続き到達不能状態。

イベント ステータスに変更はありません。

10:45AM PDT June 7, 2010

デバイス A が到達可能になった。

デバイス A で新しい到達可能イベントを作成します。

11:00AM PDT June 7, 2010

デバイス A は到達可能なまま。

イベント ステータスに変更はありません。

12:00AM PDT June 7, 2010

デバイス A が到達不能になった。

デバイス A で新しい到達不能イベントを作成します。

アラーム作成

アラームは、ネットワークにおける障害のライフ サイクルを表します。これは、障害の根本原因を定義します。複数のイベントを単一のアラームに関連付けることができます。

アラームは、次の順序で作成されます。

1. ネットワークで障害が発生すると、通知がトリガーされます。

2. この通知に基づいてイベントが作成されます。

3. このイベントに対応するアクティブなアラームがないかどうかを確認した後で、アラームが作成されます。

アラームは、次の 2 つのタイプのイベントに関連付けられます。

アクティブ イベント:クリアされていないイベント。アラームは、ネットワークで障害が解決されるまでこの状態のままです。

履歴イベント:クリアされたイベント。障害が解消した時点で、イベントの状態は履歴イベントに変更されます。アラームのクリア方法については、「アラームのステータス」を参照してください。

アラームのクリア後は、アラームのライフ サイクルの終了を示します。クリアされたアラームは、プリセット期間内に同じ障害が再発生した場合に復活されることがあります。プリセット期間は、Prime CM で 5 分に設定されます。

イベントとアラームの関連付け

Prime CM は、イベントとアラームのカタログを維持します。カタログには、Prime CM によって管理されるイベントのリスト、およびイベントとアラーム間の関係が含まれています。さまざまなタイプのイベントを同じアラーム タイプに結び付けることができます。

通知の受信時には、次のことが行われます。

1. Prime CM は、着信通知をイベントとアラーム カタログと突き合わせて比較します。

2. Prime CM は、イベントを出す必要があるかどうかを決定します。

3. イベントを出す場合、Prime CM では、そのイベントにより新しいアラームをトリガーするか、そのイベントを既存のアラームに関連付けるかが決定されます。

トリガーされる新しいイベントのタイプが同じで、同じソースで発生する場合、新しいイベントは既存のアラームに関連付けられます。

たとえば、アクティブなインターフェイス エラー アラームです。同じインターフェイスで発生するインターフェイス エラー イベントは、すべて同じアラームに関連付けられます。

アラームのステータス

次に、アラームでサポートされるステータスを示します。

[Not Acknowledged]:イベンによりが新しいアラームがトリガーされるか、イベントが既存のアラームに関連付けられる場合。

[Acknowledged]:アラームを確認すると、そのステータスは [Not Acknowledged] から [Acknowledged] に変更されます。

[Cleared]:アラームのステータスには次のものがあります。

[Auto-clear from the device]:障害がデバイスで解決され、同じデバイスでイベントがトリガーされます。たとえば、デバイス到達可能イベントは、デバイス到達不能イベントをクリアします。次に、これによって、デバイス到達不能アラームがクリアされます。

またセッション中に、パケット損失、ジッター、および遅延に伴ってアラームがトリガーされます。これらのアラームは、セッション終了後、自動的にクリアされます。

[Manual-clear from Prime CM users]:ネットワークで障害を解決せずに、アクティブ アラームを手動でクリアできます。クリア イベントがトリガーされ、このイベントによってアラームがクリアされます。

引き続きネットワークに障害がある場合は、ポーリングに基づいて新しいイベントとアラームがさらに作成されます。

[Auto-clear from the Prime CM server]:セッションが終了すると、Prime CM はセッション関連のアラームをすべてクリアします。

24 時間アクティブ アラームに対する更新がない場合、Prime CM はアラームを自動的にクリアします。

イベントとアラームの重大度

各イベントには重大度が割り当てられています。イベントは、次の重大度カテゴリに大きく分類され、Prime CM ではそれぞれに色が関連付けられています。

フラグ付き:障害を示します。重大(赤)、やや重大(オレンジ)、比較的重大ではない(黄色)、または警告(空色)。

情報:情報(青)。一部の情報イベントは、フラグ付きイベントをクリアします。

たとえば、「リンク停止」イベントには重大度として「重大」が割り当てられる場合があるのに対し、それに対応する「リンク起動」イベントの重大度は「情報」になります。

イベントの順序では、重大度が最も高いイベントが、アラームの重大度を決定します。

Prime CM では、イベントの設定と重大度をカスタマイズできます。各ユーザにとって重要なイベントには、それぞれより高い重大度を割り当てることができます。イベントの設定と重大度をカスタマイズする方法については、「イベント管理のカスタマイズ」を参照してください。

イベントの設定と重大度がカスタマイズされていない場合は、Prime CM アプリケーションが事前に定義しているイベントの設定と重大度が使用されます。

維持されるイベントとアラーム

アクティブとクリア済みを含むすべてのイベントとアラームが、Prime CM データベースに維持されます。

イベント間の関係は保存されます。データベースの内容は、[Alarm and Event Browser] ページを使用して確認できます。


) イベントは、Prime CM イベント オブジェクトの形式で保存されます。着信イベント通知(トラップまたは Syslog)の元の通知構造は維持されません。


Prime CM の削除ポリシーについて理解するには、「バックアップと復元の実行」を参照してください。

アラーム通知

Prime CM では、重大、やや重大、比較的重大ではないアラームの通知を受信するよう購読できます。通知の詳しい設定方法については、「通知の設定」を参照してください。