グローバル障害ポリシー
グローバル障害ポリシーは、障害がクリアされた日時、フラッピング間隔(障害発生とクリア状態の間の時間)、および保持間隔(システムで障害が発生していた時間)など、Cisco UCS ドメイン 内の障害のライフサイクルを制御します。
Cisco UCS の障害には次のライフサイクルがあります。
-
ある状況がシステムで発生し、Cisco UCS Manager で障害が発生します。これはアクティブな状態です。
-
障害が軽減されると、フラッピングまたはフラッピングを防ぐことを目的としたソーキング間隔になります。障害が発生し、すぐに何度かクリアされると、フラッピングが発生します。フラッピング間隔の間、グローバル障害ポリシーに指定されている期間は、障害の重要度が保持されます。
-
フラッピング間隔中に同じ条件が再発生した場合は、障害がアクティブ状態に戻ります。フラッピング間隔中に同じ条件が再発生しない場合は、障害がクリアされます。
-
クリアされた障害は保持期間になります。この期間があるため、障害が発生した状態が改善され、さらに障害が早々に削除されていない場合でも管理者が障害に気付くことができます。保持期間のうち、グローバル障害ポリシーに指定された期間はクリアされた障害が保持されます。
-
この状況が保持間隔中に再発生する場合は、障害がアクティブ状態に戻ります。この状況が再発生しない場合は、障害が削除されます。
障害収集ポリシーの設定
手順
コマンドまたはアクション | 目的 | |
---|---|---|
ステップ 1 |
UCS-A# scope monitoring |
モニタリング モードを開始します。 |
ステップ 2 |
UCS-A /monitoring # scope fault policy |
モニタリング障害ポリシー モードを開始します。 |
ステップ 3 |
UCS-A /monitoring/fault-policy # set clear-action {delete | retain } |
クリアしたすべてのメッセージを保持するか、削除するかを指定します。 retain オプションが指定された場合、メッセージを保持する時間の長さは、 set retention-interval コマンドによって決まります。 |
ステップ 4 |
UCS-A /monitoring/fault-policy # set flap-interval seconds |
障害状態を変更する前にシステムが待機する間隔を指定します(秒単位)。障害が発生し、すぐに何度かクリアされると、フラッピングが発生します。これを回避するために、最後の状態変更後からフラッピング間隔が経過するまで、システムは障害の状態の変更を許可しません。フラッピング間隔中に障害が再発生した場合は、障害がアクティブ状態に戻ります。それ以外の場合は、障害がクリアされます。 |
ステップ 5 |
UCS-A /monitoring/fault-policy # set retention-interval {days hours minutes seconds | forever } |
システムが、削除する前にクリアしたすべての障害メッセージを保持する時間間隔を指定します。システムは、クリアされた障害メッセージを永続的に保持することも、指定された日数、時間数、分数、秒数保持することもできます。 |
ステップ 6 |
UCS-A /monitoring/fault-policy # commit-buffer |
トランザクションをコミットします。 |
例
この例では、クリアされた障害メッセージを 30 日間保持するよう障害収集ポリシーを設定し、フラッピング間隔を 10 秒に設定し、トランザクションをコミットします。
UCS-A# scope monitoring
UCS-A /monitoring # scope fault policy
UCS-A /monitoring/fault-policy # set clear-action retain
UCS-A /monitoring/fault-policy* # set flap-interval 10
UCS-A /monitoring/fault-policy* # set retention-interval 30 0 0 0
UCS-A /monitoring/fault-policy* # commit-buffer
UCS-A /monitoring/fault-policy #