Cisco Unified Communications Manager Release 10.5(1) での IM and Presence Service の設定と管理
ハイ アベイラビリティのトラブルシューティング
ハイ アベイラビリティのトラブルシューティング

ハイ アベイラビリティのトラブルシューティング

プレゼンスの冗長グループ ノード ステータスの表示

Cisco Unified CM Administration ユーザ インターフェイスを使用して、プレゼンス冗長グループのメンバーである IM and Presence Service ノードのステータスを表示します。

手順
    ステップ 1   [System(システム)] > [Presence Redundancy Groups(プレゼンス冗長グループ)] を選択します。

    [Find and List Presence Redundancy Groups(プレゼンス冗長グループの検索と一覧表示)] ウィンドウが表示されます。

    ステップ 2   プレゼンス冗長グループの検索パラメータを選択し、[Find(検索)] をクリックします。

    一致するレコードが表示されます。

    ステップ 3   検索結果に一覧表示されているプレゼンス冗長グループを選択します。

    [Presence Redundancy Group Configuration(プレゼンス冗長グループの設定)] ウィンドウが表示されます。 2 個のノードがそのグループに設定されおり、ハイ アベイラビリティが有効になっている場合は、そのグループ内のノードの状態が [High Availability(ハイ アベイラビリティ)] 領域に表示されます。


    ノード状態の定義

    表 1 プレゼンス冗長グループのノード状態の定義

    状態

    説明

    初期化中(Initializing)

    これは Cisco Server Recovery Manager サービスが起動したときの初期(遷移)状態で、一時的な状態です。

    アイドル(Idle)

    フェールオーバーが発生し、サービスが停止されると、IM and Presence Service はアイドル状態になります。 アイドル状態では、IM and Presence Service ノードはアベイラビリティまたはインスタント メッセージング サービスを提供しません。 アイドル状態では、Cisco Unified CM Administration のユーザ インターフェイスを使用して、このノードへのフォールバックを手動で開始できます。

    標準(Normal)

    これは安定したステートです。 IM and Presence Service ノードが正常に動作しています。 この状態では、Cisco Unified CM Administration のユーザ インターフェイスを使用して、このノードへのフェイルオーバーを手動で開始できます。

    バックアップモードで実行中(Running in Backup Mode)

    これは安定したステートです。 IM and Presence Service ノードは、ピア ノードのバックアップとして動作します。 ユーザはこの(バックアップ)ノードに移動されました。

    テイクオーバー中(Taking Over)

    これは遷移状態です。 IM and Presence Service ノードは、ピア ノードをテイクオーバーしています。

    フェールオーバー中(Failing Over)

    これは遷移状態です。 IM and Presence Service ノードは、ピア ノードによってテイクオーバーされています。

    フェールオーバー済み(Failed Over)

    これは、定常状態です。 IM and Presence Service ノードがフェールオーバーしましたが、重要なサービスはダウンしていません。 この状態では、Cisco Unified CM Administration のユーザ インターフェイスを使用して、このノードへのフォールバックを手動で開始できます。

    フェールオーバー済み(重要なサービスは非実行)(Failed Over with Critical Services Not Running)

    これは、定常状態です。 IM and Presence Service ノードの一部の重要なサービスが停止または失敗しました。

    フォールバック中(Falling Back)

    これは遷移状態です。 システムがバックアップ モードで動作するノードからこの IM and Presence Service ノードにフォールバックしています。

    テイクバック中(Taking Back)

    これは遷移状態です。 失敗した IM and Presence Service ノードは、ピアからテイクバック中です。

    障害モードで実行中(Running in Failed Mode)

    状態遷移またはバックアップモードで実行中にエラーが発生します。

    不明(Unknown)

    ノード状態は不明です。

    考えられる原因は、ハイ アベイラビリティが IM and Presence Service ノードで適切に有効にされていないことです。 プレゼンス冗長グループの両方のノードで Server Recovery Manager サービスを再起動します。

    ノード状態、原因、および推奨処置

    Cisco Unified CM Administration のユーザ インターフェイスを使用してグループを選択すると、[Presence Redundancy Group Configuration(プレゼンス冗長グループ設定)] ウィンドウにプレゼンス冗長グループのノードのステータスを表示できます。

    表 2 プレゼンス冗長グループのノードのハイ アベイラビリティ ステート、原因、および推奨処置

    ノード 1

    ノード 2

    状態

    理由

    状態

    理由

    原因/推奨処置

    標準(Normal)

    標準(Normal)

    標準(Normal)

    標準(Normal)

    標準(Normal)

    フェールオーバー中(Failing Over)

    管理者からの要求(On Admin Request)

    テイクオーバー中(Taking Over)

    管理者からの要求(On Admin Request)

    管理者はノード 1 からノード 2 への手動フェールオーバーを開始しています。 手動フェールオーバーが進行中です。

    アイドル(Idle)

    管理者からの要求(On Admin Request)

    バックアップモードで実行中(Running in Backup Mode)

    管理者からの要求(On Admin Request)

    ノード 1 から管理者が開始したノード 2 への手動フェールオーバーが完了しました。

    テイクバック中(Taking Back)

    管理者からの要求(On Admin Request)

    フォールバック中(Falling Back)

    管理者からの要求(On Admin Request)

    管理者はノード 2 からノード 1 への手動フォールバックを開始しています。 手動フォールバック中です。

    アイドル(Idle)

    初期化(Initialization)

    バックアップモードで実行中(Running in Backup Mode)

    管理者からの要求(On Admin Request)

    管理者はノード 1 が "アイドル" 状態の間にノード 1 で SRM サービスを再起動します。

    アイドル(Idle)

    初期化(Initialization)

    バックアップモードで実行中(Running in Backup Mode)

    初期化(Initialization)

    管理者は、プレゼンス冗長グループが手動フェールオーバー モードである間に、プレゼンス冗長グループの両方のノードを再起動するか、両方のノードの SRM サービスを再起動します。

    アイドル(Idle)

    管理者からの要求(On Admin Request)

    バックアップモードで実行中(Running in Backup Mode)

    初期化(Initialization)

    管理者は、ノード 2 がバックアップ モードで動作中、ノード 1 のハートビートがタイムアウトする前に、ノード 2 の SRM サービスを再起動します。

    フェールオーバー中(Failing Over)

    管理者からの要求(On Admin Request)

    テイクオーバー中(Taking Over)

    初期化(Initialization)

    管理者は、ノード 2 がテイクオーバー中、ノード 1 のハートビートがタイムアウトする前にノード 2 で SRM サービスを再起動します。

    テイクバック中(Taking Back)

    初期化(Initialization)

    フォールバック中(Falling Back)

    管理者からの要求(On Admin Request)

    管理者は、テイクバック中、ノード 2 のハートビートがタイムアウトする前にノード 1 の SRM サービスを再起動します。 テイクバック プロセスが完了すると、両方のノードが正常状態になります。

    テイクバック中(Taking Back)

    自動フォールバック(Automatic Fallback)

    フォールバック中(Falling Back)

    自動フォールバック(Automatic Fallback)

    ノード 2 からノード 1 への自動フォールバックが開始され、進行中です。

    フェールオーバー済み(Failed Over)

    [初期化中(Initialization)] または [重要なサービス停止(Critical Service Down)]

    バックアップモードで実行中(Running in Backup Mode)

    重要なサービス ダウン(Critical Service Down)

    次のいずれかの条件が発生した場合、フェールオーバー済みの状態へのノード 1 の移行

    • 重要なサービスは、ノード 1 の再起動により復旧します。

    • ノード 1 が フェールオーバー済み(重要なサービスは非実行)(Failed Over with Critical Services Not Running)状態である場合に、管理者がノード 1 で重要なサービスを開始します。

      ノード 1 が フェールオーバー済み(Failed Over)の状態に移行すると、そのノードは、管理者が手動フォールバックを実行してプレゼンス冗長グループ内のノードを正常(Normal)状態に復元するための準備が整います。

    フェールオーバー済み(重要なサービスは非実行)(Failed Over with Critical Services Not Running)

    重要なサービス ダウン(Critical Service Down)

    バックアップモードで実行中(Running in Backup Mode)

    重要なサービス ダウン(Critical Service Down)

    重要なサービスがノード 1 でダウンしました。 IM and Presence サービス はノード 2 への自動フェールオーバーを実行します。

    推奨処置:

    1. 重要なサービスがダウンしているノード 1 を確認し、手動でこれらのサービスを行ってください。

    2. ノード 1 の重要なサービスが起動しない場合、ノード 1 をリブートします。

    3. リブート後にすべての重要なサービスが稼働中である場合、手動でフォールバックを実行して、プレゼンス冗長グループ のノードを [Normal(正常)] 状態に復元します。

    フェールオーバー済み(重要なサービスは非実行)(Failed Over with Critical Services Not Running)

    データベース障害(Database Failure)

    バックアップモードで実行中(Running in Backup Mode)

    データベース障害(Database Failure)

    データベース サービスがノード 1 でダウンしました。 IM and Presence サービス はノード 2 への自動フェールオーバーを実行します。

    推奨処置:

    1. ノード 1 をリブートします。

    2. リブート後にすべての重要なサービスが稼働中である場合、手動でフォールバックを実行して、プレゼンス冗長グループ のノードを [Normal(正常)] 状態に復元します。

    障害モードで実行中(Running in Failed Mode)

    重要なサービスの開始が失敗(Start of Critical Services Failed)

    障害モードで実行中(Running in Failed Mode)

    重要なサービスの開始が失敗(Start of Critical Services Failed)

    プレゼンス冗長グループのノードが他のノードからテイクバック中に、重要なサービスが起動に失敗しました。

    推奨処置 テイクバック中のノードで、次の操作を実行してください。

    1. 重要なサービスがダウンしているノードを確認します。 手動でこれらのサービスを開始するには、[Presence Redundancy Group Configuration(プレゼンス冗長グループの設定)] ウィンドウの [Recovery(回復)] をクリックします。

    2. 重要なサービスが起動しない場合は、ノードをリブートします。

    3. リブート後にすべての重要なサービスが稼働中である場合、手動でフォールバックを実行して、プレゼンス冗長グループ のノードを [Normal(正常)] 状態に復元します。

    障害モードで実行中(Running in Failed Mode)

    重要なサービス ダウン(Critical Service Down)

    障害モードで実行中(Running in Failed Mode)

    重要なサービス ダウン(Critical Service Down)

    重要なサービスがバックアップ ノードでダウンしました。 両方のノードが障害状態になります。

    推奨処置:

    1. ダウンしている重要なサービスのバックアップ ノードを確認します。 これらのサービスを手動で開始するには、[Presence Redundancy Group Configuration(プレゼンス冗長グループの設定)] ウィンドウで [Recovery(回復)] をクリックします。

    2. 重要なサービスが起動しない場合は、ノードをリブートします。

    ノード 1 がネットワーク接続の切断によりダウンしているか、SRM サービスが起動していない。

    バックアップモードで実行中(Running in Backup Mode)

    ピアの停止(Peer Down)

    ノード 2 はノード 1 のハートビートを喪失しました。 IM and Presence サービス はノード 2 への自動フェールオーバーを実行します。

    推奨処置 Node 1 が起動中、次のアクションを実行します。

    1. プレゼンス冗長グループ内のノード間のネットワーク接続を確認して修正します。 ノード間のネットワーク接続を再確立すると、そのノードが障害状態になる場合があります。 正常の状態にノードを復元するには、[Presence Redundancy Group Configuration(プレゼンス冗長グループの設定)] ウィンドウの [Recovery(回復)] をクリックします。

    2. 正常(Normal)状態にプレゼンス冗長グループのノードをリストアするために、SRM サービスを開始し、手動フォールバックを実行します。

    3. (ノードがダウンしている場合)ノード 1 の修復/電源投入を行います。

    4. ノードが起動中で、すべての重要なサービスが稼働中である場合、手動でフォールバックを実行してプレゼンス冗長グループのノードを正常(Normal)状態に復元します。

    ノード 1 がダウンしている(可能性のある原因は、電源切断、ハードウェア障害、シャットダウン、リブート)

    バックアップモードで実行中(Running in Backup Mode)

    ピアの再起動(Peer Reboot)

    IM and Presence サービスは、ノード 1 の次の状態によってノード 2 に自動フェイルオーバーを実行します。
    • ハードウェア障害

    • 電源切断

    • 再起動

    • シャットダウン

    推奨処置:

    1. ノード 1 の修復/電源投入

    2. ノードが起動中で、すべての重要なサービスが稼働中である場合、手動でフォールバックを実行してプレゼンス冗長グループのノードを正常(Normal)状態に復元します。

    フェールオーバー済み(重要なサービスは非実行)(Failed Over with Critical Services Not Running)または、フェールオーバー済み(Failed Over)

    初期化(Initialization)

    バックアップ モード(Backup Mode)

    初期化中にピアが停止(Peer Down During Initialization)

    ノード 2 からは起動中のノード 1 が見えません。

    推奨処置:

    ノード 1 が起動中で、すべての重要なサービスが稼働中である場合、手動でフォールバックを実行してプレゼンス冗長グループのノードを正常(Normal)状態に復元します。

    障害モードで実行中(Running in Failed Mode)

    Cisco Server Recovery Manager によるユーザのテイクオーバーが失敗(Cisco Server Recovery Manager Take Over Users Failed)

    障害モードで実行中(Running in Failed Mode)

    Cisco Server Recovery Manager によるユーザのテイクオーバーが失敗(Cisco Server Recovery Manager Take Over Users Failed)

    テイクオーバー プロセス中にユーザの移動に失敗しました。

    推奨処置:

    データベース エラーの可能性があります。 [Presence Redundancy Group Configuration(プレゼンス冗長グループの設定)] ウィンドウの [Recovery(回復)] をクリックします。 問題が続く場合は、ノードを再起動します。

    障害モードで実行中(Running in Failed Mode)

    Cisco Server Recovery Manager によるユーザのテイクバックが失敗(Cisco Server Recovery Manager Take Back Users Failed)

    障害モードで実行中(Running in Failed Mode)

    Cisco Server Recovery Manager によるユーザのテイクバックが失敗(Cisco Server Recovery Manager Take Back Users Failed)

    フォールバック プロセス中にユーザの移動に失敗しました。

    推奨処置:

    データベース エラーの可能性があります。 [Presence Redundancy Group Configuration(プレゼンス冗長グループの設定)] ウィンドウの [Recovery(回復)] をクリックします。 問題が続く場合は、ノードを再起動します。

    障害モードで実行中(Running in Failed Mode)

    不明(Unknown)

    障害モードで実行中(Running in Failed Mode)

    不明(Unknown)

    他のノードの SRM が障害状態である、または内部システム エラーが発生すると、ノードの SRM が再起動します。

    推奨処置:

    [Presence Redundancy Group Configuration(プレゼンス冗長グループの設定)] ウィンドウの [Recovery(回復)] をクリックします。 問題が続く場合は、ノードを再起動します。

    バックアップがアクティブ(Backup Activated)

    データベース障害からの自動回復(Auto Recover Database Failure)

    フェールオーバーがサービスに影響(Failover Affected Services)

    データベース障害からの自動回復(Auto Recover Database Failure)

    データベースがバックアップ ノードでダウンしました。 ピア ノードはフェールオーバー モードで、プレゼンス冗長グループのすべてのユーザをテイクオーバーできます。 自動リカバリ操作が自動的に実行され、すべてのユーザがプライマリ ノードに移動します。

    バックアップがアクティブ(Backup Activated)

    データベース障害からの自動回復(Auto Recover Database Failure)

    フェールオーバーがサービスに影響(Failover Affected Services)

    重要なサービス ダウンからの自動回復(Auto Recover Critical Service Down)

    重要なサービスがバックアップ ノードでダウンしました。 ピア ノードはフェールオーバー モードで、プレゼンス冗長グループのすべてのユーザをテイクオーバーできます。 自動リカバリ操作が自動的に実行され、すべてのユーザがピア ノードに移動します。

    不明(Unknown)

    不明(Unknown)

    ノード状態は不明です。

    考えられる原因は、ハイ アベイラビリティが IM and Presence サービス ノードで適切に有効にされていないことです。

    推奨処置:

    プレゼンス冗長グループの両方のノードで Server Recovery Manager サービスを再起動します。