Cisco Unified Communications Manager Release 10.0(1) での IM and Presence Service の設定と管理
高可用性のトラブルシューティング
高可用性のトラブルシューティング

高可用性のトラブルシューティング

プレゼンス冗長グループのノードのステータスの表示

[Cisco Unified CMの管理(Cisco Unified CM Administration)] ユーザ インターフェイスを使用して、プレゼンス冗長グループのメンバーになっている IM and Presence サービス ノードのステータスを表示します。

手順
    ステップ 1   [システム(System)] > [プレゼンス冗長グループ(Presence Redundancy Groups)] を選択します。

    [プレゼンス冗長グループの検索/一覧表示(Find and List Presence Redundancy Groups)] ウィンドウが表示されます。

    ステップ 2   プレゼンス冗長グループの検索パラメータを選択して、[検索(Find)] をクリックします。

    一致するレコードが表示されます。

    ステップ 3   検索結果に一覧表示されているプレゼンス冗長グループを選択します。

    [プレゼンス冗長グループの設定(Presence Redundancy Group Configuration)] ウィンドウが表示されます。そのグループ内で 2 つのノードが設定され、高可用性が有効になっている場合、[高可用性(High Availability)] 領域にそのグループ内のノードのステータスが表示されます。


    ノード状態の定義

    表 1 プレゼンス冗長グループのノード状態の定義

    状態

    説明

    [初期化中(Initializing)]

    これは、Cisco Server Recovery Manager サービスが開始されたときの初期(遷移)状態であり、一時的な状態です。

    [アイドル(Idle)]

    フェールオーバーが発生してサービスが停止されると、IM and Presence サービスはアイドル状態になります。アイドル状態では、IM and Presence サービス ノードが可用性 サービスやインスタント メッセージ サービスを提供しません。[Cisco Unified CMの管理(Cisco Unified CM Administration)] ユーザ インターフェイスを使用して、このノードへのフォールバックを手動で開始できます。

    [標準(Normal)]

    これは安定した状態です。IM and Presence サービスが正常に稼働しています。この状態では、[Cisco Unified CMの管理(Cisco Unified CM Administration)] ユーザ インターフェイスを使用して、このノードへのフェールオーバーを手動で開始できます。

    [バックアップモードで実行中(Running in Backup Mode)]

    これは安定した状態です。IM and Presence サービス ノードが、そのピア ノードのバックアップとして機能中です。ユーザは、この(バックアップ)ノードに移動しました。

    [テイクオーバー中(Taking Over)]

    これは遷移状態です。IM and Presence サービス ノードが、そのピア ノードへのテイクオーバー中です。

    [フェールオーバー中(Failing Over)]

    これは遷移状態です。IM and Presence サービス ノードが、そのピア ノードによってテイクオーバーされているところです。

    [フェールオーバー済み(Failed Over)]

    これは安定した状態です。IM and Presence サービス ノードがフェールオーバーしましたが、重要なサービスはダウンしていません。この状態では、[Cisco Unified CMの管理(Cisco Unified CM Administration)] ユーザ インターフェイスを使用して、このノードへのフォールバックを手動で開始できます。

    [フェールオーバー済み/重要なサービスが実行されていません(Failed Over with Critical Services Not Running)]

    これは安定した状態です。IM and Presence サービス ノード上の重要なサービスの一部が、停止したか失敗しました。

    [フォールバック中(Falling Back)]

    これは遷移状態です。システムが、バックアップ モードで実行中のノードからこの IM and Presence サービス ノードへのフォールバック中です。

    [テイクバック中(Taking Back)]

    これは遷移状態です。失敗した IM and Presence サービス ノードが、そのピアからテイクバックされているところです。

    [失敗モードで実行中(Running in Failed Mode)]

    遷移状態または [バックアップモードで実行中(Running in Backup Mode)] 状態のときにエラーが発生しました。

    [不明(Unknown)]

    ノード状態は不明です。

    原因として、IM and Presence サービス ノード上で高可用性が正しく有効にされなかったことが考えられます。プレゼンス冗長グループの両方のノード上で、Server Recovery Manager サービスを再起動してください。

    ノードの状態、原因、および推奨処置

    [Cisco Unified CMの管理(Cisco Unified CM Administration)] ユーザ インターフェイスを使用してグループを選択する場合、[プレゼンス冗長グループの設定(Presence Redundancy Group Configuration)] ウィンドウのプレゼンス冗長グループでノードのステータスを表示できます。

    表 2 プレゼンス冗長グループ ノードの高可用性状態、原因、および推奨されるアクション

    ノード 1

    ノード 2

    状態

    理由

    状態

    理由

    原因/推奨処置

    [標準(Normal)]

    [標準(Normal)]

    [標準(Normal)]

    [標準(Normal)]

    [標準(Normal)]

    [フェールオーバー中(Failing Over)]

    管理者からの要求時

    [テイクオーバー中(Taking Over)]

    管理者からの要求時

    管理者がノード 1 からノード 2 への手動フェールオーバーを開始しました。手動フェールオーバーの処理中です。

    [アイドル(Idle)]

    管理者からの要求時

    [バックアップモードで実行中(Running in Backup Mode)]

    管理者からの要求時

    管理者が開始したノード 1 からノード 2 への手動フェールオーバーが完了しました。

    [テイクバック中(Taking Back)]

    管理者からの要求時

    [フォールバック中(Falling Back)]

    管理者からの要求時

    管理者がノード 2 からノード 1 への手動フォールバックを開始しました。手動フォールバックの処理中です。

    [アイドル(Idle)]

    初期化

    [バックアップモードで実行中(Running in Backup Mode)]

    管理者からの要求時

    ノード 1 が「アイドル」状態であるとき、管理者がノード 1 上で SRM サービスを再起動しました。

    [アイドル(Idle)]

    初期化

    [バックアップモードで実行中(Running in Backup Mode)]

    初期化

    プレゼンス冗長グループが手動フェールオーバー モードであるとき、管理者がプレゼンス冗長グループの両方のノードを再起動したか、両方のノード上の SRM サービスを再起動しました。

    [アイドル(Idle)]

    管理者からの要求時

    [バックアップモードで実行中(Running in Backup Mode)]

    初期化

    ノード 2 がバックアップ モードで実行中でも、ノード 1 のハートビートがタイムアウトする前に、管理者がノード 2 上の SRM サービスを再起動しました。

    [フェールオーバー中(Failing Over)]

    管理者からの要求時

    [テイクオーバー中(Taking Over)]

    初期化

    ノード 2 がテイクオーバー中でも、ノード 1 のハートビートがタイムアウトする前に、管理者がノード 2 上の SRM サービスを再起動しました。

    [テイクバック中(Taking Back)]

    初期化

    [フォールバック中(Falling Back)]

    管理者からの要求時

    ノード 1 がテイクバック中でも、ノード 2 のハートビートがタイムアウトする前に、管理者がノード 1 上の SRM サービスを再起動しました。テイクバック プロセスの完了後、両方のノードは [正常(Normal)] 状態になります。

    [テイクバック中(Taking Back)]

    自動フォールバック

    [フォールバック中(Falling Back)]

    自動フォールバック

    ノード 2 からノード 1 への自動フォールバックが開始され、現在処理中です。

    [フェールオーバー済み(Failed Over)]

    初期化または重要なサービスのダウン

    [バックアップモードで実行中(Running in Backup Mode)]

    重要なサービスのダウン

    次のいずれかの条件が発生すると、ノード 1 は [フェールオーバー済み(Failed Over)] 状態に遷移します。

    • ノード 1 のリブートにより、重要なサービスが稼働状態に戻る。

    • ノード 1 が [フェールオーバー済み/重要なサービスが実行されていません(Failed Over with Critical Services Not Running)] 状態であるとき、管理者がノード 1 上で重要なサービスを開始する。

      ノード 1 が [フェールオーバー済み(Failed Over)] 状態に遷移するとき、プレゼンス冗長グループのノードを [正常(Normal)] 状態に復元するために、管理者がノード 1 を手動フォールバックできる状態にある。

    [フェールオーバー済み/重要なサービスが実行されていません(Failed Over with Critical Services not Running)]

    重要なサービスのダウン

    [バックアップモードで実行中(Running in Backup Mode)]

    重要なサービスのダウン

    ノード 1 上で重要なサービスがダウンしています。IM and Presence サービスは、ノード 2 への自動フェールオーバーを実行します。

    推奨処置:

    1. ノード 1 にダウンしている重要なサービスがないかどうかを確認し、手動でのそのサービスの開始を試みます。

    2. ノード 1 上の重要なサービスが開始されない場合は、ノード 1 をリブートします。

    3. リブート後にすべての重要なサービスが起動して実行中になったら、手動フォールバックを実行してプレゼンス冗長グループのノードを [正常(Normal)] 状態に復元します。

    [フェールオーバー済み/重要なサービスが実行されていません(Failed Over with Critical Services not Running)]

    データベース障害

    [バックアップモードで実行中(Running in Backup Mode)]

    データベース障害

    ノード 1 上のデータベース サービスがダウンしています。IM and Presence サービスは、ノード 2 への自動フェールオーバーを実行します。

    推奨処置:

    1. ノード 1 をリブートします。

    2. リブート後にすべての重要なサービスが起動して実行中になったら、手動フォールバックを実行してプレゼンス冗長グループのノードを [正常(Normal)] 状態に復元します。

    [失敗モードで実行中(Running in Failed Mode)]

    重要なサービスの開始が失敗

    [失敗モードで実行中(Running in Failed Mode)]

    重要なサービスの開始が失敗

    他のノードからプレゼンス冗長グループのノードへのテイクバック中は、重要なサービスを開始できません。

    推奨処置。 テイクバック中のノード上で、次の操作を実行します。

    1. ノードにダウンしている重要なサービスがないかどうかを確認します。これらのサービスを手動で開始するには、[プレゼンス冗長グループの設定(Presence Redundancy Group Configuration)] ウィンドウで [リカバリ(Recovery)] をクリックします。

    2. 重要なサービスが開始されない場合は、ノードをリブートします。

    3. リブート後にすべての重要なサービスが起動して実行中になったら、手動フォールバックを実行してプレゼンス冗長グループのノードを [正常(Normal)] 状態に復元します。

    [失敗モードで実行中(Running in Failed Mode)]

    重要なサービスのダウン

    障害モードで実行中(Running in Failed Mode)

    重要なサービスのダウン

    バックアップ ノード上で重要なサービスがダウンしました。両方のノードが失敗状態に入ります。

    推奨処置:

    1. バックアップ ノードにダウンしている重要なサービスがないかどうかを確認します。これらのサービスを手動で開始するには、[プレゼンス冗長グループの設定(Presence Redundancy Group Configuration)] ウィンドウで [リカバリ(Recovery)] をクリックします。

    2. 重要なサービスが開始されない場合は、ノードをリブートします。

    ネットワーク接続が失われているためにノード 1 がダウンしているか、SRM サービスが実行されていません。

    バックアップモードで実行中(Running in Backup Mode)

    ピア ダウン

    ノード 2 がノード 1 からのハートビートを見失いました。IM and Presence サービスは、ノード 2 への自動フェールオーバーを実行します。

    推奨処置。 ノード 1 が起動したら、次の操作を実行します。

    1. プレゼンス冗長グループのノード間のネットワーク接続を確認し、修復します。ノード間のネットワーク接続を再確立すると、ノードが失敗状態になる場合があります。[プレゼンス冗長グループの設定(Presence Redundancy Group Configuration)] ウィンドウで [リカバリ(Recovery)] をクリックして、ノードを「通常」状態に復元します。

    2. SRM サービスを開始し、手動フォールバックを実行して、プレゼンス冗長グループのノードを [正常(Normal)] 状態に復元します。

    3. (ノードがダウンしている場合)ノード 1 を修復し、電源を入れます。

    4. ノードが起動し、すべての重要なサービスが実行中になったら、手動フォールバックを実行してプレゼンス冗長グループのノードを [正常(Normal)] 状態に復元します。

    (電源切断、ハードウェア障害、シャットダウン、リブートなどにより)ノード 1 がダウンしています。

    バックアップモードで実行中(Running in Backup Mode)

    ピア リブート

    ノード 1 上で次のような条件が発生したため、IM and Presence サービスはノード 2 への自動フェールオーバーを実行しました。
    • ハードウェア障害

    • 電源切断

    • 再起動

    • シャットダウン

    推奨処置:

    1. ノード 1 を修復し、電源を入れます。

    2. ノードが起動し、すべての重要なサービスが実行中になったら、手動フォールバックを実行してプレゼンス冗長グループのノードを [正常(Normal)] 状態に復元します。

    [フェールオーバー済み/重要なサービスが実行されていません(Failed Over with Critical Services not Running)] または [フェールオーバー完了(Failed Over)]

    初期化

    [バックアップモード(Backup Mode)]

    初期化中のピア ダウン

    起動中、ノード 2 はノード 1 を参照しません。

    推奨処置:

    ノード 1 が起動し、すべての重要なサービスが実行中になったら、手動フォールバックを実行してプレゼンス冗長グループのノードを [正常(Normal)] 状態に復元します。

    [失敗モードで実行中(Running in Failed Mode)]

    Cisco Server Recovery Manager によるユーザのテイクオーバーが失敗

    [失敗モードで実行中(Running in Failed Mode)]

    Cisco Server Recovery Manager によるユーザのテイクオーバーが失敗

    テイクオーバー プロセス中のユーザ移動は失敗します。

    推奨処置:

    データベース エラーの可能性があります。[プレゼンス冗長グループの設定(Presence Redundancy Group Configuration)] ウィンドウで、[リカバリ(Recovery)] をクリックしてください。問題が解決しない場合は、ノードをリブートします。

    [失敗モードで実行中(Running in Failed Mode)]

    Cisco Server Recovery Manager によるユーザのテイクバックが失敗

    [失敗モードで実行中(Running in Failed Mode)]

    Cisco Server Recovery Manager によるユーザのテイクバックが失敗

    フォールバック プロセス中のユーザ移動は失敗します。

    推奨処置:

    データベース エラーの可能性があります。[プレゼンス冗長グループの設定(Presence Redundancy Group Configuration)] ウィンドウで、[リカバリ(Recovery)] をクリックしてください。問題が解決しない場合は、ノードをリブートします。

    [失敗モードで実行中(Running in Failed Mode)]

    [不明(Unknown)]

    [失敗モードで実行中(Running in Failed Mode)]

    [不明(Unknown)]

    ノード上の SRM が再起動したがもう一方のノード上の SRM が失敗状態であるか、内部システム エラーが発生しました。

    推奨処置:

    [プレゼンス冗長グループの設定(Presence Redundancy Group Configuration)] ウィンドウで、[リカバリ(Recovery)] をクリックしてください。問題が解決しない場合は、ノードをリブートします。

    [バックアップがアクティブ化済み(Backup Activated)]

    データベースの自動リカバリに失敗

    [フェールオーバーがサービスに影響(Failover Affected Services)]

    データベースの自動リカバリに失敗

    バックアップ ノード上でデータベースがダウンしました。ピア ノードがフェールオーバー モードであり、プレゼンス冗長グループのすべてのユーザをテイクオーバーできます。自動リカバリ操作が自動的に行われ、すべてのユーザはプライマリ ノードに移動されます。

    [バックアップがアクティブ化済み(Backup Activated)]

    データベースの自動リカバリに失敗

    [フェールオーバーがサービスに影響(Failover Affected Services)]

    重要なサービスのダウンの自動リカバリ

    バックアップ ノード上で重要なサービスがダウンしました。ピア ノードがフェールオーバー モードであり、プレゼンス冗長グループのすべてのユーザをテイクオーバーできます。自動リカバリ操作が自動的に行われ、すべてのユーザはピア ノードに移動されます。

    [不明(Unknown)]

    [不明(Unknown)]

    ノード状態は不明です。

    原因として、IM and Presence サービス ノード上で高可用性が正しく有効にされなかったことが考えられます。

    推奨処置:

    プレゼンス冗長グループの両方のノード上で、Server Recovery Manager サービスを再起動してください。