配置冗余和高可用性

Presence 冗余组概述

Presence 冗余组由两个来自同一群集的 IM and Presence Service 节点构成。 Presence 冗余组中的每个节点都监控对等节点的状态或心跳。 您可以配置 Presence 冗余组,以便为 IM and Presence Service 客户端和应用程序提供冗余和恢复。

  • 故障转移 — 当组中 IM and Presence Service 节点上的一个或多个关键服务失败或组中的节点断开连接时,Presence 冗余组中将发生故障转移。 客户端自动连接到该组中的另一个 IM and Presence Service 节点。

  • 回退 — 在发生以下情况期间,从 CLI 或 Cisco Unified Communications Manager 发出回退命令时,即发生回退:

    • 断开连接的 IM and Presence Service 节点恢复服务,且所有关键服务均在运行中。 在节点恢复连接后,该组中故障转移的客户端重新连接到恢复的节点。

    • 备份的已激活 IM and Presence Service 节点由于关键服务失败而断开连接,对等节点处于“故障转移”状态且支持自动恢复回退。

例如,如果您在使用 Presence 冗余组时,本地 IM and Presence Service 节点上的服务失败或硬件出现故障,Cisco Jabber 客户端将故障转移到备份的 IM and Presence Service 节点。 如果您配置了自动回退,当断开连接的节点重新上线后,客户端将自动重新连接到本地 IM and Presence Service 节点。 如果未配置自动回退,当断开连接的节点上线后,您可以手动启动回退。

除冗余和恢复之外,您还可以通过 Presence 冗余组为群集配置高可用性。

高可用性

IM and Presence Service 支持多节点高可用性部署。

配置 Presence 冗余组后,您可以为组启用高可用性。 高可用性需要一对节点。 每个节点都有一个独立的数据库和使用能够支持普通用户的共享可用性数据库操作的一组用户。

所有 IM and Presence Service 节点均须属于某个 Presence 冗余组,该组可以包含一个 IM and Presence Service 节点或一对 IM and Presence Service 节点。

您可以使用两种不同模式配置高可用性:

  • 平衡模式:当一个节点因组件故障或电源断开而出现问题时,为冗余高可用性提供自动用户负载均衡和用户故障转移。

  • 主用/备用模式:备用节点会在活动节点失败时自动接管活动节点。 它不提供自动负载均衡。

我们建议您将 IM and Presence Service 部署配置为高可用性部署。 虽然您可以在一个部署中同时配置高可用性和非高可用性 Presence 冗余组,但是不建议您使用此配置。

Presence 冗余组前提条件

对于 WAN 上的部署,每个 IM and Presence Service 群集需要至少每秒 10 兆比特的专用带宽,以及不超过 80 毫秒的往返滞后时间。 小于此建议的任何带宽均可对性能造成不良影响。

Presence 冗余组任务流程

IM and Presence Service 节点只能分配给一个 Presence 冗余组。 要获得高可用性,您必须将同一群集中的两个节点分配到 Presence 冗余组,并为该组启用高可用性。

过程

  命令或操作 目的

步骤 1

验证数据库复制

确保在 IM and Presence Service 群集中设置了数据库复制。

步骤 2

验证服务

确保关键服务正在您计划添加到 Presence 冗余组的节点上运行。

步骤 3

配置 Presence 冗余组

IM and Presence Service 客户端和应用程序提供冗余和恢复。

步骤 4

配置故障转移的心跳间隔

可选。 Presence 冗余组中的每个节点都监控其对等节点的状态或心跳。 您可以配置每个节点监控其对等节点的时间间隔。

步骤 5

启用高可用性

可选。 如果在配置 Presence 冗余组时未启用高可用性,请按此程序操作。

步骤 6

配置用户分配模式

配置您希望同步代理如何在 IM and Presence Service 群集的各个节点上分配用户。 此设置会影响系统处理故障转移和负载均衡的方式。

验证数据库复制

为 Presence 冗余组启用高可用性之前,需确保在 IM and Presence Service 群集中设置了数据库复制。

过程


步骤 1

使用以下方法之一启动一个 CLI 会话:

  • 从远程系统,使用 SSH 安全连接到 Cisco Unified 操作系统。 在 SSH 客户端,输入您的 ssh adminname@hostname,然后输入密码。

  • 从到串行端口的直接连接,看到自动显示的系统提示时,输入您的凭证。

步骤 2

执行 utils dbreplication status 命令以检查数据库表中是否存在错误或不匹配问题。

步骤 3

执行 utils dbreplication runtimestate 命令以检查数据库复制在节点上是否处于活动状态。

输出会列出所有节点;如果数据库复制已设置且处于良好状态,每个节点的复制设置值为 2

如果返回的值不是 2,则必须先消除错误,然后再继续。


下一步做什么

验证服务

验证服务

确保关键服务正在您计划添加到 Presence 冗余组的节点上运行。 启用高可用性之前,关键服务必须运行。 如果两个节点上都没有运行关键服务,当您启用高可用性时,Presence 冗余组将进入故障状态。 如果关键服务未在一个节点上停止运行,当您启用高可用性时,该节点将会故障转移到另一个节点。

开始之前

验证数据库复制

过程


步骤 1

在 Cisco Unified IM and Presence 功能配置中,选择工具 > 控制中心 - 网络服务

步骤 2

服务器列表选择合适的节点,然后单击执行

步骤 3

IM and Presence Service 区域中,确保以下服务已启动:

  • Cisco 客户端配置文件代理

  • 思科同步代理

  • Cisco XCP 路由器

步骤 4

相关链接下拉列表选择控制中心 - 网络服务,然后单击前往

步骤 5

IM and Presence Service 区域中,确保以下服务已启动:

  • Cisco SIP Proxy

  • Cisco Presence Engine


下一步做什么

配置 Presence 冗余组

配置 Presence 冗余组

使用 Cisco Unified Communications ManagerIM and Presence Service 节点配置冗余。

每个 Presence 冗余组可以包含两个 IM and Presence Service 节点。 一个节点只能分配给一个 Presence 冗余组。 Presence 冗余组中的两个节点都必须位于同一群集并且有相同的 IM and Presence Service 数据库发布方节点。

开始之前

  • 验证服务

  • 确保您添加到 Presence 冗余组的 IM and Presence Service 节点在运行相同的软件版本。

过程


步骤 1

Cisco Unified CM 管理中,选择系统 > Presence 冗余组

步骤 2

单击新增

步骤 3

为 Presence 冗余组输入一个唯一的名称。

您最多可以输入 128 个字母数字字符,包括下划线 (_) 和连字符 (-)。

步骤 4

输入组说明。

您最多可以输入 128 个字母数字字符,可包含符号,但不能包含双引号 (")、百分号 (%)、和号 (&)、反斜线 (\) 或尖括号 (<>)。

步骤 5

Presence 服务器字段中选择两个不同的 IM and Presence Service 节点,以便将它们分配给该组。

步骤 6

(可选) 选中启用高可用性复选框,为 Presence 冗余组启用高可用性。

步骤 7

单击保存


下一步做什么

配置故障转移的心跳间隔

配置故障转移的心跳间隔

配置确定保持连接设置的可选服务参数,通过该设置,Presence 冗余组中的每个节点会监控其对等节点的心跳(即状态),以确认该对等节点是否处于活动状态。 如果在配置的计时器到期后对等节点没有响应,可启动故障转移。



思科建议您使用这些服务参数的默认值。 不过,您也可以根据自身需求重新配置值。


过程


步骤 1

在 Cisco Unified CM IM and Presence 管理中,选择系统 > 服务参数

步骤 2

服务器下拉列表中选择 IM and Presence 节点

步骤 3

服务下拉列表中选择 Cisco Server Recovery Manager(活动)

步骤 4

常规 Server Recovery Manager 参数(群集范围)下,配置 Presence 冗余组中的每个节点用于监控其对等节点心跳的群集范围内的保持连接设置。 如果对等节点没有响应,可启动故障转移。

  • 服务端口 — 此参数指定 Cisco Server Recovery Manager 用于与其对等节点通信的端口。 默认值为 22001。
  • 管理 RPC 端口 — 此参数指定 Cisco Server Recovery Manager 用于提供管理 RPC 请求的端口。 默认值为 20075。
  • 关键服务延迟 — 此参数指定在启动故障转移之前关键服务可以关闭的时长(以秒为单位)。 默认值为 90。
  • 启用自动回退 — 此参数指定是否执行自动回退。 如果发生故障转移,在主节点恢复为健康状态三十分钟后,IM and Presence Service 会自动将用户从备份节点移到主节点。 默认值为 False。
  • 初始化保持连接(心跳)超时 — 此参数指定在启动故障转移之前的初始化期间,对等节点可失去心跳的时长(以秒为单位)。 默认值为 120。
  • 保持连接(心跳)超时 — 此参数指定在启动故障转移之前,对等节点可失去心跳的时长(以秒为单位),默认值为 60。
  • 保持连接(心跳)间隔 — 此参数指定两次向对等节点发送保持连接(心跳)消息之间的间隔。 默认值为 15。
  • 启用 XCP 身份验证服务监控 — 此参数用于配置系统以监控 Cisco XCP 身份验证服务,并在服务在节点上出现故障时启动自动故障转移到对等节点。 在启用 XCP 身份验证服务监控字段中,将服务参数的值设置为 TRUE

步骤 5

配置以下附加参数,这些参数指定 CUPC 8.5 及更高版本的客户端在尝试重新登录之前需要等待多长时间。 与上述参数不同,必须为每个群集节点单独配置这些参数。

  • 客户端重新登录下限 — 此参数指定 CUPC 8.5(及更高版本)在尝试重新登录此服务器之前应等待的最小秒数。 默认值为 120。
  • 客户端重新登录上限 — 此参数指定 CUPC 8.5(及更高版本)在尝试重新登录此服务器之前应等待的最大秒数。 默认值为 537。

步骤 6

单击保存


下一步做什么

如果在配置 Presence 冗余组时未启用高可用性,请立即启用高可用性

启用高可用性


小心


若无法在 IM and Presence Service 集中设置复制并确保所有关键服务运行,则会导致启用在线状态冗余组的高可用性后立即发生故障转移。


开始之前

  • 配置 Presence 冗余组

  • 确保在 IM and Presence Service 集中设置了复制。

  • 确保所有关键服务都在运行。

过程


步骤 1

Cisco Unified CM 管理中,选择系统 > Presence 冗余组

步骤 2

指定搜索条件,然后单击查找

步骤 3

选择您配置的 Presence 冗余组。

步骤 4

要启用高可用性,请选中启用高可用性复选框。

步骤 5

单击保存


配置用户分配模式

此程序用于配置同步代理将用户分配至群集中节点的方式。 此设置可帮助管理故障转移和负载均衡。

过程


步骤 1

从“Cisco Unified CM 管理”中,选择系统 > 企业参数

步骤 2

用户管理参数区域,为 Presence 服务器的用户分配模式参数选择以下选项之一:

  • 平衡 — 此模式会将用户平均分配到每个子群集中的各个节点,并尝试让各个节点上的用户总数达到均衡。 这是默认选项。
  • 主用-备用 — 此模式会将所有用户分配至子群集的第一个节点,并让第二个服务器作为备份。
  • — 如果选择此模式,同步代理不会将任何用户分配到群集中的节点。

步骤 3

单击保存


启动手动故障转移、回退或恢复

此程序用于启动 Presence 冗余组中 IM and Presence Service 节点的手动故障转移、回退或恢复。

  • 手动故障转移 — 当您启动手动故障转移时,Cisco Server Recovery Manager 将在故障节点上停止关键服务。 故障节点上的所有用户都将断开连接,必须重新登录到备用节点。 除非我们调用手动回退,否则关键服务不会重新启动。

  • 手动回退 — 当您启动手动回退时,Cisco Server Recovery Manager 将重新启动主节点上的关键服务,并断开已经故障转移的所有用户。 然后,这些用户必须重新登录到其被分配到的节点。

  • 手动恢复 — 当 Presence 冗余组中的两个节点都处于故障状态时,需要进行手动恢复。 此时,IM and Presence Service 会重新启动 Presence 冗余组中两个节点上的 Cisco Server Recovery Manager 服务。

过程


步骤 1

从 Cisco Unified CM 管理中,选择系统 > Presence 冗余组

步骤 2

单击查找并选择具有适用节点的 Presence 冗余组。

步骤 3

执行下列操作之一: 请注意,可用的按键取决于节点当前的状态:

  • 单击故障转移可启用活动节点的故障转移。
  • 单击回退可启动故障转移节点的回退。
  • 如果两个节点都已进行故障转移并且您想要恢复它们,则单击恢复



还可以从 Cisco Unified Communications Manager 或使用 CLI 从 IM and Presence Service 中启动这些操作。 有关详细信息,请参阅《Cisco Unified Communications 解决方案的命令行界面指南》


如果其中一个节点处于故障转移状态,您就不能将最终用户添加到 IM and Presence Service 群集。


节点状态定义

表 1. Presence 冗余组节点状态定义

状态

说明

正在初始化

这是 Cisco 服务器恢复管理器服务启动时的初始(过渡)状态;是一个临时状态。

空闲

进行故障转移并且停止服务时,IM and Presence Service 于空闲状态。 在空闲状态下,IM and Presence Service 点不会提供任何可用性或即时消息服务。 在空闲状态下,可以使用 Cisco Unified CM 管理用户界面手动启动对此节点的回退。

正常

这是一个稳定的状态。 IM and Presence Service 节点正常运行。 在此状态下,可以使用 Cisco Unified CM 管理用户界面手动启动对此节点的故障转移。

正在备份模式下运行

这是一个稳定的状态。 IM and Presence Service 节点充当其对等节点的备份。 用户已移至此(备份)节点。

正在接管

这是一个过渡状态。 IM and Presence Service 节点接管其对等节点。

正在进行故障转移

这是一个过渡状态。 IM and Presence Service 节点由其对等节点接管。

已执行故障转移

这是一个稳定的状态。 IM and Presence Service 节点已故障转移,但关键服务没有关闭。 在此状态下,可以使用 Cisco Unified CM 管理用户界面手动启动对此节点的回退。

已执行故障转移,且关键服务没有运行

这是一个稳定的状态。 IM and Presence Service 节点上的一些关键服务已停止或发生故障。

正在回退

这是一个过渡状态。 系统从在备份模式下运行的节点回退到此 IM and Presence Service 节点。

正在收回

这是一个过渡状态。 从其对等节点接管发生故障的 IM and Presence Service 节点。

正在故障模式下运行

过渡状态或“在备份模式下运行”状态期间发生错误。

未知

节点状态未知。

可能的原因是 IM and Presence Service 节点上没有正确启用高可用性。 重新启动 Presence 冗余组中两个节点上的服务器恢复管理器服务。

节点状态、原因和建议的操作

使用 Cisco Unified CM 管理用户界面选择一个 Presence 冗余组后,您可以在 Presence 冗余组配置窗口中查看该组中节点的状态。

表 2. Presence 冗余组节点高可用性状态、原因和建议的操作

节点 1

节点 2

状态

原因

状态

原因

原因/建议的操作

正常

正常

正常

正常

正常

正在进行故障转移

应管理员的请求

正在接管

应管理员的请求

管理员启动从节点 1 到节点 2 的手动故障转移。手动故障转移正在进行中。

空闲

应管理员的请求

正在备份模式下运行

应管理员的请求

管理员启动的、从节点 1 到节点 2 的手动故障转移已完成。

正在收回

应管理员的请求

正在回退

应管理员的请求

管理员启动从节点 2 到节点 1 的手动回退。手动回退正在进行中。

空闲

初始化

正在备份模式下运行

应管理员的请求

管理员当节点 1 处于“空闲”状态时重新启动节点 1 上的 SRM 服务。

空闲

初始化

正在备份模式下运行

初始化

当 Presence 冗余组处于手动故障转移模式时,管理员重新启动 Presence 冗余组中的两个节点,或重新启动两个节点上的 SRM 服务。

空闲

应管理员的请求

正在备份模式下运行

初始化

当节点 2 在备份模式下运行,但节点 1 上的心跳超时之前,管理员重新启动节点 2 上的 SRM 服务。

正在进行故障转移

应管理员的请求

正在接管

初始化

当节点 2 接管,但节点 1 上的心跳超时之前,管理员重新启动节点 2 上的 SRM 服务。

正在收回

初始化

正在回退

应管理员的请求

当取回但节点 2 上的心跳超时之前,管理员重新启动节点 1 上的 SRM 服务。 取回过程完成后,两个节点都处于“普通”状态。

正在收回

自动回退

正在回退

自动回退

从节点 2 到节点 1 的自动回退已启动并且当前正在进行。

已执行故障转移

初始化或关键服务关闭

正在备份模式下运行

关键服务关闭

节点 1 在出现以下任一情况时转换为“已故障转移”状态:

  • 关键服务由于节点 1 重新启动恢复运行。

  • 当节点 1 处于“关键服务未运行时故障转移”状态时,管理员启动节点 1 上的关键服务。

    节点 1 转换为“已故障转移”状态后,该节点已准备就绪,管理员可执行手动回退,以将 Presence 冗余组中的节点恢复为“普通”状态。

已执行故障转移,且关键服务没有运行

关键服务关闭

正在备份模式下运行

关键服务关闭

节点 1 上的关键服务已关闭。IM and Presence Service 会执行到节点 2 的自动故障转移。

建议的操作:

  1. 检查节点 1 有无任何关键服务关闭,并尝试手动启动这些服务。

  2. 如果节点 1 上的关键服务没有启动,则重新启动节点 1。

  3. 当所有关键服务均已启动并在重新启动后运行时,执行手动回退以将 Presence 冗余组中的节点恢复为“普通”状态。

已执行故障转移,且关键服务没有运行

数据库失败

正在备份模式下运行

数据库失败

节点 1 上的数据库服务已关闭。IM and Presence Service 会执行到节点 2 的自动故障转移。

建议的操作:

  1. 重新启动节点 1。

  2. 当所有关键服务均已启动并在重新启动后运行时,执行手动回退以将 Presence 冗余组中的节点恢复为“普通”状态。

正在故障模式下运行

启动关键服务失败

正在故障模式下运行

启动关键服务失败

Presence 冗余组中的节点从其他节点收回时关键服务无法启动。

建议的操作。 在收回的节点上,执行以下操作:

  1. 检查该节点有无关键服务关闭。 要手动启动这些服务,单击 Presence 冗余组配置窗口中的恢复

  2. 如果关键服务没有启动,重新启动该节点。

  3. 当所有关键服务均已启动并在重新启动后运行时,执行手动回退以将 Presence 冗余组中的节点恢复为“普通”状态。

正在故障模式下运行

关键服务关闭

正在故障模式下运行

关键服务关闭

关键服务在备份节点上关闭。 两个节点都进入故障状态。

建议的操作:

  1. 检查备份节点有无关键服务关闭。 要手动启动这些服务,单击 Presence 冗余组配置窗口中的恢复

  2. 如果关键服务没有启动,重新启动该节点。

节点 1 由于失去网络连接而关闭,或 SRM 服务没有运行。

正在备份模式下运行

对等节点关闭

节点 2 失去来自节点 1 的心跳。IM and Presence Service 会执行到节点 2 的自动故障转移。

建议的操作。 如果节点 1 已启动,则执行以下操作:

  1. 检查并修复 Presence 冗余组中节点之间的网络连接性。 当您重新建立节点之间的网络连接后,节点可能会进入故障状态。 单击 Presence 冗余组配置窗口中的恢复以将节点恢复为“普通”状态。

  2. 启动 SRM 服务并执行手动回退以将 Presence 冗余组中的节点恢复为“普通”状态。

  3. (如果节点关闭)修复节点 1 并通电。

  4. 当节点已启动并且所有关键服务均已运行时,执行手动回退以将 Presence 冗余组中的节点恢复为“普通”状态。

节点 1 已关闭(由于可能的电源中断、硬件故障、关闭、重新启动)

正在备份模式下运行

对等节点重新启动

由于节点 1 上出现以下可能的情况,IM and Presence Service 执行到节点 2 的自动故障转移:
  • 硬件故障

  • 电源中断

  • 重新启动

  • shutdown

建议的操作:

  1. 修复节点 1 并通电。

  2. 当节点已启动并且所有关键服务均已运行时,执行手动回退以将 Presence 冗余组中的节点恢复为“普通”状态。

“关键服务未运行时故障转移”或“已故障转移”

初始化

备份模式

初始化期间对等节点关闭

节点 2 在启动期间不会看到节点 1。

建议的操作:

当节点 1 已启动并且所有关键服务均已运行时,执行手动回退以将 Presence 冗余组中的节点恢复为“普通”状态。

正在故障模式下运行

Cisco 服务器恢复管理器接管用户失败

正在故障模式下运行

Cisco 服务器恢复管理器接管用户失败

用户在接管过程中失败。

建议的操作:

可能的数据库错误。 单击 Presence 冗余组配置窗口中的恢复。 如果问题仍然存在,则重新启动节点。

正在故障模式下运行

Cisco 服务器恢复管理器取回用户失败

正在故障模式下运行

Cisco 服务器恢复管理器取回用户失败

用户在回退过程中失败。

建议的操作:

可能的数据库错误。 单击 Presence 冗余组配置窗口中的恢复。 如果问题仍然存在,则重新启动节点。

正在故障模式下运行

未知

正在故障模式下运行

未知

当其他节点上的 SRM 处于故障状态,或发生内部系统错误时,节点上的 SRM 会重新启动。

建议的操作:

单击 Presence 冗余组配置窗口中的恢复。 如果问题仍然存在,则重新启动节点。

备份已激活

自动恢复数据库失败

故障转移受影响的服务

自动恢复数据库失败。

数据库在备份节点上关闭。 对等节点处于故障转移模式并且能够接管 Presence 冗余组中的所有用户。 自动进行自动恢复操作并且所有用户均移至主节点。

备份已激活

自动恢复数据库失败

故障转移受影响的服务

自动恢复关键服务关闭

关键服务在备份节点上关闭。 对等节点处于故障转移模式并且能够接管 Presence 冗余组中的所有用户。 自动进行自动恢复操作并且所有用户均移至对等节点。

未知

未知

节点状态未知。

可能的原因是 IM and Presence Service 节点上没有正确启用高可用性。

建议的操作:

重新启动 Presence 冗余组中两个节点上的服务器恢复管理器服务。

IM and Presence 故障转移增强,停机时间几乎为零

IM and Presence Service 得到增强,可减少节点和群集升级及故障转移过程中的影响,从而最大限度地缩短 Jabber 服务中断的时间。

在版本 14 中,IM and Presence Service 服务支持与 Jabber 客户端的双连接。在客户端启用后,此类连接在高可用性故障转移事件期间可确保缩短服务停机时间(至接近零)。

它有助于:

  • 在 IM and Presence Service 直接标准升级期间,最大程度减少 Jabber 客户端的服务中断

  • 在主节点和辅助节点之间无缝切换用户会话

您可以在 Jabber 客户端中通过一些其他配置来启用此功能。有关如何在 Jabber 中启用双重连接的详细信息,请参阅《Cisco Jabber 14 参数参考指南》中的 EnableDualConnectionsInactive_Connection_Activation_Timer 参数。

要尽可能缩短停机时间,请确保满足以下前提条件以启用此功能增强:

  • 在升级过程中保持启用高可用性 (HA)。

  • 版本兼容性:Cisco Unified CM 和 IM and Presence 版本 14、Jabber 版本 14 和 Expressway 14(如果是移动和远程访问用户)。

图 1. IM Presence 故障转移增强

如果发生故障转移,此增强有助于尽量缩短停机时间至将近零。这是通过启用 Cisco Jabber 客户端以维护与 IM and Presence 节点的双连接来实现的。与在客户端登录过程中创建的主节点保持活动连接。在客户端重新登录下限客户端重新登录上限值之间的随机秒数后,与备份节点之间的非活动连接将建立。这些限制配置为 Cisco Server Recovery Manager 服务的服务参数。

发生故障转移时,Jabber 客户端将激活“非活动”连接以与服务器通信。由于已在备份节点上创建非活动连接,因此 Jabber 停机时间可缩至最短。



由于 Cisco Jabber 客户端的限制,这种(适用于 Jabber 的)故障转移增强功能不能与 IM and Presence Service 无限制 (XU) 版配合使用。这是因为在无限制版中禁用了 XMPP 客户端(例如 Jabber)与 IM and Presence 服务之间的安全 TLS 连接。

在受限版本中, 启用 XMPP 客户端 IM/P 服务安全模式选项在安全设置页(系统 > 安全 > 设置)中默认启用,从而令故障转移增强功能可以与 Jabber 配合使用。如果您要使用故障转移增强功能,我们建议不要禁用此模式。有关此限制的详细信息,请参阅 CSCvx94284。


如何检查是否已建立双重注册

为确保建立双重注册,请考虑在主节点上分配 X 个用户,在辅助节点上分配 Y 个用户的方案。当您检查主节点上的 JsmSessionsClientJsmSessionsClientInactive 计数器时,可以看到连接至 JsmSessionsClientJsmSessionsClientInactive 的用户总数分别是 X 和 Y。与此同时,在辅助接点上,连接至 JsmSessionsClientJsmSessionsClientInactive 的用户总数分别是 Y 和 X。

如何禁用双重注册

您可以禁用双重注册,方法是在客户端禁用 HA,无需在服务器中禁用 HA。此外,如果禁用 HA,则不会从服务器向客户端提供双重注册,并且客户端无法尝试建立非活动连接。有关如何在 Jabber 中启用双重连接的详细信息,请参阅《Cisco Jabber 14 参数参考指南》中的 EnableDualConnectionsInactive_Connection_Activation_Timer 参数。

在升级期间用于监控零停机时间的计数器

要跟踪升级过程以确保零停机时间,您可以通过实时监控工具监控以下计数器:

表 3. 在升级期间用于监控零停机时间的计数器

计数器

说明

ActiveJsmSessions

此计数器提供分配给发布方节点的活动用户数。在故障转移过程中,它会显示主(升级)节点为零,并将活动用户从主节点添加到备份节点。

InactiveJsmSessions

此计数器提供分配给订阅方节点的活动用户数。

JsmSessionsComposed

此计数器表示 JSM 处于活动状态的组合会话数。

JsmSessionsClientInactive

此计数器表示 JSM 处于非活动状态的客户端会话数。

JsmSessionsClient

此计数器表示 JSM 处于活动状态的客户端会话数。

JsmSessionsClientInactive

此计数器表示 JSM 处于非活动状态的客户端会话数。

冗余相互作用和限制

功能

互动

添加用户

如果其中一个群集节点处于故障转移状态,您就不能将新用户添加到 IM and Presence Service 群集。

多设备消息传送

如果发生故障转移,多设备消息传送功能会导致 IM and Presence Service 上的服务器恢复延迟。 如果配置了多设备消息传送的系统上发生服务器故障转移,则故障转移时间通常是使用 Cisco Server Recovery Manager 服务参数指定的时间的两倍。

推送通知高可用性

从 11.5(1)SU3 开始,推送通知部署支持高可用性。 如果启用了推送通知,并且节点进行了故障转移,则 iPhone 和 iPad 客户端上的 Cisco Jabber 会出现以下问题:

  • 对于处于前台模式的 Cisco Jabber 客户端,Jabber 客户端会自动登录到备份节点,该节点将在主节点恢复之前接管。 无论是备份节点接管还是主节点恢复时,服务都不会中断。

  • 对于处于后台模式的 Cisco Jabber 客户端,备份节点将接管,但在发送推送通知之前会有一段延迟。 由于 Jabber 客户端处于后台模式,没有活动的网络连接,因此不会自动登录到备份节点。 在发送任何推送通知之前,备份节点必须为处于后台模式的所有故障转移的用户重新创建 JSM 会话。

    延迟的时长取决于系统负载。 测试表明,对于含 15,000 个用户的 OVA(用户均匀分布在 HA 对中),故障转移后发送推送通知需要 10-20 分钟。 当备份节点接管时以及主节点恢复后,会再次出现此延迟。

 
如果节点发生故障或 Cisco XCP 路由器意外崩溃,无需用户执行任何操作,系统即会维护用户的 IM 会话(包括 IM 历史记录)。 但是,如果 iPhone 或 iPad 客户端上的 Cisco Jabber 处于挂起模式,则无法检索服务器崩溃时在其上排队的未读消息。
用户的临时在线状态

在故障转移、回退和用户移动后,用户的临时在线状态会显示过期的在线状态。 这是因为对临时在线状态的订阅将会删除,用户必须重新订阅临时在线状态,才能看到用户的有效临时在线状态。

例如,如果用户 A 订阅用户 B 的临时在线状态,并且用户 B 被分配到的 IM and Presence 节点上发生故障转移,则即使用户 B 重新登录到备份节点后,用户 B 仍会对用户 A 显示离线。 这是因为对用户 B 临时在线状态的订阅删除,而用户 A 对此不知情。 用户 A 必须重新订阅用户 B 的临时在线状态。

当用户 A 从 Jabber 客户端删除用户 B 的搜索时,用户 A 至少需要等待 30 秒,然后才会尝试搜索用户 B 的临时在线状态。如果不是,用户 A 会看到用户 B 过期的在先状态。对于同一用户,Jabber 客户端必须在两次搜索之间至少等待 30 秒,才能获得有效的临时在线状态。

IM and Presence 状态

当用户从一个 Presence 冗余组移动到另一个 Presence 冗余组时,用户必须从 Jabber 会话注销,以便 IM and Presence 状态在用户已移入的当前 Presence 冗余组中可见。