地址更改问题故障诊断

群集验证故障诊断

您可以使用命令行界面 (CLI) 对订阅方节点上的群集验证问题进行故障诊断。

过程


步骤 1

输入 show network eth0 [detail] 验证网络配置。

步骤 2

输入 show network cluster 验证网络群集信息。

  • 如果输出显示不正确的发布方信息,请在订阅方节点上输入 set network cluster publisher [hostname/IP address] CLI 命令以更正信息。

  • 如果您在发布方节点上,并且 show network cluster CLI 命令显示不正确的订阅方信息,请登录 Cisco Unified Communications Manager 管理,然后选择系统 > 服务器以检查输出。

  • 如果您在订阅方节点上,并且 show network cluster 输出显示不正确的发布方信息,请使用 set network cluster publisher [hostname | IP_address] CLI 命令来更改发布方主机名或 IP 地址。


数据库复制故障诊断

您可以使用命令行界面 (CLI) 对群集节点上的数据库复制进行故障诊断。
  • 验证数据库复制在群集中是否处于正确的状态。
  • 为节点修复并重新建立数据库复制。
  • 重置数据库复制。

有关这些命令或使用 CLI 的详细信息,请参阅《Cisco Unified Communications 解决方案的命令行界面指南》

验证数据库复制

使用命令行界面 (CLI) 检查群集中所有节点的数据库复制状态。 验证复制设置 (RTMT) 和详细信息的值是否显示为 2。 如果是除 2 以外的其他值,表示数据库复制存在问题,您需要为该节点重置复制。 有关输出的示例,请参阅与数据库复制示例相关的主题。

过程


步骤 1

在第一个节点上输入 utils dbreplication runtimestate,以检查群集中所有节点上的数据库复制。

对于 IM and Presence Service,如果您的部署中有多个节点,则在数据库发布方节点上输入命令。

提示

 

如果没有为群集中的节点设置复制,您可以使用 CLI 重置节点的数据库复制。 有关详细信息,请参阅与使用 CLI 重置数据库复制相关的主题。

示例:

admin: utils dbreplication runtimestate DDB and Replication Services: ALL RUNNING DB CLI Status: No other dbreplication CLI is running... Cluster Replication State: BROADCAST SYNC Completed on 1 servers at: 2013-09-26-15-18 Last Sync Result: SYNC COMPLETED 257 tables sync'ed out of 257 Sync Errors: NO ERRORS DB Version: ccm9_0_1_10000_9000 Number of replicated tables: 257 Repltimeout set to: 300s Cluster Detailed View from PUB (2 Servers): PING REPLICATION REPL. DBver& REPL. REPLICATION SETUP SERVER-NAME IP ADDRESS (msec) RPC? STATUS QUEUE TABLES LOOP? (RTMT) & details ----------- ------------ ------ ---- ----------- ----- ------ ----- ----------------- server1 100.10.10.17 0.052 Yes Connected 0 match Yes (2) PUB Setup Completed server2 100.10.10.14 0.166 Yes Connected 0 match Yes (2) Setup Completed

步骤 2

验证输出。

输出应显示每个节点的复制状态为已连接,并且复制设置值为 (2) 设置完成。 这意味着群集中的复制网络运行正常。 如果输出结果不同,请继续进行故障诊断并修复数据库复制。


数据库复制 CLI 输出示例

以下列表显示了当您在群集的第一个节点上运行 utils dbreplication runtimestate 命令行界面 (CLI命令时,Replicate_State 的可能值。

对于 IM and Presence Service,如果您的部署中有多个节点,则在数据库发布方节点上输入命令。

  • 0 - 复制未启动。 订阅方不存在,或自从订阅方安装后没有运行过数据库层监控服务。

  • 1 - 复制已创建,但其计数不正确。

  • 2 - 复制正常工作。

  • 3 - 群集中的复制有错误。

  • 4 - 复制设置失败。



验证复制设置 (RTMT) 和详细信息的值是否显示为 2 非常重要。 如果是除 2 以外的其他值,表示数据库复制存在问题,您需要重置复制。 有关解决数据库复制问题的信息,请参阅与数据库复制故障诊断相关的主题。


Cisco Unified Communications Manager 节点 CLI 输出示例

在本例中,复制设置 (RTMT) 和详细信息的值显示为 2。 复制正常工作。

admin: utils dbreplication runtimestate Server Time: Mon Jun 1 12:00:00 EDT 2013 Cluster Replication State: BROADCAST SYNC Completed on 1 servers at: 2013-06-01-12-00 Last Sync Result: SYNC COMPLETED on 672 tables out of 672 Sync Status: NO ERRORS Use CLI to see detail: 'file view activelog cm/trace/dbl/2013_06_01_12_00_00_dbl_repl_output_Broadcast.log' DB Version: ccm10_0_1_10000_1 Repltimeout set to: 300s PROCESS option set to: 1 Cluster Detailed View from uc10-pub (2 Servers): PING Replication REPLICATION SETUP SERVER-NAME IP ADDRESS (msec) RPC? Group ID (RTMT) & Details ----------- ---------- ------ ---- ----------- ------------------- uc10-pub 192.0.2.95 0.040 Yes (g_2) (2) Setup Completed uc10-sub1 192.0.2.96 0.282 Yes (g_3) (2) Setup Completed
IM and Presence Service 节点 CLI 输出示例

在本例中,复制设置 (RTMT) 和详细信息的值显示为 2。 复制正常工作。

admin: utils dbreplication runtimestate Server Time: Mon Jun 1 12:00:00 EDT 2013 DB and Replication Services: ALL RUNNING Cluster Replication State: Replication status command started at: 2012-02-26-09-40 Replication status command COMPLETED 269 tables checked out of 269 No Errors or Mismatches found. Use 'file view activelog cm/trace/dbl/sdi/ReplicationStatus.2012_02_26_09_40_34.out' to see the details DB Version: ccm8_6_3_10000_23 Number of replicated tables: 269 Cluster Detailed View from PUB (2 Servers): PING REPLICATION REPL. DBver& REPL. REPLICATION SETUP SERVER-NAME IP ADDRESS (msec) RPC? STATUS QUEUE TABLES LOOP? (RTMT) & details ----------- ------------ ------ ---- ----------- ----- ------- ----- ----------------- gwydla020218 10.53.46.130 0.038 Yes Connected 0 match Yes (2) PUB Setup Completed gwydla020220 10.53.46.133 0.248 Yes Connected 128 match Yes (2) Setup Completed

修复数据库复制

使用命令行界面 (CLI) 修复数据库复制。

过程


步骤 1

在第一个节点上输入 utils dbreplication repair all 修复所有,以尝试修复数据库复制。

对于 IM and Presence Service,如果您的部署中有多个节点,请从数据库发布方节点修复数据库复制状态。

根据数据库的大小,可能需要几分钟的时间来修复数据库复制。 继续执行下个步骤,以监控数据库复制修复的进度。

示例:

admin:utils dbreplication repair all -------------------- utils dbreplication repair -------------------- Replication Repair is now running in the background. Use command 'utils dbreplication runtimestate' to check its progress Output will be in file cm/trace/dbl/sdi/ReplicationRepair.2013_05_11_12_33_57.out Please use "file view activelog cm/trace/dbl/sdi/ReplicationRepair.2013_05_11_12_33_57.out " command to see the output

步骤 2

在第一个节点上输入 utils dbreplication runtimestate,以检查复制修复的进度。

对于 IM and Presence Service,如果您的部署中有多个节点,则在数据库发布方节点上输入命令。

复制输出示例中的粗体文本高亮显示复制修复的最终状态。

示例:

admin:utils dbreplication runtimestate DB and Replication Services: ALL RUNNING Cluster Replication State: Replication repair command started at: 2013-05-11-12-33 Replication repair command COMPLETED 269 tables processed out of 269 No Errors or Mismatches found. Use 'file view activelog cm/trace/dbl/sdi/ReplicationRepair.2013_05_11_12_33_57.out' to see the details DB Version: ccm8_6_4_98000_192 Number of replicated tables: 269 Cluster Detailed View from PUB (2 Servers): PING REPLICATION REPL. DBver& REPL. REPLICATION SETUP SERVER-NAME IP ADDRESS (msec) RPC? STATUS QUEUE TABLES LOOP? (RTMT) & details ----------- ------------ ------ ---- ----------- ----- ------ ----- ----------------- server1 100.10.10.17 0.052 Yes Connected 0 match Yes (2) PUB Setup Completed server2 100.10.10.14 0.166 Yes Connected 0 match Yes (2) Setup Completed
  1. 如果复制修复运行完成而没有任何错误或不匹配,请运行该程序以再次验证节点名称是否更改,确认现在是否已正确复制新节点名称。

  2. 如果发现错误或不匹配,节点之间可能存在瞬态不匹配。 再次运行该程序以修复数据库复制。

 

如果在多次尝试修复复制后,系统报告不匹配或错误,请与您的 Cisco 支持代表联系解决此问题。

步骤 3

在第一个节点上输入 utils dbreplication reset all,以尝试重新建立复制。

对于 IM and Presence Service,如果您的部署中有多个节点,则在数据库发布方节点中输入命令。

根据数据库的大小,完全重新建立复制可能需要几分钟到一个小时以上的时间。 继续执行下个步骤,以监控数据库复制重新建立的进度。

示例:

admin:utils dbreplication reset all This command will try to start Replication reset and will return in 1-2 minutes. Background repair of replication will continue after that for 1 hour. Please watch RTMT replication state. 此值应 0 到 2 之间的值。当所有子节点的 RTMT Replicate State 为 2 时,复制就完成了。 If Sub replication state becomes 4 or 1, there is an error in replication setup. Monitor the RTMT counters on all subs to determine when replication is complete. Error details if found will be listed below OK [10.53.56.14]

步骤 4

在第一个节点上输入 utils dbreplication runtimestate,以监控尝试重新建立数据库复制的进度。

对于 IM and Presence Service,如果您的部署中有多个节点,则在数据库发布方节点上输入命令。

当所有节点的复制状态都显示为已连接且复制设置值为 (2) 设置完成时,系统会视为已重新建立复制。

示例:

admin: utils dbreplication runtimestate DDB and Replication Services: ALL RUNNING DB CLI Status: No other dbreplication CLI is running... Cluster Replication State: BROADCAST SYNC Completed on 1 servers at: 2013-09-26-15-18 Last Sync Result: SYNC COMPLETED 257 tables sync'ed out of 257 Sync Errors: NO ERRORS DB Version: ccm9_0_1_10000_9000 Number of replicated tables: 257 Repltimeout set to: 300s Cluster Detailed View from newserver100 (2 Servers): PING REPLICATION REPL. DBver& REPL. REPLICATION SETUP SERVER-NAME IP ADDRESS (msec) RPC? STATUS QUEUE TABLES LOOP? (RTMT) & details ----------- -------------- ------ ---- ----------- ----- ------ ----- ----------------- server1 100.10.10.201 0.038 Yes Connected 0 match Yes (2) PUB Setup Completed server2 100.10.10.202 0.248 Yes Connected 0 match Yes (2) Setup Completed server3 100.10.10.203 0.248 Yes Connected 0 match Yes (2) Setup Completed server4 100.10.10.204 0.248 Yes Connected 0
  1. 如果复制已重新建立,请运行该程序以再次验证节点名称是否更改,确认现在是否已正确复制新节点名称。

  2. 如果复制没有恢复,请与您的 Cisco 支持代表联系以解决此问题。

小心

 

如果数据库复制中断,请不要继续此操作之后的步骤。


重置数据库复制

如果没有为群集中的节点设置复制,请重置数据库复制。 您可以使用命令行界面 (CLI) 重置数据库复制。

开始之前

检查群集中所有节点的数据库复制状态。 验证复制设置 (RTMT) 和详细信息的值是否显示为 2。 如果是除 2 以外的其他值,表示数据库复制存在问题,您需要为该节点重置复制。

过程


步骤 1

在群集中的节点上重置复制。 执行下列操作之一:

  1. 对于 Unified Communications Manager,请输入 utils db replication reset all

    在任何 Cisco Unified Communications Manager 节点上运行此 CLI 命令之前,先在重置的所有订阅方节点上运行命令 utils dbreplication stop,然后在发布方服务器上运行。 有关详细信息,请参阅《Cisco Unified Communications 解决方案的命令行界面指南》

  2. 对于 IM and Presence Service,在所有数据库发布方节点上输入 utils db replication reset all,以重置群集中的所有 IM and Presence Service 节点。

提示

 

您可以输入特定的主机名,而不是 all,仅重置该节点上的数据库复制。 有关详细信息,请参阅《Cisco Unified Communications 解决方案的命令行界面指南》

步骤 2

输入 utils dbreplication runtimestate 以检查数据库复制状态。

对于 IM and Presence Service,在 IM and Presence 数据库发布方节点上运行 CLI 命令

网络故障诊断

您可以使用命令行界面 (CLI) 对节点上的网络问题进行故障诊断。

过程


步骤 1

输入 show network eth0 [detail] 验证网络配置。

步骤 2

如果任何字段缺失,则重置网络接口。

  1. 输入 set network status eth0 down

  2. 输入 set network status eth0 up

步骤 3

验证 IP 地址、掩码和网关。

确保这些值在整个网络中是唯一的。

Network Time Protocol troubleshooting

对订阅方节点上的 NTP 进行故障诊断

您可以使用命令行界面 (CLI) 对订阅方节点上的网络时间协议 (NTP) 问题进行故障诊断。

过程


步骤 1

输入 show network eth0 [detail] 验证网络配置。

步骤 2

输入 utils ntp status 验证 NTP 状态。

步骤 3

输入 utils ntp restart 重新启动 NTP。

步骤 4

输入 show network cluster 验证网络群集。

如果输出显示不正确的发布方信息,请使用 set network cluster publisher [hostname/IP_address] CLI 命令重置发布方。


对发布方节点上的 NTP 进行故障诊断

您可以使用命令行界面 (CLI) 对发布方节点上的网络时间协议 (NTP) 问题进行故障诊断。

过程

  命令或操作 目的

步骤 1

输入 show network eth0 [detail] 验证网络配置。

步骤 2

输入 utils ntp status 验证 NTP 状态。

步骤 3

输入 utils ntp restart 重新启动 NTP。

步骤 4

输入 utils ntp server list 验证 NTP 服务器。

要添加或删除 NTP 服务器,请使用 utils ntp server [add/delete] CLI 命令。