语音和统一通信 : Cisco Unified Communications Manager (CallManager)

排除故障在Cisco Unified Communications Manager的NTP

2015 年 8 月 28 日 - 机器翻译
其他版本: PDFpdf | 英语 (2015 年 4 月 23 日) | 反馈

简介

本文描述如何排除故障在Cisco Unified Communications Manager (CUCM)和Cisco Unified通信(UC)产品的网络时间协议(NTP)问题。

贡献用Vasanth库马尔K, Cisco TAC工程师。

背景信息

CUCM要求NTP配置为了保证:

  • 计时在CUCM节点同步。
  • 时间在所有时间敏感的配置更改之前是正确例如证书重新生成。
  • 数据库复制在集群的所有节点同步。

在UC产品的NTP轮询机制

CUCM使用NTP监视器为了保持时间同步与Ntp server。如果时刻在超过三秒之前,抵消NTP监视器周期地轮询已配置的外部NTP服务器并且重新启动NTP。

NTP守护程序有规律地正确时间,但是在一毫秒时间表。NTP重新启动介入您运行一次的NTP为了进行一个总时间更正和跟随与NTP守护程序的重新启动继续正常简单更正的。

NTP监视器一次轮询NTP在VMware的一分钟和一次在物理机器的每30分钟。轮询间隔为VMware是短,因为在虚拟机(VMs)的时钟较不稳定的比在物理机器和VMware功能例如VMotion,存储设备迁移相反影响时间。

在VMware运行的主节点必须总是配置为了与在物理计算机在VM运行补尝高度时间偏差或延迟的外部NTP服务器使同步。附属节点总是自动地配置参考主节点Ntp server为了保证在集群内的所有节点及时是接近的。

NTP监视器记录重新启动总时间更正的NTP守护程序由于VMWare VMotions和存储设备迁移的速率。如果此速率超出每个小时10重新启动, NTP监视器延期进一步重新启动,直到需要的速率重新启动下降在10以下每个小时。因为此速率被认为额外,复合速率VMotions和存储设备迁移不应该超过10每个小时。

因此NTP监视器实施,您不跟随投票间隔,在使用情况ntp状态被看到。嗅探器捕获显示了8 NTP投票(示例)每60秒。这是主要,因为NTP实施使用NTP监视器,并且ntpdate如何轮询在UC实施的Ntp server。

确定使用的NTP版本

注意:CUCM发行商配置与一外部Ntp server,并且用户被添加到集群同步给发行商。

注意:CUCM版本9.x和以上要求NTPv4服务器配置作为首选的Ntp server。

运行嗅探器捕获为了确定已配置的Ntp server使用的NTP版本:

admin:utils network capture port 123

Executing command with options:
size=128 count=1000 interface=eth0
src=dest= port=123
ip=

16:03:03.689725 IP cucmlab.cisco.local.34063 > linux.local.ntp: NTPv4,Client, length 48

16:03:03.690174 IP linux.local.ntp > cucmlab.cisco.local.34063: NTPv3,Server, length 48

CUCM发送NTPv4数据包,并且在答复您收到NTPv3数据包。虽然NTPv4是向后兼容的对NTPv3, NTP的CUCM实施变化,导致不同步NTP :

admin:utils ntp status

ntpd (pid 22458) is running...

remote refid st t when poll reach delay offset jitter
=================================================================
172.28.5.9 .INIT. 2 u 45 64 377 0.374 492.965 18.189


unsynchronised
time server re-starting
polling server every 64 s

为了调整问题,思科推荐您使用一基于linux的外部Ntp server或Cisco IOS或者IOS基于XE的Ntp server并且保证NTPv4配置。

这是NTP术语的说明在NTP状态输出中:

  • refid列指示远程的时间源。LOCAL(0)是本地硬件时钟。.INIT意味着初始化未成功。

  • st列是远程Ntp server的层。16是含义的一个无效层值“此服务器没有认为时间供应商”。层可以由于多种原因无效,最普通哪些是没同步的“时间供应商”, “已配置的来源不存在”,或者不运行“的ntp server”。

  • t列指示服务器类型(l :本地;u :单播;m :组播或者b :广播)。

  • 列指示多少秒钟前远程被查询了。

  • 投票列以秒钟指示轮询间隔。例如, "64"含义远程轮询每64秒。最短的间隔NTP用途是每64秒,并且最长是1,024秒。越好Ntp source随着时间的推移对估计,越长间隔。(UC实施不跟随定义的间隔此处。)

  • 伸手可及的距离列指示可达性测试趋势在八的,其中每个位,当转换对二进制,代表一特定的投票是否是成功的(二进制1)或不成功(二进制0)。例如, "1"含义仅一投票至今完成,并且是成功的。"3" (=二进制11)含义最后两投票是成功的。"7" (=二进制111)含义最后三投票是成功的。"17" (=二进制1 111)含义最后四投票是成功的。"15" (=二进制1 101)含义最后两投票是成功的,在那之前的投票不成功,并且在那之前的投票是成功的。

  • 延迟偏移量抖动列是往返延迟、散射和抖动以毫秒。

诊断在CUCM的NTP相关问题

完成这些步骤为了诊断NTP相关问题:

  1. 保证CUCM能与在波尔特123的Ntp server联络。

  2. 得到使用情况ntp状态输出。

    • 层次级别少于4应该是在最佳性能的发行商
    • 如果多个NTP服务器配置,请保证至少在服务器可及的;您应该看到(*)符号作为参考使用的Ntp server由CUCM。


  3. 查看Syslog报警并且相应地采取行动。Syslog报警的可能原因是:

    • 外部Ntp server不可及的。
    • NTP层高于可接受限制。
    • 发行商发生故障,因此用户NTP是不同步的。
    • 如果ntpdate - q涉及警报被看到,它是可能的您有与必败之事的NTP版本4.2.6+启用的(KoD)功能。(故意地,在突发流量之间的最低的间隔和由所有客户端的iburst发送的数据包是两,不违犯此限制条件。由违犯此限制条件将丢弃的其他实施的发送的数据包和返回的KoD数据包,如果已启用)。当您使用该版本作为Ntp server UC产品时,推荐禁用此功能。


  4. 请使用此诊断模块为了验证Ntp server配置。

    • 使用情况诊断模块ntp_reachability
    • 使用情况诊断模块ntp_clock_drift
    • 使用情况诊断模块ntp_stratum


  5. 回车使用情况ntp重新启动为了重新启动客户端/服务器的NTP。此命令是有用的,每当一个总时间更正需要立即发生或,每当外部服务器是可及的和可操作的,但是同步发生故障。请使用status命令的使用情况ntp为了确定外部NTP服务器运行状态。

与NTP关联的普通的已知问题CUCM的

Cisco Bug ID CSCue18813 :NTP配置“tos通过CLI被控制的maxdist”参数

解决方法:应该提出Cisco技术支持中心盒为了手工添加在ntp.conf文件的tos maxdist参数。

Cisco Bug ID CSCuq70611 :NTP层测验不适当地验证与单个Ntp server

修正版本:10.5(2.10000.005)

Cisco Bug ID CSCui85967 :CUCM从6.1.5的跃迁升级到9.1.2发生故障由于NTP参考丢失

解决方法:跃迁升级文档更新,并且NTP配置列出作为预升级任务。

Cisco Bug ID CSCtw46611 : NTP同步发生故障由于不正确文件系统标记capture.txt

修正版本:8.6(2.24900.017)

Cisco Bug ID CSCur94973 : 时间同步问题betn VMHost & VM实例在M1迁移时

解决方法: 禁用VM的NTP同步用有使用的ESXi主机此应急方案。备选应急方案是配置ESXi服务器和CUCM发行商指向同样Ntp server。 


相关的思科支持社区讨论

思科支持社区是您提问、解答问题、分享建议以及与工作伙伴协作的论坛。


Document ID: 118718