简介
本文档介绍用于排除思科网真多点控制单元(MCU)产品故障的步骤。本文档针对视频系统管理员和客户为视频系统管理员的思科合作伙伴编写。
MCU产品系列是行业领先的多媒体会议产品。它们是复杂的嵌入式系统,采用思科设计的硬件来提供最佳性能。本文档旨在帮助解决可能由思科MCU产品硬件故障引起的任何情况。必须由思科技术支持工程师提供制造授权退货(RMA),工程师会根据可疑组件验证产品是否确实未通过一系列测试。本指南旨在通过深入了解这些测试来加速此过程。
先决条件
要求
Cisco 建议您了解以下主题:
- 思科网真MCU MSE系列
- 思科网真 MCU 5300 系列
- 思科网真 MCU 4500 系列
- 思科网真 MCU 4200 系列
- 思科网真ISDN网关(GW)系列
使用的组件
本文档中的信息基于思科网真MCU媒体服务引擎(MSE)系列。
本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。
相关产品
本文档也可用于以下硬件和软件版本:
- 思科网真服务器7010
- 思科网真 MCU 5300 系列
- 思科网真 MCU 4500 系列
- 思科网真 MCU 4200 系列
- 思科网真ISDN网关系列
思科网真MCU MSE系列RMA核对表
本节介绍一些更基本的检查,这些检查用于确认您的MCU MSE系列刀片是否运行正常,并且不会出现硬件故障。完成这些检查后,应记录MCU行为。
在MCU上完成快速检查
本部分提供一份核对表,您可以使用该核对表来排除通过MCU Web界面进行的基本配置故障。此过程通过验证H.323设置、自动总机、端口许可证使用和环回呼叫来完成。
验证刀片是否可以进行视频呼叫。如果MCU的Web界面可以访问,并且可以进行呼叫,则它从根本上是功能性的。请完成以下步骤:
- 打开Web浏览器并导航至MCU IP地址。主页必须立即显示。
注意:如果网页无法访问,请参阅本文档的检查MCU网络连接部分。
- 单击Status链接以检查当前在MCU上运行的软件版本。
注意:如果当前使用的版本低于4.3版,建议您查看最新版本说明并考虑升级。
- 如果您能够访问Web界面,请完成以下步骤:
- 导航至Settings > H.323,并将H.323网守用法设置为Disabled。此步骤非常重要,因为某些网守会阻止从MCU直接呼叫IP地址。
- 导航至设置>会议>高级设置,并确保将传入呼叫设置为未知会议或自动话务员,设置为默认自动话务员。
- 创建新会议,并添加IP地址为127.0.0.1的H.323参与者。这会导致MCU回拨到其自己的自动总机(AA)。 AA屏幕显示在预览缩略图中,并且音频和视频编解码器在每个方向上协商。
以下是MCU MSE 8510屏幕的示例,MCU可以成功调用自身:

如果此操作有效,并且看到连接的参与者(类似于上一映像),则很可能存在网守、网络或终端互操作性问题。拨打实际终端,然后使用事件日志和H323/会话初始协议(SIP)日志进行故障排除。如果连接立即失败,但Web界面仍然有效,请继续执行此步骤。
- 要验证端口许可证是否已分配给MCU,请转至Supervisor刀片的端口许可证管理部分。下图显示了从Supervisor MSE 8050刀片分配的端口许可证:

在图像中,插槽4下的空块显示,此插槽中有一个刀片,没有为其分配端口许可证。此刀片无法进行呼叫,因此步骤3中描述的环回测试在此刀片上会失败。插槽2、3、5和7下的蓝色块显示,这些插槽已完全分配了端口许可证。如果插槽显示警告符号,则插槽中没有刀片。半蓝色块表示刀片已分配了一些端口许可证,但不表示其容量已满。这样的刀片无法连接其通告的端口总数,直到其分配了更多许可证。
- 如果没有为刀片分配端口许可证(联机帮助中介绍了此过程)。 如果没有端口许可证的密钥,请联系您的客户经理。
注意:如果呼叫失败,即使刀片具有足够的端口许可证,请参考本文档的“Web界面上的访问MCU”部分。如果Web界面在此测试期间变得不可用,并且与刀片的联系丢失,则刀片可能已重新启动;检索刀片诊断日志,然后联系思科技术支持。
检查MCU网络连接
使用本部分根据网络连接和网络配置的验证,排除尝试从浏览器连接到MCU Web界面的问题。
当您尝试从浏览器连接到MCU Web界面时,可能会遇到以下问题之一:
- PC与MCU之间的网络问题
- MCU本身(网络接口卡(NIC)、硬件或配置)出现问题
请完成以下步骤以排除故障:
- 尝试ping MCU的IP地址。
注意:NetBSD产品的最大大小为76字节。大多数路由器的默认值为100字节。
如果MCU响应ping,但Web界面关闭,则MCU可能无法完全启动,或者可能被锁定到重新启动循环中。如果是,请参考本文档的刀片上的物理检查部分。如果MCU未响应ping,请继续执行此步骤。
- 导航至包含MCU MSE 8510刀片的机箱的Supervisor MSE 8050刀片的Web界面。如果无法访问Supervisor刀片用户界面,请联系您的本地网络管理员以调查可能的网络问题。如果可以访问Supervisor刀片用户界面,并且Supervisor和MCU不在不同的网络中,则可能是刀片或其IP设置有问题。
- 从Supervisor刀片用户界面,导航至硬件,然后单击MCU MSE 8510刀片的插槽编号链接。然后,单击“Port A(端口A)”选项卡。
- 检查MCU端口A IP配置,确认网络上没有其他主机分配了相同的IP地址。重复的IP地址是一个非常常见的问题。如有必要,请咨询网络管理员以验证这些设置。
- 检查端口A以太网状态部分。如果链路状态为up,请检查网络电缆是否已连接到交换机。电缆或交换机端口可能有问题。
- 如果MCU现在可在网络上访问,请重复此步骤的第一步。如果IP地址设置正确且以太网链路状态为up,但刀片仍无法从网络上的任何位置联系,请参阅本文档的通过Supervisor检查MCU MSE 8510系列刀片部分。
通过Supervisor检查MCU MSE 8510系列刀片
要检查MCU刀片和会议状态、运行状况和正常运行时间、软件版本、温度和电压报告,请完成以下步骤:
- 单击Hardware,然后单击出现问题的刀片的插槽编号。摘要页面提供有关以下内容的信息:
- 刀片状态,包括IP地址、正常运行时间、序列号和软件版本
- 刀片健康,带温度、电压和实时时钟(RTC)电池
- 活动会议的“报告”状态、参与者数量、使用中的音频/视频端口和流查看器
此图显示了刀片运行状况部分:

- 如果任何电压状态(电流或更差)未显示OK,请确保电源架中安装了足够的整流器,以便为机箱供电。此外,请检查电源是否符合机箱的当前要求,如计算MSE 8000 Cisco的功率和当前要求文章。
- 如果电源调配未显示“OK(正常)”,请联系Cisco技术支持。
- 如果“刀片运行状况”部分中的任何其他当前状态未显示为“OK”,请联系Cisco技术支持。
- 如果所有“当前”状态都显示OK,但一个或多个“Worst status seen”未显示OK,请从主管获取事件日志和警报日志,然后与Cisco技术支持联系。
- 检查正常运行时间。如果正常运行时间意外短(不到30分钟),并且没有已知原因(例如,如果未重新通电或刀片未重新拔插),则刀片可能最近已重新启动。重新启动的原因可能是软件缺陷或硬件问题。这取决于它是一次性重启还是周期性重启。
要确定此项,请完成以下步骤:
- 等30分钟。
- 刷新页面。
- 再次检查正常运行时间。
如果可以根据刷新的正常运行时间确定刀片随后已重新启动,请参阅本文档的崩溃部分。
- 如果在您检查状态页面后刀片未重新启动,并且它在其他方面(通过验证网络设置和端口许可证)都显示正常,则刀片可能已启动,但没有任何可用的数字信号处理器(DSP)资源。
要验证此情况,请完成以下步骤:
- 从Supervisor用户界面检查刀片摘要页面上的报告状态部分:

- 刀片显示其成功启动和许可的视频资源总数。这必须等于分配给刀片的端口许可证数量,当刀片处于高清(HD)/HD+模式时最多20个,当刀片处于标清(SD)模式时最多80个。如果这些不相等,请联系思科技术支持,了解已记录的行为、版本和诊断日志。
刀片上的物理检查
本节介绍根据LED光解释和刀片移动到不同插槽时对刀片执行物理检查所用的步骤。
如果在完成上述各节介绍的步骤后无法确定刀片是否存在硬件问题,请实际检查MSE 8000系列机箱。要执行物理检查,请完成以下步骤:
- 确保在您初次接通机箱电源后,为刀片提供足够的时间进行启动(或将刀片安装到已通电的机箱中)。 这大约需要20分钟。
- 观察并记录刀片正面照明的LED灯的颜色。重要的LED指示灯为:
- 电源(蓝色) — 此灯位于底部塑料卡舌的正上方,在给刀片供电时即会亮起。
- 状态(绿色) — 当刀片成功启动时,此指示灯亮起。
- 警报(红色) — 当刀片正在启动或处于无法启动的状态时,此指示灯会亮起。
- 以太网端口A链路(三个绿色) — 指示灯指示活动、双工和速度。从版本4.4开始,8510仅支持端口A上的连接;不支持端口B、C和D。
此映像显示八个MCU MSE 8510系列刀片已成功引导,一个刀片仍在引导或无法成功引导:

- 如果观察LED指示灯时遇到问题,请完成以下步骤:
- 如果指示灯未点亮,请检查机箱的其余部分是否通电,以及刀片是否正确插入插槽。
- 如果指示灯仍未亮起,请将刀片移至机箱中的其他插槽。优选地,将其与具有已知工作刀片的插槽互换。
- 如果刀片仍未通电,请联系思科技术支持。
- 如果蓝色电源指示灯亮起,且其他指示灯均未亮起,请与Cisco技术支持联系。如果红色警报灯保持亮起超过30分钟,请参考本文档的“崩溃”部分。
- 如果蓝色电源指示灯和绿色状态指示灯亮起,但绿色端口A指示灯未亮起,则无需RMA。这表示与交换机端口的连接有问题。使用新的电缆/交换机端口/交换机,并从Supervisor Hardware选项卡中检查刀片以太网端口A的配置。强烈建议将链路的两端都设置为“自动协商”。
注意:在进行故障排除时,获取串行日志和诊断日志非常重要。当您向思科技术支持部门提交服务请求时,应提供这些服务。
在Web界面上访问MCU
思科网真MCU可通过随设备提供的控制台电缆通过控制台会话进行访问。如果系统无法通过Web界面访问,并且不响应ping请求,则可以打开到设备的控制台会话,以便通过检查已启用的服务、端口配置和状态来排除故障。
如果系统不能ping通,或者为系统分配IP地址后无法导航至Web界面,请完成以下步骤以到达MCU:
- 验证设备正面未亮起红色报警灯。如果设备通电超过20分钟,红色警报灯仍亮起,请参阅本文档的崩溃部分。
- 如果设备上的绿色状态指示灯亮起,请通过随设备一起提供的控制台电缆将PC连接到控制台端口。
注意:有关如何完成此步骤的说明,请参阅Cisco购买的Codian设备上的连接到控制台端口文章。
- 要验证连接的终端会话是否已实际连接,请按Enter键几次,然后出现提示。显示的提示符显示您的设备(例如,IPGW:>、ISDNGW:>或MCU:>):

- 要验证HTTP和/或HTTPS服务是否已启用,请输入service show 命令:

- 要验证设备上的链路状态,请输入status命令:

- 如果端口A上未显示链路,请尝试将以太网电缆连接到端口B,以便查看链路状态是否发生变化:

- 如果端口B能够检测到链路,但端口A不能,请完成以下步骤,以再次检查端口A上的IP配置:
- 如果端口A似乎没有问题,则尝试执行reset_config过程,以使设备恢复出厂默认设置。
注意:有关此步骤的详细信息,请参阅重置密码并将设备恢复为出厂设置思科文章。
- 完成出厂重置过程后,在端口上重新配置静态IP地址。
- 如果仍然遇到问题,请从控制台重新启动系统,并通过所使用的终端客户端将引导输出收集到文本文件中:

MCU MSE 8510系列刀片和MCU MSE 8710系列刀片显示两个以太网接口为vfx0和vfx1。机架安装系统(MCU 4500系列和4200系列,IPGW 3500系列和ISDN GW 3241系列)将其以太网接口显示为bge0 和bge1。
- 在MCU MSE 8510和8710系列刀片上,验证已分配MAC地址,并且vfx0和/或vfx1没有任何问题。
- 在机架安装设备上,您可能会看到下一个映像中所示的输出bge0,它表示设备上出现网络接口卡(NIC)故障。这表示未检测到物理层。如果发现此问题,请联系思科技术支持。

- 如果交换端口后未显示链路,请检验网络连通性。理想情况下,输出应如下图所示,并显示所有IP信息。这表示设备上的IP设置已正确配置。
注意:出于安全原因,IP地址信息在图像中被遮掩。

- 更改设备的IP地址,以发现网络中任何IP地址集的问题。
- 将以太网电缆移到单独的交换机端口,以消除任何交换机端口问题。
- 如果交换机端口问题消除,请通过交叉电缆将笔记本电脑直接连接到设备,并使用该子网中包含的相同子网掩码、默认网关和IP地址配置笔记本电脑。
- 在笔记本电脑上配置IP地址后,从笔记本电脑向设备发送ping。尝试从笔记本电脑访问设备的Web界面。此外,尝试通过ping命令从设备控制台会话向笔记本电脑IP地址发送ping。如果存在连接和Web访问,则表明存在网络连接问题。否则,以太网端口引脚可能已损坏,您应联系思科技术支持。
崩溃
思科网真MCU产品崩溃可能是由完全引导失败、持续重启周期或连续会议发生的事件引起的。
如果设备上的红色警报灯保持亮起20分钟以上,则无法导航到设备Web界面,或者无法进行视频呼叫,则设备可能无法完全启动,或者设备陷入重新启动循环。如果出现这种情况,请完成以下步骤以排除故障:
- 拔下设备电源线。如果是刀片,请将其从机箱中移除。
- 等待五分钟,打开设备电源。
- 如果设备无法正常启动,请收集控制台日志,其中显示尝试启动的设备。这是此情况的最佳诊断工具。有关如何获取控制台日志的信息,请参阅Cisco获得的Codian设备上的连接到控制台端口文章。
- 关闭设备,然后打开设备电源。
- 等到输出完全停止或设备重新启动三四次。联系思科技术支持,并提供控制台日志。
排除MSE 8000系列风扇托架、电源整流器和电源架故障
风扇托架、电源整流器和电源架都通过Supervisor MSE 8050系列刀片进行监控。您可以通过Supervisor Web界面排除与这些故障或问题相关的故障。本节介绍通过验证日志和状态来排除风扇、电源架或电源整流器故障所用的步骤。
下图显示了完整的MSE 8000系列机箱:

请注意上图:
- 上部和下部风扇托架
- 插入的刀片
- 单个刀片的特写
- 机架安装
注意:有关如何安装MSE 8000系列机箱的详细信息,请参阅Cisco TelePresence MSE 8000入门指南。
排除MSE 8000系列风扇故障
使用此部分可通过验证Supervisor MSE 8050系列刀片上的警报状态和事件日志来排除MSE 8000系列机箱上的风扇故障。
以下是事件日志中显示上部风扇托架问题的部分:
37804 2012/07/03 18:43:28.567 HEALTH Warning
upper fan tray, fan 3 too slow - 1569 rpm
37805 2012/07/03 18:43:28.567 ALARMS Info
set alarm : 2 / Fan failure SET
37806 2012/07/03 18:43:44.568 ALARMS Info
clear alarm : 2 / Fan failure CLEAR
37807 2012/07/03 18:44:00.569 HEALTH Warning
upper fan tray, fan 3 too slow
当您看到以下错误时,请完成以下步骤以收集所需日志:
- 要下载警报日志文本文件,请导航至“警报”>“警报日志”>“下载为文本”。观察记录此日期的最近日期。
- 要下载事件日志文本文件,请导航至Logs > Event Log > Download as Text。
- 导航至警报>警报状态,然后拍摄警报状态页面的屏幕截图。
- 卸下顶部风扇托架,并验证所有风扇是否工作正常。
- 卸下底部风扇托架,并验证所有风扇是否工作正常。
- 要从Supervisor清除“历史警报”,请导航到警报 > 警报状态 > 清除历史警报。
- 要清除警报日志,请导航到警报> 警报日志> 清除日志。
- 监控,并查看警报是否返回。
- 如果问题再次出现,请将顶部托盘与底部托盘交换,然后确定风扇托盘是否出现问题。如果问题再次出现,并在风扇托架后,请联系思科技术支持,了解您收集的日志。
电源架问题
在MSE 8000系列机箱中,有两个独立的直流电源输入,您可以直接连接到两个直流电源,或者连接到两个将交流电转换为直流电的Valere机架。MSE 8000系列机箱可以使用一个或两个电源架(A和B)运行。这些电源独立供给每个风扇托架和刀片。设备可以从电源A或电源B完全供电。如果任一电源发生故障,设备将继续运行,因为它会从另一电源获取电源。
思科建议,为了实现完全冗余和最大可靠性,电源必须连接到独立电源。每个机架必须具有提供设备和每个机架全部电负载的能力,这些机架包含相同数量的整流器。
下图显示MSE 8000系列DC电源架:

以下是您可能会遇到的两个常见电源架问题:
- 与电源架失去联系 — 当您导航到硬件>电源时,电源A显示与电源架失去联系。这意味着Supervisor MSE 8050系列无法与电源架通信。
- 10/外部电源超出范围SET — 这意味着机箱的输入电压超出规格。通过计算MSE 8000在线工具的功率和电流要求,验证是否为机箱提供了正确的功率和电流。
如果您在执行上述电源和当前验证时没有遇到差异,请检索此信息并联系思科技术支持:
- MSE 8050系列Supervisor配置
- 审核日志
- 警报日志
- 事件日志
- “警报状态”页面的截图
- 机箱中刀片的数量和型号
- 电源的状态
配置电源状态监控
思科建议您配置电源状态监控,以便向视频管理员提供有关日志中显示的任何错误、警告或其他重要信息的可靠反馈。
要启用电源电压监控以及AC-to-DC电源架(如果需要),请完成Cisco TelePresence Supervisor 2.3联机帮助(可打印格式)第61页上的步骤。 在电源状态配置完成后清除日志。
检查从电源架背面到机箱的电源架监控电缆。这是用于电源架监控的专用电缆。检查电缆时要小心,因为它很容易与常规DB9-RJ45控制台电缆混淆。电源架监控电缆标有标有“Power Shelf Rear(电源架后部)”的标签:

MSE 8000系列机箱背面有两对连接器:左侧的线对标记为插槽10,右侧线对标记为插槽1。确保监控电缆连接到插槽1,这是代表MSE 8050系列Supervisor插槽的连接器。
如果电源架监控配置遇到任何问题,请完成以下步骤:
- 将电源架监控电缆从机架A交换到机架B,以确定电缆是否有问题。如果问题出在电缆上,请联系思科技术支持。
- 换用电源架A和电源架B的NIC卡,以确定网卡是否是问题的原因。如果警报返回,且问题出在网卡上,请联系思科技术支持。
下图显示电源架网卡:

电源整流器故障排除
在某些情况下,您可能会遇到其中一个电源整流器的问题。本节介绍如何排除这些问题。
下面是带整流器的电源架的正面图:

电源架的后视图如下:

要解决电源整流器的问题,请完成以下步骤:
- 如果整流器上出现错误,请重新安装该整流器,然后等待查看该错误是否仍然出现(整流器是热插拔的)。
- 如果几分钟后仍出现错误,请将整流器插入电源架A或B的不同插槽中,以确定问题出在整流器还是电源架插槽上。
- 如果您仍然遇到问题,请联系思科技术支持并提供以下信息:
- 整流器报警状态图
- 整流器的序列号(位于整流器右侧的任一位置)
- “电源”页面的截图(“硬件”>“电源”)
- 运行状况页面的截图(状态>运行状况)
- 审核日志
- 警报日志
- 事件日志
排除思科网真ISDN GW问题
思科网真ISDN GW通过ISDN在IP和ISDN网络之间提供无缝集成,并实现完全的功能透明。本节介绍如何排除DSP上的ISDN PRI接口和缓冲区故障。
PRI第1层和第2层下
使用本部分对ISDN GW上的PRI接口问题进行故障排除。PRI端口可以使用环回插头进行检查,以确定其是否有故障:
- 第1层(L1)表示物理层或PRI连接。
- 第2层(L2)用于信令。
您可以使用环回电缆来确定ISDN GW上PRI端口的L1状态。将引脚1连接到引脚4,引脚2连接到引脚5,以创建环回电缆。

将环回电缆插入端口1,并检查L1的状态。如果端口1上的L1状态显示为Up,则问题可能是由使用的电缆引起的。您可以在线路的下方使用环回电缆来隔离问题。
如果端口1上的L1状态随环回电缆显示Down,请为ISDN GW上的PRI启用端口2。使用环回电缆测试端口2。如果特定端口仍然存在问题,则可能存在PRI端口故障。请与 Cisco 技术支持联系。
乒乓错误和DSP超时
DSP上有两个缓冲区,称为Ping和Pong。每个缓冲区一次处理十毫秒的数据(一个ISDN帧)。其目的是在读取下一个缓冲区时处理一个缓冲区。如果这两个缓冲区彼此不同步,它们会交换以尝试重新同步。
以下是思科网真ISDN GW事件日志中的一个示例,其中缓冲区失去同步并尝试更正它们:
14031 2012/02/29 13:03:05.143 dspapi Warning DSP(05):
"Ping Pong buffer returned to sync 0, 11111111"
14032 2012/02/29 13:03:05.399 dspapi Error DSP(05):
"Ping Pong buffer out of sync 1, 11111111"
14033 2012/02/29 13:03:05.399 dspapi Info DSP(05):
"Attempt to correct Ping Pong buffer sync"
14034 2012/02/29 13:03:05.400 dspapi Warning DSP(05):
"Ping Pong buffer returned to sync 0, 11111111"
14035 2012/02/29 13:03:05.856 dspapi Error DSP(05):
"Ping Pong buffer out of sync 1, 11111111"
14036 2012/02/29 13:03:05.856 dspapi Info DSP(05):
"Attempt to correct Ping Pong buffer sync"
14037 2012/02/29 13:03:05.862 dspapi Warning DSP(05):
"Ping Pong buffer returned to sync 0, 11111111"
14064 2012/02/29 13:03:21.626 dspapi Info DSP(04):
"receive from local primary dsp timeout"
14065 2012/02/29 13:03:21.626 dspapi Info DSP(03):
"receive from local primary dsp timeout"
14066 2012/02/29 13:03:21.638 dspapi Info DSP(15):
"receive from peer primary dsp timeout (rx)"
以下是需要考虑的一些问题:
- 为什么它们会不同步?
- 无效帧、故障ISDN时钟或不可靠PRI是否可能导致问题?
以下是要收集的信息列表:
- 有多少个PRI连接到此GW?
- 所有PRI是来自同一台交换机还是来自不同的交换机?
- 如果所有PRI都已拔掉并且系统重新启动,错误是否继续?收集显示这些错误的控制台日志。
- 如果仅连接了PRI 1,是否返回错误?
- 如果仅连接了PRI 2,是否返回错误?对所有PRI重复,一次一个。
如果使用来自不同交换机的PRI,则PRI时钟必须同步(来自同一电信公司的PRI通常是同步的)。 一台交换机的PRI的时钟可能与另一台交换机上PRI的时钟完全不同步。如果只连接了一个PRI,并且似乎正常,则从一台交换机连接一个PRI,从另一台交换机连接一个PRI,重新启动系统,并查看错误是否返回。记录您的测试和行为,以便根据需要提供给思科技术支持。
相关信息