Voz y Comunicaciones unificadas : Cisco Unified Communications Manager (CallManager)

Problemas comunes CUCM en la plataforma UCS: Base, CPU elevada - Entrada-salida, estado bloqueado

17 Octubre 2016 - Traducción Automática
Otras Versiones: PDFpdf | Inglés (22 Agosto 2015) | Comentarios

Introducción

Este documento describe cómo resolver problemas cinco escenarios del problema común encontrados con el administrador de las Comunicaciones unificadas de Cisco (CUCM) en la plataforma del sistema de la Computación unificada (UCS).

Algunas de las causas comunes son:

  • Falla del disco rígido
  • Falla del controlador de la Matriz redundante de discos independientes (RAID)
  • Error de la unidad de backup de batería (BBU)

Contribuido por Sivakumar Shanmugam, ingeniero de Cisco TAC.

Escenario 1: CPU elevada utilización debido a al problema de la espera entrada-salida

Síntomas

Los servicios informáticos del Cisco Call Manager (CCM) y de Integración de telefonía de computadora (CTI) recomienzan debido a la base de CCM CTI.

Cómo verificar

Trazas CUCM

Utilice estos comandos CLI para recoger las trazas CUCM:

  • muestre el proceso usando-más la CPU
  • show status
  • lista del active de la base del utils
  • la base uso analiza la salida más <latest, dura el output> dos

Examine estos registros de la herramienta del monitoreo en tiempo real (RTMT):

  • CCM detallado
  • CTI detallado
  • Recopilador de datos PerfMonLogs del servidor de información en tiempo real (RI)
  • Registros de la aplicación del visor de eventos
  • Registros del sistema del visor de eventos

Ejemplo de Salida

Aquí está una cierta salida de muestra:

admin:utils core active list
Size Date Core File Name
===============================================
355732 KB 2014-X-X 11:27:29 core.XXX.X.ccm.XXXX
110164 KB 2014-X-X 11:27:25 core.XXX.X.CTIManager.XXXX
admin:util core analyze output 

====================================
CCM service backtrace
===================================
#0 0x00df6206 in raise () from /lib/libc.so.6
#1 0x00df7bd1 in abort () from /lib/libc.so.6
#2 0x084349cb in IntentionalAbort (reason=0xb0222f8 "CallManager unable to process
signals. This may be due to CPU or blocked function. Attempting to restart
CallManager.") at ProcessCMProcMon.cpp:80
#3 0x08434a8c in CMProcMon::monitorThread () at ProcessCMProcMon.cpp:530
#4 0x00a8fca7 in ACE_OS_Thread_Adapter::invoke (this=0xb2b04270) at OS_Thread_
Adapter.cpp:94
#5 0x00a45541 in ace_thread_adapter (args=0xb2b04270) at Base_Thread_Adapter.cpp:137
#6 0x004aa6e1 in start_thread () from /lib/libpthread.so.0
#7 0x00ea2d3e in clone () from /lib/libc.so.6
====================================
 
 
====================================
CTI Manager backtrace
===================================
#0 0x00b3e206 in raise () from /lib/libc.so.6
#1 0x00b3fbd1 in abort () from /lib/libc.so.6
#2 0x08497b11 in IntentionalAbort (reason=0x86fe488 "SDL Router Services declared
dead. This may be due to high CPU usage or blocked function. Attempting to restart
CTIManager.") at ProcessCTIProcMon.cpp:65
#3 0x08497c2c in CMProcMon::verifySdlTimerServices () at ProcessCTIProcMon.cpp:573
#4 0x084988d8 in CMProcMon::callManagerMonitorThread (cmProcMon=0x93c9638) at Process
CTIProcMon.cpp:330
#5 0x007bdca7 in ACE_OS_Thread_Adapter::invoke (this=0x992d710) at OS_Thread_
Adapter.cpp:94
#6 0x00773541 in ace_thread_adapter (args=0x992d710) at Base_Thread_Adapter.cpp:137
#7 0x0025d6e1 in start_thread () from /lib/libpthread.so.0
#8 0x00bead3e in clone () from /lib/li
====================================

Del recopilador de datos PerfMonLogs RI, usted puede ver la alta entrada-salida del disco durante el tiempo de la base.

El backtrace hace juego el Id. de bug Cisco CSCua79544: Memorias frecuentes del proceso de CCM debido a la alta entrada-salida del disco. Este bug describe un problema de hardware y explica cómo aislar más lejos el problema.

Información entrada-salida del archivo del permiso (FIOR):

Utilice estos comandos para habilitar FIOR:

utils fior start
utils fior enable

Entonces, espera para el acontecimiento siguiente. Aquí está el comando CLI de recoger la salida: el archivo consigue el activelog platform/io-stats. Ingrese estos comandos para inhabilitar FIOR:

utils fior stop
utils fior disable

Aquí está una cierta salida del registro de la muestra FIOR:

kern 4 kernel: fio_syscall_table address set to c0626500 based on user input
kern 4 kernel: fiostats: address of do_execve set to c048129a
kern 6 kernel: File IO statistics module version 0.99.1 loaded. 
kern 6 kernel: file reads > 265000 and writes > 51200 will be logged
kern 4 kernel: fiostats: enabled.
kern 4 kernel: fiostats[25487] started.

Solución

La ESPERA entrada-salida es generalmente un problema con la plataforma UCS y su almacenamiento.

El registro UCS se requiere para aislar la ubicación de la causa. Refiera a cómo recoger la sección de los registros UCS para que las instrucciones recojan las trazas.

Escenario 2: CUCM reinicia periódicamente

Síntomas

Las reinicializaciones CUCM debido a una caída ESXI pero al problema subyacente son que la máquina UCS pierde el poder.

Cómo verificar

Examine estas trazas CUCM:

  • Recopilador de datos PerfMonLog de Cisco RI
  • Registro de la aplicación del visor de eventos
  • Visor de eventos - Registro del sistema
  • CCM detallado

No hay nada relevante en las trazas CUCM. El CUCM para antes del incidente y esto se sigue un reinicio normal del servicio. Esto elimina CUCM e indica que miente la causa a otra parte.

La plataforma UCS donde los funcionamientos CUCM tienen el problema. La plataforma UCS tiene muchos casos de la máquina virtual (VM) que se ejecuten en ella. Si cualquier VM encuentra un error, después se ve en los registros UCS.

El registro UCS se requiere para aislar la ubicación de la causa. Refiera a cómo recoger la sección de los registros UCS para las instrucciones sobre cómo recoger las trazas.

Muestree el regulador de la administración integrada de Cisco (CIMC) hecho salir

Aquí está una cierta salida de muestra:

5:2014 May 11 13:10:48:BMC:kernel:-:<5>[lpc_reset_isr_handler]:79:LPC Reset ISR ->
ResetState: 1
5:2014 May 11 13:10:48:BMC:kernel:-:<5>drivers/bmc/usb/usb1.1/se_pilot2_udc_usb1_1.c:
2288:USB FS: VDD Power WAKEUP- Power Good = OFF
5:2014 May 11 13:10:48:BMC:kernel:-:<5>[se_pilot2_wakeup_interrupt]:2561:USB HS:
VDD Power = OFF
5:2014 May 11 13:10:48:BMC:BIOSReader:1176: BIOSReader.c:752:File Close :
/var/nuova/BIOS/BiosTech.txt
5:2014 May 11 13:10:48:BMC:kernel:-:<5>[block_transfer_fetch_host_request_for_app]:
1720:block_transfer_fetch_host_request_for_app : BT_FILE_CLOSE : HostBTDescr = 27 :
FName = BiosTech.txt
5:2014 May 11 13:10:48:BMC:IPMI:1357: Pilot2SrvPower.c:466:Blade Power Changed To:
[ OFF ]
5:2014 May 11 13:10:49:BMC:lv_dimm:-: lv_dimm.c:126:[lpc_reset_seen]LPC Reset Count
is Different [0x1:0x2] Asserted LPC Reset Seen
 

Solución

Cuando usted encuentra este error, el poder Pilot2SrvPower.c:466:Blade cambió a: [OFF] - Problema de alimentación, significa que la máquina UCS pierde el poder. Por lo tanto, usted debe asegurarse de que la máquina UCS consiga la energía suficiente.

Escenario 3: Caídas CUCM

Síntomas

Las caídas CUCM VM pero todavía responden a los ping. Las visualizaciones de pantalla de la consola del vSphere esta información:

*ERROR* %No Memory Available*ERROR* %No Memory Available

Cómo verificar

Examine estas trazas CUCM:

  • Recopilador de datos PerfMonLog de Cisco RI
  • Registro de la aplicación del visor de eventos
  • Visor de eventos - Registro del sistema
  • CCM detallado

No hay nada relevante en las trazas CUCM. El CUCM para antes del incidente y es seguido por un reinicio normal del servicio. Esto elimina CUCM e indica que miente la causa a otra parte.

La plataforma UCS donde los funcionamientos CUCM tienen el problema. La plataforma UCS tiene muchos casos VM que se ejecuten en ella. Si cualquier VM encuentra un error, después se ve en los registros UCS.

El registro UCS se requiere para aislar la ubicación de la causa. Refiera a cómo recoger la sección de los registros UCS para las instrucciones sobre cómo recoger las trazas.

Solución Aternativa

El poder apagado el VM y lo reinicia. Después de que la reinicialización, el sistema trabaje muy bien.

Escenario 4: CUCM cuelga

Síntomas

El servidor CUCM va a un estado donde cuelga.

Cómo verificar

Examine estas trazas CUCM:

  • Recopilador de datos PerfMonLog de Cisco RI
  • Registro de la aplicación del visor de eventos
  • Visor de eventos - Registro del sistema
  • CCM detallado

No hay nada relevante en las trazas CUCM. El CUCM para antes del incidente y es seguido por un reinicio normal del servicio. Esto elimina CUCM e indica que miente la causa a otra parte.

La plataforma UCS donde los funcionamientos CUCM tienen el problema. La plataforma UCS tiene muchos casos VM que se ejecuten en ella. Si cualquier VM encuentra un error, después se ve en los registros UCS.

El registro UCS se requiere para aislar la ubicación de la causa. Refiera a cómo recoger la sección de los registros UCS para las instrucciones sobre cómo recoger las trazas.

Solución Aternativa

Intente un reinicio manual para ver si ayuda.

Escenario 5: CUCM está en el modo de sólo lectura

Síntomas

Usted recibe este error:

The /common file system is mounted read only.Please use Recovery Disk to check
the file system using fsck.

Cómo verificar 

Publisher (publicación) y un suscriptor (SUBMARINO) que están instalados en la misma demostración de la máquina UCS el error del modo de sólo lectura. El disco de la recuperación no repara el problema.

No hay nada relevante en las trazas CUCM. El CUCM para antes del incidente y es seguido por un reinicio normal del servicio. Esto elimina CUCM e indica que miente la causa a otra parte.

La plataforma UCS donde los funcionamientos CUCM tienen el problema. La plataforma UCS tiene muchos casos VM que se ejecuten en ella. Si cualquier VM encuentra un error, después se ve en los registros UCS.

El registro UCS se requiere para aislar la ubicación de la causa. Refiera a cómo recoger la sección de los registros UCS para las instrucciones sobre cómo recoger las trazas.

Solución

Después del reemplazo de hardware, reconstruya los Nodos problemáticos.

Cómo recoger los registros UCS

Esta sección describe cómo recoger las trazas necesarias para identificar el problema o proporciona los links a los artículos que proporcionan esa información.

Cómo recoger los registros CIMC: Show tech

Refiera a estos artículos para información acerca de cómo recoger los registros CICM:

Usando Cisco CIMC GUI para recoger los detalles de la demostración-tecnología

Guía visual para recoger los archivos del soporte técnico (B y serie C)

Cómo recoger los registros ESXI: Registros del sistema

Refiera a este artículo para información acerca de cómo recoger los registros ESXI:

Obtención de la información de diagnóstico para los host de ESXi 5.x que usan al cliente del vSphere 

Salida de la muestra CIMC CLI

Aquí está alguna muestra CIMC CLI hecho salir de una Falla del disco rígido:

ucs-c220-m3 /chassis # show hdd
Name Status LocateLEDStatus
-------------------- -------------------- --------------------
HDD1_STATUS present TurnOFF
HDD2_STATUS present TurnOFF
HDD3_STATUS failed TurnOFF
HDD4_STATUS present TurnOFF
HDD5_STATUS absent TurnOFF
HDD6_STATUS absent TurnOFF
HDD7_STATUS absent TurnOFF
HDD8_STATUS absent TurnOFF
 
ucs-c220-m3 /chassis # show hdd-pid
Disk Controller Product ID Vendor Model
---- ----------- -------------------- ---------- ------------
1 SLOT-2 A03-D500GC3 ATA ST9500620NS
2 SLOT-2 A03-D500GC3 ATA ST9500620NS
3 SLOT-2 A03-D500GC3 ATA ST9500620NS
4 SLOT-2 A03-D500GC3 ATA ST9500620NS
 
 
ucs-c220-m3 /chassis/storageadapter # show physical-drive
Physical Drive Number Controller Health Status Manufacturer Model Predictive
Failure Count Drive Firmware Coerced Size Type
--------------------- ---------- -------------- ---------------------- ------
-------- -------------- ------------------------ -------------- -------------- -----
1 SLOT-2 Good Online ATA ST9500620NS 0 CC03 475883 MB HDD
2 SLOT-2 Good Online ATA ST9500620NS 0 CC03 475883 MB HDD
3 SLOT-2 Severe Fault Unconfigured Bad ATA ST9500620NS 0 CC03 0 MB HDD
4 SLOT-2 Good Online ATA ST9500620NS 0 CC03 475883 MB HDD

Aquí está alguna muestra CICM CLI hecha salir de la falla del controlador RAID:

ucs-c220-m3 /chassis/storageadapter # show virtual-drive
Virtual Drive Health Status Name Size RAID Level Boot Drive
------------- -------------- -------------------- ---------------- ----------
---------- ----------
0 Moderate Fault Degraded 951766 MB RAID 10 true

Salida de la muestra CIMC GUI

Aquí está alguna muestra CIMC GUI hecho salir de una Falla del disco rígido:

Aquí está alguna muestra CIMC GUI hecho salir de un error púrpura de la pantalla:

(Falla del controlador de la incursión | Defecto: Excepción 14 CSCuh86924 ESXi PSOD PF - Regulador 9266-8i LSI RAID)

Aquí está alguna muestra CIMC GUI hecho salir de un error BBU:



Document ID: 118702