Introducción
Este documento describe cómo configurar las alertas de disponibilidad del agente en AppDynamics y solucionar problemas.
Prerequisites
Requirements
- Java/máquina/agente de base de datos que informa de las métricas de disponibilidad al controlador.
- Permisos para crear HeathRule y directivas.
- AppDynamics Controller (SaaS o in situ).
Componentes Utilizados
La información que contiene este documento se creó a partir de los dispositivos en un ambiente de laboratorio específico. Todos los dispositivos que se utilizan en este documento se pusieron en funcionamiento con una configuración verificada (predeterminada). Si tiene una red en vivo, asegúrese de entender el posible impacto de cualquier comando.
Antecedentes
En un entorno en el que las aplicaciones son las primeras digitales, el rendimiento ininterrumpido de las aplicaciones es esencial, no solo para la satisfacción del usuario, sino también para la continuidad y la reputación de la empresa. AppDynamics ofrece una poderosa observabilidad al recopilar telemetría crítica de cada esquina de su pila. Pero, ¿qué ocurre cuando los propios agentes responsables de esta visibilidad se oscurecen? Sin la detección oportuna de las interrupciones del agente, su capacidad de observación se verá comprometida, lo que no le permitirá ver los problemas emergentes ni las posibles interrupciones.
Declaración de problema
Cuando los agentes de AppDynamics (agentes de aplicaciones o agentes de equipos) dejan de generar informes, se pierde información en tiempo real sobre el estado de las aplicaciones, el rendimiento y el estado de la infraestructura. Este punto ciego puede ser el resultado de fallos de agentes, configuraciones inadecuadas, fallos de red o agotamiento de recursos. Las consecuencias son significativas:
- Pérdida de la capacidad de observación: las lagunas en los datos de supervisión eliminan su capacidad para detectar, diagnosticar y resolver de forma proactiva los problemas de rendimiento o disponibilidad, lo que deja puntos ciegos críticos en su entorno.
- Respuesta más lenta ante incidentes: sin alertas puntuales, las interrupciones o las degradaciones pueden pasar desapercibidas hasta que afectan a los usuarios finales, lo que se traduce en un tiempo de inactividad más prolongado y en un aumento del tiempo medio de resolución.
- Vulnerabilidades de cumplimiento y auditoría: los registros de supervisión incompletos pueden socavar el cumplimiento de las normas y dificultar la demostración de la preparación de la auditoría, lo que expone a la organización a posibles sanciones.
- Impacto empresarial y en el cliente: las interrupciones o los problemas de rendimiento que no se detectan pueden degradar la experiencia del usuario, disminuir la confianza, afectar negativamente a la reputación de la organización y provocar una pérdida de ingresos directa.
Importancia de visibilidad del agente
1. Conservación de la visibilidad integral:
Las alertas de disponibilidad de agentes garantizan que se le notifique inmediatamente cuando un agente deja de informar, lo que le permite restaurar la supervisión antes de que surjan brechas críticas. Esto es fundamental para mantener la observabilidad de extremo a extremo en todos los sistemas distribuidos.
2. Gestión proactiva de incidentes:
Las alertas automatizadas permiten a los equipos reaccionar ante las lagunas de supervisión antes de que se conviertan en interrupciones que afecten a la empresa. La detección temprana implica una remediación más rápida y un tiempo de inactividad minimizado.
3. Apoyo al cumplimiento y la gobernanza:
A menudo se requiere una supervisión continua para cumplir las normas. Las alertas de disponibilidad de agentes le ayudan a mantener registros de supervisión completos y a demostrar el cumplimiento de los estándares operativos.
4. Escalabilidad con confianza:
A medida que los entornos aumentan en tamaño y complejidad, las comprobaciones manuales de los agentes se vuelven imprácticas. Las alertas automatizadas de disponibilidad de agentes garantizan la capacidad de observación a escala y marcan las lagunas en todos los nodos y servicios.
5. Reducción de los falsos positivos:
AppDynamics le permite ajustar reglas de estado y usar calificadores (como SUMA o valor en una ventana de tiempo) para evitar alertas innecesarias de desconexiones transitorias o breves problemas de red. Esto garantiza que solo se le alertará cuando se produzcan lagunas reales en la capacidad de observación.
Configurar
La configuración de alertas de disponibilidad de agentes en AppDynamics implica tres pasos principales: crear una regla de mantenimiento, definir una acción y vincularlos a una directiva.
Paso 1: Crear una regla de mantenimiento
- Vaya a la interfaz de usuario de AppDynamics Controller.
- Navegue hasta Alerta y respuesta y seleccione Reglas de estado.
- Haga clic en el botón + para agregar una nueva regla de mantenimiento.
- Asigne un nombre a la regla (por ejemplo, Alerta de agente caído - BookHouzeService):

- En la sección Entidades afectadas, seleccione los nodos o niveles que desea supervisar:

- En la sección Criterios Críticos, establezca la ruta de métrica:
- Para el agente de aplicaciones: Agente|Aplicación|Disponibilidad
- Para el agente de máquina: Recursos de hardware|Máquina|Disponibilidad
- Para Database Agent: Disponibilidad de BD|KPI|DB
(Utilice Metrics Browser para explorar y verificar estas trayectorias)
- Establezca la condición para que se active cuando el valor sea menor que 1 (< 1). Esto significa que la alerta se activa si el agente no está realizando el informe.
- Asegúrese de que la opción Evaluar a verdadero en ningún dato esté marcada como Crítico para detectar casos en los que el agente deja de enviar métricas por completo.

Consejo: Si la aplicación experimenta períodos de inactividad (sin tráfico), el agente podría descargarse y aparecer inactivo. Considere la posibilidad de ajustar la configuración del tiempo de espera de inactividad de la aplicación o ajustar la ventana de evaluación de reglas de estado para evitar falsos positivos.
Paso 2: Crear una acción
- Vaya a Alerta y respuesta > Acciones.
- Cree una acción, como enviar una notificación por correo electrónico o invocar un webhook.
- Especifique los destinatarios o los extremos de integración de la alerta.


Paso 3: Crear una directiva
- Vaya a Alerta y respuesta > Políticas.
- Cree una nueva directiva y seleccione la regla de mantenimiento que ha creado:

- Asigne la acción a esta política:

Ahora, cada vez que un agente deja de informar, AppDynamics notifica automáticamente a su equipo, lo que permite una investigación y remediación rápidas.
Verificación
Paso 1: Comprobar estado de evaluación de regla de mantenimiento
- Vaya a Reglas de estado:
Vaya a Alert & Respond > Health Rules en AppDynamics Controller.
- Busque la regla:
Busque la regla de estado de disponibilidad de agentes en la lista.
- Indicador de estado:
Busque el icono de estado o el resumen de evaluación junto a la regla. Una marca de verificación verde o el estado OK indica que se está evaluando; una advertencia o un error indican que hay un problema de configuración.

Paso 2: Uso del explorador de métricas
- Abra el explorador de métricas:
Vaya a Monitor > Metric Browser.
- Encuentre la métrica de disponibilidad:
Acceder a Agente|Aplicación|Disponibilidad o Agente|Máquina|Disponibilidad para el nodo o nivel de destino.
Paso 3: Simular un escenario de agente caído
- Detener el agente:
Detenga temporalmente el servicio del agente AppDynamics en un nodo de prueba.
- Espere a la evaluación:
Deje tiempo suficiente para que pase la ventana de evaluación de regla de mantenimiento.

- Comprobar si hay alertas:
Compruebe si la infracción de la regla de mantenimiento aparece en la interfaz de usuario y si se ha activado la acción configurada (como correo electrónico o webhook). 
Paso 4: Revisar panel de alertas y respuestas
- Vaya a Alerta y respuesta > Acciones y políticas:
Confirme que la acción y la directiva vinculadas a la regla de mantenimiento muestren los registros de actividad o desencadenadores recientes.

Paso 5: Comprobar entrega de notificaciones
- Verificar correo electrónico/webhook:
Asegúrese de recibir la alerta en su bandeja de entrada o terminal.
- Revisar contenido de alertas:
El mensaje de alerta debe hacer referencia a la regla de estado correcta y al nodo o nivel afectado.

Validar lista de comprobación:
√ El estado de la regla de mantenimiento es correcto o se está evaluando activamente.
√ Las evaluaciones recientes de las reglas de mantenimiento y (si procede) las infracciones son visibles en la interfaz de usuario.
√ Metric Browser muestra datos en tiempo real para la métrica de disponibilidad.
√ El escenario simulado de agente caído desencadena una alerta y una infracción de regla de mantenimiento.
√ La alerta se recibe a través del canal de notificación configurado.
Estos pasos de validación ayudan a garantizar que la alerta de disponibilidad del agente no solo esté configurada correctamente, sino que también se supervise de forma activa y esté lista para notificarle en el momento en que un agente se desconecta. Esta simple rutina puede prevenir puntos ciegos inesperados de monitoreo y fortalecer su estrategia general de observabilidad.
Troubleshoot
Incluso con la mejor configuración, a veces las alertas no se activan cuando se espera que lo hagan. Esta es una lista de verificación práctica para ayudarlo a resolver problemas si sus alertas de disponibilidad de agente no funcionan en AppDynamics:
Categoría |
Pasos para la resolución de problemas |
Comprobar la configuración de la regla de mantenimiento
|
- Ruta de la métrica: compruebe que está utilizando la ruta de la métrica correcta (Agente|Aplicación|Disponibilidad o Agente|Máquina|Disponibilidad).
- Lógica de condición: asegúrese de que la condición de alerta se haya configurado para que se active cuando el valor sea menor que 1 (< 1).
- Ventana de evaluación: si la ventana de evaluación es demasiado corta o demasiado larga, puede provocar alertas perdidas o retrasadas. Ajústelo según necesidades.
- Evaluar como verdadero si no hay datos: asegúrese de que esta opción esté habilitada para que la regla se active aunque el agente deje de enviar datos por completo.
|
Verificar la acción y la política
|
- Configuración de la acción: confirme que la acción (como correo electrónico o webhook) está configurada correctamente y apunta a los destinatarios o terminales adecuados.
- Vinculación de políticas: asegúrese de que la regla de estado está realmente vinculada a la acción a través de una directiva.
- Estado de la política: compruebe que la política está activada y no en pausa o desactivada.
|
Pruebe la alerta de extremo a extremo
|
- Simular un agente caído: detiene o desconecta a un agente para ver si se activa la regla de mantenimiento y se envía la alerta.
- Compruebe los canales de notificación: compruebe que el correo electrónico, los SMS o los terminales de webhook funcionan y no están bloqueados por filtros de spam o firewalls.
|
Revisar registros y paneles de AppDynamics
|
- Registros del controlador: busque errores o advertencias en los registros de AppDynamics Controller relacionados con alertas o reglas de mantenimiento.
- Panel de alerta y respuesta: utilice la interfaz de usuario de AppDynamics para revisar las infracciones de reglas de estado y las acciones activadas recientemente.
|
Comprobar el estado del agente y de la red
|
- Estado del agente: asegúrese de que el agente está realmente inactivo o no está realizando el informe. En ocasiones, el agente se está ejecutando pero no envía datos debido a problemas de red.
- Conectividad de red: asegúrese de que no haya ninguna partición de red o firewall que bloquee la comunicación entre el agente y el controlador.
|
Obstáculos comunes
|
- Tiempos de espera de inactividad del grupo de aplicaciones: en el caso de las aplicaciones web, los tiempos de espera de inactividad pueden hacer que los agentes se descarguen. Ajuste la configuración o amplíe la ventana de evaluación para evitar falsos negativos.
- Varios controladores: si tiene varios controladores de AppDynamics, compruebe que está comprobando el correcto.
|
Sugerencia profesional: Mantenga una regla de mantenimiento y una política de prueba en un entorno que no sea de producción para poder experimentar y verificar de forma segura el comportamiento de las alertas después de cualquier cambio o actualización de la configuración.
Estos pasos de solución de problemas le ayudan a identificar y resolver rápidamente la mayoría de los problemas con las alertas de disponibilidad del agente en AppDynamics, lo que garantiza que su supervisión siga siendo confiable y que su equipo esté alerta de las interrupciones.
Conclusión
Las alertas de disponibilidad del agente son una piedra angular de la observabilidad confiable en AppDynamics. Al detectar y responder de forma proactiva a las interrupciones del servicio de los agentes, mantiene una visibilidad continua, acelera la respuesta a incidentes y protege su empresa frente a los riesgos de interrupciones no detectadas. En un mundo en el que cada segundo de tiempo de inactividad cuenta, estas alertas permiten a los equipos anticiparse a las interrupciones y ofrecer las experiencias digitales flexibles que esperan los usuarios.
Necesita más ayuda
Si tiene alguna pregunta o tiene problemas, póngase en contacto con AppDynamics Support e incluya detalles como mensajes de error, información de configuración o registros relevantes para ayudar a acelerar la solución de problemas.
Información Relacionada