Introdução
Este documento descreve como configurar Alertas de Disponibilidade do Agente no AppDynamics e solucionar problemas.
Pré-requisitos
Requisitos
- Métricas de disponibilidade de relatórios do Java/Machine/Database Agent para o controlador.
- Permissões para criar HeathRule e Políticas.
- AppDynamics Controller (SaaS ou Local).
Componentes Utilizados
As informações neste documento foram criadas a partir de dispositivos em um ambiente de laboratório específico. Todos os dispositivos utilizados neste documento foram iniciados com uma configuração (padrão) inicial. Se a rede estiver ativa, certifique-se de que você entenda o impacto potencial de qualquer comando.
Informações de Apoio
Em um cenário digital pioneiro, o desempenho ininterrupto dos aplicativos é essencial — não apenas para a satisfação do usuário, mas também para a continuidade e a reputação dos negócios. O AppDynamics oferece uma excelente capacidade de observação coletando telemetria essencial de todos os cantos da pilha. Mas o que acontece quando os próprios agentes responsáveis por essa visibilidade escurecem? Sem a detecção oportuna de interrupções de agente, sua capacidade de observação fica comprometida, deixando você às cegas para problemas emergentes e possíveis interrupções.
Instrução do problema
Quando os agentes do AppDynamics (Agentes de Aplicativos ou Agentes de Máquinas) param de reportar, você perde informações em tempo real sobre a integridade do aplicativo, o desempenho e o status da infraestrutura. Esse ponto cego pode resultar de travamentos do agente, configurações incorretas, falhas na rede ou esgotamento de recursos. As consequências são significativas:
- Perda de capacidade de observação: lacunas no monitoramento de dados eliminam sua capacidade de detectar, diagnosticar e resolver proativamente problemas de desempenho ou disponibilidade, deixando pontos cegos críticos em seu ambiente.
- Resposta mais lenta a incidentes: sem alertas oportunos, as interrupções ou degradações podem persistir sem serem percebidas até afetarem os usuários finais, resultando em um maior tempo de inatividade e maior tempo médio para resolução.
- Vulnerabilidades de conformidade e auditoria: registros de monitoramento incompletos podem prejudicar a conformidade normativa e dificultar a demonstração da prontidão da auditoria, expondo a empresa a possíveis penalidades.
- Impacto nos negócios e no cliente: interrupções não detectadas ou problemas de desempenho podem degradar a experiência do usuário, diminuir a confiança, afetar negativamente a reputação da organização e levar à perda direta de receita.
Importância da visibilidade do agente
1. Preservando a Visibilidade de Ponta a Ponta:
Os alertas de disponibilidade do agente garantem que você seja imediatamente notificado quando um agente parar de emitir relatórios, permitindo que você restaure o monitoramento antes que surjam lacunas críticas. Isso é fundamental para manter a observabilidade de ponta a ponta em sistemas distribuídos.
2. Gerenciamento pró-ativo de incidentes:
Os alertas automatizados permitem que as equipes reajam a falhas de monitoramento antes que elas se transformem em interrupções que afetam os negócios. Detecção antecipada significa correção mais rápida e tempo de inatividade minimizado.
3. Suporte à conformidade e governança:
O monitoramento contínuo é frequentemente necessário para a conformidade regulatória. Os alertas de disponibilidade do agente ajudam a manter registros de monitoramento completos e a demonstrar a adesão aos padrões operacionais.
4. Dimensionamento com Confiança:
À medida que os ambientes crescem em tamanho e complexidade, as verificações manuais de agentes se tornam impraticáveis. Os alertas automatizados de disponibilidade do agente garantem a capacidade de observação em escala, assinalando lacunas em todos os nós e serviços.
5. Redução dos falsos positivos:
O AppDynamics permite que você ajuste as regras de integridade e use qualificadores (como SUM ou valor em uma janela de tempo) para evitar alertas desnecessários de desconexões temporárias ou problemas breves de rede. Isso garante que você seja alertado somente quando ocorrerem lacunas reais na observação.
Configurar
A configuração de alertas de disponibilidade do agente no AppDynamics envolve três etapas principais: criar uma regra de integridade, definir uma ação e vinculá-la a uma política.
Passo 1: Criar uma regra de integridade
- Vá para a interface do usuário do AppDynamics Controller.
- Navegue até Alerta e resposta e selecione Regras de integridade.
- Clique no botão + para adicionar uma nova regra de integridade.
- Nomeie sua regra (como Agente Inativo Alerta - BookHouzeService):

- Na seção Entidades Afetadas, selecione os nós ou camadas que deseja monitorar:

- Na seção Critérios Críticos, defina o caminho da métrica:
- Para Agente de Aplicativo: Agente|Aplicativo|Disponibilidade
- Para agente de máquina: Recursos de hardware|Máquina|Disponibilidade
- Para o Agente de Banco de Dados: DB|KPI|Disponibilidade de BD
(Utilize o Navegador de métricas para explorar e verificar esses caminhos)
- Defina a condição para disparar quando o valor for menor que 1 (< 1). Isso significa que o alerta será acionado se o agente não estiver relatando.
- Verifique se a opção Avaliar como verdadeiro se não houver dados está marcada como Crítico para capturar casos em que o agente para de enviar métricas por completo.

Tip: Se seu aplicativo passar por períodos de inatividade (sem tráfego), o agente poderá descarregar e aparecer inativo. Considere ajustar as configurações de timeout de ociosidade do aplicativo ou ajustar a janela de avaliação da regra de integridade para evitar falsos positivos.
Passo 2: Criar uma ação
- Vá para Alerta e resposta > Ações.
- Crie uma ação, como enviar uma notificação por email ou chamar um webhook.
- Especifique os destinatários ou pontos de extremidade de integração para o alerta.


Passo 3: Criar uma política
- Vá para Alert & Respond > Policies.
- Crie uma nova política e selecione a regra de integridade criada:

- Atribuir a ação a esta política:

Agora, sempre que um agente parar de relatar, o AppDynamics notificará automaticamente sua equipe, permitindo uma investigação e correção rápidas.
Verificar
Passo 1: Verificar Status de Avaliação de Regra de Integridade
- Navegue até Regras de Integridade:
Vá para Alerta e Resposta > Regras de Integridade no AppDynamics Controller.
- Localize sua regra:
Localize sua Regra de Integridade de Disponibilidade do Agente na lista.
- Indicador de status:
Procure o ícone de status ou o resumo de avaliação ao lado da regra. Um status de marca de seleção verde ou OK indica que ele está sendo avaliado; um aviso ou erro indica que há um problema de configuração.

Passo 2: Usar o Navegador de Métricas
- Abrir Navegador de Métricas:
Vá para Monitor > Navegador de Métricas.
- Localize a Métrica de Disponibilidade:
Fazer drill-down para Agente|Aplicativo|Disponibilidade ou Agente|Computador|Disponibilidade para o nó ou camada de destino.
Passo 3: Simular um cenário de inatividade do agente
- Interromper o agente:
Interrompa temporariamente o serviço do agente do AppDynamics em um nó de teste.
- Aguardar avaliação:
Aguarde tempo suficiente para que a janela de avaliação da regra de integridade seja aprovada.

- Verificar Alerta:
Verifique se a violação da regra de integridade aparece na interface do usuário e se a ação configurada (como email, webhook) foi disparada. 
Etapa 4: Analisar painel de alertas e respostas
- Navegue até Alerta e resposta > Ações e políticas:
Confirme se a ação e a política vinculadas à sua regra de integridade mostram logs de atividade ou disparadores recentes.

Passo 5: Verificar entrega de notificação
- Verificar e-mail/webhook:
Certifique-se de receber o alerta em sua caixa de entrada ou endpoint.
- Revisar conteúdo do alerta:
A mensagem de alerta deve referenciar a regra de integridade correta e o nó/camada afetado.

Validar lista de verificação:
√ status da regra de integridade é OK ou está sendo avaliado ativamente.
√ Avaliações recentes de regras de integridade e (se aplicável) violações são visíveis na interface do usuário.
√ Navegador de Métricas mostra dados em tempo real para a métrica de disponibilidade.
√ Cenário de inatividade de agente simulado aciona uma violação de regra de integridade e alerta.
√ O alerta é recebido através do canal de notificação configurado.
Essas etapas de validação ajudam a garantir que o alerta de disponibilidade do agente não esteja apenas configurado corretamente, mas também monitorado ativamente e pronto para notificá-lo quando um agente ficar off-line. Essa rotina simples pode evitar o monitoramento inesperado de pontos cegos e fortalecer sua estratégia geral de observabilidade.
Troubleshooting
Mesmo com a melhor configuração, às vezes os alertas não disparam quando você espera que eles funcionem. Esta é uma lista de verificação prática para ajudá-lo a solucionar problemas se os Alertas de disponibilidade do agente não estiverem funcionando no AppDynamics:
Categoria |
Passos de Troubleshooting |
Verificar a Configuração da Regra de Integridade
|
- Caminho da métrica: verifique duas vezes se você está usando o caminho da métrica correto (Agente|Aplicativo|Disponibilidade ou Agente|Computador|Disponibilidade).
- Lógica da Condição: Certifique-se de que a condição de alerta esteja definida para disparar quando o valor for menor que 1 (< 1).
- Janela Avaliação: Se a janela de avaliação for muito curta ou muito longa, ela poderá causar alertas perdidos ou atrasados. Ajuste conforme necessário.
- Avaliar como verdadeiro se não houver dados: certifique-se de que essa opção esteja ativada para que a regra seja acionada mesmo que o agente pare de enviar dados por completo.
|
Verificar a ação e a política
|
- Configuração da ação: confirme se sua ação (como e-mail, webhook) está configurada corretamente e aponta para os destinatários ou endpoints corretos.
- Vinculação de política: Certifique-se de que a regra de integridade esteja realmente vinculada à ação por meio de uma política.
- Status da Política: verifique se a política está ativada e não pausada ou desativada.
|
Teste o alerta de ponta a ponta
|
- Simular um Agente Inativo: Interrompe ou desconecta um agente para ver se a regra de integridade é acionada e se o alerta é enviado.
- Verificar Canais de Notificação: Verifique se seus endpoints de e-mail, sms ou webhook estão funcionando e não estão bloqueados por filtros de spam ou firewalls.
|
Examinar Logs e Painéis do AppDynamics
|
- Logs do Controlador: Procure erros ou avisos nos logs do AppDynamics Controller relacionados a regras de alerta ou integridade.
- Painel de Alerta e Resposta: Use a IU do AppDynamics para revisar violações de regra de integridade recentes e ações disparadas.
|
Verificar a integridade do agente e da rede
|
- Status do agente: verifique se o agente está realmente inativo ou não está relatando. Às vezes, o agente está em execução, mas não está enviando dados devido a problemas de rede.
- Conectividade de rede: verifique se não há partição de rede ou firewall bloqueando a comunicação entre o agente e o controlador.
|
Armadilhas comuns
|
- Tempos Limite Ociosos do Pool de Aplicativos: Para aplicativos Web, os tempos limite ociosos podem fazer com que os agentes sejam descarregados. Ajuste as configurações ou estenda a janela de avaliação para evitar falsos negativos.
- Vários Controladores: Se você tiver vários controladores do AppDynamics, verifique se você está verificando o correto.
|
Dica de profissional: Mantenha uma regra e uma política de integridade de teste em um ambiente que não seja de produção para que você possa experimentar e verificar com segurança o comportamento de alerta após qualquer alteração ou upgrade de configuração.
Essas etapas de solução de problemas ajudam você a identificar e resolver rapidamente a maioria dos problemas com os alertas de disponibilidade do agente no AppDynamics — garantindo que seu monitoramento permaneça confiável e sua equipe fique à frente das interrupções.
Conclusão
Os alertas de disponibilidade do agente são a base da observação confiável no AppDynamics. Detectando e respondendo proativamente a paralisações do agente, você mantém visibilidade contínua, acelera a resposta a incidentes e protege sua empresa contra os riscos de paralisações não detectadas. Em um mundo em que cada segundo de tempo de inatividade conta, esses alertas capacitam as equipes a se manterem à frente das interrupções e proporcionarem as experiências digitais resilientes esperadas pelos usuários.
Precisa de mais assistência
Se você tiver uma dúvida ou estiver com problemas, entre em contato com o Suporte do AppDynamics e inclua detalhes como mensagens de erro, informações de configuração ou logs relevantes para ajudar a acelerar a solução de problemas.
Informações Relacionadas