Introduzione
In questo documento viene descritto come configurare gli avvisi sulla disponibilità degli agenti in AppDynamics e come risolvere i problemi.
Prerequisiti
Requisiti
- Java/Machine/Database Agent che segnala le metriche di disponibilità al controller.
- Autorizzazioni per la creazione di HeathRule e Policies.
- AppDynamics Controller (SaaS o locale).
Componenti usati
Le informazioni discusse in questo documento fanno riferimento a dispositivi usati in uno specifico ambiente di emulazione. Su tutti i dispositivi menzionati nel documento la configurazione è stata ripristinata ai valori predefiniti. Se la rete è operativa, valutare attentamente eventuali conseguenze derivanti dall'uso dei comandi.
Premesse
In un ambiente in cui la tecnologia è la prima a essere digitale, le prestazioni delle applicazioni ininterrotte sono essenziali, non solo per la soddisfazione degli utenti, ma anche per la continuità aziendale e la reputazione. AppDynamics offre una potente capacità di osservazione grazie alla raccolta di dati di telemetria critici da ogni angolo dello stack. Ma cosa succede quando gli agenti responsabili di questa visibilità si oscurano? Senza il rilevamento tempestivo delle interruzioni degli agenti, l'osservabilità è compromessa, rendendo ciechi i problemi emergenti e le potenziali interruzioni.
Dichiarazione di problema
Quando gli agenti AppDynamics (agenti app o agenti computer) interrompono la creazione di report, si perde la comprensione in tempo reale dello stato, delle prestazioni e dell'infrastruttura dell'applicazione. Questo punto cieco può essere causato da arresti anomali dell'agente, configurazioni non corrette, errori di rete o esaurimento delle risorse. Le conseguenze sono significative:
- Perdita di osservabilità: le lacune nei dati di monitoraggio eliminano la possibilità di rilevare, diagnosticare e risolvere in modo proattivo i problemi di prestazioni o disponibilità, lasciando punti ciechi critici nell'ambiente.
- Risposta agli incidenti più lenta: senza avvisi tempestivi, le interruzioni o i danni possono persistere inosservati fino a quando non influiscono sugli utenti finali, con conseguente aumento dei tempi di inattività e del tempo medio di risoluzione.
- Vulnerabilità di conformità e audit: record di monitoraggio incompleti possono compromettere la conformità normativa e rendere difficile la dimostrazione della fattibilità delle verifiche, esponendo l'organizzazione a potenziali sanzioni.
- Impatto sul business e sul cliente: le interruzioni non rilevate o i problemi di prestazioni possono compromettere l'esperienza dell'utente, diminuire la fiducia, avere un impatto negativo sulla reputazione dell'organizzazione e comportare una perdita diretta di profitti.
Importanza visibilità agente
1. Mantenimento della visibilità completa:
Gli avvisi sulla disponibilità dell'agente consentono di ricevere immediatamente una notifica quando un agente interrompe la creazione di report, in modo da ripristinare il monitoraggio prima che si verifichino lacune critiche. Questo è fondamentale per mantenere l'osservabilità end-to-end tra sistemi distribuiti.
2. Gestione proattiva degli incidenti:
Gli avvisi automatizzati consentono ai team di reagire alle lacune di monitoraggio prima che queste si aggravino in caso di interruzioni che hanno un impatto sul business. Il rilevamento precoce consente di ridurre al minimo i tempi di inattività e di correggere i problemi più rapidamente.
3. Supporto della conformità e della governance:
Il monitoraggio continuo è spesso necessario per garantire la conformità normativa. Gli avvisi sulla disponibilità degli agenti consentono di mantenere record di monitoraggio completi e di dimostrare la conformità agli standard operativi.
4. Scalabilità con sicurezza:
Con l'aumento delle dimensioni e della complessità degli ambienti, i controlli manuali degli agenti diventano impraticabili. Gli avvisi automatici sulla disponibilità degli agenti garantiscono l'osservabilità su vasta scala, evidenziando le lacune in tutti i nodi e i servizi.
5. Riduzione dei falsi positivi:
AppDynamics consente di ottimizzare le regole di integrità e utilizzare qualificatori (come SUM o valore in una finestra temporale) per evitare avvisi non necessari da disconnessioni temporanee o brevi problemi di rete. In questo modo, l'utente viene avvisato solo quando si verificano reali lacune nell'osservabilità.
Configurazione
L'impostazione degli avvisi di disponibilità dell'agente in AppDynamics prevede tre passaggi principali: creazione di una regola di integrità, definizione di un'azione e collegamento a un criterio.
Passaggio 1: Creare una regola di integrità
- Passare all'interfaccia utente di AppDynamics Controller.
- Passare a Avviso e risposta e selezionare Regole integrità.
- Fare clic sul pulsante + per aggiungere una nuova regola di integrità.
- Assegnare un nome alla regola (ad esempio Alert inattività agente - BookHouzeService):

- Nella sezione Entità interessate selezionare i nodi o i livelli da monitorare:

- Nella sezione Criteri critici impostare il percorso della metrica:
- Per l'agente app: Agente|App|Disponibilità
- Per l'agente computer: Risorse hardware|Computer|Disponibilità
- Per l'agente database: DB|KPI|Disponibilità DB
(Utilizzare l'elenco delle metriche per esplorare e verificare questi percorsi)
- Impostare la condizione da attivare quando il valore è minore di 1 (< 1). Questo significa che l'avviso viene attivato se l'agente non sta effettuando la segnalazione.
- Assicurarsi che l'opzione Valuta su true in assenza di dati sia selezionata come Critica per rilevare i casi in cui l'agente interrompe completamente l'invio delle metriche.

Suggerimento: Se nell'applicazione si verificano periodi di inattività (nessun traffico), l'agente potrebbe scaricarsi e apparire inattivo. Per evitare falsi positivi, è consigliabile regolare le impostazioni di timeout di inattività dell'applicazione o regolare la finestra di valutazione della regola di integrità.
Passaggio 2: Crea un'azione
- Andare a Avviso e risposta > Azioni.
- Creare un'azione, ad esempio l'invio di una notifica e-mail o la chiamata di un webhook.
- Specificare i destinatari o gli endpoint di integrazione per l'avviso.


Passaggio 3: Crea un criterio
- Andare a Avviso e risposta > Criteri.
- Creare un nuovo criterio e selezionare la regola di integrità creata:

- Assegna l'azione al criterio:

Ora, ogni volta che un agente interrompe la segnalazione, AppDynamics invia automaticamente una notifica al team, consentendo un'indagine e un risanamento rapidi.
Verifica
Passaggio 1: Verifica stato valutazione regola di integrità
- Passare a Regole di integrità:
Andare a Avviso e risposta > Regole di integrità in AppDynamics Controller.
- Individuare la regola:
Individuare la regola di integrità della disponibilità dell'agente nell'elenco.
- Indicatore di stato:
Cercare l'icona di stato o il riepilogo di valutazione accanto alla regola. Un segno di spunta verde o lo stato OK indica che è in corso di valutazione; un avviso o un errore indica la presenza di un problema di configurazione.

Passaggio 2: Utilizzare l'elenco delle metriche
- Aprire l'elenco delle metriche:
Selezionare Monitor > Browser metriche.
- Trovare la metrica di disponibilità:
Espandere a Agente|App|Disponibilità o Agente|Computer|Disponibilità per il nodo o il livello di destinazione.
Passaggio 3: Simulare uno scenario di inattività dell'agente
- Arrestare l'agente:
Arresta temporaneamente il servizio agente AppDynamics in un nodo di test.
- In attesa di valutazione:
Attendere il completamento della finestra di valutazione delle regole di integrità.

- Verifica avvisi:
Verificare se la violazione della regola di integrità viene visualizzata nell'interfaccia utente e se l'azione configurata (ad esempio e-mail, webhook) è attivata. 
Passaggio 4: Pannello di controllo Revisione avvisi e risposta
- Passare a Avviso e risposta > Azioni e policy:
Confermare che l'azione e il criterio collegati alla regola di integrità visualizzino i log delle attività recenti o dei trigger.

Passaggio 5: Verifica recapito notifiche
- Verifica indirizzo di posta elettronica/webhook:
Assicurarsi di ricevere l'avviso nella posta in arrivo o nell'endpoint.
- Rivedi contenuto avviso:
Il messaggio di avviso deve fare riferimento alla regola di integrità corretta e al nodo/livello interessato.

Convalida elenco di controllo
Lo stato della regola di integrità è OK o sta valutando attivamente.
Le valutazioni e le violazioni recenti delle regole di integrità (se applicabili) sono visibili nell'interfaccia utente.
√ Browser metriche mostra i dati in tempo reale per la metrica di disponibilità.
√ Lo scenario di inattività dell'agente simulato attiva una violazione e un avviso delle regole di integrità.
√ L'avviso viene ricevuto tramite il canale di notifica configurato.
Questa procedura di convalida garantisce che l'avviso di disponibilità dell'agente non solo sia configurato correttamente, ma sia anche monitorato attivamente e pronto a inviare una notifica nel momento in cui l'agente non è più in linea. Questa semplice routine può prevenire la comparsa di punti ciechi improvvisi e rafforzare la strategia di osservazione complessiva.
Risoluzione dei problemi
Anche con la configurazione migliore, a volte gli avvisi non vengono attivati quando ci si aspetta che vengano attivati. Di seguito è riportato un elenco di controllo pratico che consente di risolvere i problemi se gli avvisi sulla disponibilità dell'agente non funzionano in AppDynamics:
Categoria |
Procedura di risoluzione dei problemi |
Controllare la configurazione della regola di integrità
|
- Percorso metrica: verificare che il percorso della metrica in uso sia corretto (Agente|App|Disponibilità o Agente|Computer|Disponibilità).
- Logica condizione: assicurarsi che la condizione di avviso sia impostata in modo da essere attivata quando il valore è minore di 1 (< 1).
- Finestra di valutazione: se la finestra di valutazione è troppo breve o troppo lunga, può causare la perdita o il ritardo degli alert. Regolare in base alle esigenze.
- Valuta su true in assenza di dati: verificare che questa opzione sia abilitata in modo che la regola venga attivata anche se l'agente interrompe completamente l'invio dei dati.
|
Verifica l'azione e il criterio
|
- Configurazione azione: verificare che l'azione (ad esempio e-mail, webhook) sia impostata correttamente e punti ai destinatari o agli endpoint corretti.
- Collegamento ai criteri: verificare che la regola di integrità sia effettivamente collegata all'azione tramite un criterio.
- Stato criterio: verificare che il criterio sia abilitato e non in pausa o disabilitato.
|
Verifica completa degli avvisi
|
- Simulare l'inattività di un agente: arrestare o disconnettere un agente per verificare se la regola di integrità viene attivata e se l'avviso viene inviato.
- Controlla canali di notifica: verifica che gli endpoint e-mail, sms o webhook funzionino e non siano bloccati dai filtri antispam o dai firewall.
|
Verifica registri e dashboard di AppDynamics
|
- Registri controller: cercare errori o avvisi nei registri di AppDynamics Controller relativi agli avvisi o alle regole di integrità.
- Dashboard avvisi e risposte: utilizzare l'interfaccia utente di AppDynamics per esaminare le violazioni delle regole di integrità recenti e le azioni attivate.
|
Verifica integrità agente e rete
|
- Stato agente: verificare che l'agente sia effettivamente inattivo o che non stia eseguendo la segnalazione. A volte l'agente è in esecuzione ma non invia dati a causa di problemi di rete.
- Connettività di rete: verificare che tra l'agente e il controller non vi siano partizioni di rete o firewall che impediscano la comunicazione.
|
insidie comuni
|
- Timeout di inattività del pool di applicazioni: per le app Web, i timeout di inattività possono causare lo scaricamento degli agenti. Regolare le impostazioni o estendere la finestra di valutazione per evitare falsi negativi.
- Più controller: se si dispone di più controller AppDynamics, verificare che si stia controllando quello corretto.
|
Suggerimento Pro: Mantenere una regola e un criterio di integrità del test in un ambiente non di produzione in modo da poter sperimentare e verificare in modo sicuro il comportamento degli avvisi dopo qualsiasi modifica o aggiornamento della configurazione.
Questa procedura di risoluzione dei problemi consente di identificare e risolvere rapidamente la maggior parte dei problemi relativi agli avvisi sulla disponibilità degli agenti in AppDynamics, garantendo l'affidabilità del monitoraggio e la protezione del team dalle interruzioni.
Conclusioni
Gli avvisi sulla disponibilità degli agenti sono una pietra miliare dell'osservabilità affidabile in AppDynamics. Rilevando e rispondendo in modo proattivo alle interruzioni delle attività degli agenti, è possibile mantenere una visibilità continua, accelerare la risposta alle richieste di assistenza e proteggere le attività aziendali dai rischi di interruzioni non rilevate. In un mondo in cui ogni secondo di downtime conta, questi allarmi consentono ai team di stare al passo con le interruzioni e fornire le prestazioni digitali resilienti che gli utenti si aspettano.
Ulteriore assistenza
In caso di domande o di problemi, contatta il supporto AppDynamics e includi dettagli quali messaggi di errore, informazioni di configurazione o registri rilevanti per accelerare la risoluzione dei problemi.
Informazioni correlate