Introduzione
In questo documento vengono descritti in dettaglio la logica di paging e i miglioramenti che consentono di ottimizzare il paging durante la congestione della CPU MME, garantendo stabilità e continuità della rete.
Descrizione del problema
Impatto Paging Storm sulle risorse MME a causa di errori eNB/RAN
Nelle reti mobili su larga scala, la procedura di paging è fondamentale per individuare le apparecchiature utente inattive (UE) in presenza di dati di downlink. Questa procedura prevede più fasi di paging e una logica di fallback che si estende in tutta la rete in determinate condizioni di errore.
È possibile osservare un problema significativo a causa di un errore critico a livello di Evolved Node B (eNB)/Radio Access Network (RAN), dove tutti i tentativi di paging durante la fase 1 del paging non sono riusciti. In base al meccanismo di fallback standard, questi errori di paging sono stati riportati alla fase 2, quindi alla fase 3, e infine hanno portato a tentativi di paging simultanei alla fase 4.
Gli operatori di rete in genere configurano la fase di paging 3 e la fase 4 con una logica ad area ampia, attivando il paging a tutte le eNB o a tutte le TAI (Tracking Area Identities). Negli scenari in cui la CPVM (Control Plane Virtual Machine) viene ricaricata (a causa di un errore del percorso EGTPC (Evolved GPRS Tunneling Protocol Control) o l'RAN non risponde, la logica di fallback determina il paging di massa nella rete.
Conseguenze
- Questa tempesta di paging provoca un'impennata inattesa di messaggi di paging e richieste di ricollegamento, con un carico enorme per il gestore dell'entità di gestione della mobilità (MME).
- Si osserva un elevato utilizzo della CPU e della memoria, che spesso spinge il sistema in uno stato di sovraccarico o di avviso.
- In queste condizioni di stress, il manager MME (componente di MME che gestisce il paging) entra in uno stato 'occupato', causando il rifiuto di nuove connessioni o sessioni, con conseguenti downgrade temporanei della capacità e riduzione del livello del servizio.
Soluzioni chiave per gli operatori di rete
Questo caso sottolinea l'importanza di:
- Implementazione di meccanismi di controllo e limitazione della velocità per il paging.
- Monitoraggio di indicatori precoci quali ricaricamenti della CPVM, tempi di risposta del paging RAN e modelli di nuovi tentativi di paging per gestire preventivamente il carico.
Rappresentazione grafica dell'impatto
In questo caso si presume che il profilo di paging sia stato configurato dalla fase di paging 1, 2, 3 e 4.
Questi grafici rappresentano il totale dei tentativi e degli errori di paging per le diverse fasi di paging.
Tentativo di Paging Profilo MME Fase1
Errore fase 1 profilo di paging ME
Errore fase 2 profilo di paging ME
Tentativo di profilo di paging MME Fase 3
Tentativo MME Paging Profile Fase4
Grafico Utilizzo CPU di MME Manager
Grafico Utilizzo CPU di MME Manager
Utilizzo memoria di MME Manager - registri:
2024-01-11T22:18:10.575996+09:00 UHNxxxmmvm0001 evlogd: [local-60sec10.022] UHN3tte2mmvm0001 [resmgr 14508 error] [17/0/10121 <rmmgr:170> _resource_cpu.c:4421] [software internal system critical-info syslog] The task mmemgr-8 is way over its memory limit! Allocated 409600K, Using 624696K
2024-01-11T22:18:10.069772+09:00 UHN3xxxmmvm0001 evlogd: [local-60sec9.695] UHN3tte2mmvm0001 [resmgr 14508 error] [8/0/10120 <rmmgr:80> _resource_cpu.c:4421] [software internal system critical-info syslog] The task mmemgr-6 is way over its memory limit! Allocated 409600K, Using 584680K
2024-01-11T22:18:09.998162+09:00 UHN3xxxmmvm0001 evlogd: [local-60sec9.634] UHN3tte2mmvm0001 [resmgr 14508 error] [10/0/10132 <rmmgr:100> _resource_cpu.c:4421] [software internal system critical-info syslog] The task mmemgr-2 is way over its memory limit! Allocated 409600K, Using 543404K
Esempio di configurazione
paging-profile paging-ps
paging-stage 1 match-criteria ue-contact-time 1200 action last-n-enb-last-tai max-n-enb 1 t3413-timeout 2 max-paging-attempts 1.
paging-stage 2 match-criteria all action last-n-enb-last-tai max-n-enb 5 t3413-timeout 2 max-paging-attempts 1
paging-stage 3 match-criteria all action all-enb-last-tai t3413-timeout 2 max-paging-attempts 1
paging-stage 4 match-criteria all action all-enb-all-tai t3413-timeout 3 max-paging-attempts 1
Come viene gestita la paging all'interno di ME

Logica funzionale
È importante comprendere la logica generale di paging, soprattutto quando si verificano condizioni eccezionali in scenari di paging critici. Come descritto, i responsabili delle sessioni gestiscono la cache di paging e mantengono il mapping tra i responsabili TAI e MME. Questo mapping viene aggiornato dopo ogni tentativo/risposta di paging riusciti, ma rimane invariato in caso di errore di paging. Durante il primo tentativo di paging, Session Manager trasmette la richiesta di paging a tutti i manager MME e utilizza le risposte per creare la cache di paging e stabilire il mapping del manager TAI-MME.
Flusso messaggi di paging
Creazione della cache
Ogni volta che il Sessmgr desidera impaginare l'UE, controllerà se le informazioni della cache sono presenti per tutti i TAC che devono essere impaginati. In caso affermativo, e la verifica della validità del passaggio della voce della cache, Sessmgr invia una richiesta di paging unicast/multicast al MMEMgr interessato. In caso negativo, la richiesta di paging viene inviata a tutti i gruppi MME. In risposta, MMEMgr deve indicare i TAC nella richiesta di paging che serve, in modo che Sessmgr crei la cache.
Validità della cache
Ogni voce della cache include un timestamp di origine. Quando si accede alla cache, questa viene convalidata in base al relativo timestamp di creazione e al timeout di validità della cache configurato. Se il timeout è scaduto, la voce non deve essere utilizzata. È necessario cancellare l'intera cache quando tutti i servizi MME vengono arrestati.
Soluzione
Funzionamento della disattivazione automatica della funzionalità di paging
Come accennato in precedenza, solo la fase di paging configurata con la configurazione di paging critica può essere attivata, ma non è così ed è stato rilevato che in questa funzione esiste una dipendenza della cache di paging. Pertanto, se un determinato mapping del gestore TAI-MME è già disponibile nella cache di paging di Sessmgr, il paging critico utilizza il trigger di paging solo per le fasi di paging configurate. Tuttavia, nel caso in cui non sia disponibile alcun mapping TAI-MMEMgr per un TAI specifico, i tentativi possono essere visualizzati anche nelle fasi di paging successive, anche se non è configurato nelle fasi di paging. Una volta che la mappatura viene creata nella cache di paging, viene eseguita la normale logica del paging critico.
Configurazione
mme-manager
congestion-control cpu-utilization threshold 90 tolerance 10
#exit
Configuration: critical paging need to configure under paging-profile to allow the configured paging stages while skip the unconfigured paging stages.
configure
lte-policy
paging-profile paging_profile_name
[ no ] critical paging_stage
end
Esempio di configurazione
paging-profile paging-ps
paging-stage 1 match-criteria ue-contact-time 1200 action last-n-enb-last-tai max-n-enb 1 t3413-timeout 2 max-paging-attempts 1
paging-stage 2 match-criteria all action last-n-enb-last-tai max-n-enb 5 t3413-timeout 2 max-paging-attempts 1
paging-stage 3 match-criteria all action all-enb-last-tai t3413-timeout 2 max-paging-attempts 1
paging-stage 4 match-criteria all action all-enb-all-tai t3413-timeout 3 max-paging-attempts 1
critical 1 2
In questo caso, la fase di paging 1 e 2 viene attivata ogni volta che si verificano condizioni per il paging critico. Se i tentativi di paging non sono riusciti nella Fase 1 e 2, in base alla logica di paging, i tentativi vengono attivati nella fase di paging successiva. In questo scenario, si tratta della fase di paging 3 e 4. Tuttavia, se è configurato il paging critico, non verrà eseguito alcun tentativo di paging dopo la fase di paging 2. Tuttavia, esistono condizioni eccezionali in cui è possibile visualizzare anche i tentativi di paging su fasi di paging non configurate. Per ulteriori informazioni, vedere la sezione 'Condizione eccezionale di paging critico'.
Condizione eccezionale di paging critico
Come accennato in precedenza, viene attivata solo la fase di paging configurata in modalità di paging critico, ma non è così e si osserva una dipendenza della cache di paging in questa funzione. Pertanto, se un determinato mapping del gestore TAI-MME è già disponibile nella cache di paging di Sessmgr, il paging critico utilizza il trigger di paging solo per le fasi di paging configurate. Tuttavia, nel caso in cui non sia disponibile alcun mapping TAI-MMEMgr per un TAI specifico, i tentativi possono essere visualizzati anche nelle fasi di paging successive, anche se non è configurato nelle fasi di paging. E una volta che la mappatura viene creata sotto la cache di paging, utilizza nuovamente la normale logica del paging critico.
Test delle funzionalità

Come accennato in precedenza, le fasi 1 e 2 di paging sono configurate in paging-ps del profilo di paging. Quindi, in caso di errore di paging sul palco 1 e 2, altri tentativi di paging sono stati saltati su altri palcoscenici di paging 3 e 4. Ma, ancora si può vedere che pochi tentativi sono stati fatti. Ed è dovuto alle condizioni definite in 'Critical Paging Exceptional condition'.