Introducción
Este documento detalla la lógica de paginación y las mejoras que optimizan la paginación durante la congestión de CPU MME, garantizando la estabilidad y continuidad de la red.
Descripción de problemas
Impacto de la tormenta de avisos en los recursos de MME debido a un error de eNB/RAN
En las redes móviles a gran escala, el procedimiento de paginación es fundamental para localizar equipos de usuario (UE) inactivos cuando hay datos de enlace descendente. Este procedimiento implica varias fases de paginación y una lógica de repliegue que se extiende a través de la red bajo ciertas condiciones de falla.
Se puede observar un problema importante debido a cualquier fallo crítico en el nivel de nodo evolucionado B (eNB)/red de acceso de radio (RAN), donde todos los intentos de localización durante la etapa de localización 1 fallaron. Según el mecanismo de reserva estándar, estos errores de paginación se escalaron a la etapa de paginación 2, luego a la etapa de paginación 3 y, finalmente, llevaron a intentos de paginación simultáneos en la etapa de paginación 4.
Los operadores de red suelen configurar las fases de paginación 3 y 4 con lógica de área extensa, lo que activa la paginación para todos los eNB o todas las identidades de área de seguimiento (TAI). En los escenarios en los que la máquina virtual del plano de control (CPVM) se recarga (debido a un error en la ruta de EGTPC (Evolved GPRS Tunneling Protocol Control) o RAN no responde, la lógica de reserva da como resultado una paginación masiva en toda la red.
Impacto
- Esta tormenta de avisos provoca un aumento inesperado de los mensajes de aviso y las solicitudes de nueva conexión, lo que supone una carga inmensa para el administrador de la entidad de gestión de la movilidad (MME).
- Se observa un uso elevado de la CPU y la memoria, lo que a menudo empuja al sistema a estados de sobrecarga o advertencia.
- En estas condiciones estresadas, el administrador de MME (componente de MME que administra la paginación) ingresa en un estado 'ocupado fuera', lo que hace que rechace nuevas conexiones o sesiones, lo que resulta en rebajas de capacidad temporales y degradación del servicio.
Puntos clave para los operadores de red
Este caso subraya la importancia de:
- Implementar el control de velocidad y los mecanismos de limitación para paginación.
- Monitoreo de indicadores tempranos como recargas CPVM, respuesta de paginación RAN y patrones de reintento de paginación para administrar la carga de manera preventiva.
Representación gráfica del impacto
Aquí se supone que el perfil de búsqueda se ha configurado desde las fases de búsqueda 1, 2, 3 y 4.
Estos gráficos representan el total de intentos y errores de paginación para las diferentes etapas de paginación.
Intento de perfil de búsqueda MME, etapa 1
Falla de etapa 1 del perfil de búsqueda de MME
Falla de etapa 2 del perfil de búsqueda de MME
Intento de perfil de búsqueda MME, etapa 3
Intento de perfil de búsqueda MME, etapa 4
Gráfico de utilización de CPU de MME Manager
Gráfico de utilización de CPU de MME Manager
Utilización de memoria de MME Manager - registros:
2024-01-11T22:18:10.575996+09:00 UHNxxxmmvm0001 evlogd: [local-60sec10.022] UHN3tte2mmvm0001 [resmgr 14508 error] [17/0/10121 <rmmgr:170> _resource_cpu.c:4421] [software internal system critical-info syslog] The task mmemgr-8 is way over its memory limit! Allocated 409600K, Using 624696K
2024-01-11T22:18:10.069772+09:00 UHN3xxxmmvm0001 evlogd: [local-60sec9.695] UHN3tte2mmvm0001 [resmgr 14508 error] [8/0/10120 <rmmgr:80> _resource_cpu.c:4421] [software internal system critical-info syslog] The task mmemgr-6 is way over its memory limit! Allocated 409600K, Using 584680K
2024-01-11T22:18:09.998162+09:00 UHN3xxxmmvm0001 evlogd: [local-60sec9.634] UHN3tte2mmvm0001 [resmgr 14508 error] [10/0/10132 <rmmgr:100> _resource_cpu.c:4421] [software internal system critical-info syslog] The task mmemgr-2 is way over its memory limit! Allocated 409600K, Using 543404K
Configuración de muestra:
paging-profile paging-ps
paging-stage 1 match-criteria ue-contact-time 1200 action last-n-enb-last-tai max-n-enb 1 t3413-timeout 2 max-paging-attempts 1.
paging-stage 2 match-criteria all action last-n-enb-last-tai max-n-enb 5 t3413-timeout 2 max-paging-attempts 1
paging-stage 3 match-criteria all action all-enb-last-tai t3413-timeout 2 max-paging-attempts 1
paging-stage 4 match-criteria all action all-enb-all-tai t3413-timeout 3 max-paging-attempts 1
Cómo se gestiona la búsqueda en el MME

Lógica funcional
Es importante comprender la lógica general de paginación, especialmente cuando se trata de condiciones excepcionales en escenarios de paginación críticos. Como se ha descrito, los administradores de sesiones gestionan la caché de paginación y mantienen la asignación entre los TAI y los administradores de MME. Esta asignación se actualiza después de cada respuesta o intento de búsqueda correctos, pero permanece sin cambios en caso de que se produzca un error de búsqueda. Durante el primer intento de paginación, el Administrador de sesiones transmite la solicitud de paginación a todos los administradores de MME y utiliza las respuestas para crear la caché de paginación y establecer la asignación de administrador TAI-MME.
Flujo de mensajes de búsqueda
Creación de la caché
Cada vez que Sessmgr desea enviar un aviso a la UE, verificará si la información de la memoria caché está presente para todos los TAC que necesitan ser paginados. Si la respuesta es sí, y la entrada de caché pasa la comprobación de validez, Sessmgr envía la solicitud de paginación de unidifusión/multidifusión al MMEMgr correspondiente. Si no, entonces Sessmgr transmite la solicitud de paginación a todos los MMEMgrs. En respuesta, MMEMgr debe indicar los TAC en la solicitud de paginación a la que sirve, de modo que Sessmgr genere la memoria caché.
Validez de la memoria caché
Cada entrada de caché incluye una marca de hora de origen. Cuando se accede a la memoria caché, se valida en función de su marca de tiempo de creación y del tiempo de espera de validez de la memoria caché configurado. Si el tiempo de espera ha caducado, no se debe utilizar la entrada. Se debe borrar toda la memoria caché cuando se detienen todos los servicios MME.
Solución
Cómo Funciona la Desactivación Automática de la Función de Localización
Como se mencionó anteriormente, solo se activará la etapa de paginación que está configurada bajo la configuración de paginación crítica, pero no es el caso y se ve que hay una dependencia de la memoria caché de paginación en esta función. Por lo tanto, si alguna asignación de administrador TAI-MME en particular ya está disponible en la memoria caché de paginación de Sessmgr, la paginación crítica utiliza el disparador de paginación sólo para las etapas de paginación configuradas. Pero, en caso de que no haya una asignación TAI-MMEMgr disponible para un TAI determinado, también se pueden ver los intentos en las etapas de paginación subsiguientes, incluso si no está configurada en las etapas de paginación. Y, una vez que el mapeo se construye bajo la memoria caché de paginación, entonces la lógica normal de paginación crítica tiene lugar.
Configuración
mme-manager
congestion-control cpu-utilization threshold 90 tolerance 10
#exit
Configuration: critical paging need to configure under paging-profile to allow the configured paging stages while skip the unconfigured paging stages.
configure
lte-policy
paging-profile paging_profile_name
[ no ] critical paging_stage
end
Configuración de muestra:
paging-profile paging-ps
paging-stage 1 match-criteria ue-contact-time 1200 action last-n-enb-last-tai max-n-enb 1 t3413-timeout 2 max-paging-attempts 1
paging-stage 2 match-criteria all action last-n-enb-last-tai max-n-enb 5 t3413-timeout 2 max-paging-attempts 1
paging-stage 3 match-criteria all action all-enb-last-tai t3413-timeout 2 max-paging-attempts 1
paging-stage 4 match-criteria all action all-enb-all-tai t3413-timeout 3 max-paging-attempts 1
critical 1 2
Aquí, las etapas de paginación 1 y 2 se activan siempre que se dan las condiciones para la paginación crítica. En caso de que los intentos de paginación hayan fallado en la etapa 1 y 2, según la lógica de paginación, los intentos se activan en la siguiente etapa de paginación. En este escenario, es la fase de paginación 3 y 4. Pero si se configura una paginación crítica, no se intenta ninguna paginación adicional después de la fase de paginación 2. Pero hay condiciones excepcionales en las que también se pueden ver los intentos de paginación en fases de paginación no configuradas. Consulte la sección "Condiciones excepcionales de búsqueda críticas" para obtener más información.
Condición excepcional de búsqueda crítica
Como se mencionó anteriormente, solo se dispara la etapa de paginación que está configurada bajo la paginación crítica, pero no es el caso y se ve que hay una dependencia de la memoria caché de paginación en esta función. Por lo tanto, si alguna asignación de administrador TAI-MME en particular ya está disponible en la memoria caché de paginación de Sessmgr, la paginación crítica utiliza el disparador de paginación sólo para las etapas de paginación configuradas. Pero, en caso de que no haya una asignación TAI-MMEMgr disponible para un TAI determinado, también se pueden ver los intentos en las etapas de paginación subsiguientes, incluso si no está configurada en las etapas de paginación. Y una vez que el mapeo se construye bajo la memoria caché de paginación, entonces, nuevamente utiliza la lógica normal de paginación crítica.
Prueba de funciones

Como se mencionó anteriormente, las etapas de paginación 1 y 2 se configuran en paging profile paging-ps. Por lo tanto, en caso de que se produzca un error de paginación en las fases 1 y 2, se han omitido otros intentos de paginación en las fases 3 y 4 de paginación. Sin embargo, puede ver que se realizan pocos intentos. Y se debe a las condiciones definidas en "Condiciones excepcionales de búsqueda crítica".