El conjunto de documentos para este producto aspira al uso de un lenguaje no discriminatorio. A los fines de esta documentación, "no discriminatorio" se refiere al lenguaje que no implica discriminación por motivos de edad, discapacidad, género, identidad de raza, identidad étnica, orientación sexual, nivel socioeconómico e interseccionalidad. Puede haber excepciones en la documentación debido al lenguaje que se encuentra ya en las interfaces de usuario del software del producto, el lenguaje utilizado en función de la documentación de la RFP o el lenguaje utilizado por un producto de terceros al que se hace referencia. Obtenga más información sobre cómo Cisco utiliza el lenguaje inclusivo.
Cisco ha traducido este documento combinando la traducción automática y los recursos humanos a fin de ofrecer a nuestros usuarios en todo el mundo contenido en su propio idioma. Tenga en cuenta que incluso la mejor traducción automática podría no ser tan precisa como la proporcionada por un traductor profesional. Cisco Systems, Inc. no asume ninguna responsabilidad por la precisión de estas traducciones y recomienda remitirse siempre al documento original escrito en inglés (insertar vínculo URL).
Este documento describe cómo monitorear el uso de la CPU en los controladores de LAN inalámbrica de Catalyst 9800, además de cubrir varias recomendaciones de configuración.
Antes de profundizar en la resolución de problemas de carga de CPU, debe comprender los aspectos básicos del uso de las CPU en los controladores de LAN inalámbrica de Catalyst 9800 y algunos detalles sobre la arquitectura de software.
En general, el documento Prácticas recomendadas de Catalyst 9800 define un conjunto de buenas configuraciones que pueden evitar problemas en el nivel de la aplicación. Por ejemplo, utilizar el filtrado de ubicación para mDNS o garantizar que la exclusión de clientes siempre está habilitada. Se recomienda que aplique esas recomendaciones junto con los temas expuestos aquí.
Los controladores Catalyst 9800 se diseñaron como una plataforma flexible, orientada a diferentes cargas de red y centrada en la escalabilidad horizontal. La denominación de desarrollo interno era eWLC con la e de elástico, para significar que la misma arquitectura de software, sería capaz de funcionar desde un solo sistema integrado de CPU pequeño a varios dispositivos de gran escala de CPU/núcleo.
Cada WLC ha tenido dos lados distintos:
En una vista simplificada, el controlador tiene mecanismos de comunicación entre el plano de control y el plano de datos, punt, envía tráfico de la red al plano de control e inyección, empuja tramas desde el plano de control a la red.
Como parte de una posible investigación de resolución de problemas de CPU alta, es necesario monitorear el mecanismo de punt, para evaluar qué tráfico está llegando al plano de control y podría conducir a una carga alta.
Para el controlador Catalyst 9800, esto se ejecuta como parte del procesador de paquetes de Cisco (CPP), que es un marco de software para desarrollar motores de reenvío de paquetes, que se utilizan en varios productos y tecnologías.
La arquitectura permite un conjunto de funciones comunes, a través de diferentes implementaciones de hardware o software. Por ejemplo, permitir funciones similares para 9800CL frente a 9800-40, con diferentes escalas de rendimiento.
El WLC realiza el balanceo de carga a través de las CPU durante el proceso de unión CAPWAP AP AP, con el diferenciador clave que es el nombre de la etiqueta del sitio AP. La idea es que cada AP represente una carga específica de CPU agregada, proveniente de su actividad de cliente, y el AP mismo. Existen varios mecanismos para realizar este equilibrio:
Por ejemplo, si tiene un 9800-40, que maneja una oficina principal, más 5 sucursales, con diferentes conteos de AP, la configuración podría verse de la siguiente manera:
wireless tag site office-main
load 120
wireless tag site branch-1
load 10
wireless tag site branch-2
load 12
wireless tag site branch-3
load 45
wireless tag site branch-4
load 80
wireless tag site branch-5
load 5
En esta situación, no desea que la etiqueta de la oficina principal esté en el mismo WNCD que la sucursal 3 y la sucursal 4, hay en total 6 etiquetas de sitio y la plataforma tiene 5 WNCD, por lo que podría haber una posibilidad de que las etiquetas de sitio cargadas más altas aterrizaran en la misma CPU. Con el comando load, puede crear una topología de balanceo de carga de AP predecible.
El comando load es un tamaño esperado. No tiene que coincidir exactamente con el conteo de AP, pero normalmente se configura en los AP esperados que pueden unirse.
Para las plataformas de hardware, el recuento de WNCD es fijo: 9800-40 tiene 5, 9800-80 tiene 8. Para 9800CL (virtual), el número de WNCD dependerá de la plantilla de máquina virtual utilizada durante la implementación inicial.
Como regla general, si desea averiguar cuántas WNCD se están ejecutando en el sistema, puede utilizar este comando en todos los tipos de controladores:
9800-40#show processes cpu platform sorted | count wncd
Number of lines which match regexp = 5
En el caso específico de 9800-CL, puede utilizar el comando show platform software system all
para recopilar detalles sobre la plataforma virtual:
9800cl-1#show platform software system all
Controller Details:
=================
VM Template: small
Throughput Profile: low
AP Scale: 1000
Client Scale: 10000
WNCD instances: 1
La asignación de AP a WNCD se aplica durante el proceso de unión CAPWAP AP AP, por lo que no se espera que cambie durante las operaciones, independientemente del método de equilibrio, a menos que haya un evento de reinicio CAPWAP en toda la red donde todos los AP se desconecten y se vuelvan a unir.
El comando CLIshow wireless loadbalance tag affinity
puede proporcionar una manera fácil de ver el estado actual del equilibrio de carga de AP en todas las instancias WNCD:
98001#show wireless loadbalance tag affinity
Tag Tag type No of AP's Joined Load Config Wncd Instance
---------------------------------------------------------------------------------------------
Branch-tag SITE TAG 10 0 0
Main-tag SITE TAG 200 0 1
default-site-tag SITE TAG 1 NA 2
si desea correlacionar la distribución de AP, contra el conteo de clientes y la carga de CPU, la manera más fácil es utilizar la herramienta de soporte de WCAE y cargar unshow tech wireless
tomado durante las horas ocupadas. La herramienta resume el conteo de clientes WNCD, tomado de cada AP que está asociado con él.
Ejemplo de un controlador debidamente balanceado, durante el bajo uso y el conteo de clientes:
Otro ejemplo, para un controlador más cargado, que muestra el uso normal de la CPU:
En resumen, puede resumir las diferentes opciones en:
Este umbral de 500 AP es para marcar cuándo es efectivo aplicar el mecanismo de balanceo de carga, ya que agrupa los AP en bloques de 100 unidades de forma predeterminada.
Hay escenarios donde usted desea hacer un equilibrio más avanzado del AP, y es deseable tener el control granular sobre cómo los AP se distribuyen a través de las CPU. Por ejemplo, escenarios de densidad muy alta donde la métrica de carga clave es el conteo de clientes frente a centrarse únicamente en el número de AP presentes en el sistema.
Un buen ejemplo de esta situación son los grandes acontecimientos: un edificio podría albergar miles de clientes, más de varios cientos de AP, y necesitaría dividir la carga en tantas CPU como fuera posible pero optimizar el roaming al mismo tiempo. Por lo tanto, no se desplaza por WNCD a menos que sea necesario. Usted desea prevenir situaciones de sal y pimienta donde múltiples APs en diferentes WNCDs/etiquetas de sitio se entremezclan en la misma ubicación física.
Para ayudar a ajustar y proporcionar una visualización de la distribución, puede utilizar la herramienta WCAE y aprovechar la función AP RF View:
Esto le permite ver la distribución de AP/WNCD, simplemente establezcaView Type
en WNCD. Aquí, cada color representaría un WNCD/CPU. También puede establecer el filtro RSSI en -85, para evitar conexiones de señal baja, que también son filtradas por el algoritmo RRM en el controlador.
En el ejemplo anterior, correspondiente a Cisco Live EMEA 24, puede ver que la mayoría de los AP adyacentes se agrupan bien en el mismo WNCD, con superposición cruzada muy limitada.
Las etiquetas de sitio asignadas al mismo WNCD, obtienen el mismo color.
Es importante recordar el concepto de la arquitectura Cisco IOS XE y tener en cuenta que hay dos vistas principales del uso de la CPU. Uno proviene del soporte histórico de Cisco IOS, y el principal, con una vista holística de la CPU en todos los procesos y núcleos.
En general, puede utilizar el comandoshow processes cpu platform sorted
para recopilar información detallada de todos los procesos en Cisco IOS XE:
9800cl-1#show processes cpu platform sorted
CPU utilization for five seconds: 8%, one minute: 14%, five minutes: 11%
Core 0: CPU utilization for five seconds: 6%, one minute: 11%, five minutes: 5%
Core 1: CPU utilization for five seconds: 2%, one minute: 8%, five minutes: 5%
Core 2: CPU utilization for five seconds: 4%, one minute: 12%, five minutes: 12%
Core 3: CPU utilization for five seconds: 19%, one minute: 23%, five minutes: 24%
Pid PPid 5Sec 1Min 5Min Status Size Name
--------------------------------------------------------------------------------
19953 19514 44% 44% 44% S 190880 ucode_pkt_PPE0
28947 8857 3% 10% 4% S 1268696 linux_iosd-imag
19503 19034 3% 3% 3% S 247332 fman_fp_image
30839 2 0% 0% 0% I 0 kworker/0:0
30330 30319 0% 0% 0% S 5660 nginx
30329 30319 0% 1% 0% S 20136 nginx
30319 30224 0% 0% 0% S 12480 nginx
30263 1 0% 0% 0% S 4024 rotee
30224 8413 0% 0% 0% S 4600 pman
30106 2 0% 0% 0% I 0 kworker/u11:0
30002 2 0% 0% 0% S 0 SarIosdMond
29918 29917 0% 0% 0% S 1648 inet_gethost
Hay varios puntos clave que destacar aquí:
show tech wireless
puede generar una carga máxima en procesos IOSd, smand, pubd, ya que se recopila una salida de texto muy grande, con cientos de comandos CLI ejecutados. Esto no es un problema, y la carga cae después de que se haya completado la salida.Pid PPid 5Sec 1Min 5Min Status Size Name
--------------------------------------------------------------------------------
19371 19355 62% 83% 20% R 128120 smand
27624 27617 53% 59% 59% S 1120656 pubd
4192 4123 11% 5% 4% S 1485604 linux_iosd-imag
Pid PPid 5Sec 1Min 5Min Status Size Name
--------------------------------------------------------------------------------
21094 21086 25% 25% 25% S 978116 wncd_0
21757 21743 21% 20% 20% R 1146384 wncd_4
22480 22465 18% 18% 18% S 1152496 wncd_7
22015 21998 18% 17% 17% S 840720 wncd_5
21209 21201 16% 18% 18% S 779292 wncd_1
21528 21520 14% 15% 14% S 926528 wncd_3
show processes cpu sorted
. Esto corresponde a la actividad del proceso linux_iosd-image de la lista de Cisco IOS XE.9800cl-1#show processes cpu sorted
CPU utilization for five seconds: 2%/0%; one minute: 3%; five minutes: 3%
PID Runtime(ms) Invoked uSecs 5Sec 1Min 5Min TTY Process
215 81 88 920 1.51% 0.12% 0.02% 1 SSH Process
673 164441 7262624 22 0.07% 0.00% 0.00% 0 SBC main process
137 2264141 225095413 10 0.07% 0.04% 0.05% 0 L2 LISP Punt Pro
133 534184 21515771 24 0.07% 0.04% 0.04% 0 IOSXE-RP Punt Se
474 1184139 56733445 20 0.07% 0.03% 0.00% 0 MMA DB TIMER
5 0 1 0 0.00% 0.00% 0.00% 0 CTS SGACL db cor
6 0 1 0 0.00% 0.00% 0.00% 0 Retransmission o
2 198433 726367 273 0.00% 0.00% 0.00% 0 Load Meter
7 0 1 0 0.00% 0.00% 0.00% 0 IPC ISSU Dispatc
10 3254791 586076 5553 0.00% 0.11% 0.07% 0 Check heaps
4 57 15 3800 0.00% 0.00% 0.00% 0 RF Slave Main Th
8 0 1 0 0.00% 0.00% 0.00% 0 EDDRI_MAIN
Esta opción está disponible en laMonitoring/System/CPU Utilization
ficha .
La lista de procesos exacta variaría según el modelo de controlador y la versión de Cisco IOS XE. Esta es una lista de algunos de los procesos clave, y no pretende cubrir todas las entradas posibles.
Nombre del proceso |
¿Qué hace? |
Evaluación |
wncd_x |
Gestiona la mayoría de las operaciones inalámbricas. Según el modelo 9800, puede haber entre 1 y 8 instancias. |
Se pueden ver picos de utilización alta durante las horas punta. Informe si la utilización se bloquea durante un 95% o más durante varios minutos. |
linux_iosd-image |
proceso IOS |
Se espera un uso elevado si se recopila una gran salida de CLI (show tech). Las operaciones SNMP grandes o demasiado frecuentes pueden conducir a una CPU alta. |
nginx |
Servidor Web |
Este proceso puede mostrar picos y solo se puede informar sobre una carga alta sostenida. |
ucode_pkt_PPE0 |
Plano de datos en 9800CL/9800L |
Utilice el comando |
ezman |
Administrador de chipsets para interfaces |
Una CPU alta sostenida aquí podría indicar un problema de hardware o un posible problema de software del núcleo. Se puede informar. |
dbm |
Administrador de bases de datos |
Aquí se puede informar de una CPU alta y sostenida. |
odm_X |
Operation Data Manager gestiona las bases de datos consolidadas entre los procesos. |
Se esperaba una CPU alta en los sistemas cargados. |
pícaro |
Gestiona la funcionalidad de acceso no deseado |
Aquí se puede informar de una CPU alta y sostenida. |
smand |
Shell Manager se encarga del análisis de la CLI y de la interacción entre los diferentes procesos. |
Se esperaba una CPU alta mientras se gestionaba una salida CLI grande. Se puede informar de una CPU alta y sostenida en ausencia de carga. |
emd |
Administrador de Shell. Se encarga del análisis de CLI y de la interacción entre los diferentes procesos. |
Se esperaba una CPU alta mientras se gestionaba una salida CLI grande. Se puede informar de una CPU alta y sostenida en ausencia de carga. |
púbico |
Parte de la gestión de telemetría |
Se esperaba una CPU alta para suscripciones de telemetría grandes. Se puede informar de una CPU alta y sostenida en ausencia de carga. |
Los controladores de LAN inalámbrica de Catalyst 9800 cuentan con mecanismos de protección extensos en torno a la actividad de la red o del cliente inalámbrico, para evitar un uso elevado de la CPU debido a situaciones accidentales o intencionales. Existen varias funciones clave diseñadas para ayudarle a contener dispositivos problemáticos:
Esta opción está activada de forma predeterminada y forma parte de las políticas de protección inalámbrica, y se puede activar o desactivar según el perfil de política. Esto puede detectar varios problemas de comportamiento diferentes, quitar el cliente de la red y configurarlo en una lista de exclusión temporal. Mientras que el cliente está en este estado excluido, los AP no hablan con ellos, evitando cualquier acción adicional.
Una vez transcurrido el temporizador de exclusión (60 segundos de forma predeterminada), se permite al cliente volver a asociarse.
Existen varios desencadenadores para la exclusión de clientes:
La exclusión de clientes protege su controlador, AP e infraestructura AAA (Radius) de varios tipos de actividad alta que podrían conducir a una CPU alta. En general, no es recomendable deshabilitar ninguno de los métodos de exclusión, a menos que sea necesario para un ejercicio de solución de problemas o un requisito de compatibilidad.
La configuración predeterminada funciona para casi todos los casos y solo en algunos escenarios excepcionales, es necesaria para aumentar el tiempo de exclusión o deshabilitar algún desencadenador específico. Por ejemplo, algunos clientes heredados o especializados (IOT/Medicina), necesitan que el disparador de falla de asociación esté inhabilitado, debido a defectos del lado del cliente que no se pueden reparar fácilmente
Puede personalizar los desencadenadores en la interfaz de usuario: Políticas de configuración/protección inalámbrica/exclusión de clientes:
El disparador de exclusión ARP se diseñó para habilitarse permanentemente a nivel global, pero se puede personalizar en cada perfil de política. Puede verificar el estado con el comandosh wireless profile policy all
look para este resultado específico:
ARP Activity Limit
Exclusion : ENABLED
PPS : 100
Burst Interval : 5
Se trata de un mecanismo avanzado en el plano de datos para garantizar que el tráfico enviado al plano de control no supere un conjunto predefinido de umbrales. La función se denomina Punt Policers y, en casi todos los casos, no es necesario tocarlos e, incluso en ese caso, solo se debe realizar mientras se trabaja con el Soporte de Cisco.
La ventaja de esta protección es que proporciona una perspectiva muy detallada de lo que está sucediendo en la red, y si hay alguna actividad específica que esté teniendo una velocidad aumentada, o paquetes inesperadamente altos por segundo.
Esto solo se expone a través de CLI, ya que normalmente forman parte de una funcionalidad avanzada que rara vez se necesita modificar.
Para obtener una vista de todas las políticas de punt:
9800-l#show platform software punt-policer
Per Punt-Cause Policer Configuration and Packet Counters
Punt Config Rate(pps) Conform Packets Dropped Packets Config Burst(pkts) Config Alert
Cause Description Normal High Normal High Normal High Normal High Normal High
-------------------------------------------------------------------------------------------------------------------------------------------------------------
2 IPv4 Options 874 655 0 0 0 0 874 655 Off Off
3 Layer2 control and legacy 8738 2185 33 0 0 0 8738 2185 Off Off
4 PPP Control 437 1000 0 0 0 0 437 1000 Off Off
5 CLNS IS-IS Control 8738 2185 0 0 0 0 8738 2185 Off Off
6 HDLC keepalives 437 1000 0 0 0 0 437 1000 Off Off
7 ARP request or response 437 1000 0 330176 0 0 437 1000 Off Off
8 Reverse ARP request or repso 437 1000 0 24 0 0 437 1000 Off Off
9 Frame-relay LMI Control 437 1000 0 0 0 0 437 1000 Off Off
10 Incomplete adjacency 437 1000 0 0 0 0 437 1000 Off Off
11 For-us data 40000 5000 442919246 203771 0 0 40000 5000 Off Off
12 Mcast Directly Connected Sou 437 1000 0 0 0 0 437 1000 Off Off
Esta puede ser una lista grande, con más de 160 entradas, dependiendo de la versión del software.
En el resultado de la tabla, desea verificar la columna de paquetes descartados junto con cualquier entrada que tenga un valor distinto de cero en el conteo de descartes alto.
Para simplificar la recopilación de datos, puede utilizar el comandoshow platform software punt-policer drop-only
, para filtrar sólo las entradas del regulador de tráfico con caídas.
Esta función podría ser útil para identificar si hay tormentas ARP o inundaciones de sonda 802.11 (utilizan paquetes de cola 802.11 a LFTS). LFTS significa servicio de transporte de reenvío de Linux).
En todas las versiones de mantenimiento recientes, el controlador tiene un monitor de actividad, para reaccionar dinámicamente a la CPU alta y asegurarse de que los túneles CAPWAP AP AP permanezcan activos, ante una presión insostenible. La función verifica la carga WNCD y comienza a regular la nueva actividad del cliente, para asegurar que quedan suficientes recursos para manejar las conexiones existentes y proteger la estabilidad CAPWAP. Esto se habilita por defecto y no tiene opciones de configuración.
Hay tres niveles de protección definidos, L1 con 80% de carga, L2 con 85% de carga y L3 con 89%, cada uno desencadenando diferentes caídas de protocolos entrantes como mecanismos de protección. La protección se elimina automáticamente en cuanto disminuye la carga.
En una red saludable, no puede ver los eventos de carga L2 o L3, y si ocurren con frecuencia, se pueden investigar.
Para monitorear, utilice el comandowireless stats cac
como se muestra en la imagen.
9800-l# show wireless stats cac
WIRESLESS CAC STATISTICS
---------------------------------------------
L1 CPU Threshold: 80 L2 CPU Threshold: 85 L3 CPU Threshold: 89
Total Number of CAC throttle due to IP Learn: 0
Total Number of CAC throttle due to AAA: 0
Total Number of CAC throttle due to Mobility Discovery: 0
Total Number of CAC throttle due to IPC: 0
CPU Throttle Stats
L1-Assoc-Drop: 0 L2-Assoc-Drop: 0 L3-Assoc-Drop: 0
L1-Reassoc-Drop: 0 L2-Reassoc-Drop: 0 L3-Reassoc-Drop: 0
L1-Probe-Drop: 12231 L2-Probe-Drop: 11608 L3-Probe-Drop: 93240
L1-RFID-Drop: 0 L2-RFID-Drop: 0 L3-RFID-Drop: 0
L1-MDNS-Drop: 0 L2-MDNS-Drop: 0 L3-MDNS-Drop: 0
mDNS como protocolo permite un enfoque sin intervención del usuario para detectar servicios en todos los dispositivos, pero al mismo tiempo, puede ser muy activo y activar la carga de forma significativa, si no se configura correctamente.
mDNS, sin ningún tipo de filtrado, puede impulsar fácilmente el uso de la CPU WNCD, viniendo de varios factores:
Puede verificar el tamaño de la lista mDNS por servicio con este comando:
9800-l# show mdns-sd service statistics
Service Name Service Count
-----------------------------------------------------------------------------
_ipp._tcp.local 84
_ipps._tcp.local 52
_raop._tcp.local 950
_airplay._tcp.local 988
_printer._tcp.local 13
_googlerpc._tcp.local 12
_googlecast._tcp.local 70
_googlezone._tcp.local 37
_home-sharing._tcp.local 7
_cups._sub._ipp._tcp.local 26
Esto puede dar una idea de cuán grande puede llegar a ser una consulta dada. No denota un problema por sí solo, solo una manera de supervisar lo que se rastrea.
Existen algunas recomendaciones importantes para la configuración de mDNS:
9800-1(config)# mdns-sd gateway
9800-1(config-mdns-sd)# transport ipv4
De forma predeterminada, utiliza transporte IPv4. Para el rendimiento, se recomienda utilizar IPv6 o IPv4, pero no ambos.
En caso de que observe una carga de CPU alta y ninguno de los pasos anteriores le ayude, póngase en contacto con CX a través de un caso y agregue estos datos como punto de partida:
show tech-support wireless
request platform software trace archive last <days> to-file bootflash:<archive file>
Revisión | Fecha de publicación | Comentarios |
---|---|---|
2.0 |
06-Jun-2025
|
Texto alternativo actualizado, requisitos de estilo, traducción automática, requisitos de marca y formato para cumplir con las directrices de Cisco para la externalización |
1.0 |
09-May-2024
|
Versión inicial |