Switches : Switches Cisco Catalyst 3750 Series

Troubleshooting da utilização elevada da CPU dos Catalyst 3750 Series Switch

14 Outubro 2016 - Tradução por Computador
Outras Versões: Versão em PDFpdf | Inglês (22 Agosto 2015) | Feedback


Índice


Introdução

Este documento descreve as causas da utilização elevada da CPU nos Cisco Catalyst 3750 Series Switches. Similar aos roteadores Cisco, os switches usam o comando show processes cpu para exibir a utilização da CPU para identificar as causas de sua utilização elevada. Contudo, devido às diferenças na arquitetura e nos mecanismos de encaminhamento entre roteadores e switches Cisco, as saídas típicas do comando show processes cpu diferem significativamente. Este documento também lista alguns dos sintomas comunas que causam a utilização elevada da CPU no Catalyst 3750 Series Switch.

Pré-requisitos

Requisitos

Não existem requisitos específicos para este documento.

Componentes Utilizados

A informação neste documento é baseada em Catalyst 3750 Switch.

As informações neste documento foram criadas a partir de dispositivos em um ambiente de laboratório específico. Todos os dispositivos utilizados neste documento foram iniciados com uma configuração (padrão) inicial. Se a sua rede estiver ativa, certifique-se de que entende o impacto potencial de qualquer comando.

Convenções

Consulte as Convenções de Dicas Técnicas da Cisco para obter mais informações sobre convenções de documentos.

Informações de Apoio

Antes que você olhe a arquitetura do manuseio de pacotes CPU e pesquise defeitos a utilização elevada da CPU, você deve compreender as maneiras diferentes em que o Switches com base em hardware da transmissão e do¿Â do Cisco IOSï roteadores baseado em software do½ usam o CPU. A concepção errada comum é que a utilização elevada da CPU indica o esgotamento de recursos em um dispositivo e a ameaça de um impacto. Um problema de capacidade é um dos sintomas de utilização de CPU alta no Roteadores do Cisco IOS. Contudo, um problema de capacidade é quase nunca um sintoma de utilização de CPU alta com Switches com base em hardware da transmissão.

A primeira etapa para pesquisar defeitos a utilização elevada da CPU é verificar os Release Note da versão do Cisco IOS de seu Catalyst 3750 Switch para ver se há o Bug de IOS conhecido possível. Esta maneira você pode eliminar o Bug de IOS de seus passos de Troubleshooting. Refira Release Note dos Cisco Catalyst 3750 Series Switch para a lista de Release Note para Catalyst 3750 Switch.

Pesquise defeitos problemas comuns da utilização elevada da CPU

Esta seção cobre alguns dos problemas comuns da utilização elevada da CPU no Catalyst 3750 Switch.

Alta utilização da CPU devido a uma tempestade dos mensagens de licença de IGMP

Um dos motivos comuns para a utilização elevada da CPU é que o catalizador 3750 CPU é ocupado com a tempestade de processamento de mensagens de licença do Internet Group Management Protocol (IGMP). Se uma pilha de Catalyst 3750 Switch que executam o Cisco IOS Software Release 12.1(14)EA1a é conectada a um outro interruptor, tal como um Cat6500 que execute Cactos, que gerencie perguntas com base em MAC IGMP com opções IP, a utilização elevada da CPU de 3750 experiências no processo IGMPSN (espião). Este é um resultado dos pacotes com base em MAC da pergunta que dão laços dentro da pilha. Você pode igualmente ver uma alta utilização da CPU com o processo do pedido HRPC hl2mm. Se você tem o EtherChannel configurado no catalizador 3750 pilhas com Cisco IOS Software Release 12.1(14)EA1a, uma tempestade dos mensagens de licença de IGMP pôde ser criada.

O catalizador 3750 recebe muitas perguntas IGMP. Isto faz o contador da pergunta IGMP começar incrementar por segundo por centenas. Isto conduz à alta utilização da CPU no Catalyst 3750 Switch. Refira a identificação de bug Cisco CSCeg55298 (clientes registrados somente). O erro foi identificado no Cisco IOS Software Release 12.1(14)EA1a e é fixado em Cisco IOS Software Release 12.2(25)SEA e Mais Recente. A solução permanente é promover à versão do Cisco IOS a mais atrasada. A solução temporária é desabilitar o IGMP Snooping no catalizador 3750 pilhas, ou desabilite a pergunta com base em MAC no interruptor conectado às 3750 pilhas.

Este é um exemplo de saída do comando show ip traffic que mostra pacotes IP com opções e alertas ruins que incrementam rapidamente:

Switch#show ip traffic 
 Rcvd: 48195018 total, 25628739 local destination
 0 format errors, 0 checksum errors, 10231692 bad hop count
 0 unknown protocol, 9310320 not a gateway
 0 security failures, 10231 bad options, 2640539 with options
 Opts: 2640493 end, 206 nop, 0 basic security, 2640523 loose source route
 0 timestamp, 0 extended security, 16 record route
 0 stream ID, 0 strict source route, 10231 alert, 0 cipso, 0 ump
 0 other
 Frags: 16 reassembled, 0 timeouts, 0 couldn't reassemble
 32 fragmented, 0 couldn't fragment
 Bcast: 308 received, 0 sent
 Mcast: 4221007 received, 4048770 sent
 Sent: 25342014 generated, 20710669 forwarded
 Drop: 617267 encapsulation failed, 0 unresolved, 0 no adjacency
 0 no route, 0 unicast RPF, 0 forced drop
 0 options denied, 0 source IP address zero 

 
!--- Output suppressed.

O comando show processes cpu indica a informação sobre os processos ativo no interruptor e em suas estatísticas de uso da CPU correspondentes. Este é um exemplo de saída do comando show processes cpu quando a utilização CPU é normal:

switch#show processes cpu 

CPU utilization for five seconds: 8%/4%; one minute: 6%; five minutes: 5%   

PID  Runtime(ms)  Invoked  uSecs   5Sec  1Min     5Min  TTY   Process
   1      384       32789     11  0.00%  0.00%   0.00%   0    Load Meter 
   2     2752        1179   2334  0.73%  1.06%   0.29%   0    Exec 
   3   318592        5273  60419  0.00%  0.15%   0.17%   0    Check heaps 
   4        4           1   4000  0.00%  0.00%   0.00%   0    Pool Manager 
   5     6472        6568    985  0.00%  0.00%   0.00%   0    ARP Input 
   6    10892        9461   1151  0.00%  0.00%   0.00%   0    IGMPSN

!--- CPU utilization at normal condition.

   7    67388       53244   1265  0.16%  0.04%   0.02%   0    CDP Protocol 
   8   145520      166455    874  0.40%  0.29%   0.29%   0    IP Background 
   9     3356        1568   2140  0.08%  0.00%   0.00%   0    BOOTP Server 
  10       32        5469      5  0.00%  0.00%   0.00%   0    Net Background 
  11    42256      163623    258  0.16%  0.02%   0.00%   0    Per-Second Jobs 
  12   189936      163623   1160  0.00%  0.04%   0.05%   0    Net Periodic 
  13     3248        6351    511  0.00%  0.00%   0.00%   0    Net Input 
  14      168       32790      5  0.00%  0.00%   0.00%   0    Compute load avgs 
  15   152408        2731  55806  0.98%  0.12%   0.07%   0    Per-minute Jobs 
  16        0           1      0  0.00%  0.00%   0.00%   0    HRPC hI2mm reque 


!--- Output suppressed.

Este é um exemplo de saída do comando show processes cpu quando a utilização CPU é alta devido ao processo do IGMP Snooping:

switch#show processes cpu 

CPU utilization for five seconds: 8%/4%; one minute: 6%; five minutes: 5%   

  PID  Runtime(ms)  Invoked  uSecs   5Sec  1Min     5Min  TTY   Process
   1        384       32789     11  0.00%  0.00%   0.00%   0    Load Meter 
   2       2752        1179   2334  0.73%  1.06%   0.29%   0    Exec 
   3     318592        5273  60419  0.00%  0.15%   0.17%   0    Check heaps 
   4          4           1   4000  0.00%  0.00%   0.00%   0    Pool Manager 
   5       6472        6568    985  0.00%  0.00%   0.00%   0    ARP Input 
   6      10892        9461   1151    100    100     100   0    IGMPSN 

!--- Due to high CPU utilization.

   7      67388       53244   1265  0.16%  0.04%   0.02%   0    CDP Protocol 
   8     145520      166455    874  0.40%  0.29%   0.29%   0    IP Background 
   9       3356        1568   2140  0.08%  0.00%   0.00%   0    BOOTP Server 
  10         32        5469      5  0.00%  0.00%   0.00%   0    Net Background 
  11      42256      163623    258  0.16%  0.02%   0.00%   0    Per-Second Jobs 
  12     189936      163623   1160  0.00%  0.04%   0.05%   0    Net Periodic 
  13       3248        6351    511  0.00%  0.00%   0.00%   0    Net Input 
  14        168       32790      5  0.00%  0.00%   0.00%   0    Compute load avgs 
  15     152408        2731  55806  0.98%  0.12%   0.07%   0    Per-minute Jobs 
  16          0        2874      0    100    100     100   0    HRPC hI2mm reque 
	

!--- Output suppressed.

Alta utilização da CPU devido a um túnel GRE

O túnel geral do encapsulamento de roteamento (GRE) não é apoiado pelos Cisco Catalyst 3750 Series Switch. Mesmo que esta característica possa ser configurada com CLI, os pacotes podem nem ser comutados pelo hardware, nem pelo software, que aumenta a utilização CPU.

Nota: Somente as interfaces de túnel do Distance Vetora Multicast Routing Protocol (DVMRP) são apoiadas para o roteamento de transmissão múltipla no catalizador 3750. Mesmo para isto, os pacotes não podem ser comutados com hardware. Os pacotes distribuídos através deste túnel devem ser comutados através do software. O número maior de pacotes enviados através deste túnel aumenta a utilização CPU.

Não há nenhuma ação alternativa para este problema. Esta é uma limitação do hardware nos Catalyst 3750 Series Switch.

Alta utilização da CPU durante uma alteração de configuração

Se os Catalyst 3750 Switch estão conectados em uma pilha, e se há alguma alteração de configuração feita a um interruptor, o processo running da configuração do hulc acorda e gerencie uma cópia nova da configuração running. Então, envia a todo o Switches na pilha. A configuração running nova é processo intensivo de cpu. Consequentemente, o USO de CPU é alto ao construir um processo de configuração running novo e ao enviar as configurações novas ao outro Switches. Contudo, este uso da alta utilização da CPU deve existir somente para o mesmo valor do tempo onde toma para executar a etapa de configuração da construção do comando show running-configuration.

Não há nenhuma necessidade de uma ação alternativa para este problema. O USO de CPU é normalmente alto nestas situações.

Este é um exemplo de saída do comando show processes cpu quando a utilização CPU é alta devido ao processo do corredor do hulc:

switch#show processes cpu 

CPU utilization for five seconds: 63%/0%; one minute: 27%; five minutes: 23%      

 PID Runtime(ms) Invoked   uSecs   5Sec   1Min   5Min   TTY   Process
   1      384      32789      11  0.00%  0.00%   0.00%   0    Load Meter 
   2     2752       1179    2334  0.73%  1.06%   0.29%   0    Exec 
   3   318592       5273   60419  0.00%  0.15%   0.17%   0    Check heaps 
   4        4          1    4000  0.00%  0.00%   0.00%   0    Pool Manager 
   5     6472       6568     985  0.00%  0.00%   0.00%   0    ARP Input 
   6    10892       9461    1151  0.00%  0.00%   0.00%   0    IGMPSN
   7    67388      53244    1265  0.16%  0.04%   0.02%   0    CDP Protocol 
   8   145520     166455     874  0.40%  0.29%   0.29%   0    IP Background 
   9     3356       1568    2140  0.08%  0.00%   0.00%   0    BOOTP Server 
  10       32       5469       5  0.00%  0.00%   0.00%   0    Net Background 
  11    42256     163623     258  0.16%  0.02%   0.00%   0    Per-Second Jobs 
  12   189936     163623    1160  0.00%  0.04%   0.05%   0    Net Periodic 
  13     3248       6351     511  0.00%  0.00%   0.00%   0    Net Input 
  14      168      32790       5  0.00%  0.00%   0.00%   0    Compute load avgs 
  15   152408       2731   55806  0.98%  0.12%   0.07%   0    Per-minute Jobs 
  16        0          1       0  0.00%  0.00%   0.00%   0    HRPC h12mm reque
  17    85964        426  201793 55.72% 12.05%   5.36%   0    hulc running	


!--- Output suppressed.

Alta utilização da CPU devido às requisições ARP excessivas

A utilização elevada da CPU do processo de entrada do Address Resolution Protocol (ARP) ocorre se o roteador tem que originar um número excessivo de requisições ARP. As requisições ARP para o mesmo endereço IP de Um ou Mais Servidores Cisco ICM NT são limite de taxa a um pedido cada dois segundos. Consequentemente, um número excessivo de requisições ARP tem que originar para endereços IP de Um ou Mais Servidores Cisco ICM NT diferentes. Isto pode ocorrer se uma rota IP foi configurada e aponta a uma interface de transmissão. Um exemplo óbvio é uma rota padrão, como:

ip route 0.0.0.0 0.0.0.0 Fastethernet0/0

Neste caso, o roteador gerencie uma requisição ARP para cada endereço IP de Um ou Mais Servidores Cisco ICM NT que não é rotas mais específicas diretas alcançáveis, assim que significa que o roteador gerencie uma requisição ARP para quase cada endereço no Internet. Refira a especificação de um endereço IP de Um ou Mais Servidores Cisco ICM NT do salto seguinte para rotas estáticas para obter mais informações sobre de como configurar o endereço IP de Um ou Mais Servidores Cisco ICM NT do salto seguinte para o roteamento estático.

Alternativamente, uma quantidade excessiva de requisições ARP pode ser causada por um fluxo de tráfego malicioso que faça a varredura com as sub-redes localmente anexadas. Uma indicação de tal córrego é a presença muito de um alto número de entradas de ARP incompletas na tabela ARP. Porque os pacotes do IP recebido que provocam requisições ARP têm que ser processados, pesquisar defeitos este problema é essencialmente a mesma que a utilização elevada da CPU do Troubleshooting no processo de entrada IP.

Alta utilização da CPU devido ao processo IP SNMP

Nas versões do Cisco IOS as mais atrasadas para o catalizador 3750, os pedidos do Simple Network Management Protocol (SNMP) são segurados pelo ENGINE DE SNMP. É normal para o CPU ir alta devido a este processo do ENGINE DE SNMP. O processo SNMP tem uma prioridade baixa e não deve afetar nenhuma funcionalidade no interruptor.

Refira a utilização elevada da CPU das causas do Simple Network Management Protocol (SNMP) IP para obter mais informações sobre da utilização elevada da CPU causada pelo processo do ENGINE DE SNMP.

Alta utilização da CPU devido ao molde de SDM

O gerenciamento de base de dados do interruptor (SDM) nos Catalyst 3750 Series Switch controla a informação da camada 2 e de switching da camada 3 que é mantida no Ternary Content Addressable Memory (TCAM). Os moldes de SDM são usados para configurar recursos de sistema no interruptor a fim aperfeiçoar o apoio para características específicas, que depende de como o interruptor é usado na rede. Os moldes de SDM podem ser selecionados a fim fornecer a utilização de sistema máxima para algumas funções, ou usar o molde do padrão a fim equilibrar recursos. Os moldes dão a prioridade a recursos de sistema a fim aperfeiçoar o apoio para estes tipos de características:

  • Distribuição — O molde de roteamento maximiza os recursos de sistema para o roteamento do unicast, exigidos tipicamente para um roteador ou um agregador no centro de uma rede.

  • VLAN — O molde de VLAN desabilita o roteamento e apoia o número máximo de endereços MAC unicast. Isto é selecionado tipicamente para um switch de Camada 2.

  • Acesso — O molde do acesso maximiza recursos de sistema para que o Access Control Lists (ACLs) acomode um grande número ACL.

  • Padrão — O molde do padrão dá o equilíbrio a todas as funções.

Há duas versões de cada molde: um molde de desktop e um molde do agregador.

Nota: O molde do padrão para switch de área de trabalho é o molde de desktop do padrão. O molde do padrão para o catalizador 3750-12S é o molde do agregador do padrão.

Selecione um molde de SDM apropriado que forneça a utilização de sistema máxima para a característica usada. Um molde de SDM impróprio pode sobrecarregar o CPU e severamente degradar o desempenho do interruptor.

Emita o comando da utilização do tcam da plataforma da mostra ver quanto TCAM tem sido utilizado agora e quanto está disponível.

Switch#show platform tcam utilization

CAM Utilization for ASIC# 0                      Max            Used
                                             Masks/Values    Masks/values

 Unicast mac addresses:                        784/6272         12/26
 IPv4 IGMP groups + multicast routes:          144/1152          6/26
 IPv4 unicast directly-connected routes:       784/6272         12/26
 IPv4 unicast indirectly-connected routes:     272/2176          8/44
 IPv4 policy based routing aces:                 0/0             0/0
 IPv4 qos aces:                                528/528          18/18
 IPv4 security aces:                          1024/1024         27/27

Note: Allocation of TCAM entries per feature uses
a complex algorithm. The above information is meant
to provide an abstract view of the current TCAM utilization

Se a utilização de TCAM é próxima ao máximo para alguns dos parâmetros, verifique se algumas das outras características do molde podem aperfeiçoar para esse parâmetro.

show sdm prefer access | default | dual-ipv4-and-ipv6 | routing | vlan

Switch# show sdm prefer routing

"desktop routing" template:
 The selected template optimizes the resources in
 the switch to support this level of features for
 8 routed interfaces and 1024 VLANs.

  number of unicast mac addresses:             3K
  number of igmp groups + multicast routes:    1K
  number of unicast routes:                    11K
    number of directly connected hosts:        3K
    number of indirect routes:                 8K
  number of policy based routing aces:         512
  number of qos aces:                          512
  number of security aces:                     1K

A fim especificar o molde de SDM para usar-se no interruptor, emita o sdm preferem o comando global configuration.

Nota: O reload do interruptor é exigido para usar o molde de SDM novo.

A alta utilização da CPU devido à política baseou o roteamento

A aplicação do Policy Based Routing (PBR) nos Cisco Catalyst 3750 Switch tem algumas limitações. Se estas limitações não são seguidas, pode causar a utilização elevada da CPU.

  • Você pode permitir o PBR em uma porta roteada ou em um SVI.

  • O interruptor não apoia instruções de negação do mapa de rotas para o PBR.

  • O tráfego multicast não é política-roteado. O PBR aplica-se somente ao tráfego de unicast.

  • Não combine os ACL que permitem os pacotes destinados para um endereço local. PBR para a frente estes pacotes, que podem causar o flapping do sibilo ou do protocolo da falha de Telnet ou da rota.

  • Não combine ACL com negam ACE. Os pacotes que combinam uma negação ACE são enviados ao CPU, que pode causar a utilização elevada da CPU.

  • A fim usar o PBR, você deve primeiramente permitir o molde de roteamento com o sdm prefere distribuir o comando global configuration. O PBR não é apoiado com o molde VLAN ou de padrão.

Para uma lista completa, refira as diretrizes de configuração PBR.

Alta utilização da CPU devido aos redirecionamentos de ICMP excessivos

Você pode obter o ICMP deixado cair reorienta quando um VLAN (ou alguma porta da camada 3) recebem um pacote onde o IP da fonte esteja em uma sub-rede, o IP de destino estão em uma outra sub-rede, e o salto seguinte está no mesmo VLAN ou mergulha o segmento 3.

Aqui está um exemplo:

Você pode ver esta mensagem na mostra registrar:

51w2d: ICMP-Q:Dropped redirect disabled on L3 IF: Local Port Fwding 
L3If:Vlan7 L2If:GigabitEthernet2/0/13 DI:0xB4, LT:7, Vlan:7   
SrcGPN:65, SrcGID:65, ACLLogIdx:0x0, MacDA:001a.a279.61c1, 
MacSA: 0002.5547.3bf0  IP_SA:64.253.128.3 IP_DA:208.118.132.9 IP_Proto:47
TPFFD:EDC10041_02C602C6_00B0056A-000000B4_EBF6001B_0D8A3746

Isto ocorre onde o pacote é recebido em VLAN 7 com IP 64.253.128.3 da fonte e tenta-o alcançar 208.118.132.9, o IP de destino. Você pode ver que o salto seguinte configurado no interruptor (64.253.128.41, neste caso) está igualmente no mesmo VLAN 7.


Informações Relacionadas


Document ID: 68461