Introdução
Este original descreve o script que detecta o aumento na ligação de dados do erro ou contadores NPU pela porta.
Pré-requisitos
Requisitos
A Cisco recomenda que você tenha conhecimento destes tópicos:
Este documento não se restringe a versões de software e hardware específicas.
As informações neste documento foram criadas a partir de dispositivos em um ambiente de laboratório específico. Todos os dispositivos utilizados neste documento foram iniciados com uma configuração (padrão) inicial. Se a rede estiver ativa, certifique-se de que você entenda o impacto potencial de qualquer comando.
Problema
Os contadores de erros a nível da porta podem ser um grande origem de informação a fim pesquisar defeitos várias edições com um nó de StarOS.
A maioria de informação valiosa, neste caso, é a variação daqueles contadores durante um determinado período de tempo.
Os valores estáticos que estão disponíveis na saída de um único comando " show " não estão fornecendo a informação suficiente para fazer conclusões significativas.
Uma aproximação típica é recolher diversas saídas dos comandos show e fazer então manualmente a diferença.
Esta pode ser umas tarefas difíciis, especialmente quando não se sabe que porta está impactada exatamente.
Este script simplifica este processo fornecendo a variação dos contadores de erros durante um determinado período de tempo pela porta.
Exemplos das edições que podem ser detectadas:
- Más combinações MTU
- Misconfiguration VLAN
- Erros nivelados da ligação de dados
Como o script trabalha?
No arquivo SSD, há duas saídas dos contadores do npu do show port e dos contadores da ligação de dados do show port tomados no intervalo de diversos minutos.
Isto permite para ver a porta nivelar a tempo contadores em um determinado momento e ver igualmente sua dinâmica.
Este script está verificando os contadores de erros das saídas do comando e gerencie um alerta quando um aumento no contador é observado.
Geralmente, isto indica um problema a exame ou nível de rede. Continue com as etapas pesquisar defeitos segundo a situação.
Contadores NPU
Estes contadores NPU estão sendo observados:
Contador |
Descrição |
Notas |
Erro do HW |
O número de rejeitado pacotes devido a first in, ao first-out (FIFO, primeiro a entrar, primeiro a sair) (FIFO) passado ou ao underrun. |
|
Porta não-operacional |
O número de devido rejeitado pacotes mover não operacional. |
|
O SRC MAC é Multicast |
O número de rejeitado pacotes devido ao endereço MAC de origem é Multicast. |
|
Etiqueta desconhecida VLAN |
O número de rejeitado pacotes devido a uma etiqueta não reconhecida da rede de área local virtual (VLAN). |
Verifique a configuração de VLAN no interruptor do seguinte-lúpulo |
Encabeçamento IPv4 ruim |
O número de pacotes rejeitou devido ao encabeçamento IPv4 inválido |
|
IPv4 MRU excedido |
O número de rejeitado pacotes devido ao comprimento do pacote é demasiado longo. |
|
Fragmento minúsculo TCP |
O número de pacotes rejeitou devido ao fragmento minúsculo TCP |
|
O TTL expirou |
O número de pacotes rejeitou porque seu parâmetro do tempo ao vivo foi excedido. |
|
Demasiado curto: IP |
O número de rejeitado pacotes devido ao pacote IP demasiado curto |
|
Demasiado curto: ICMP |
O número de rejeitado pacotes devido ao pacote ICMP demasiado curto para a chave da consulta |
|
Demasiado curto: IGMP |
O número de rejeitado pacotes devido ao pacote de IGMP demasiado curto para a chave da consulta |
|
Demasiado curto: TCP |
O número de rejeitado pacotes devido ao pacote de TCP demasiado curto para a chave da consulta |
|
Demasiado curto: UDP |
O número de rejeitado pacotes devido ao pacote de UDP demasiado curto para a chave da consulta |
|
Demasiado curto: IPIP |
O número de rejeitado pacotes devido ao pacote de UDP demasiado curto para a chave da consulta |
Aparentemente um erro tipográfico na documentação. Provavelmente é pacote IPIP a curto para a chave da consulta. |
Demasiado curto: GRE |
O número de rejeitado pacotes devido ao tamanho do cabeçalho de GRE < 8 bytes |
|
Demasiado curto: Chave GRE |
O número de rejeitado pacotes devido ao cabeçalho de GRE diz o presente chave mas o tamanho de cabeçalho < 13 bytes |
|
Não fazem os descartes do frag |
Pacotes que exigem a fragmentação que são rejeitados pelo NPU porque o bit do Don't Fragment do cabeçalho IP é ajustado. |
|
IPv4VlanMap deixado cair |
Número total de pacotes do mapa IPv4 VLAN que foram deixados cair. |
|
Fluxo MPLS não encontrado |
Número total de pacotes deixados cair quando um fluxo MPLS não foi encontrado. |
|
Contadores da ligação de dados
Estes contadores da ligação de dados são analisados:
Contador |
Descrição |
Notas |
Bytes RX RUINS |
O número de bytes recebidos. |
|
Bytes TX RUINS |
O número de bytes que foi transmitido com erros. |
|
RX OVF |
O número de excessos recebidos. |
|
TX ADIAM |
O número de quadros adiados em cima do primeiros transmite a tentativa devido a uma linha ocupada. |
|
TX COL |
O número de eventos regulares da colisão que ocorrem durante a transmissão. |
|
RX CRC CURTO |
O número de quadros, menos de 64 bytes de comprimento, recebido com erro da verificação de redundância cíclica (CRC). |
|
TX SCOL |
O número de quadros transmitidos sem algum erro que segue uma única colisão. |
|
RX NENHUM FSD |
O número de quadros recebidos sem detecção do delimitador do quadro do começo (FSD) mas com afirmação do portador. |
|
TX MCOL |
O número de quadros transmitidos sem algum erro depois do colisão múltipla. |
|
TX XCOL |
O número de quadros que experimentaram 16 colisões consecutiva ou mais. |
|
TX LCOL |
O número de aborto da transmissão devido a uma colisão que ocorre após a transmissão de pacotes que é 64 byes de comprimento. |
|
PAUSA TX |
O número de quadros transmitidos corretos do controlo de fluxo. |
|
RX CRC LONGO |
O número de quadros, maior do que o tamanho máximo do frame, recebido com erro CRC. |
|
TX ERR |
O número de quadros transmitidos com um erro devendo transmitir a afirmação da corrente de fundo FIFO ou do sinal TXERR |
|
PAUSA RX |
O número de quadros recebidos corretos do controlo de fluxo. |
|
RX FALS CR |
O número de eventos falsos do portador detectados. |
|
SYM ERR RX |
O número de frames recebidos durante que os erros de símbolo (PHY) físicos foram detectados. |
|
Quadros do MAU RX |
O número de frames recebidos com erros. |
|
Runt frame RX |
O número de frames recebidos de menos que esperaram o tamanho. |
|
Quadros de tamanho grande RX |
O número de quadros de tamanho grande recebidos. |
Provavelmente um erro na documentação. Devem ser o mesmos como “quadros de tamanho grande RX” |
Quadros de tamanho grande RX |
O número de quadros desproporcionados recebidos. |
|
NORMA CRC RX |
O número de quadros, com comprimentos entre 64 bytes e o tamanho máximo do frame, recebido com um número inteiro de bytes e um erro da verificação de redundância cíclica (CRC). |
|
NORMA ALI RX |
O número de quadros, com comprimentos entre 64 bytes e o tamanho máximo do frame, recebido com um número de bytes NON-integral e um erro da verificação de redundância cíclica (CRC). |
|
RX GPCS ERR |
O número de frames recebidos durante que os erros de símbolo (PHY) físicos foram detectados. |
|
Há umas séries de contadores da ligação de dados vistos somente para relações STM:
Contador |
Descrição |
Notas |
grupo dos quadros FECN do rx |
|
Frame Relay relativo |
grupo dos quadros BECN do rx |
|
Frame Relay relativo |
erros CRC do rx |
|
|
erros de alinhamento do rx |
|
|
violações de comprimento do rx |
|
|
o rx FBP esvazia |
|
|
fila do host do rx completamente |
|
|
encabeçamento ilegal do rx |
|
|
aborto do rx |
|
|
erros de paridade do rx |
|
|
rx DLCI unsupported |
|
Frame Relay relativo |
erros do rx SOP/EOP |
|
|
bytes de erro totais do rx |
|
|
grupo dos quadros FECN do tx |
|
Frame Relay relativo |
grupo dos quadros BECN do tx |
|
Frame Relay relativo |
underrun do tx |
|
|
quadros abortados tx |
|
|
|
|
|
Saídas de exemplo
Aumente em algum do erro ou os countersoutputs da ligação de dados do show port do countersor do npu da porta do fromshow dos contadores de queda são observados no SSD fornecido.
O script destaca todos os contadores que estão sendo verificados, mas somente esses com aumento devem ser analisados, que é esses que contêm 'o aumento de seguimento observado para o port'statement
Note que tais aumentos não estão apontando necessariamente a uma edição com o nó. Geralmente, é um problema com um cabo, problema SFP, de misconfiguration ou de nível de rede.
Verifique a definição dos contadores afetados e continue para a frente com as etapas pesquisar defeitos baseado nesta.
########################## NPU COUNTERS ######################################
No errors increase found during monitoring period
######################## DATALINK COUNTERS ###################################
Errors observed in the output of 'show port datalink counters' between Monday October 01 12:29:49 CDT 2018 and Monday October 01 13:03:24 CDT 2018 on the ports 6/10,6/16,5/15
- Following increase in errors is seen on port 6/10:
RX OverSize frames:Frames: 404
- Following increase in errors is seen on port 6/16:
RX OverSize frames:Frames: 402
- Following increase in errors is seen on port 5/15:
RX OverSize frames:Frames: 3
Como compreender a saída?
Se nenhuma variação foi considerada em alguns dos contadores de nosso interesse em alguma porta, o script não retorna nada.
Se há uma variação com pelo menos um contador de nosso interesse, sobre, pelo menos, uma porta - o script não geraria um alerta.
Os alertas são agrupados pelo tipo (NPU ou ligação de dados) e então pela porta.
Primeiramente, haveria uma indicação que resume todos os resultados e o período de monitoração.
Errors observed in the output of 'show port datalink counters' between Monday October 01 12:29:49 CDT 2018 and Monday October 01 13:03:24 CDT 2018 on the ports 6/10,6/16,5/15
Acima dela está entre segunda-feira 1 de outubro 12:29:49 CDT 2018 e segunda-feira 1 de outubro 13:03:24 CDT 2018, isto é realiza-se em torno das meias horas.
Os timestamps são tomados das saídas de contadores da ligação de dados do show port ou, respectivamente, de contadores do npu do show port
Mais tarde, há um sumário dos contadores problemáticos identificados pela porta.
- Following increase in errors is seen on port 6/16:
RX OverSize frames:Frames: 402
No exemplo mencionado, havia 402 quadros desproporcionados recebidos na porta de 6/16 durante o período de monitoração (em torno das meias horas).