Módulos e interfaces de Cisco : Cisco Nexus 7000 M2-Series 6-Port 40 Gigabit Ethernet Module

Troubleshooting de los errores de la tela CRC del nexo 7000

16 Enero 2016 - Traducción Automática
Otras Versiones: PDFpdf | Inglés (7 Noviembre 2015) | Comentarios

Introducción 

Este documento describe cómo resolver los errores de entramado señalados en la plataforma del nexo 7000 de Cisco. Un Troubleshooting de las sumas de comprobación de la redundancia cíclica de la tela (CRC) implica la obtención de datos, la análisis de datos, y un proceso de la eliminación para aislar el componente del problema. Este documentos abarca la mayoría de los tipos comunes de errores de la tela CRC.

Contribuido por Yogesh Ramdoss, ingeniero de Cisco TAC.

Descripción de la detección de la tela CRC

Aquí está un diagrama de alto nivel de un módulo de recursos físicos del nexo 7018 con el linecards M1:

 

 

La imagen anterior da una descripción de los componentes implicados cuando un paquete atraviesa un módulo de recursos físicos. Efectúe 1 (s1), la etapa 2 (s2), y la etapa 3 (S3) es las tres etapas de la tela del nexo 7000, el pulpo es el Motor de cola, Santa Cruz (SC) es el ASIC de recurso físico, y cita como ejemplo 1 y 2 es los dos casos SC en XBAR. Este documento considera solamente uno XBAR. Recuerde por favor que la mayor parte de los 7000 Series Switch del nexo tienen tres o más XBARs instaló.

Con la suposición que un flujo unidireccional del módulo 1 (M1) al módulo 2 (M2) está presente, el ingreso Octopus-1 en el M1 realiza los errores check en los paquetes que recibe del sur, y la salida Octopus-1 en el M2 del norte. Si el CRC se detecta en el S3, un problema pudo haber sucedido en el s1 o el s2 también, puesto que no se realiza ningún control CRC en esas etapas. Así pues, los dispositivos implicados en la trayectoria son el pulpo del ingreso, los chasis, los recursos físicos de barra cruzada, y el pulpo de la salida.

En arquitectura M1/Fab1, los CRC se detectan solamente en el linecard de la salida (S3).

Aquí está un mensaje de error de ejemplo:

%OC_USD-SLOT1-2-RF_CRC: OC1 received packets with
 CRC error from MOD 15 through XBAR slot 1/inst 1

Esto es señalada por el M1, que indica que él los paquetes recibidos con el CRC incorrecto del módulo 15 (M15) vía XBAR el slot 1/instance 1.

Entienda los diversos errores de la tela CRC

Esta sección describe cuatro de la mayoría de los tipos comunes de errores de la tela CRC.

  • Error crc con un módulo de fuente única, reciba el módulo, y XBAR el caso:
    %OC_USD-SLOT1-2-RF_CRC: OC1 received packets with
     CRC error from MOD 15 through XBAR slot 1/inst 1
    Esto significa que el módulo en el slot1 detectó a error crc de M15 a través XBAR del slot 1/instance 1. El módulo donde los errores CRC originan se refiere como el módulo de ingreso (M15 en este caso), y el módulo que señaló el problema es el módulo de la salida (M1). XBAR 1 es la barra cruzada en la cual el paquete fue recibido. Hay dos casos por XBAR. En este caso, el M1 detectó los errores CRC de M15 con XBAR el caso 1. del slot1.

  • Error crc con un módulo de fuente única, reciba el módulo, pero ningún XBAR caso:
    %OC_USD-SLOT4-2-RF_CRC: OC2 received packets with
     CRC error from MOD 1
    En este mensaje, el módulo 4 (M4) señaló error crc del M1. Note que XBAR la información falta. El sistema no puede comprobar XBAR que el paquete atravesó. Hay muchas razones, pero las mas comunes son: La información en la encabezado de la tela del paquete pudo ser corrupta, así que el módulo de fuente no puede ser determinado; XBAR que fue atravesado se quita del sistema puesto que el error incrementó. Así, no fue señalado en el mensaje de Syslog por hora.

  • Error crc sin reciba el módulo:
    %OC_USD-2-RF_CRC: OC1 received packets with
     CRC error from MOD 16 through XBAR slot 1/inst 1
    El en este caso, un dispositivo detectó un CRC del módulo 16 (M16) con XBAR 1. No hay, sin embargo, módulo de receptor. Cuando el supervisor (SUP) detecta un CRC que venga del módulo de recursos físicos, la información del slot no se registra. Cuando usted no ve la información del slot, después el SUP detectó el problema. Esto no significa que el SUP es malo. Apenas como cuando el módulo señala el problema, hay los componentes múltiples que pudieron haber causado el problema: M16, el chasis (no como probablemente), XBAR 1, o el SUP.

  • Error crc con los módulos de fuente posible múltiples:
    %OC_USD-SLOT6-2-RF_CRC: OC2 received packets with
     CRC error from MOD 11 or 12 or 14 or 15 or 16 or 17 or 18
    El módulo de fuente se espiga del pulpo del ingreso que originado el mún paquete. El driver que aumenta una interrupción para registrar este mensaje de error no conoce siempre el pulpo del ingreso del cual el mún paquete originó. Esto es porque algunos de los bits usados para representar el pulpo del ingreso no se utilizan. Si el sistema determina los módulos múltiples tienen estos bits inusitados girados, el sistema deben asumir que de ellos pudo ser la fuente, que hace el mensaje de error incluir todos esos módulos. El sistema encontró que el módulo 13 (M13) no puede tener este conflicto debido a esos bits que no son utilizados; así, no se registra como fuente potencial.

Acercamiento del Troubleshooting de la tela CRC

Las nuevas placas de línea (M2) y el módulo de recursos físicos 2 (FAB2) detectan los CRC en el s1, el s2, o el S3. Cuando usted investiga detalladamente y encuentra los modelos en el error y los mensajes del registro, ayuda al aislante el componente defectuoso.

Aquí están algunas preguntas a pedir:

  • ¿Era el mensaje de error un evento de una sola vez, o se han registrado los mensajes del múltiplo error crc?
  • ¿Error crc los mensajes se registran cómo con frecuencia? (Cada hora, una vez al día, una vez al mes?)
  • ¿Hacen los errores CRC que TODOS vienen del mismo módulo de ingreso?
  • ¿Son los errores CRC señalados TODO sobre el mismo módulo de la salida?
  • ¿Están los errores CRC de los módulos de ingreso múltiples Y señalados en los módulos múltiples de la salida?
  • ¿Si los módulos múltiples señalan los errores CRC, hay un módulo de fuente común o XBAR módulo?

Las respuestas a las estas preguntas permiten que usted se acerque al procedimiento del Troubleshooting de un ángulo que sea más probable llevar a una resolución más rápida.

Guías de consulta generales del Troubleshooting CRC

Esta sección establece un marco general usado para resolver problemas estos problemas.

  1. Encuentre los módulos comunes (XBARs incluyendo) que están señalados en los mensajes de la tela error crc.
  2. Después de que usted encuentre los módulos comunes, escoja la causa más probable del problema, apague (en caso de XBAR), la mueva a un slot sabido que trabaje, vuélvalo a sentar, y substituya mientras que usted monitorea para verificar si sale el problema. Apagado, vuelva a sentar, y substituya los módulos uno a la vez. Esto hace más fácil aislar a las partes defectuosas.
  3. Cuando usted apaga, mueva, vuelva a sentar, o substituya una pieza, buscan cualquier cambio en los síntomas del problema. Usted puede ser que tenga que revisar su plan de acción después de que usted aprenda más de cada medida tomada.
  4. Si se substituyen las piezas múltiples y todavía persiste el problema, entonces:

    • Las nuevas piezas pudieron ser malas.
    • XBARs múltiple pudo ser malo.
    • Un mún slot del chasis pudo ser la causa.

Estudios de casos

Esta sección proporciona los ejemplos de cómo resolver problemas los problemas similares.

El módulo de ingreso corrompe los paquetes

Registros

%OC_USD-SLOT1-2-RF_CRC: OC2 received packets with CRC error from MOD 7
%OC_USD-SLOT3-2-RF_CRC: OC2 received packets with CRC error from MOD 7
%OC_USD-SLOT1-2-RF_CRC: OC2 received packets with CRC error from MOD 7
%OC_USD-SLOT3-2-RF_CRC: OC2 received packets with CRC error from MOD 7
%OC_USD-SLOT1-2-RF_CRC: OC2 received packets with CRC error from MOD 7
%OC_USD-SLOT3-2-RF_CRC: OC2 received packets with CRC error from MOD 7

Problema

Por algunas horas, los errores CRC se consideran en M1 y el módulo 3 (M3) que vienen del módulo 7 (M7) solamente. 

Causa probable del problema

Hay un malo o mis asentado XBAR que corrompe los paquetes dirigidos a M7, o M7 es malo o mis asentado.

Proceso del aislamiento del componente defectuoso

  1. Apague el XBARs uno a uno mientras que usted monitorea para verfiy si el problema es resolved.
  2. Vuelva a sentar el ingreso M7 mientras que usted monitorea.
  3. Substituya el M7 mientras que usted monitorea.

Si usted tiene tres XBARs instalado, le da la Redundancia N+1. Por lo tanto, usted puede cerrarlos abajo de uno a la vez (nunca apagado más de uno en cualquier momento) con solamente el efecto mínimo para ver si el problema es resolved. Ingrese estos comandos para completar este proceso:

N7K(config)# poweroff xbar 1

<monitor>

N7K(config)# no poweroff xbar 1
N7K(config)# poweroff xbar 2

<monitor>

N7K(config)# no poweroff xbar 2
N7K(config)# poweroff xbar 3
N7K(config)# no poweroff xbar 3

En este estudio de caso particular, el problema no era resolved cuando el XBARs fue apagado.

Pues hay dos módulos que señalan los errores CRC, es inverosímil que esos dos módulos (M1 y M3) son la causa. El siguiente paso es volver a sentar M7 (módulo de ingreso), porque es más probable el componente defectuoso. El linecards mis asentado pudo causar este problema, y se recomienda para volver a sentar el módulo antes del reemplazo.

En este caso estudie, los errores CRC continuos para incrementar en el módulo de recursos físicos después de un volver a sentar de M7. Entre en contacto el Centro de Asistencia Técnica de Cisco (TAC) en este momento (o antes de que esta punta) para substituir M7 puesto que un volver a sentar no resuelve el problema.

En este caso estudie, el reemplazo de M7 paró los mensajes de la tela error crc, y resolvió la pérdida del paquete.

Mis asentado XBAR inyecta los paquetes corruptos

Registros

%OC_USD-SLOT11-2-RF_CRC: CRC error from MOD 12 through XBAR slot 3/inst 1
%OC_USD-SLOT12-2-RF_CRC: CRC error from MOD 12 through XBAR slot 3/inst 1
%OC_USD-SLOT13-2-RF_CRC: CRC error from MOD 12 through XBAR slot 3/inst 1
%OC_USD-SLOT15-2-RF_CRC: CRC error from MOD 12 through XBAR slot 3/inst 1
%OC_USD-SLOT2-2-RF_CRC: CRC error from MOD 12 through XBAR slot 3/inst 1
%OC_USD-SLOT4-2-RF_CRC: CRC error from MOD 12 through XBAR slot 3/inst 1
%OC_USD-SLOT5-2-RF_CRC: CRC error from MOD 12 through XBAR slot 3/inst 1
%OC_USD-SLOT6-2-RF_CRC: CRC error from MOD 12 through XBAR slot 3/inst 1
%OC_USD-SLOT7-2-RF_CRC: CRC error from MOD 12 through XBAR slot 3/inst 1
%OC_USD-SLOT8-2-RF_CRC: CRC error from MOD 12 through XBAR slot 3/inst 1

Problema

Los módulos múltiples señalan los errores CRC del módulo 12 (M12) que pasan con XBAR 3.

Causa probable del problema

XBAR 3 es malos o mis asentados, o M12 es mis asentado o defectuoso.  

Proceso del aislamiento del componente defectuoso

  1. Apague XBAR 3 mientras que usted monitorea.
  2. Vuelva a sentar el ingreso M12 mientras que usted monitorea.
  3. Substituya M12 mientras que usted monitorea.

En este caso, XBAR 3 se apaga con el procedimiento descrito previamente (en el primer caso práctico), y monitoreado para otros errores. Fue encontrado que los errores cesaron cuando XBAR 3 fueron apagados. En este momento, se vuelve a sentar XBAR 3, y el cuidado es orden admitida para asegurarse de que no se dobla ningunos contactos en el midplane y de que el módulo está insertado correctamente. Después de que se vuelva a permitir XBAR 3, el problema nunca ocurre de nuevo. Este problema se atribuye XBAR a un módulo mis asentado.

El módulo defectuoso de la salida corrompe los paquetes de la tela

Registros

%OC_USD-SLOT6-2-RF_CRC: OC1 received packets with CRC error from
 MOD 1 or 2 or 7 or 13 or 17 through XBAR 
 slot 1/inst 1 and slot 2/inst 1 and slot 3/inst 1

%OC_USD-SLOT6-2-RF_CRC: OC2 received packets with CRC error from
 MOD 1 or 2 or 3 or 7 or 15 or 17 through XBAR
 slot 2/inst 1 and slot 3/inst 1

%OC_USD-SLOT6-2-RF_CRC: OC1 received packets with CRC error from
 MOD 1 or 2 or 5 or 7 or 16 or 17 through XBAR
 slot 1/inst 1 and slot 2/inst 1 and slot 3/inst 1

Problema

El módulo 6 (M6) señala los paquetes con los errores CRC recibidos del linecards múltiple y de XBARs.

Causa probable del problema

M6 es mis asentado o malo.

Proceso del aislamiento del componente defectuoso

  1. Vuelva a sentar M6 mientras que usted monitorea.
  2. Substituya M6 mientras que usted monitorea.

M6 es la causa más probable de este problema porque es los módulos comunes uno en todos los mensajes de error. De todos los módulos enumerados en los mensajes de error, el que aparece lo más constantemente posible es M6. Por lo tanto, tentativa de volver a sentar M6 para ver si se resuelve el problema antes de que usted lo substituya.

En este caso, se vuelve a sentar M6, pero los errores todavía persisten. Así pues, usted debe abrir un caso del TAC de Cisco para hacer M6 substituir. Después de que se substituya M6, los errores no están señalados.

Comandos para Troubleshooting

Aquí está una lista para del resolver problemas usado los comandos/debug:

  • show clock
  • muestre la Mod xbar
  • muestre el detalle de la utilización de estructura del hardware 
  • muestre el grupo fecha/hora del detalle de la utilización de estructura del hardware
  • muestre a hardware el XBAR-driver interno todos los errores del historial de eventos
  • muestre a hardware el XBAR-driver interno todos los msgs del historial de eventos
  • muestre a sistema el XBAR-cliente interno los msgs internos del historial de eventos
  • muestre a sistema xbar interno todo
  • historial de eventos interno 1 xbar del módulo show
  • actividad interna 1 xbar del módulo show
  • historial de eventos interno 2 xbar del módulo show
  • actividad interna 2 xbar del módulo show
  • historial de eventos interno 3 xbar del módulo show
  • actividad interna 3 xbar del módulo show
  • historial de eventos interno 4 xbar del módulo show
  • actividad interna 4 xbar del módulo show
  • historial de eventos interno 5 xbar del módulo show
  • actividad interna 5 xbar del módulo show
  • muestre a registro xbar interno a bordo
  • muestre a registro el pulpo interno a bordo
  • muestre el detalle de la tecnología

Discusiones relacionadas de la comunidad de soporte de Cisco

La Comunidad de Soporte de Cisco es un foro donde usted puede preguntar y responder, ofrecer sugerencias y colaborar con colegas.


Document ID: 116458