Introducción
Este documento describe los defectos del software dominantes que pueden hacer el marco de datos corrupto ser inyectado en una tela del sistema de la Computación unificada (UCS) según lo identificado por los contadores de errores de la verificación por redundancia cíclica (CRC) o de la Secuencia de verificación de tramas (FCS) de la interfaz.
Nota: Este documento no describe cómo aislar la punta de la inyección CRC.
Antecedentes
En un entorno UCS, los errores CRC pueden estar de alto impacto. El aislamiento y la mitigación de la causa de tales errores se deben tratar con prioritario.
El impacto depende de la punta en la cual el problema ocurre, que puede extender a los chasis múltiples y afecta la Conectividad de los Ethernetes y del almacenamiento.
Mientras que error del componente físico (especialmente cable y pequeño (SFP) enchufable de Form Factor) es la causa más frecuente, allí es los defectos del software conocido que pueden también causar los errores CRC.
Estos defectos causan la potencia de la señal baja entre los diversos componentes, que lleva para corromper las tramas.
Un concepto fundamental que usted puede referirse es la altura del ojo que es una medida de la integridad de señal entre los componentes de la Capa física. Si el nivel de la señal cae debajo de un nivel determinado (diferencia entre los componentes), enmarca enviado o recibido puede ser corrompido.
Cisco recomienda que usted tiene los problemas de rendimiento, el especiallyFrame y pérdida del paquete comunes del reviewedFlexPod para identificar la fuente de errores unstomped CRC dentro de la tela UCS y/o del Switches de la conexión en sentido ascendente.
Mientras que el documento se piensa para las implementaciones de FlexPod, la sección mencionada es aplicable para los entornos NON-FlexPod UCS.
Indicaciones al defecto relacionado CRC
Si usted tiene cableado de Twinax en su entorno UCS, es más probable ser afectado por uno o más de estos defectos, pues la mayoría de los defectos está para Twinax basó el cableado.
Los entornos que tienen solamente cableado Óptica pueden todavía experimentar los problemas, mientras que los errores CRC puede ser inyectado entre el adaptador y el UCS módulo I/O (IOM). Sin embargo, esto se limita a los servidores específicos y no afecta a los servidores múltiples o al chasis en el caso de un problema del uplink o del puerto de servidor.
Si la neutralización/el permiso de un puerto en el administrador UCS parece parar los errores de interfaz sin la acción adicional tal como cable intercambian o vuelven a sentar, otros controles se deben hacer para verificar si un defecto del software es la causa raíz del problema.
Si se han considerado los errores CRC después de que sea súbito las inestabilidades del puerto/las reinicializaciones, estos defectos pueden ser una posible causa.
Comandos de verificar la altura del ojo
Una indicación dominante de los defectos de un software relacionado CRC es un valor bajo de la altura del ojo para los uno o más puertos.
Los comandos comunes usados para marcar esto son:
Nexo 5500 switches basados:
show hardware internal carmel eye
La tela UCS 6200 interconecta:
connect nxos a
show hardware internal carmel eye
exit
connect nxos b
show hardware internal carmel eye
exit
Salida de muestra que muestra una buena altura del ojo (200 milivoltio):
UCSB-5-A(nxos)# show hardware internal carmel eye
+-------+------------+-------------+------------+----------------------------+--+--+--+--+--+--+--+--+--+--+
| Port | Eye Height | Eye Width | Raw values | Time measured |St|20|21|22|23|24|25|26|2E|2F|
+-------+------------+-------------+------------+----------------------------+--+--+--+--+--+--+--+--+--+--+
Eth 1/1 | 200 mv | 796 mUI | 40/ 33 | 08/31/2016 16:48:52.345248 |a9|ee|82|00|00|6e|82|00|88|00|
fi0 | 200 mv | 843 mUI | 40/ 36 | 08/31/2016 16:48:52.350360 |00|00|00|00|00|00|00|00|00|00|
fi1 | 200 mv | 859 mUI | 40/ 37 | 08/31/2016 16:48:52.355470 |00|00|00|00|00|00|00|00|00|00|
En estas Plataformas, si es el valor:
- Debajo de 50mV, se ha encontrado para accionar los errores CRC
- 50 - 100mV, puede causar los errores CRC y se aconseja la mitigación
- > 100 milivoltio, no debe causar los errores CRC
Los comandos antedichos son no corresponde a 6332, a 6454 o a 6324 que la tela interconecta
Módulos UCS 2200 IOM:
connect local-mgmt a or connect local-mgmt b
connect iom x
show platform software woodside sts (Note: The HI number/s for the servers that you need to check)
dbgexec woo
kr_geteye HIxx
Ctrl-C to exit dbgexec mode
Salida de muestra que muestra una buena altura del ojo (125 milivoltio):
woo> kr_geteye HI31
[serdes] reg: 64/40h = 42ch
check_kr_status: HI31: up (kr_retries=0)
sent SPICO interrupt(20, 0, 49)
Vertical eye result 0x14
sent SPICO interrupt(20, 0, 49)
Horizontal eye result 0x28
HI31: 125.0 mV, 0.6250 UI (NORM)
Módulos UCS 2300 IOM:
connect local-mgmt a or connect local-mgmt b
connect iom x
show platform software tiburon sts (Note the HI number/s for the servers you need to check)
dbgexec tib
kr_geteye 0 HIxx
Ctrl-C to exit dbgexec mode
Salida de muestra que muestra una buena altura del ojo (156 milivoltio):
tib> kr_geteye 0 HI31
Start eye measurement HI31...
bottom: -73.5 (mV), top: 82.7 (mV), height: 156.2 (mV)
left: -0.34 (UI), right: 0.33 (UI), width: 0.69 (UI)
total time = 0.119456 sec
En estas Plataformas, si es el valor de la altura:
- Debajo de 90 milivoltio, se ha encontrado para accionar los errores CRC
- > 90 milivoltio, no debe accionar los errores CRC
Defectos
Interconexión de la tela
- CSCuo76425 observando error crc en el cable de cobre
Este defecto se considera en los puertos de la interconexión de la tela, tales como uplink y puertos de servidor.
Se repara en la infraestructura UCS 2.2(3a), refiere a la Herramienta de búsqueda del bug para otras versiones revisadas.
- Cerca del bug idéntico que firmware posterior UCS de las influencias:
CSCuw36398 observando los errores CRC en el cable de cobre
Este defecto se considera en los puertos de la interconexión de la tela, tales como uplink y puertos de servidor
Se repara en la infraestructura UCS 2.2(7b). Refiera a la Herramienta de búsqueda del bug para otras versiones revisadas.
IOM y adaptador
- Altura del ojo CSCuz78417 Serdes entre IOM y el VIC más bajos que 90mV
Este defecto se observa entre las interfaces de backplane de las interfaces (HIF) y de los adaptadores del host IOM.
Se ha encontrado desde entonces que esto se puede causar por los problemas del backplane del chasis. Si usted observa este problema, abra una solicitud de servicio con el TAC de Cisco.
- El problema nativo del entrenamiento del link 40g CSCva47085 VIC1340+2304 IOM causa la Pérdida de conectividad
Este defecto se considera entre IOM HIF y adaptadores, que afecta a los servidores individuales.
Actualmente bajo investigación.
Serie C
- CSCux31002 VIC 1227 muestra los CRC cuando usted utiliza un cable activo del twinax.
Reparado en el firmware independiente de la serie C 2.0(9c). Refiera a la Herramienta de búsqueda del bug para otras versiones revisadas.
La condición del activador de este bug es el revés de la sabiduría común que Twinax activo es menos probable causar los problemas CRC debido a su transmisión de energía activa.
Nexo 5500
- Necesidad CSCuj86736 de optimizar DFE que ajusta en los 55xxUP Series Switch - errores RX CRC
Mientras que no no estrictamente un bug UCS, él todavía está comúnmente - visto en configuraciones UCS debido al predominio de la conexión en sentido ascendente del nexo 55xx. Refiera a la Herramienta de búsqueda del bug para más información sobre las versiones corregidas.
Soluciones alternativas/mitigación
Refiera al Release Note para cada bug para los detalles específicos, pero si usted ha encontrado las pruebas de la altura baja del ojo, después shut/no cerrado del puerto es razonable.
En el caso de un defecto de la altura del ojo IOM/Adapter, una restauración del DCE en la interfaz puede ser hecha. Navegue al adaptador del server> > a la interfaz DCE > Connectivityas reajustado que es apropiado.
Las salidas se deben entonces marcar para considerar si la altura del ojo ha aumentado a los valores adecuados y si los contadores de CRC han incrementado no más.
Varias aletas (comúnmente hasta 5) puede ser necesario aumentar la altura del ojo suficientemente.
Si la altura del ojo no se recupera después de varias aletas del link, podría haber una falla de hardware del componente.
Cuando usted agita los puertos, sea consciente que esto puede accionar una detección baja del administrador UCS.
Una detección baja en circunstancias normales no es afectación plana de los datos, sin embargo, hay los defectos conocidos que afectan a las cuchillas B200-M4 (véase CSCut61527 para el defecto más común). Una detección baja puede dar vuelta en una detección profunda, que puede accionar la reinicialización del host OS.
Cisco recomienda que usted revisa los Release Note para su versión del administrador UCS para otros defectos aplicables.
Además del cambio manual del puerto como paso de recuperación reactivo, la gestión de error de error de puerto del policy basado UCS en el administrador UCS 2.2(4) y posterior se puede utilizar para inhabilitar los puertos NIF cuando se consideran los errores CRC. Mientras que tal acción puede limitar rápidamente el impacto de los errores CRC, puede tener el potencial para la interrupción del flujo de tráfico, por lo tanto no se habilita por abandono y el cuidado se debe tomar si usted enabke él.
El administrador UCS genera los incidentes para los errores CRC y tales incidentes se pueden monitorear vía XML API o Simple Network Management Protocol (SNMP).