Switches : Switches Cisco Nexus de la serie 7000

Resuelva problemas los problemas del hardware común y de la arquitectura en los 7000 Series Switch del nexo

17 Octubre 2016 - Traducción Automática
Otras Versiones: PDFpdf | Inglés (22 Agosto 2015) | Comentarios

Introducción

Este documento proporciona una explicación abreviada y las soluciones para los problemas del hardware común y de la arquitectura para el Switches Cisco Nexus de la serie 7000 que funciona con el software del sistema del Cisco NX-OS.

Nota: El formato exacto del syslog y de los mensajes de error que este documento describe puede variar levemente. La variación depende de la versión de software que se ejecuta en Supervisor Engine.

Contribuido por Ivan Shirshin y Naveen Venkateshaiah, ingenieros de Cisco TAC.

Problema: Error de SpineControlBus

La prueba de control de la espina dorsal falla para el supervisor del nexo 7000:

Nexus7000# show module internal exceptionlog module 5
...
System Errorcode  : 0x418b0022 Spine control test failed
Error Type        : Warning
PhyPortLayer      : 0x0
Port(s) Affected  : none
Error Description : Module 10 Spine Control Bus test Failed
...
         11) SpineControlBus E
                Error code ------------------> DIAG TEST ERR DISABLE
                Total run count -------------> 1597800
                Last test execution time ----> Mon May 27 21:57:17 2013
                First test failure time -----> Sun Nov 20 00:30:55 2011
                Last test failure time ------> Mon May 27 21:57:17 2013
                Last test pass time ---------> Mon May 27 21:56:47 2013
                Total failure count ---------> 33
                Consecutive failure count ---> 1
                Last failure reason ---------> Spine control test failed

Solución

Este isue se relaciona con el Id. de bug Cisco CSCuc72466. Refiera al nexo 7000 FAQ: Cuál es la acción recomendada para tomar cuando la prueba de SpineControlBus falla?.

Problema: Bloques erróneos encontrados en el NVRAM

Los errores del NVRAM aparecen en los eventos de diagnóstico:

Nexus7000#show diagnostic events
1) Event:E_DEBUG, length:97, at 9664 usecs after Wed Dec  5 01:03:42 2012
    [103] Event_ERROR: TestName->NVRAM TestingType->health monitoring module->5
Result->fail Reason->
#show diagnostic result module 5 test NVRAM detail
 4) NVRAM-------------------------> E
                Error code ------------------> DIAG TEST ERR DISABLE
                Total run count -------------> 52596
                Last test execution time ----> Wed Dec  5 01:03:41 2012
                First test failure time -----> Tue Dec  4 23:28:45 2012
                Last test failure time ------> Wed Dec  5 01:03:42 2012
                Last test pass time ---------> Tue Dec  4 23:23:41 2012
                Total failure count ---------> 20
                Consecutive failure count ---> 20
                Last failure reason ---------> Bad blocks found on nvram

Esto es problemas del hardware, un error del Supervisor Engine, o un problema transitorio.

Solución

  1. Vuelva a efectuar la prueba del NVRAM para ver si esto es una alarma falsa. Ingrese estos comandos para inhabilitar y volver a permitir la prueba de diagnóstico (ejemplo si está dado para el módulo del problema 5):
    • ningún NVRAM de la prueba del módulo 5 del monitor de diagnóstico
    • NVRAM de la prueba del módulo 5 del monitor de diagnóstico

    Ingrese el comando detail del NVRAM de la prueba del módulo 5 del resultado del diagnóstico de la demostración para ver los resultados del comando test.

  2. Si la prueba del NVRAM falla otra vez, vuelva a sentar el módulo 5. observan el resultado del módulo 5 del resultado del diagnóstico de la demostración y de los comandos show module.
  3. Si el módulo falla otra vez, aumente un pedido de la Autorización de devolución de materiales (RMA) el supervisor en el slot del problema.

Problema: Error del Flash compacta del módulo 9

Uno o todos los éstos se ve en el supervisor 2/Supervisor 2E:

  • Mensaje de error:
    DEVICE_TEST-2-COMPACT_FLASH_FAIL: Module 5 has failed test CompactFlash 
    20 times on device Compact Flash due to error The compact flash power test failed.
  • Incapaz de salvar los config.
  • Errores de la prueba de diagnóstico:
           Test results: (. = Pass, F = Fail, I = Incomplete,
           U = Untested, A = Abort, E = Error disabled)
           7) CompactFlash E
                   Error code ------------------> DIAG TEST ERR DISABLE
                   Total run count -------------> 23302
                   Last test execution time ----> Sun Apr 13 10:07:30 2014
                   First test failure time -----> Sun Apr 13 00:37:41 2014
                   Last test failure time ------> Sun Apr 13 10:07:40 2014
                  Last test pass time ---------> Sun Apr 13 00:07:41 2014
                  Total failure count ---------> 20
                   Consecutive failure count ---> 20
                   Last failure reason ---------> The compact flash power test
                                                   failed
                   Next Execution time ---------> Sun Apr 13 10:37:30 2014

Causa raíz

Los nexos de la segunda generación 7000 supervisores se envían con dos flashes idénticos del eUSB para la Redundancia. Los flashes proporcionan un repositorio para el bootflash, las configuraciones, y la otra información pertinente. Se configuran de nuevo estos dos flashes mientras que una Matriz redundante de discos independientes (RAID) 1 arsenal que implemente el Reflejo interno. Con la Redundancia, un supervisor puede funcionar con la pérdida de uno de los flashes pero no de ambos.

Hay algunos casos en el campo donde un o ambo flashes son marcados como malo por el software RAID sobre una porción de tiempo de varios meses o años en el servicio. Una restauración/una reinicialización de la tarjeta redescubre estos flashes fallados es sanas en el inicio siguiente para arriba.

Solución

Complete estos pasos para verificar si esto es o no es problemas del hardware:

  1. Recargue al supervisor del problema, si es posible.
  2. Si el problema se considera después de la recarga, usted necesita un reemplazo de hardware.
  3. Si el problema es reparado por la recarga, la causa raíz se relaciona con el Id. de bug Cisco CSCus22805.

Problema: Falla de prueba de PortLoopback del linecard N7K-M132XP-12

El linecard señala los diagnósticos falla debidos virar la falla de prueba de PortLoopback hacia el lado de babor 10 veces consecutivamente:

DIAG_PORT_LB-2-PORTLOOPBACK_TEST_FAIL  Module:16 Test:PortLoopback
failed 10 consecutive times. Faulty module:Module 16 affected ports:5,7 
Error:Loopback test failed. Packets lost on the LC at the Queueing engine ASIC

MODULE-4-MOD_WARNING  Module 16 (serial: XXXX) reported warning on
ports 16/5-16/5 (Ethernet) due to Loopback test failed. 
Packets lost on the LC at the Queueing engine ASIC in device 78
(device error 0x41830059)

Causa raíz

Esto es un mensaje de advertencia y en la mayoría de los casos indica los problemas del hardware con el puerto.

Solución

La comprobación para el Id. de bug Cisco CSCtn81109 y el Id. de bug Cisco CSCti95293 primero, como esto podía ser un problema de software.

Vuelva a sentar el módulo primero para reinicializar las pruebas de la cordura del hardware del bootup del indicador luminoso LED amarillo de la placa muestra gravedad menor y del reestreno. Si las pruebas de diagnósticos todavía muestran el error para el mismo indicador luminoso LED amarillo de la placa muestra gravedad menor, substituya el indicador luminoso LED amarillo de la placa muestra gravedad menor.

Recargue el indicador luminoso LED amarillo de la placa muestra gravedad menor en una hora conveniente y recoja las salidas de estos comandos:

  • muestre el registro del registro
  • show module
  • muestre a módulo del resultado del diagn todo el detalle

Alternativamente, usted puede volver a efectuar solamente esta prueba específica y no necesita recargar el indicador luminoso LED amarillo de la placa muestra gravedad menor. Este ejemplo muestra el módulo 16:

show diagnostic result module 16
diagnostic clear result module all
(config)# no diagnostic monitor module 16 test 5
(config)# diagnostic monitor module 16 test 5
diagnostic start module 16 test 5
show diagnostic result module 16 test 5

Problema: N7K-M132XP-12 linecard MODULE-4-MOD_WARNING

Estos errores aparecen y hay una recarga posible del módulo:

2013 Mar 27 00:40:23 DC3-7000-PRODD2-A23  MODULE-4-MOD_WARNING  
Module 9 (serial: XXX) reported warning on ports 9/1-9/3 (Unknown)
due to BE2 Arbiter experienced an error in device 65 (device error 0xc410f613)

Causa raíz

Esto es una falla de hardware causada por los errores de paridad o los problemas del hardware en la placa hija.

Solución

  1. Marque la salida de estos comandos:
    • show version
    • muestre el módulo X del motivo de restauración del sistema
    • muestre a registro el motivo de restauración interno a bordo
    • módulo de historial de eventos interno del módulo show X
    • show log
  2. Si su versión de Cisco NS-OX es anterior que la versión 4.2, después la actualización a una nueva versión para asegurar los arreglos para estos defectos del software es integrada (minimice la posibilidad de los errores de paridad):
    • El D-caché del Id. de bug Cisco CSCso72230 L1 habilitó 8541 caídas CPU con los errores de paridad del D-caché L1
    • Id. de bug Cisco CSCsr90831 - El D-caché L1 habilitó 8541 caídas CPU con los errores de paridad del empuje del D-caché L1
  3. Si ocurren los errores en varias ocasiones, vuelva a sentar el indicador luminoso LED amarillo de la placa muestra gravedad menor y el monitor.
  4. Si los errores todavía están relanzando, substituya el módulo del problema.

Defecto adicional del software conocido

Id. de bug Cisco CSCtb98876

Problema: Error de la pérdida de sincronización de los serdes N7K-M224XP-23L chico

Estos errores aparecen en el módulo:

%MODULE-4-MOD_WARNING: Module # (Serial number: XXXX) reported warning 
Ethernet#/# due to chico serdes sync loss in device DEV_SKYTRAIN
(device error 0xc9003600)

Causa raíz

Estos errores indican que hay un problema de la pérdida de sincronización entre el módulo # y el Xbar/ASIC. En la mayoría de los casos la causa es una falla de hardware del módulo.

Si su versión de Cisco NS-OX es anterior de no aparece 6.1(4) y el mensaje continuamente, puede ser afectado por el Id. de bug Cisco CSCud91672. La causa del defecto es que las configuraciones de los serdes NX-OS son diferentes de las configuraciones de diagnóstico en los dos canales entre SKT <-->SAC.

Solución

Recoja la salida de estos comandos:

  • show version
  • show module
  • ‘show run’
  • módulo de historial de eventos interno del módulo show X
  • módulo interno X de la actividad del módulo show
  • módulo interno X del excepción-registro del módulo show
  • errores internos del historial de eventos del módulo show
  • muestre el último 200 del registro
  • muestre el nvram del registro

Actualice el Switch a la versión 6.1(4) o posterior NS-OX para aislar la causa del defecto.

Realice esta prueba para confirmar si el indicador luminoso LED amarillo de la placa muestra gravedad menor es defectuoso en vez del xbar o del slot del chasis:

  1. Mueva el módulo del problema a otro slot libre en el chasis.
  2. Si usted tiene un módulo de repuesto, insértelo en un slot del problema.
  3. Si los errores no se consideran después del paso 1, inserte el módulo detrás en el slot del problema y verifiquelo.

Problema: N7K-F248XP-25 PrimaryBootROM y fallas de prueba de SecondaryBootROM

El módulo N7K-F248XP-25 falla en las pruebas de PrimaryBootROM y de SecondaryBootROM:

show module internal exceptionlog module 1 | i Error|xception
********* Exception info for module 1 ********
exception information --- exception instance 1 ----
Error Description : Secondary BootROM test failed
 
exception information --- exception instance 2 ----
Error Description : Primary BootROM test failed

Causa raíz

Esto es generalmente visto debido a la corrupción del archivo BIOS o a la falla de hardware del linecard.

Solución

El Id. de bug Cisco CSCuf82089 agrega el código para mostrar más información descriptiva sobre tales errores para mejores diagnósticos. Por ejemplo, muestra a un componente fallado en vez actualmente de un valor nulo.

El problema es causado en algunos casos por la corrupción BIOS en el módulo. Ingrese el comando forzado bíos del módulo X del instalar para resolver esto. Observe que este comando puede potencialmente afectar el servicio. La recomendación es ejecutarla solamente durante una ventana de mantenimiento.

Complete estos pasos para resolver el problema:

  1. Programe una ventana de mantenimiento y ingrese el comando forzado bíos del módulo X del instalar como solución alternativa posible. Ingrese solamente este comando durante una ventana de mantenimiento para evitar el impacto del servicio potencial.
  2. Si el paso 1 no ayuda o no es posible tener una ventana de mantenimiento para esta acción, substituya el módulo. Esta salida de ejemplo muestra un intento fallido:
Nexus7000# install module 1 bios forced
Warning: Installing Bios forcefully...!
Warning: Please do not remove or power off the module at this time
Upgrading primary bios
Started bios programming .... please wait
[#                            0%                             ]
BIOS install failed for module 1, Error=0x40710027(BIOS flash-type verify failed)
BIOS is OK ...
Please try the command again... 

Problema: Error del sensor de temperatura

Este error se considera en la plataforma:

%PLATFORM-4-MOD_TEMPFAIL: Module-2 temperature sensor 7 failed

Causa raíz

Esto es un problema intermitente con el bloque de la temperatura/del voltaje en ASIC bajo ciertas condiciones debido a medir el tiempo interno de ASIC. El Id. de bug Cisco CSCtw79052 describe la causa sabida para este problema.

Éste es un problema de sincronización entre ASIC que traba la temperatura internamente y el software que muestrea el bit válido. El problema es que puede golpear en los 12 casos uces de los de las podadoras. No hay activador determinado para este problema y es intermitente. Este problema no afecta el servicio y se presenta porque la temperatura leyó la lógica tiene un problema que requiere más recomprobaciones en el driver.

Solución

Recoja la salida de estos comandos y del control contra el Id. de bug Cisco CSCtw79052:

  • show version
  • muestre la temperatura ENV
  • muestre el <module-> del módulo del sprom 
  • <module-> del módulo de la fijación de Nexus#
  • errores internos del historial de eventos del sensor del hardware del <module#>#show

Problema: Xbar Error/C7010-FAB-1 en el estado inactivo del poder

El C7010-FAB-1 está en un estado inactivo del poder y estos errores aparecen:

%PLATFORM-3-EJECTOR_STAT_CHANGED: Ejectors' status in slot 13 has changed, 
Left Ejector is OPEN, Right Ejector is CLOSE

%PLATFORM-3-EJECTOR_STAT_CHANGED: Ejectors' status in slot 13 has changed,
Left Ejector is OPEN, Right Ejector is OPEN

%PLATFORM-2-XBAR_REMOVE: Xbar 3 removed (Serial number XXX)
 
Xbar Ports  Module-Type                         Model              Status
---  -----  ----------------------------------- ------------------ ----------
3    0      Fabric Module                       N/A                powered-dn
?
Xbar Power-Status  Reason
---  ------------  ---------------------------
3    powered-dn     failure(powered-down) since maximum number of bringups were exceeded

Alternativamente, los errores xbar de ASIC aparecen:

%MODULE-4-MOD_WARNING: Module 15 (serial: XXX) reported warning due to 
X-bar Interface ASIC Error in device 70 (device error 0xc4600248)

%OC_USD-SLOT15-2-RF_CRC: OC2 received packets with CRC error from MOD 15
through XBAR slot 3/inst 2

Causa raíz

Este problema es debido módulo xbar defectuoso o malo-asentado, o a un mún slot del chasis.

Solución

  1. Marque la salida de estos comandos:
    • show version
    • show module
    • show logging
    • muestre el nvram del registro
    • excepción-registro interno del módulo show
    • historial de eventos interno del módulo show
    • muestre la base
    • muestre el motivo de restauración del sistema
    • show environment | en xbar
    • el historial de eventos interno X xbar de la plataforma interna del sistema de la demostración es xbar #
    • muestre a sistema el XBAR-cliente interno los errores internos del historial de eventos
    • muestre a sistema xbar interno todo
    • muestre a sistema los errores xbar internos del historial de eventos
  2. Realice un duro vuelven a sentar del módulo xbar y marcan el estatus.
  3. Si el volver a sentar falla, pruebe xbar en otro slot o pruebe el mismo slot con otro módulo xbar para asegurarse que el chasis está muy bien.
  4. Substituya el hardware defectuoso basado en las pruebas realizadas en los pasos 2 y 3.

Problema: Módulo fallado N7K-C7010-FAN-F de la fan

Uno o más de estos síntomas de falla de ventilador se observan:

%PLATFORM-5-FAN_STATUS: Fan module 3 (Serial number XXX) 
Fan3(fab_fan1) current-status is  FAN_FAIL
 
Nexus 7000#show environment fan
Fan3(fab_fan1)  N7K-C7010-FAN-F    1.1     Failure (Failed Fanlets: 2 6 7 8 9 10 14 15 )
Fan4(fab_fan2)  N7K-C7010-FAN-F    1.1     Ok 
...
 
#show hardware
----------------------------------
Chassis has 4 Fan slots
----------------------------------
Fan3(fab_fan1) failed
  Model number is N7K-C7010-FAN-F
...

Causa raíz

En la mayoría de los casos éste es un error el de la fan o slot del chasis.

Solución

  1. Marque la salida de estos comandos:
    • show version
    • show module
    • muestre el inventario
    • show log
    • muestre el nvram del registro
    • muestre la fan del entorno
  2. Pruebe este N7K-C7010-FAN-F en otros buenos chasis.
  3. Substituya la fan o el chasis basado en los resultados de los pasos 1 y 2.

Problema: Alarma de la fuente de alimentación %PLATFORM-2-PS_CAPACITY_CHANGE

Las alarmas se consideran para los cambios de la capacidad, a veces muy con frecuencia.

%PLATFORM-2-PS_CAPACITY_CHANGE: Power supply PS2 changed its capacity. 
possibly due to On/Off or power cable removal/

2013 Oct 17 17:06:40 ... last message repeated 14 times

 

Causa raíz

Este problema es debido a un cable de alimentación eléctrica defectuoso o disconnected, o una falla de la fuente de alimentación.

Solución

Marque la salida del comando detail del poder de la demostración ENV e investigue el estado de la fuente de alimentación. En esta salida de ejemplo, ambos acordes están conectados pero la segunda capacidad 1200W de las demostraciones solamente en vez de 3000W y de ella necesita estar para el 220V AC en el N7K-AC-6.0KW. La fuente de alimentación probada OK. Substituya la fuente de alimentación.

PS_2 total capacity:    4200 W   Voltage:50Vchord 1    capacity:    3000 W chord 1    
connected to 110v AC chord 2    capacity:    1200 W chord 2    connected to 220v AC

Problema: %PLATFORM-5-PS_STATUS: Alarma de la fuente de alimentación X PS_FAIL

Esta alerta aparece en la plataforma:

%PLATFORM-5-PS_STATUS: PowerSupply 3 current-status is PS_FAIL

%PLATFORM-2-PS_FAIL: Power supply 3 failed or shut down (Serial number xxxxx)

Causa raíz

Esta alerta es debido a un cable de alimentación eléctrica defectuoso o disconnected, o una falla de la fuente de alimentación.

Solución

  1. Marque la salida de estos comandos:
    • detalle del show environment power
    • ‘show power’
  2. Vuelva a sentar la fuente de alimentación fallada. Utilice la fuente de alimentación redundante para asegurarse que no va el poder off-liné.
  3. Someta un RMA para la fuente de alimentación. Utilice la fuente de alimentación redundante para asegurarse que no va el poder off-liné.

Referencias

Redundancia de la fuente de alimentación de las 7000 Series del nexo de Cisco

Problema: Problema de la fuente de alimentación en FEX

Estas alarmas aparecen para la fuente de alimentación FEX:

%SATCTRL-FEX104-2-SOHMS_DIAG_ERROR: FEX-104 Module 1: Runtime diag detected major event:
Voltage failure on power supply: 1
%SATCTRL-FEX104-2-SOHMS_DIAG_ERROR: FEX-104 System minor alarm on power
supply 1: failed

%SATCTRL-FEX104-2-SOHMS_DIAG_ERROR: FEX-104 Recovered: System minor alarm
on power supply 1: failed 

Solución

Comprobación para el hardware y los problemas de alimentación. Si usted tiene un problema de software, los mensajes de error continúan incluso después usted intercambia el hardware.

Los métodos para resolver estos problemas incluyen:

  1. Vuelva a sentar la fuente de alimentación FEX. Utilice la fuente de alimentación redundante para asegurarse que no va el poder off-liné.
  2. Someta el RMA para la fuente de alimentación FEX. Utilice la fuente de alimentación redundante para asegurarse que no va el poder off-liné.
  3. Relance estos pasos para la segunda fuente de alimentación eléctrica.

Revise y conteste a estas preguntas para ayudar a definir las circunstancias del error:

  1. ¿Cuántas fuentes de alimentación FEX son afectadas?
  2. ¿Para una alarma menor, usted intercambió la fuente de entrada, y ésa diferenció?
  3. ¿Usted tiene otras fuentes de alimentación FEX que tengan problemas?
  4. ¿Usted tiene otros cuadros de la misma fuente de alimentación?
  5. ¿Usted substituyó el cable de alimentación eléctrica?
  6. ¿Había un pico de tensión o una interferencia en el entorno?

Recolecte la salida de estos comandos para investigar los errores:

  • muestre el fex 100 todos del sprom
  • muestre el registro del registro | no más
  • muestre el fex 100 de la tecnología | no más
  • asocie el fex 100
  • muestre la traza del satctrl del software de plataforma

Defecto del software conocido

Id. de bug Cisco CSCtr77620

Problema: Las fuentes de alimentación N7K-AC-6.0KW están señaladas como fall

Las fuentes de alimentación N7K-AC-6.0KW de Emerson están señaladas como el fall/cerró pero los funcionamientos del Switch muy bien y la salida real non-0 se considera para la fuente de alimentación del problema.

Causa raíz

En una fuente con el active de ambas entradas, cuando una entrada es disconnected, vuelto a conectar, y desconectado otra vez en el plazo de 1.5 segundos la fuente puede trabar un incidente del bajo-voltaje y NX-OS puede señalar la fuente de alimentación por medio de una bandera según lo fallado. En otra variación, en una fuente con dos entradas, quite uno entrado y espere 20 a 30 segundos. La fuente pudo fijar intermitentemente la alarma interna del incidente y NX-OS señala la fuente de alimentación según lo fallado.

El Id. de bug Cisco CSCty78612 realiza los cambios al firmware en las unidades de fuente de alimentación para reparar el problema.

El Id. de bug Cisco CSCuc86262 agrega una mejora del software para recuperarse de estas fallas falsas. NX-OS ahora autónomo monitorea el estatus de la unidad de fuente de alimentación (PSU) y lo modifica al estatus apropiado si el estado señalado diferencia de los bienes inmuebles.

Solución

Ingrese el comando detail del poder de la demostración ENV y verifique la salida real para verificar la falla falsa:

Nexus7000# show env power
Power Supply:
Voltage: 50 Volts
Power Actual Total
Supply Model Output Capacity Status
(Watts ) (Watts )
------- ------------------- ----------- ----------- --------------
1 N7K-AC-6.0KW 0 W 0 W Shutdown
2 N7K-AC-6.0KW 3888 W 6000 W Fail/Shut

Se borra el fall erróneo/el estatus cerrado cuando usted acciona off/on el PSU.

El Id. de bug Cisco CSCty78612 realiza los cambios al firmware en el PSU. El software se ha aumentado con el Id. de bug Cisco CSCuc86262 que se recupera del fall falso/de las notificaciones cerradas con la corrección de los bits falsos si la fuente de alimentación en el tiempo de ejecución actúa normalmente. Las versiones NX-OS 5.2(9), 6.1(3), 6.2(2) y posterior tienen el presente de la mejora que evita un RMA.

Problema: Caídas de paquetes del software

Caen a la parte de los paquetes de gran tamaño cuando hay una alta velocidad de los paquetes del IP con una longitud más larga que el MTU configurado en la interfaz de egreso del paquete.

Causa raíz

Debe ocurrir lo siguiente. Cuando el sistema recibe un paquete del IP con una longitud más larga que el MTU configurado en la interfaz de egreso del paquete, el sistema envía este paquete al avión del control, que toma el cuidado de la fragmentación. En NX-OS 4.1.3 y posterior, un tarifa-limitador se aplica a tales los paquetes llevados en batea. Esto lo limita a un máximo de 500 pps por abandono.

Solución

Esto es un defecto del software conocido en el Id. de bug Cisco CSCsu01048.

Problema: Error del sistema de autoprueba del error USER-2-SYSTEM_MSG FIP

El error de autoprueba "USER-2-SYSTEM_MSG FIP en DCOS_rand - errores apareces del netstack”.

Causa raíz

Siempre que se genere un número aleatorio, el autoexamen condicional del generador del número aleatorio (CRNG) se ejecuta. Si la prueba falla, se registra un mensaje de Syslog. Esto se hace según la recomendación de los Estándares de procesamiento de la información federales (FIP). Sin embargo, el impacto de esto es inofensivo pues el número aleatorio se genera otra vez.

Hay dos tipos de generadores del número aleatorio (RNGs) en NX-OS:

  • FIP RNG que se implementa en la biblioteca crypto del openssl
  • NON-FIP RNG que es el linux RNG

Según los FIP, todo el RNGs debe implementar la prueba condicional del generador del número aleatorio (CRNGT). La prueba compara el número aleatorio generado corriente con el anterior. Si los números son lo mismo, después se genera un mensaje de Syslog y se genera un más número aleatorio.

La prueba se funciona con para asegurar esa unicidad del número aleatorio. No hay impacto funcional pues se regenera el número.

Solución

Este mensaje es inofensivo a la operación del sistema. De la versión 5.2x y posterior del Cisco NX-OS, la gravedad del mensaje se baja lejos de 2 así que se ve no más con la configuración de registro predeterminada. Este registro ocurre como parte de los autoexámenes internos NX-OS para las diversas funciones en el Switch.

Esto es un defecto del software conocido en el Id. de bug Cisco CSCtn70083.



Document ID: 118959