Routers : Routers Cisco de la serie 7500

Resolución de problemas de CEF- Mensajes de error relacionados

18 Octubre 2015 - Traducción Automática
Otras Versiones: PDFpdf | Traducción Manual (10 Abril 2009) | Inglés (22 Agosto 2015) | Comentarios


Contenido


Introducción

Este documento describe las causas del Cisco Express Forwarding común (antes CEF) - los Mensajes de error relacionados en las Plataformas que ejecutan el Distributed Cisco Express Forwarding (antes dCEF) que conmuta (los Cisco 7500 Series Router y los Cisco 12000 Series Internet Router) y cómo resolver problemaslas.

Nota: Dependiendo de la plataforma en la cual se configura el Distributed Cisco Express Forwarding, los Route Processor (RP) y el linecards (LC) se refieren diferentemente. En el caso de la Serie 7500, el RP se denomina Route Switch Processor (RSP) y las LC se denominan Versatile Interface Processors (VIP). En la serie 12000, RP se conoce como el Procesador de ruta Gigabit (GRP) y las LC se denominan simplemente como LC.

prerrequisitos

Requisitos

No hay requisitos específicos para este documento.

Componentes Utilizados

Este documento no tiene restricciones específicas en cuanto a versiones de software y de hardware.

Convenciones

Consulte Convenciones de Consejos TécnicosCisco para obtener más información sobre las convenciones del documento.

Antecedentes

La conmutación Cisco Express Forwarding es una forma propietaria de conmutación escalable cuyo objetivo es ocuparse de los problemas asociados con el pedido de almacenamiento en la memoria caché. Con la conmutación de Cisco Express Forwarding, la información que tradicionalmente se guarda en la memoria caché de una ruta se divide en varias estructuras de datos. El código de Cisco Express Forwarding es capaz de mantener estas estructuras de datos en el RP y, además, en procesadores esclavos como los VIP en Cisco 7500 Series y las LC en Cisco 12000 Series. Entre las estructuras de datos que proporcionan búsquedas optimizadas para un reenvío de paquetes eficaz se encuentran:

  • Tabla Forwarding Information Base (FIB): Cisco Express Forwarding usa una FIB para tomar decisiones relativas a la conmutación basada en prefijos de destino IP. El FIB es conceptualmente similar a una tabla de ruteo o base de información. Mantiene una imagen réplica de la información de transmisión contenida en la tabla de IP Routing Cuando se producen modificaciones en el ruteo o la topología de la red, la tabla de IP Routing se actualiza y estos cambios son reflejados en el FIB. La FIB mantiene la información sobre la dirección next-hop teniendo en cuenta la información de la tabla de IP Routing.

    Dado que existe correlación “uno a uno” entre las entradas de la FIB (base de reenvío de información) y las entradas de la tabla de ruteo, la FIB comprende todos los trayectos conocidos y elimina la necesidad de mantenimiento de la memoria caché del router que está asociada con los trayectos de switching, tales como el fast switching y el optimum switching.

  • Tabla de adyacencia – Se dice que los nodos de la red son adyacentes si pueden alcanzarse entre sí con un solo salto en una capa de link. Además de la FIB, Cisco Express Forwarding utiliza tablas de adyacencia para añadir información de direccionamiento de Capa 2 (L2). La tabla de adyacencia mantiene las direcciones next-hop de L2 para todas las entradas de la FIB.

Cisco Express Forwarding puede habilitarse en uno de los siguientes dos modos:

  • Modo Central Cisco Express Forwarding: Cuando se habilita el modo Cisco Express Forwarding, la FIB y las tablas de adyacencia de Cisco Express Forwarding residen en el RP, y el RP ejecuta el reenvío rápido. Puede usar el modo Cisco Express Forwarding cuando los LCs no están disponibles para conmutación de Cisco Express Forwarding o cuando necesita usar características que no son compatibles con conmutación de Distributed Cisco Express Forwarding.

  • Modo Distributed Cisco Express Forwarding: Cuando se habilita Distributed Cisco Express Forwarding, las LC (como LC de VIP o LC de Gigabit Switch Router [GSR]), conservan copias idénticas de la FIB y de las tablas de adyacencia. Las LC puede realizar el reenvío express por ellas mismas haciendo que el procesador principal (GRP o SRP) no tenga que involucrarse con la operación de conmutación. Éste es el único método de conmutación disponible en las series 12000.

    Distributed Cisco Express Forwarding utiliza un mecanismo Inter-Process Communication (IPC) para garantizar la sincronización de la FIB y las tablas de adyacencia en el RP y las LC.

Verifique el estado de Cisco Express Forwarding en VIP y LC

Nota: En los ejemplos abajo, algunos de los comandos utilizan a los modificadores de resultado (representados por | símbolo), simplificar la visualización para mostrar solamente la información requerida. Soportan a los modificadores de resultado en el Software Release 12.0 y Posterior de Cisco IOS�. Si usted está funcionando con una versión anterior, publique el comando main (el que está antes del | el símbolo), y busca las líneas correspondientes en el resultado completo.

Podrá verificar fácilmente en qué VIP o LC se ha deshabilitado Cisco Express Forwarding ejecutando el comando show cef linecard:

  • En la serie 7500:

    Router#show cef linecard
    CEF linecard generic information: 
      Slot MsgSent   Seq MaxSeq   LowQ   MedQ  HighQ Flags 
      4          8     6     30      0      0      0 up
      5          8     6     30      0      0      0 up
    
    Default-table CEF table, version 13, 11 routes
    Slot CEF-ver CEF-XDR Interface Flags
       4      12       5         5 Active, sync
       5      12       5         2 Active, sync
    
  • En las 12000 Series:

    Router#show cef linecard
    CEF table version 694517, 95239 routes
    Slot CEF-ver MsgSent XdrSent Seq MaxSeq LowQ MedQ HighQ Flags
    0      32128     365   33320 362    367    0    0     0 disabled
    1      95821    1010   99369 1006  1025    0    0     0 disabled
    2      92559     971    6033 967    984    0    0     0 disabled
    8      62514     653   65734 649    661    0    0     0 disabled
    9      47165     486   48428 483    498    0    0     0 disabled
    10     79887     834   83232 830    849    0    0     0 disabled
    

    Como la Serie 12000 sólo es compatible con Distributed Cisco Express Forwarding, un estado de disabled hace que se deshabilite toda la LC.

Descripción general de la representación externa de datos (XDR)

Para poder comprender los siguientes mensajes de error, es necesario que entienda qué son los mensajes XDR y para qué se utilizan:

  • %FIB-3-NORPXDRQELEMS

  • %FIB-3-FIBBADXDRLEN

  • %FIB-4-FIBXDRLEN

Aquí está una descripción de la arquitectura XDR:

http://www.cisco.com/c/dam/en/us/support/docs/routers/7500-series-routers/7603-cef-error-msgs-7603.gif

Como se explica en la sección de información previa de este documento, los mensajes IPC transportan la BOLA y las tablas de adyacencia del RP a los LC. En otras palabras, el mecanismo IPC sincroniza ambos conjuntos de tablas en el RP y en las LC. Cualquier estructura de datos empleada por alguna función deberá ser transportada a la LC a través del IPC de la FIB y las estadísticas se deberán enviar de regreso al RP. Cuando se encuentra activado Distributed Cisco Express Forwarding, LC toma la decisión de reenvío con las bases de datos replicadas y almacenadas a nivel local.

Se hace referencia a XDR como un mecanismo de superposición IPC. Los mensajes XRD se usan de manera exclusiva con la implementación Distributed Cisco Express Forwarding.

Tanto las estadísticas como las estructuras de datos compatibles con una característica del software IOS de Cisco se transmiten en los mensajes XDR sobre el mecanismo IPC del software del IOS de Cisco entre el RP y los LC. Específicamente, los mensajes XDR comprenden tres grupos de información, tal como se detalla en la siguiente tabla:

Tipo de mensaje Descripción de los mensajes Dirección:
Control El RP envía los datos de control en los subbloques de funciones del RP que se deben enviar a todos los subbloques de duplicación en las LC que deben recibir la información de cualquier modificación. RP a LC
Estadísticas Las LC recolectan información estadística de los diferentes subbloques de funciones, ubican la información recolectada en un buffer XDR y envían un mensaje XDR al RP. El RP luego agrega estas estadísticas. LC a RP
Informe de eventos asincrónicos Las LC informan sucesos no rutinarios a través de mensajes asincrónicos que se envían cuando se registra el inconveniente. LC a RP

Ejecute el comando show cef line internal para ver la información transmitida por medio de los mensajes XDR. Una actualización de Network Descriptor Block (NDB)/Routing Descriptor Block (RDB) representa un ejemplo de XDR.

Total elements queued: 
  prefix                    1877106 
  adjacency                 6011 
  interface                 4084 
  address                   4010 
  policy routing            3 
  hw interface              84 
  state                     6 
  resequence                2 
  control                   24 
  time                      308 
  subblock                  18109 
  flow features deactivate  3 
  flow cache config         3 
  flow export config        3 
  flow sampling config      3 
  access-list               213 
  mpls ttl propogate        3 
  routemap config           126 
  mpls stats aggregate      3 
  dot1q vlan                10109 
  icmp limit                3 

Troubleshooting

En esta sección se enumeran los mensajes de error que aparecen en los registros del router y se proporcionan sugerencias para resolver los problemas.

%FIB-3-FIBDISABLE: Fatal error, slot [#]: no memory and %FIB-3-NOMEM: Malloc Failure, disabling dCEF on line card

Estos tipos de mensajes de error se encuentran en los registros del router (ejecute el comando show logging exec en su router o consulte su servidor syslog, si usa uno) de la siguiente manera:

  • En la serie 7500:

    Dec 19 17:58:56 CET: %FIB-3-FIBDISABLE: Fatal error, slot 0: no memory
    DEC 19 17:58:58 CET: %IPC-5-SLAVELOG: VIP-SLOT0: 
    00:03:37: %SYS-2-MALLOCFAIL: Memory allocation of 65524 bytes failed from     
    0x6009E9E4, pool Processor, alignment 16
    -Process= "CEF IPC Background", ipl= 0, pid= 7
    -Traceback= 600A141C 600A2B78 6009E9EC 6009F350 60235A34 60221BA4 60225528 
    6022A46C 60231104 6022FAC4 6022FCCC 6022FDBC 60230334 6009BB74 6009BB60      
    DEC 19 17:59:06 CET: %FIB-3-FIBDISABLE: Fatal error, slot 9: no memory
    DEC 19 17:59:11 CET: %IPC-5-SLAVELOG: VIP-SLOT9:
    00:03:47: %SYS-2-MALLOCFAIL: Memory allocation of 65524 bytes failed from      
    0x6009E9E4, pool Processor, alignment 16 
    -Process= "CEF IPC Background", ipl= 0, pid= 7
    -Traceback= 600A141C 600A2B78 6009E9EC 6009F350 60235A34 60221BA4 60225528      
    6022A46C 60231104 6022FAC4 6022FCCC 6022FDBC 60230334 6009BB74 6009BB60     
    DEC 19 17:59:31 CET: %IPC-5-SLAVELOG: VIP-SLOT8: 
    00:04:11: %SYS-2-MALLOCFAIL: Memory allocation of 3956 bytes failed from      
    0x602835F0, pool Processor, alignment 32 
    -Process= "CEF LC Stats", ipl= 0, pid= 21 
    -Traceback= 600A141C 600A2EC8 602835F8 60283C84 60283C58 60283CE4 60230574      
    6009BB74 6009BB60
    DEC 19 17:59:38 CET: %FIB-3-FIBDISABLE: Fatal error, slot 8: no memory
    DEC 19 18:00:29 CET: %FIB-3-FIBDISABLE: Fatal error, slot 10: no memory
    ...
    
  • En la Serie 7500, el mensaje de error que aparece inmediatamente después del mensaje %IPC-5-SLAVELOG: VIP-SLOT proviene directamente del VIP que se sitúa en la ranura mencionada empleando un mecanismo IPC. En este ejemplo en particular, el mensaje %SYS-2-MALLOCFAIL proviene de la tarjeta VIP.

    Jun 27 04:58:56 CET: %FIB-3-FIBDISABLE: Fatal error, slot 1: no memory
    Jun 27 04:59:07 CET: %FIB-3-FIBDISABLE: Fatal error, slot 2: no memory
    Jun 27 04:59:36 CET: %FIB-3-FIBDISABLE: Fatal error, slot 4: no memory
    Jun 27 04:59:45 CET: %FIB-3-FIBDISABLE: Fatal error, slot 0: no memory
    SLOT 2:Jun 27 04:23:00: %SYS-2-MALLOCFAIL: Memory allocation of 65524        
    bytes failed from 0x4009D9E4, pool Processor, alignment 32 
    -Process= "CEF IPC Background", ipl= 0, pid= 38 
    -Traceback= 400A0BFC 400A2358 4009D9EC 4009E338 403168BC 40316B68 40316EBC       
    4031C318 40321234 4032858C
    40326CD4 40326EF4 40326FE4 403275CC 4009BC74 4009BC60
    SLOT 2:Jun 27 04:23:00: %FIB-3-NOMEM: 
    Malloc Failure, disabling DCEF on linecard
    ...

    Nota: Mensajes que comienzan con el “SLOT-: ” son generados por el LC sí mismo.

Estos mensajes indican que Cisco Express Forwarding distribuido ha sido desactivado en el VIP (para la serie 7500) o en la LC (para la serie 12000) porque no había memoria suficiente para descargar de la placa principal el FIB de Cisco Express Forwarding ni las tablas de adyacencia. Como la Serie 12000 sólo es compatible con la conmutación de Distributed Cisco Express Forwarding, al deshabilitar Distributed Cisco Express Forwarding, también se desactiva la tarjeta.

Para ejecutar las rutas de protocolo de gateway de frontera (BGP) de Internet completo, se recomienda tener por lo menos 128MB en el VIP o en la LC.

Como el VIP2-40 en un router de la Serie 7500 sólo puede tener un máximo de 64 MB, se recomienda que realice una actualización a VIP2-50 o incluso a VIP4-80 si quiere utilizar Distributed Cisco Express Forwarding con rutas BGP de Internet completas. Treinta y dos MB definitivamente no es suficiente para ejecutar Distributed Cisco Express Forwarding.

Se recomienda contar con un VIP2-50 o superior, con al menos 128 MB de memoria, según el tamaño de la tabla de ruteo.

Si su router acepta la tabla de ruteo de Internet completa (o casi completa), BGP necesitará una gran cantidad de memoria de manera provisoria durante la fase de convergencia después que se recargue un router o que un link BGP cambie de estado. Durante dicha convergencia, el agrupamiento de la memoria del procesador puede alcanzar un valor muy bajo, como se muestra en el resultado del comando show memory summary. Durante la breve condición de poca memoria, otros procesos pueden quedar afectados si necesitan memoria. Por ejemplo, para emitir un comando telnet con el objetivo de comunicarse con un router se requiere memoria para mantener la sesión TCP.

Otro usuario transitorio de la memoria del procesador es el Label Distribution Protocol (LDP) en las redes de Multiprotocol Label Switching (MPLS).

Cisco Express Forwarding genera el mensaje FIBDISABLE sólo cuando el router se queda totalmente sin memoria del procesador. No hay una marca de agua baja para FIBDISABLE. Una vez que se inhabilita Cisco Express Forwarding, libera toda su memoria. Por lo tanto, la captura del resultado del comando show memory summary tras la desactivación muestra que existe suficiente memoria libre, pero este resultado es engañoso. Sólo las capturas del comando show memory summary antes de que se inhabilite Cisco Express Forwarding revelarán datos precisos sobre la condición de memoria baja.

Además, una condición FIBDISABLE puede ser un efecto secundario de quedarse sin búferes IPC. El software Cisco IOS no asigna de manera dinámica más buffers IPC que los necesarios. Quedarse sin búferes IPC no genera mensajes de error FIB NOMEM, pero se pueden ver otros mensajes de error IPC como IPC-3-NOBUFF. El ejecutarse de los buffers de IPC no causa un error FIBDISABLE; El Cisco Express Forwarding hace cola simplemente cualquier mensaje fallido e intenta otra vez más adelante. Sin embargo, si se agotan los buffers IPC y Cisco Express Forwarding no puede conseguir un buffer IPC, es posible que coloque mensajes en cola a las LC hasta que finalmente se quede sin memoria.

Una pregunta que se suele recibir en el Centro de Asistencia Técnica (TAC) de Cisco es cómo planificar o determinar si un router conectado con BGP tiene suficiente memoria para ejecutar BGP. La respuesta depende de la configuración. A continuación, algunas consideraciones:

  • ¿Tiene pensado utilizar entidades pares con Internal Border Gateway Protocol (iBGP) y External Border Gateway Protocol (eBGP)? ¿Cuántos pares? El grupo de interlocutores de BGP puede serle de ayuda. Más pares significa un tiempo de convergencia más extenso.

  • ¿Cuántos ruteo se han intercambiado en cada dirección para cada par? Asegúrese de que se realice la distinción apropiada entre rutas y trayectos. Las rutas cuentan la cantidad de prefijos que hay en la base de información de ruteo BGP. Las rutas cuentan la cantidad de prefijos BGP anunciados a un par vecino. Por ejemplo, si cinco entidades pares BGP envían la tabla de ruteo completa, entonces, cada entidad par envía las mismas rutas. Si se considera que los pares poseen un 90 por ciento de superposición en sus rutas, el router de recepción tendrá una tabla de ruteo de aproximadamente 150000 rutas con cinco trayectos para la mayoría de las rutas.

  • Entre otros de los factores que se deben considerar se incluyen los siguientes:

    • La serie 12000 tiene un motor LC.

    • El número de rutas del Protocolo de gateway interior (IGP).

    • La cantidad de adyacencias.

    • Equilibrio de carga: la cantidad de trayectos al mismo destino.

    • Uso de la red privada virtual MPLS (VPN) y el número de instancias de ruteo o reenvío virtual (VRF) y el número de rutas por VRF.

Oficialmente, la versión 12.0(18)S del software Cisco IOS y las versiones posteriores requieren 128 MB en todas las LC. Como las versiones más recientes del Software Cisco IOS ocupan más memoria del procesador, se recomienda un máximo de 256 MB para lograr la escalabilidad futura para routers que aceptan la tabla completa de ruteo de Internet. Anteriormente, la Serie 12000 se encontraba disponible con 64 MB en las LC. Tales LC deberán actualizarse.

Verifique cuáles son las tarjetas afectadas (consulte la sección Verificación del Estado de Cisco Express Forwarding en VIP y LC de este documento) y ejecute los siguientes comandos para mostrar los distintos tipos de tarjetas presentes en su router y las cantidades correspondientes de memoria:

  • En la serie 7500:

    Router#show diag | i (Slot | controller) 
    Slot 0: 
            EIP controller, HW rev 1.05, board revision B0 
            Slot database information: 
    Slot 2: 
    Slot 3: 
    Slot 4: 
            VIP2 controller, HW rev 2.11, board revision E0 
            Slot database information: 
            Controller Memory Size: 64 MBytes DRAM, 2048 KBytes SRAM 
    Slot 5: 
            VIP2 R5K controller, HW rev 2.03, board revision A0 
            Slot database information: 
            Controller Memory Size: 128 Mbytes DRAM, 8192 Kbytes SRAM 
    Slot 31 (virtual):
    
  • En las 12000 Series:

    Router#show diag | i (DRAM|SLOT) 
    SLOT 0  (RP/LC 0 ): 1 Port SONET based SRP OC-12c/STM-4 Single Mode 
      DRAM size: 268435456 bytes 
      FrFab SDRAM size: 134217728 bytes, SDRAM pagesize: 8192 bytes 
      ToFab SDRAM size: 134217728 bytes, SDRAM pagesize: 8192 bytes 
    SLOT 2  (RP/LC 2 ): 12 Port Packet over E3 
      DRAM size: 67108864 bytes 
      FrFab SDRAM size: 67108864 bytes 
      ToFab SDRAM size: 67108864 bytes 
    SLOT 3  (RP/LC 3 ): 1 Port Gigabit Ethernet 
      DRAM size: 134217728 bytes 
      FrFab SDRAM size: 134217728 bytes, SDRAM pagesize: 8192 bytes 
      ToFab SDRAM size: 134217728 bytes, SDRAM pagesize: 8192 bytes 
    SLOT 5  (RP/LC 5 ): Route Processor 
      DRAM size: 268435456 bytes
    

Al añadir más memoria a las tarjetas afectadas estará evitando que se generen mensajes y volverá a habilitar Distributed Cisco Express Forwarding en las tarjetas. Si los mensajes no desaparecen luego de la actualización de la memoria, comuníquese con su representante de soporte técnico de Cisco y proporciónele toda la información recolectada hasta el momento, además de la salida del comando show tech-support.

Nota: Los viejos modelos del Fast Ethernet Interface Processor (FEIP) (CX-FEIP2-2TX y CX-FEIP2-2TX) no soportan el Distributed Switching en absoluto, y generan los mensajes similares si usted intenta habilitar el Distributed Cisco Express Forwarding en él. Ejecute el comando show diag [slot#] para determinar si su placa es VIP o FEIP:

Router#show diag 0 
Slot 0: 
        Physical slot 0, ~physical slot 0xF, logical slot 0, CBus 0 
        Microcode Status 0x4 
        Master Enable, LED, WCS Loaded 
        Pending I/O Status: None 
        EEPROM format version 1 
        FEIP controller, HW rev 2.01, board revision B0 
        Serial number: 03696620  Part number: 73-1374-04 
        Test history: 0x0E        RMA number: 203-11-48 
        Flags: cisco 7000 board; 7500 compatible

Si desea ejecutar Distributed Cisco Express Forwarding, deberá reemplazar sus antiguos FEIP con una tarjeta VIP con adaptadores de puerto Fast Ethernet.

%FIB-3-FIBDISABLE: Fatal error, slot [#]: No window message, LC to RP IPC is non-operational

Los siguientes mensajes (en las Series 7500 y 12000) también indican que Cisco Express Forwarding fue deshabilitado, esta vez debido a que el RSP o GRP no recibió una señal de mantenimiento desde VIP o LC.

DEC 19 18:03:55 CET: %FIB-3-FIBDISABLE: Fatal error, slot 0: 
No window message, LC to RP IPC is non-operational 
DEC 19 18:04:05 CET: %FIB-3-FIBDISABLE: Fatal error, slot 9: 
No window message, LC to RP IPC is non-operational 
DEC 19 18:04:37 CET: %FIB-3-FIBDISABLE: Fatal error, slot 8: 
No window message, LC to RP IPC is non-operational 
DEC 19 18:05:28 CET: %FIB-3-FIBDISABLE: Fatal error, slot 10: 
No window message, LC to RP IPC is non-operational 
DEC 19 18:05:59 CET: %FIB-3-FIBDISABLE: Fatal error, slot 2: 
No window message, LC to RP IPC is non-operational 
DEC 19 18:06:07 CET: %FIB-3-FIBDISABLE: Fatal error, slot 1: 
No window message, LC to RP IPC is non-operational 

Primero verifique si tiene memoria suficiente en sus tarjetas.

Luego compruebe la utilización de la CPU en su VIP o LC (ejecute el comando show controllers vip [slot#] proc cpu en la Serie 7500, y el execute-on slot 0 show proc CPU en la serie 12000). Si la utilización de la CPU es verdaderamente alta (superior al 95%), el VIP o la LC pueden estar demasiado ocupados para enviar señales de mantenimiento al RSP o GRP. La causa raíz del problema aquí es el uso excesivo de la CPU. Consulte la Resolución de Problemas por Uso Excesivo de CPU en Routers Cisco para obtener consejos para solucionar problemas.

Si todo parece estar bien, lo más probable es que lo que provoca los mensajes de error sea una falla en el software del IOS de Cisco.

Cuando resuelva este error, lo primero que debería hacer es verificar las tarjetas que fueron afectadas (si desea obtener más información consulte la sección Verificación del Estado de Cisco Express Forwarding en VIP y LC de este documento). Puede intentar reiniciar Cisco Express Forwarding en esas tarjetas mediante el comando clear cef linecard [slot#]. En la serie 7500, es posible que también sea necesario reiniciar la tarjeta VIP ejecutando el comando microcode reload. Esto genera un complejo CBUS, el cual provoca una interrupción del tráfico durante aproximadamente dos minutos (si desea obtener más información consulte ¿Qué Causa un "%RSP-3-RESTART: cbus complex"? para más información). Este procedimiento debería, al menos temporalmente, restaurar Distributed Cisco Express Forwarding en el VIP o la LC.

De otro modo, la actualización a la última secuencia de la versión de software del IOS de Cisco elimina todos los problemas fijos que provocan este tipo de error. Si el problema persiste luego de la actualización, comuníquese con su representante de soporte técnico de Cisco y proporciónele toda la información recolectada hasta el momento, junto con la salida de un comando show tech-support.

%FIB-3-FIBDISABLE: Fatal error, slot [#]: IPC failure

Los siguientes mensajes de error son más genéricos y pueden causar la aparición de otros mensajes de error (tales como %FIB-3-FIBDISABLE: Fatal error, slot [#]: No window message, LC to RP IPC is nonoperational):

%FIB-3-FIBDISABLE: Fatal error, slot 3: IPC failure 
%FIB-3-FIBDISABLE: Fatal error, slot 0: IPC failure 
%FIB-3-FIBDISABLE: Fatal error, slot 1: IPC failure 
%FIB-3-FIBDISABLE: Fatal error, slot 2: IPC failure 
%FIB-3-FIBDISABLE: Fatal error, slot 4: IPC failure 
%FIB-3-FIBDISABLE: Fatal error, slot 9: IPC failure 
%FIB-3-FIBDISABLE: Fatal error, slot 10: IPC failure 

Inter-Process Communication (IPC) es un protocolo utilizado por el procesador principal (RSP o GRP) y VIP o LC para la comunicación. Asegura la sincronización de las FBI y las tablas de adyacencia cuando se está ejecutando Distributed Cisco Express Forwarding. Existen varias razones para que aparezcan estos mensajes de error IPC, tales como:

Errores de IPC

Los siguientes comandos pueden utilizarse para analizar el estado IPC actual. La salida de estos comandos a veces difiere entre la Serie 7500 y la Serie 12000.

  • show ipc status: se utiliza para comprobar errores de IPC, NACK e ipc_output_failures

  • show ipc nodes: se utiliza para verificar las tarjetas activas.

  • show ipc queue: se utiliza para verificar los mensajes IPC que aguardan al ACK.

En la serie 7500, el resultado es el siguiente:

Router#show ipc status 
IPC System Status: 

This processor is the IPC master server. 

1000 IPC message headers in cache 
1591560 messages in, 5884 out, 1587095 delivered to local port, 
2757 acknowledgements received, 2764 sent, 
0 NACKS received, 0 sent, 
0 messages dropped on input, 276 messages dropped on output 
0 no local port, 264 destination unknown, 0 no transport 
0 missing callback or queue, 0 duplicate ACKs, 5 retries, 
1 message timeout. 
12 ipc_output failures, 0 mtu failures, 
0 msg alloc failed, 0 emer MSG alloc failed, 0 no origs for RPC replies 
0 pak alloc failed, 10 memd alloc failed 
2 no hwq, 0 failed opens, 0 hardware errors 
No regular dropping of IPC output packets for test purposes 

Router#show ipc nodes 
There are 3 nodes in this IPC realm. 
   ID     Type                 Name         Last  Last 
                                            Sent  Heard 
   10000 Local      IPC Master                0      0 
 1030000 RSP-CY     RSP IPC card slot 3       7      7 
 1000000 RSP-CY     RSP IPC card slot 0      10     10 

Router#show ipc queue 
There are 0 IPC messages waiting for acknowledgement in the transmit queue. 
There are 0 IPC messages waiting for a response. 
There are 0 IPC messages waiting for additional fragments. 
There are 0 IPC messages currently on the IPC inboundQ. 
There are 0 messages currently in use by the system.

En las 12000 Series, la salida es como sigue:

Router#show ipc status 
IPC System Status: 

This processor is the IPC master server. 

19244592 messages in, 26698 out, 19244448 delivered to local port, 

102 acknowledgements received, 4780307 sent, 
0 NACKS received, 0 sent, 
0 messages dropped on input, 0 messages dropped on output 
0 no local port, 0 destination unknown, 0 no transport 
0 missing callback or queue, 0 duplicate ACKs, 0 retries, 
0 message timeouts. 
0 ipc_output failures, 0 mtu failures, 
0 MSG alloc failed, 0 emer MSG alloc failed, 0 no origs for RPC replies 
0 pak alloc failed, 0 memd alloc failed 
0 no hwq, 0 failed opens, 0 hardware errors 

Router#show ipc nodes 
There are 4 nodes in this IPC realm. 

   ID     Type       Name             Last  Last 
 10000 Local      IPC Master          0      0 
 1000000 GSR        GSR Slot 0         23     47 
 1010000 GSR        GSR Slot 1         23     26 
 1040000 GSR        GSR Slot 4         23     29 

                                  Sent  Heard
Router#show ipc queue 

There are 0 IPC messages waiting for acknowledgement in the transmit queue. 
There are 0 messages currently in use by the system. 

Si los contadores resaltados aumentan, IPC no funciona correctamente para las distintas ranuras. En ese caso, usted debe primero intentar volver a sentar el LC correspondiente, o reajustarlo publicando el comando microcode reload (para las 7500 Series), o publicando el comando hw-module slot [slot-] reload (para las 12000 Series). Si no se recupera el proceso IPC después de reiniciar la LC, intente mover la placa a otra ranura. Si aún así no funciona, reemplace el VIP o la LC defectuosos.

Problema de recursos físicos

En un router de Internet de la serie 12000 de Cisco, la estructura misma puede ser la culpable. Si una de las tarjetas Switching Fabric Cards (SFC) está dañada, obtendrá mensajes de error similares debido a que los mensajes del IPC ya no pueden atravesar el entramado. Sin embargo, en este caso, debería ver también otros mensajes señalando el recurso físico defectuoso.

Puede verificar si una de las SFC se encuentra dañada ejecutando el comando show controller fia, como se muestra a continuación:

Router#show controllers fia
Fabric configuration: Full bandwidth redundant
Master Scheduler: Slot 17

>From Fabric FIA Errors
/en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html
/en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html
/en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html
/en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html
/en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html
---
redund fifo parity 0   redund overflow 0  cell drops 1
crc32 lkup parity  0   cell parity     0  crc32      0
Switch cards present    0x0017    Slots  16 17 18 20
Switch cards monitored  0x0017    Slots  16 17 18 20
Slot:     16       17         18         19         20
Name:    csc0     csc1       sfc0       sfc1       sfc2       
/en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html
/en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html
/en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html
/en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html
/en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html
/en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html
/en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html
/en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html
/en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html
/en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html
los    0         0          0          0          0
state  Off       Off        Off        Off        Off
crc16  0         0          4334       0          0

To Fabric FIA Errors
/en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html
/en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html
/en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html
/en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html
/en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html
---
sca not pres 0       req error     0      uni FIFO overflow 0
grant parity 0       multi req     0      uni FIFO undrflow 0
cntrl parity 0       uni req       0      crc32 lkup parity 0
multi FIFO   0       empty dst req 0      handshake error   0
cell parity  0 

En este ejemplo, sfc0 probablemente sea defectuoso (slot 18) y necesite ser reemplazado.

VIP o LC que No se Inicia Correctamente o se Bloquea

Si una de las tarjetas no se inició correctamente, no podrá comunicarse con el procesador principal (GRP o RSP). Usted puede marcar el registro publicando el comando show log; esto le dice si algo salió mal en el bootup. También necesita controlar el estado de la LC.

Es posible verificar el estado actual de las LC ejecutando el comando show diag.

  • En la serie 7500:

    Router#show diag | i (Slot|Board is)
    Slot 0:
    		Board is analyzed
    		Slot database information:
    Slot 2:
    Slot 3:
    Slot 4:
    		Board is analyzed
            Slot database information:
    Slot 5:
            Board is analyzed
            Slot database information:
    Slot 31 (virtual)
    
  • En las 1200 Series:

    Router#show diags | i SLOT | State 
    SLOT 0  (RP/LC 0 ): Route Processor 
      Board State is IOS Running (ACTV  RP ) 
    SLOT 1  (RP/LC 1 ): 1 port ATM Over SONET OC12c/STM-4c Multi Mode 
      Board State is Line Card Enabled (IOS  RUN ) 
    SLOT 2  (RP/LC 2 ): 1 Port Gigabit Ethernet 
      Board State is Line Card Enabled (IOS  RUN ) 
    SLOT 3  (RP/LC 3 ): 3 Port Gigabit Ethernet 
      Board State is Line Card Enabled (IOS  RUN ) 
    SLOT 4  (RP/LC 4 ): 4 port ATM Over SONET OC-3c/STM-1 Multi Mode 
      Board State is In Reset (IN   RSET) 
    SLOT 5  (RP/LC 5 ): 8 Port Fast Ethernet Copper 
      Board State is Line Card Enabled (IOS  RUN ) 
    SLOT 6  (RP/LC 6 ): 4 Port Packet Over SONET OC-3c/STM-1 Multi Mode 
      Board State is Line Card Enabled (IOS  RUN ) 
    SLOT 7  (RP/LC 7 ): 1 Port E.D. Packet Over SONET OC-48c/STM-16 
    Single Mode/SR SC-SC connector 
      Board State is Line Card Enabled (IOS  RUN ) 
    SLOT 17 (CSC 1   ): Clock Scheduler Card(8) 
    SLOT 18 (SFC 0   ): Switch Fabric Card(8) 
    SLOT 19 (SFC 1   ): Switch Fabric Card(8) 
    SLOT 20 (SFC 2   ): Switch Fabric Card(8) 
    SLOT 24 (PS A1   ): AC Power Supply(8)
    

El estado normal es Line Card Enabled en la Serie 12000, y Board is analyzed en la Serie 7500.

Verifique si la tarjeta es compatible con el software Cisco IOS y qué imagen de inicio está ejecutando actualmente. Para ello, puede utilizar el Software Advisor (sólo clientes registrados). Si el software se está ejecutando normalmente, intente volver a instalar la LC correspondiente o reiniciarla ejecutando el comando microcode reload (en el caso de la Serie 7500), o el comando hw-module slot [slot#] reload (en el caso de la Serie 12000).

Si la LC no responde, pruebe la placa en otra ranura para asegurarse de que esta ranura en particular en el chasis no sea defectuosa. Si sigue sin funcionar, probablemente se deba reemplazar el VIP o la LC.

Es posible que también desee verificar si existe suficiente memoria en la LC y si la memoria se compró directamente a Cisco o a un proveedor autorizado por Cisco. Una LC no se inicia si se está utilizando un tipo de memoria incorrecta o si no hay memoria suficiente para cargar el microcódigo.

VIP o Tarjeta de Línea Sin Más Buffers Disponibles

Puede ocurrir que la LC tenga poca memoria y que no tenga más buffers para que se produzca la comunicación IPC. En ese caso, deberá actualizar la memoria de la LC.

Error de procesamiento de software de Cisco IOS

Si todo parece funcionar correctamente, piense en la posibilidad de una falla en el software Cisco IOS. Actualizar su versión de software Cisco IOS a la versión más reciente eliminará todos los problemas resueltos de IPC.

En algunos casos excepcionales relacionados con la Serie 12000 donde está configurada la optimización de la lista de acceso, también pueden aparecer estos mensajes de error. Una corrección a corto plazo consiste en deshabilitar esta nueva característica ejecutando el comando no access-list hardware psa. Si necesita más información, consulte Optimizaciones en el Rendimiento de la Lista de Acceso para Cisco 12000 Gigabit Switch Routers.

Si no puede determinar la causa de los mensajes, o si el problema todavía aparece en la última versión del software del IOS de Cisco disponible en CCO para su secuencia de publicación, entonces tal vez este sea un nuevo error de programación del software del IOS de Cisco. Comuníquese con su representante de soporte técnico de Cisco y bríndele los datos recopilados hasta el momento, junto con la salida de los comandos show tech-support y show cef linecard de ese router.

Inserción y extracción en línea (OIR) o interrupción del VIP

Luego de una caía del VIP, se redistribuye la memoria de paquete RSP (conocida como MEMD) y se restauran las conexiones IPC entre el RSP y los VIP. Si el RSP tiene mensajes Cisco Express Forwarding en cola en la tabla de retransmisión IPC durante un desperfecto de VIP, estos mensajes pueden expirar y hacer que Cisco Express Forwarding se desactive en otras LC. El Id. de bug Cisco CSCdv87489 (clientes registrados solamente) resuelve este problema en el RSP indicando al Cisco Express Forwarding que detecte una recarga OIR, LC, o el retallado MEMD, y los mensajes rasantes en la retransmisión hace cola. El Id. de error de Cisco CSCdu81796 (sólo clientes registrados) resuelve este problema en el Cisco 10000 Series Router.

Ejecutar una OIR de un VIP o una LC puede disparar un error FIBDISABLE en otras ranuras. Se produce esta situación cuando Cisco Express Forwarding en RP no establece la conexión IPC con otras tarjetas VIP debido a un evento de OIR en uno de los VIP. El Id. de bug Cisco CSCdv47664 (clientes registrados solamente) resuelve este problema.

%FIB-4-RPPREFIXINCONST2/1 y %FIB-4-LCPREFIXINCONST2/1

También puede observar los siguientes mensajes en los registros del router:

%FIB-4-RPPREFIXINCONST2: RP missing prefix for 195.74.205.54/32
in FIB table Default-table (present in routing)
%FIB-4-RPPREFIXINCONST2: RP missing prefix for 195.74.205.231/32
in FIB table Default-table (present in routing)
%FIB-4-RPPREFIXINCONST2: RP missing prefix for 195.74.221.68/32
in FIB table Default-table (present in routing)
%FIB-4-RPPREFIXINCONST2: RP missing prefix for 195.74.216.52/32
in FIB table Default-table (present in routing)
%FIB-4-RPPREFIXINCONST2: RP missing prefix for 195.74.216.96/32
in FIB table Default-table (present in routing)
%FIB-4-RPPREFIXINCONST2: RP missing prefix for 195.74.216.55/32
in FIB table Default-table (present in routing)

o

%FIB-4-LCPREFIXINCONST2: Slot 1 missing prefix entry for 64.0.17.0/32
%FIB-4-LCPREFIXINCONST2: Slot 1 missing prefix entry for 64.0.45.0/32
%FIB-4-LCPREFIXINCONST2: Slot 1 missing prefix entry for 64.0.23.0/32

Este inconveniente afecta al hardware que ejecuta Distributed Cisco Express Forwarding, incluidas las Series 7500 y 12000. Estos mensajes son advertencias generadas por el verificador de consistencia de Cisco Express Forwarding cuando descubre alguna incoherencia entre las tablas de Cisco Express Forwarding.

El verificador de coherencia utiliza distintos mecanismos para encontrar las incoherencias:

  • El LC o VIP envía al GRP o RSP cualquier dirección a la cual no pudo reenviar paquetes. Si el GRP o RSP detecta que se trataba de una entrada relevante, se ha detectado una inconsistencia y se imprime un mensaje de error en la consola.

  • Las tarjetas de línea o los VIP y el GRPo RSP se envían entre sí una cantidad fija de prefijos (el valor predeterminado es 100) cada 60 segundos. En caso de detectarse alguna incongruencia, aparece el mensaje de error.

Si no se corrige la inconsistencia, esto puede acarrear destinos inalcanzables y paquetes caídos. Cuando vea aquellos mensajes, lo primero que debe hacer es ejecutar un comando show ip cef en el dispositivo mencionado en el mensaje de error y verificar si está presente o no el prefijo. Esto le indica si el router corrigió o no la incoherencia por sí solo.

A continuación se encuentran explicaciones más detalladas de cada mensaje y algunas recomendaciones para librarse de ellos.

  • %FIB-4-RPPREFIXINCONST2 — Un analizador de coherencia pasivo ha descubierto un prefijo en la tabla de ruteo que no está presente en la tabla de reenvío del Cisco Express Forwarding en el RP. Es probable que esto sea pasajero.

    Si el mismo prefijo produce errores repetidos, verifique el prefijo en Cisco Express Forwarding y la tabla de ruteo. Si falta el prefijo, intente desactivar o activar Cisco Express Forwarding.

  • %FIB-4-RPPREFIXINCONST1 — Un analizador de coherencia pasivo ha descubierto un prefijo en la tabla de reenvío del LC que no está presente en el RP. Es probable que esto sea pasajero.

    Si el mismo prefijo produce errores repetidos, verifique el prefijo Cisco Express Forwarding en el RP y la tarjeta de línea. Si es necesario, la ejecución del comando clear cef linecard descarga una nueva tabla Cisco Express Forwarding en la tarjeta de línea.

  • %FIB-4-LCPREFIXINCONST1 — Un paquete ha llegado en el LC, pero las operaciones de búsqueda del IP Address de destino no podido para encontrar este prefijo en la tabla de reenvío. Sin embargo, el prefijo está presente en el RP. Es probable que esto sea pasajero.

    Si el mismo prefijo produce errores repetidos, verifique el prefijo Cisco Express Forwarding en el RP y la LC. Si es necesario, la ejecución del comando clear cef linecard descarga una nueva tabla Cisco Express Forwarding en la LC. También puede intentar ejecutar el comando clear adjacency para recargar los prefijos /32.

  • %FIB-4-LCPREFIXINCONST2 — Un analizador de coherencia pasivo ha descubierto un prefijo que faltaba de la tabla de reenvío del LC que está presente en el RP. Es probable que esto sea pasajero.

    Si el mismo prefijo produce errores repetidos, verifique el prefijo Cisco Express Forwarding en el RP y la LC. Si es necesario, la ejecución del comando clear cef linecard descarga una nueva tabla Cisco Express Forwarding en la LC. También puede intentar ejecutar el comando clear adjacency para recargar los prefijos /32.

    Si el mensaje sólo apareció una vez y la incongruencia se corrigió de inmediato, es posible que se trate de un evento pasajero y que no se requiera intervención alguna. Sin embargo, si recibe gran cantidad de estos mensajes o si el router no corrige esta situación por sí mismo, probablemente esté frente a un error de software en el código de Cisco Express Forwarding. Varios de estos errores de programación de software fueron corregidos en las versiones 12.0(17)S1 y 12.0(17)ST1 del IOS de Cisco, así que asegúrese de estar ejecutando al menos esta versión del IOS de Cisco.

    Si el problema persiste después de actualizar a la versión más reciente en su tren de versión, comuníquese con su representante de soporte técnico de Cisco e infórmele la salida de los comandos show tech, show ip route y show ip cef.

    Nota: Puede apagar los verificadores de consistencia con el comando no ip cef table consistency-check global configuration.

Para obtener más detalles y sugerencias sobre resolución de problemas relacionados con este mensaje de error, consulte Solución de Problemas sobre Inconsistencias de Prefijo con Cisco Express Forwarding.

%FIB-3-NORPXDRQELEMS: Se agotaron los elementos XDR en cola mientras se preparaba el mensaje para la ranura [#]

Nota: Refiera a la sección de Descripción general de la Representación de datos externa (XDR) de este documento para entender mejor la explicación y las recomendaciones para este mensaje de error.

Mientras el RP estaba preparando para enviar un mensaje a la LC en el sistema, agotó la fuente de elementos en cola necesarios para colocar en cola los mensajes para la transmisión.

En las series de Cisco 12000, Distributed Cisco Express Forwarding se debe deshabilitar debido a su condición de escasa memoria, durante una actualización de ruteo amplia (por ejemplo durante el inicio). Por ejemplo: durante las inestabilidades y el reinicio del ruteo, un RP puede enfrentar fallas malloc que deshabilitan la conmutación Distributed Cisco Express Forwarding.

A modo de ejemplo, si elimina el proceso ip ospf con rutas Open Shortest Path First (OSPF) de 260 k en RP, es probable que obtenga este mensaje de error.

%FIB-3-NORPXDRQELEMS: Exhausted XDR queuing 
  elements while preparing message for slot 2
  -Process= "OSPF Router", ipl= 0, pid= 149
  -Traceback= 41060B88 40D5C894 403D130C 403A4484 403AB49C 403AAB10 
  403AB7BC 40736FCC 407384E0 401BE9BC 401BE9A8

O bien, si tiene una tabla de ruteo BGP grande y si observa varias inestabilidades de ruteo o se reinicia el router, entonces verá lo siguiente:

%FIB-3-NORPXDRQELEMS: Exhausted XDR queuing elements 
  while preparing message for slot 4
   -Process= "BGP Router", ipl= 0, pid= 104
   -Traceback= 600CDC74 600DC3D0 6038FA90 6036C940 60374510 604A2F30 
  60753168 604A2FAC 604A9BC0 6018BD8C 6018BD78

Nota: Estos mensajes pueden venir así como el %FIB-3-FIBDISABLE: Fatal error, slot 6: no memory y %FIB-3-NOMEMWARNING: Malloc Failure in DCEF.

Durante el envío de rutas BGP de 100 k, es posible que note lo siguiente:

%OSPF-5-ADJCHG: Process 100, Nbr 161.10.1.1 on GigabitEthernet3/1 
  from LOADING to FULL, Loading Done
%OSPF-5-ADJCHG: Process 100, Nbr 161.10.1.1 on GigabitEthernet3/3 from LOADING 
  to FULL, Loading Done
%OSPF-5-ADJCHG: Process 100, Nbr 161.10.1.1 on GigabitEthernet3/2 from LOADING 
  to FULL, Loading Done
%OSPF-5-ADJCHG: Process 100, Nbr 161.10.1.1 on GigabitEthernet3/4 from LOADING 
  to FULL, Loading Done

%BGP-5-ADJCHANGE: neighbor 161.10.11.1 Up


%FIB-3-FIBDISABLE: Fatal error, slot 6: no memory
%FIB-3-FIBDISABLE: Fatal error, slot 3: no memory


%SYS-2-MALLOCFAIL: Memory allocation of 65540 bytes failed from 0x401C783C, 
pool Processor, alignment 0
  -Process= "BGP Router", ipl= 0, pid= 120
  -Traceback= 401CAB20 401CCF80 401C7844 401C8044 40FD017C 40FD032C 40D65AFC 
   403D4174 403A7BA4 403AA4D0 40712200 40712EF4 4112E760 40712FE0 406EDD10 
   401C155C
Queued messages:
%SYS-3-LOGGER_FLUSHING: System pausing to ensure console debugging output.

%FIB-3-NORPXDRQELEMS: Exhausted XDR queuing elements while preparing message for 
slot 4
   -Process= "BGP Router", ipl= 0, pid= 104
   -Traceback= 600CDC74 600DC3D0 6038FA90 6036C940 60374510 604A2F30 
     60753168 604A2FAC 604A9BC0 6018BD8C 6018BD78
%FIB-3-NOMEMWARNING: Malloc Failure in DCEF

Este problema lo genera Cisco Express Forwarding al utilizar demasiada memoria RP durante actualizaciones del router prolongadas. Lo que sucede es que el RP utiliza la memoria libre enviando a cola los mensajes XDR en las colas de IPC de Cisco Express Forwarding para que sean reenviados a las LC a una velocidad bastante baja. La velocidad del mensaje IPC de Cisco Express Forwarding actualmente está restringida a 25 mensajes IPC (desde cualquier cola) cada un cuarto de segundo como máximo. El resultado es que las colas en el lado RP crecen hasta alcanzar un gran tamaño y no dejan memoria RP libre, por lo tanto, ocurre una falla mallocfail e inhabilita Cisco Express Forwarding.

De ser así, puede reducirse el trayecto máximo en BGP para disminuir la cantidad de información que Cisco Express Forwarding debe propagar a las LC o reducir el tamaño de la ventana TCP para reducir la velocidad de las actualizaciones de BGP entrantes. Para obtener información detallada consulte Logre un ruteo óptimo y reduzca el consumo de memoria de BGP.

Si está ejecutando la versión 12.0(16)S, 12.0(16)ST, 12.1(9), 12.1(8a)E, 12.2(2), o 12.2(2)T o una versión posterior o equivalente del software Cisco IOS, podrá obtener resultados favorables si ajusta los parámetros del comando de configuración de la interfaz ip cef linecard ipc memory <0-128000 Kbytes>. El comportamiento predeterminado es contar con 25 memorias intermedias. Sin embargo, este valor depende de la plataforma de conmutación. Esta cantidad de memoria de LC está limitada al 50 por ciento de la memoria total disponible. Este comando:

  • Le permite asignar una cantidad mayor de memoria de la LC a la colocación en cola de ruteo Cisco Express Forwarding para actualizar mensajes.

  • Permite que el RP libere memoria al propiciar actualizaciones de Cisco Express Forwarding más rápidamente.

  • Evita que se produzca la condición de poca memoria en el RP.

Si experimenta los mensajes de error antes mencionados, la solución es aumentar la memoria IPC de la LC. Se recomienda para publicar este comando con un parámetro de 10000. En la mayoría de los casos, esto soluciona el problema. El comando se utiliza de la siguiente manera:

 Router(config)#ip cef linecard ipc mem ? 
   <0-128000>  Kbytes of linecard memory (limited to 50% of total) 

 Router(config)#ip cef linecard ipc mem 10000 

 Router#show cef linecard detail 
 CEF linecard slot number 0, status up, sync 
  Linecard CEF version number 8 
  Sequence number 3, Maximum sequence number expected 27, Seq Epoch 1 
  Send failed 0, Out Of Sequence 0, drops 0 
  Linecard CEF reset 1, reloaded 1 
  33 elements packed in 4 messages(1030 bytes) sent 
  1 elements cleared 
  linecard in sync after reloading 
  0/0/0 xdr elements in LowQ/MediumQ/HighQ 
  8/9/13 peak elements on LowQ/MediumQ/HighQ    
  Input  packets 0, bytes 0 
  Output packets 0, bytes 0, drops 0 

Si necesita más información sobre este comando, consulte ip cef linecard ipc memory.

%FIB-3-FIBBADXDRLEN y %FIB-4-FIBXDRLEN

Se sugiere que usted primero lee la sección de Descripción general de la Representación de datos externa (XDR) de este documento para entender mejor la explicación y las recomendaciones para este mensaje de error.

Es posible que reciba el siguiente mensaje de error:

%FIB-3-FIBBADXDRLEN: Invalid XDR length. Type/len 6/29479. 
XDR at 0x622D1F2C 
-Traceback= 600C786C 601D4B50 602CF7A8 60183454 60183440 

El mensaje proviene de un código de validación de mensajes que realiza comprobaciones básicas en mensajes XDR. En este caso, un mensaje XDR del tipo 6 se ha recibido cuya extensión del campo contuvo el valor 29479. Esta longitud es mayor que la memoria intermedia que contiene los datos; por lo tanto, el código descarta este mensaje.

En la serie 12000, una falla de hardware en la estructura puede dañar algunos paquetes. En estos casos aparecerá el mensaje de error XDR. Verifique la estructura de conmutación mediante la ejecución del comando show controller fia para determinar si existe alguna Verificación de Redundancia Cíclica (CRC) en alguna de las SFC. También debe revisar el registro para ver si hay algún otro mensaje que pueda brindar información para encontrar otras maneras de solucionar este mensaje de error.

%FIB-3-FIBLC_OOSEQ: Slot [#] disabled - Out of Sequence. Expected [#], received [#]

Recibirá este mensaje si el RP ha recibido un mensaje IPC fuera de secuencia desde la LC. Como consecuencia, se ha deshabilitado la conmutación Cisco Express Forwarding en la ranura especificada.

En algunas circunstancias con una gran cantidad de rutas o cuando se recarga un RP, es posible que vea el mensaje de error que figura debajo en la consola del RP.

%FIB-3-FIBLC_OOSEQ: Slot 11 disabled - Out of Sequence. 
Expected 9637, received 9638 

Este mensaje puede aparecer junto con el siguiente mensaje específico de ranura:

SLOT 11:%FIB-3-FIBSEQ: Out of sequence. State 9637 Rcvd 9638 

Ejecute el comando show cef linecard para verificar si se ha deshabilitado Cisco Express Forwarding en una ranura, tal como se indica a continuación.

router#show cef linecard 
CEF table version 40975, 47 routes 
Slot CEF-ver MsgSent XdrSent   Seq MaxSeq  LowQ HighQ Flags      
11     40750    9642  164473  9639   9661     0     0 up, sync, disabled 

No hay consecuencias funcionales; Cuando ocurre este acontecimiento se recarga la tabla de FIB. Si el problema persiste, puede ejecutar el comando clear cef linecard <slot #>. Posteriormente, verifique el estado de la LC ejecutando el comando show cef linecard. En la serie 7500, puede intentar deshabilitar Cisco Express Forwarding y luego volver a habilitarlo. SI el problema persiste, ejecutar un comando microcode reload al VIP debería resolver el inconveniente. En la Serie 12000, ejecutar el comando hw-module slot <slot #> reload a la LC resuelve el problema.

%FIB-4-PUNTINTF: CEF punting packets switched to [int] to next slower path and %FIB-5-NOPUNTINTF: CEF resuming switching packets to [int]

Si dada su configuración actual, Cisco Express Forwarding no puede conmutar alguno o la totalidad de los paquetes de esta interfaz específica, recibirá el mensaje %FIB-4-PUNTINTF. Cisco Express Forwarding dirige paquetes conmutados a esta interfaz al siguiente trayecto de conmutación más lento. Consulte Cómo Elegir el Mejor Trayecto de Conmutación del Router para su Red si necesita más información acerca de los diferentes trayectos de conmutación.

Recibe el mensaje %FIB-5-NOPUNTINTF si el Cisco Express Forwarding ha estado punteando paquetes conmutados a su interfaz a la siguiente ruta de conmutación que es más lenta y la configuración de interfaz ha cambiado de tal forma que el Cisco Express Forwarding ahora puede retomar la conmutación a su propia interfaz. Este es un mensaje informativo solamente y no se necesita tomar ninguna acción en la mayoría de los casos.

%FIB-4-PUNTINTF: CEF punting packets switched to POS2/0/0.1 
to next slower path 

Este mensaje podría estar seguido de este otro luego de un cambio de configuración de interfaz:

%FIB-5-NOPUNTINTF: CEF resuming switching packets to POS2/0/0.1 

Si su versión de software Cisco IOS se encuentra próxima a la 12.1(6) con el comando ip cef habilitado globalmente y el comando no ip route-cache cef configurado en una plantilla virtual, aparecen los siguientes mensajes cuando las interfaces de acceso virtual L2F se convierten en miembros de los agrupamientos principales de PPP de Enlaces Múltiples (Multilink PPP [MP]):

  • %FIB-4-PUNTINTF: Los paquetes de liberación de CEF cambiaron a Virtual-Access14 para el siguiente trayecto lento

  • %FIB-5-NOPUNTINTF: CEF reanudando la conmutación de paquetes hacia Virtual-Access14

  • %FIB-4-PUNTINTF: Paquetes CEF de punteo conmutados a Virtual-Access37 hacia el trayecto más lento siguiente

  • %FIB-5-NOPUNTINTF: CEF reanudando la conmutación de paquetes hacia Virtual-Access37

Una solución alternativa es establecer el nivel de registro en un valor que estos mensajes no aparezcan. Otra es deshabilitar IP Cisco Express Forwarding en forma global. Sin embargo, la inhabilitación de Cisco Express Forwarding debería ser una solución alternativa provisoria dado que constituye el mejor método de conmutación disponible en algunas plataformas. En las series 7500 y 12000, Distributed Cisco Express Forwarding es el mejor método de conmutación, luego Cisco Express Forwarding y finalmente todos los otros métodos convencionales.

A partir de las siguientes versiones del software Cisco IOS —12.1(8), 12.1(08a)E, 12.2(1)S, 12.1(8)AA, 12.0(17)S, 12.0(17)ST, 12.2(1)T, 012.002(2)— los mensajes no se registran cuando configura o limpia el indicador PUNT en una interfaz. Sigue siendo posible ejecutar el comando show cef interface o habilitar el comando debug ip cef events para verificar si Cisco Express Forwarding está o no habilitado. En consecuencia, no hay peligro de enviar innecesariamente mensajes no deseados a los usuarios cuando una interfaz está configurada para dirigir paquetes al siguiente trayecto más lento. Los routers no están sobrecargados de mensajes en la reinicialización o en el inicio de la auditoria de seguridad activa de Cisco, y los registros del sistema no están llenos de mensajes registrados para cada llamada en la plataforma de marcación.

Si es posible, debería configurar las funciones compatibles y no compatibles con Cisco Express Forwarding en subinterfaces diferentes. Cisco Express Forwarding no admite algunas encapsulaciones en las interfaces ATM. Debe revisar la Guía de configuración del software Cisco IOS de su router para saber qué encapsulaciones son admitidas y cuáles no.

%HW_RES_FAIL-4-LOW_CEF_MEM: El SLOT [char] se está ejecutando bajo

Estos mensajes en el router son parte de la característica de la elasticidad del hardware CEF. Comenzando en la versión del IOS 12.0(28)S, la característica de la elasticidad del hardware CEF se soporta en el linecards del motor 2 de las Cisco 12000 Series (E2) y del motor de los Servicios IP (ISE). La elasticidad del hardware CEF es un mecanismo de protección para los recursos de la memoria y de la ASIC-expedición del hardware CEF. La elasticidad del hardware CEF evita que el CEF sean inhabilitados y el reenvío de paquete de la afectación en caso del agotamiento de recursos o de una condición de error, de tal como por ejemplo la memoria baja o de la falla IPC. El driver de dispositivo del linecard maneja las fallas de recurso internamente sin la participación de las capas superiores.

Cuando la memoria del hardware que reenvía (PLU o TLU) funciona con el punto bajo o falla en las Cisco 12000 Series E2 o el linecard ISE, la función de supervisión del recurso imprime una alarma (mensaje de error o advertencia como la que usted tiene en su registro) en la consola del sistema y registra la alarma. Cuando una falla de asignación de memoria comienza, un proceso de supervisión temporizador-basado del recurso se activa en el fondo. Las pruebas del proceso el porcentaje memoria del hardware que reenvía PLU y TLU utilizaron en los intervalos de los minutos. Cuando los porcentajes del agotamiento de la memoria del hardware se exceden, se genera una alarma. Finalmente, la memoria a la cual el mensaje de error se está refiriendo es memoria TLU. Ésta es memoria de tamaño fijo y no puede ser actualizada.

La solución alternativa está a

  • Reduzca el número de rutas

  • Inhabilite PSA ACL (ningún psa del hardware de la lista de acceso)

%FIB-4-FIBCBLK2: Tableid que falta del cef [dec] durante el evento del [chars] para el [IP_netmask] del [IP_address]

Aquí están algunos ejemplos del mensaje como se ve en los registros de error:

%FIB-4-FIBCBLK: Missing cef table for tableid 63 during route update XDR event
%FIB-SP-4-FIBCBLK: Missing cef table for tableid 33 during Table removal event
%FIB-4-FIBCBLK: Missing cef table for tableid 45 during routing table event

La causa de estos mensajes es debido a una petición de la cancelación VRF que es generada antes de las actualizaciones asociadas del NDB (bloque del descriptor de la red) es distribuida y procesada por el linecards. Esto causa un problema temporal en la tabla CEF donde se genera una tabla ID pero se quita la tabla sí mismo. Este problema se resuelve normalmente sin la intervención, y no hay impacto a traficar o la estabilidad del router. El bug Cisco ID CSCsg03483 y CSCee26209 describe los mensajes del sistema similares.

Recopilación de Información de Solución de Problemas si se Crea una Solicitud de Servicio del TAC

Si crea una Solicitud de Servicio del TAC mediante la Herramienta de Solicitud de Servicio TAC (sólo clientes registrados), adjunte la siguiente información a su caso para resolver problemas de mensajes de error relacionados con Cisco Express Forwarding.
  • Resolución de problemas realizada antes de crear el servicio solicitado
  • La salida del comando show tech-support (en el modo activo si es posible).
  • El resultado del comando show log o las capturas de la consola, si estuvieran disponibles.
Asocie los datos recogidos a su solicitud de servicio en no relampagado, formato de texto sin formato (.txt). Usted puede adjuntar la información a su solicitud de servicio cargandola usando la herramienta de la herramienta de la solicitud de servicio de TAC (clientes registrados solamente). Si no puede acceder a la Herramienta de Solicitud de Servicio TAC, puede adjuntar la información pertinente a su solicitud de servicio y enviarla a attach@cisco.com, junto con el número de solicitud de servicio en el asunto del mensaje.

Nota: No recargue manualmente o ciclo de la potencia el router antes de recoger la información antedicha a menos que esté requerido para resolver problemas los mensajes de error relacionados al reenvío expresos de Cisco. Esto puede hacer la información importante ser perdido que es necesaria para determinar la causa raíz del problema.

Otros recursos para la solución de problemas

Si necesita más información sobre la solución de problemas de Cisco Express Forwarding, consulte los siguientes documentos:

Discusiones relacionadas de la comunidad de soporte de Cisco

La Comunidad de Soporte de Cisco es un foro donde usted puede preguntar y responder, ofrecer sugerencias y colaborar con colegas.


Información Relacionada


Document ID: 7603