El conjunto de documentos para este producto aspira al uso de un lenguaje no discriminatorio. A los fines de esta documentación, "no discriminatorio" se refiere al lenguaje que no implica discriminación por motivos de edad, discapacidad, género, identidad de raza, identidad étnica, orientación sexual, nivel socioeconómico e interseccionalidad. Puede haber excepciones en la documentación debido al lenguaje que se encuentra ya en las interfaces de usuario del software del producto, el lenguaje utilizado en función de la documentación de la RFP o el lenguaje utilizado por un producto de terceros al que se hace referencia. Obtenga más información sobre cómo Cisco utiliza el lenguaje inclusivo.
Cisco ha traducido este documento combinando la traducción automática y los recursos humanos a fin de ofrecer a nuestros usuarios en todo el mundo contenido en su propio idioma. Tenga en cuenta que incluso la mejor traducción automática podría no ser tan precisa como la proporcionada por un traductor profesional. Cisco Systems, Inc. no asume ninguna responsabilidad por la precisión de estas traducciones y recomienda remitirse siempre al documento original escrito en inglés (insertar vínculo URL).
Este documento provee información sobre cómo resolver problemas de errores de línea card en el Cisco 12000 Series Internet Router.
No hay requisitos específicos para este documento.
La información que contiene este documento se basa en las siguientes versiones de software y hardware.
Todos los routers de la serie 12000 de Internet de Cisco, entre ellos los modelos 12008, 12012, 12016, 12404, 12406, 12410 y 12416.
Todos las versiones de software Cisco IOS® compatibles con el router de Internet de la serie Cisco 12000.
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. If your network is live, make sure that you understand the potential impact of any command.
Esta sección proporciona información general sobre cómo identificar un desperfecto en la tarjeta de línea.
Para identificar rápidamente un desperfecto de la tarjeta de línea, utilice el comando show context summary:
Router#show context summary CRASH INFO SUMMARY Slot 0 : 0 crashes Slot 1 : 0 crashes Slot 2 : 0 crashes Slot 3 : 0 crashes Slot 4 : 1 crashes 1 - crash at 04:28:56 EDT Tue Apr 20 1999 Slot 5 : 0 crashes Slot 6 : 0 crashes Slot 7 : 0 crashes Slot 8 : 0 crashes Slot 9 : 0 crashes Slot 10: 0 crashes Slot 11: 0 crashes
Si el desperfecto afecta al router mismo (y no sólo a la tarjeta de línea), consulte Resolución de problemas de desperfectos del router.
Para recolectar los datos relevantes sobre el desperfecto, utilice los comandos que se muestran en la Tabla 1.
Tabla 1: Comandos que se utilizarán para recopilar datos sobre el desperfectoComando | Descripción |
---|---|
show version | Proporciona información general sobre las configuraciones de hardware y software del sistema. |
show logging | Muestra los registros generales del router. |
show diag [slot #] | Proporciona información específica sobre una ranura en particular: tipo de motor, revisiones de hardware, configuración de memoria, etc. |
show context slot [slot #] | Proporciona información de contexto sobre las caídas recientes. Este es a menudo el comando más útil para resolver problemas de caídas de tarjeta de línea. |
Vaciado de memoria | Un vaciado de memoria de una tarjeta de línea es el contenido completo de su memoria en el momento del desperfecto. Estos datos normalmente no son necesarios para una resolución de problemas inicial. Puede ser necesario más tarde si el problema resulta ser un nuevo error de software. En ese caso, consulte Configuración de un Volcado de Memoria en una Tarjeta de Línea GSR. |
Si tiene el resultado de un comando show tech-support (from enable mode) de su dispositivo Cisco, puede utilizar para mostrar posibles problemas y soluciones. Para utilizar , deberá ser un cliente registrado, haber iniciado sesión y tener habilitado JavaScript.
Verifique el valor del campo sig= en el resultado del comando show context slot [slot#]:
Router#show context slot 4 CRASH INFO: Slot 4, Index 1, Crash at 04:28:56 EDT Tue Apr 20 1999 VERSION: GS Software (GLC1-LC-M), Version 11.2(15)GS1a, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) Compiled Mon 28-Dec-98 14:53 by tamb Card Type: 1 Port Packet Over SONET OC-12c/STM-4c, S/N CAB020500AL System exception: SIG=20, code=0xA414EF5A, context=0x40337424 Traceback Using RA STACK TRACE: traceback 4014CFC0 40141AB8 40143944 4014607C 4014A7EC 401499D4 40149BB4 40149FD4 40080118 40080104 CONTEXT: $0 : 00000000, AT : 40330000, v0 : 00000000, v1 : 00000038 a0 : 4094EF58, a1 : 00000120, a2 : 00000002, a3 : 00000001 t0 : 00000010, t1 : 3400BF01, t2 : 34008D00, t3 : FFFF00FF t4 : 400A1410, t5 : 00000002, t6 : 00000000, t7 : 4041783C s0 : 4093F980, s1 : 4093F980, s2 : 4094EEF0, s3 : 4094EF00 s4 : 00000000, s5 : 00000001, s6 : 00000000, s7 : 00000000 t8 : 34008000, t9 : 00000000, k0 : 404D1860, k1 : 400A2F68 gp : 402F3070, sp : 4082BFB0, s8 : 00000000, ra : 400826FC EPC : 0x40098824, SREG : 0x3400BF04, Cause : 0x00000000 ErrorEPC : 0x4015B7E4
Consulte la Tabla 2 para saber qué razón de error coincide con el valor SIG que registró.
Tabla 2: Busque el error que coincide con el valor de SIGValor SIG | Nombre de SIG | Motivo del error |
---|---|---|
2 | SIGINT | Interrupción de hardware inesperada. |
3 | SIGQUIT | Terminación por tecla de interrupción. |
4 | SIGILL | Excepción Opcode ilegal. |
5 | SIGTRAP | Aborto debido a un punto de interrupción o una excepción aritmética. |
8 | SIGFPE | Excepción de la unidad de punto flotante (FPU). |
9 | SIGKILL | Excepción reservada. |
10 | SIGBUS | Excepción de error de bus. |
11 | SIGSEGV | Excepción de SegV. |
20 | SIGCACHE | Excepción de paridad de la memoria caché. |
21 | SIGWBERR | Interrupción de error del bus de escritura. |
22 | SIGERROR | Error fatal de hardware. |
23 | CARGAR | Caída provocada por software. |
Nota: La excepción de paridad de caché (SIG=20), la excepción de error de bus (SIG=10) y los desperfectos forzados por software (SIG=23) representan más del 95% de los desperfectos de las tarjetas de línea.
La serie Cisco 12000 admite el comando diag [slot#] para probar los diferentes componentes de la placa. Este comando es útil para la solución de problemas de caídas relacionadas con el hardware y para identificar la placa defectuosa.
La opción verbose hace que el router muestre la lista de pruebas a medida que se realizan. De lo contrario, simplemente muestra un mensaje "PASSED" o "FAILURE".
Nota: La realización de este diagnóstico detiene todas las actividades de la tarjeta de línea durante las pruebas (normalmente unos cinco minutos).
A partir de la versión 12.0(22)S del software Cisco IOS, Cisco ha desagregado la imagen de la tarjeta de línea de diagnóstico de campo del router de Internet de la serie Cisco 12000 de la imagen del software Cisco IOS. En las versiones anteriores, los diagnósticos se podían iniciar desde la línea de comandos y la imagen incrustada se lanzaría. Para dar cabida a los clientes con tarjetas de memoria Flash de 20 MB, los diagnósticos de campo de tarjeta de línea se almacenan y mantienen ahora como una imagen independiente que debe estar disponible en una tarjeta de memoria Flash o en un servidor de inicio del protocolo de transferencia de archivos trivial (TFTP) antes de que se puedan utilizar los comandos de diagnóstico de campo. Los diagnósticos de campo del procesador del router y del entramado del switch continúan agrupados y no necesitan iniciarse desde una imagen independiente. Puede encontrar más información en Field Diagnostics para el Cisco 12000 Series Internet Router.
A continuación se muestra un ejemplo de una salida de comando diag [slot#]:
Router#diag 3 verbose Running DIAG config check Running Diags will halt ALL activity on the requested slot. [confirm] CR1.LND10# Launching a Field Diagnostic for slot 3 Downloading diagnostic tests to slot 3 (timeout set to 400 sec.) Field Diag download COMPLETE for slot 3 FD 3> ***************************************************** FD 3> GSR Field Diagnostics V3.0 FD 3> Compiled by award on Tue Aug 3 15:58:13 PDT 1999 FD 3> view: award-bfr_112.FieldDiagRelease FD 3> ***************************************************** FD 3> BFR_CARD_TYPE_OC48_1P_POS testing... FD 3> running in slot 3 (128 tests) Executing all diagnostic tests in slot 3 (total/indiv. timeout set to 600/200 sec.) FD 3> Verbosity now (0x00000001) TESTSDISP FDIAG_STAT_IN_PROGRESS: test #1 R5K Internal Cache FDIAG_STAT_IN_PROGRESS: test #2 Burst Operations FDIAG_STAT_IN_PROGRESS: test #3 Subblock Ordering FDIAG_STAT_IN_PROGRESS: test #4 Dram Marching Pattern FDIAG_STAT_DONE_FAIL test_num 4, error_code 6 Field Diagnostic: ****TEST FAILURE**** slot 3: last test run 4, Dram Marching Pattern, error 6 Field Diag eeprom values: run 2 fail mode 1 (TEST FAILURE) slot 3 last test failed was 4, error code 6 Shutting down diags in slot 3 slot 3 done, will not reload automatically
Dependiendo del error encontrado, la ranura podría o no recargarse automáticamente. Si no lo es, podría estar en estado atascado o inconsistente (verifique con el comando show diag [slot #]) hasta que se recargue manualmente. This is normal. Para recargar manualmente la tarjeta, utilice el comando hw-module slot [slot#] reload.
Puede identificar las excepciones de paridad de caché por el SIG=20 en el resultado show context [slot #].
Si tiene el resultado de un comando show tech-support (from enable mode) de su dispositivo Cisco, puede utilizar para mostrar posibles problemas y soluciones. Para utilizar , deberá ser un cliente registrado, haber iniciado sesión y tener habilitado JavaScript.
Hay dos tipos diferentes de errores de paridad:
Errores de paridad de software: se producen cuando cambia un nivel de energía dentro del chip (por ejemplo, uno o cero). En el caso de un error de paridad de software, no es necesario intercambiar la placa ni ninguno de los componentes.
Errores de paridad de hardware: se producen cuando hay una falla de chip o placa que causa que los datos se corrompan. En este caso, debe volver a colocar o reemplazar el componente afectado, normalmente un intercambio de chip de memoria o un intercambio de placa. Hay un error de paridad de hardware cuando se ven varios errores de paridad en la misma dirección. Hay casos más complicados que son más difíciles de identificar pero, en general, si se observa más de un error de paridad en una región de memoria en particular en un período de tiempo relativamente corto (de varias semanas a meses), esto puede considerarse un error de paridad dura.
Se ha demostrado mediante estudios que los errores de paridad de software son 10 a 100 veces más frecuentes que los errores de paridad de hardware.
Para resolver estos errores, busque una ventana de mantenimiento para ejecutar el comando diag para ese slot.
Si el diagnóstico provoca un fallo, reemplace la tarjeta de línea.
Si no hay falla, es probable que haya un error de paridad de software y la tarjeta de línea no tenga que ser reemplazada (a menos que caiga por segunda vez con un error de paridad después de un breve período de tiempo).
Puede identificar excepciones de error de bus mediante el SIG=10 en el resultado show context [slot #].
Si tiene el resultado de un comando show tech-support (from enable mode) de su dispositivo Cisco, puede utilizar para mostrar posibles problemas y soluciones. Para utilizar , deberá ser un cliente registrado, haber iniciado sesión y tener habilitado JavaScript.
Este tipo de desperfecto normalmente está relacionado con el software, pero si por alguna razón (por ejemplo, es una tarjeta totalmente nueva, o los desperfectos comienzan después de un corte de energía) cree que el problema podría estar relacionado con el hardware, ejecute el comando diag para ese slot.
Nota: Se sabe que algunos errores de software provocan que el comando diag informe errores, aunque no haya problema con el hardware. Si una tarjeta ya ha sido reemplazada, pero aún así falla en la misma prueba en el diagnóstico, es posible que este problema le afecte. En ese caso, trate el desperfecto como un problema de software.
La actualización a la última versión de su tren de versión del software Cisco IOS elimina todos los errores de funcionamiento fijos que provocan errores de bus de tarjeta de línea. Si el desperfecto sigue presente después de la actualización, recopile la información relevante (consulte Recopilar información sobre el desperfecto), junto con un show tech-support, y cualquier información que considere útil (como un cambio de topología reciente o una nueva función implementada recientemente) y póngase en contacto con su representante de soporte de Cisco.
Puede identificar los desperfectos forzados por el SIG=23 en la salida show context [slot #]. A pesar del nombre, estos desperfectos no siempre están relacionados con el software.
Si tiene el resultado de un comando show tech-support (from enable mode) de su dispositivo Cisco, puede utilizar para mostrar posibles problemas y soluciones. Para utilizar , deberá ser un cliente registrado, haber iniciado sesión y tener habilitado JavaScript.
La razón más común para los desperfectos forzados por software es el "tiempo de espera de ping de fabric". Durante el funcionamiento normal del router, el procesador de routing (RP) realiza un ping continuo de las tarjetas de línea. Si una tarjeta de línea no responde, el procesador de ruta decide restablecerla. Esto da lugar a un desperfecto forzado por software (SIG=23) de la tarjeta de línea afectada, y debería ver estos errores en los registros del router:
Mar 12 00:42:48: %GRP-3-FABRIC_UNI: Unicast send timed out (4) Mar 12 00:42:50: %GRP-3-COREDUMP: Core dump incident on slot 4, error: Fabric ping failure
Para resolver problemas de tiempos de espera de ping de entramado, necesita saber por qué la tarjeta de línea no respondió al ping. Puede haber varias causas:
La tarjeta de línea está experimentando un uso elevado de la CPU—Esto se puede verificar usando el comando execute-on slot [slot #] show proc cpu. Si la CPU es realmente alta (por encima del 95%), consulte Resolución de problemas de uso elevado de la CPU en routers Cisco.
Hay errores de software en Inter Process Communication (IPC) o la tarjeta de línea se está quedando sin memorias intermedias IPC. La mayoría de las veces estas recargas forzadas por software son causadas por errores de software.
La actualización a la versión más reciente de su tren de versiones de software del IOS de Cisco elimina todos los errores fijos que provocan tiempos de espera de ping de fabric. Si el desperfecto sigue presente después de la actualización, recopile la información relevante (consulte Obtención de información sobre el desperfecto), junto con un show tech-support, un show ipc status y cualquier información que considere útil (como un cambio de topología reciente o una nueva función implementada recientemente) y póngase en contacto con su representante de soporte de Cisco.
Fallo de hardware: si la tarjeta se ha estado ejecutando correctamente durante mucho tiempo y no se han producido cambios recientes en la topología, el software o las funciones, o si los problemas se iniciaron después de un traslado o una interrupción del suministro eléctrico, el hardware defectuoso puede ser la causa. Ejecute el comando diag en la tarjeta de línea afectada. Sustituya la tarjeta de línea, si es defectuosa. Si se ven afectadas varias tarjetas de línea o el diag está bien, reemplace el fabric.
El error TXECCERR/RXECCERR se produce cuando la interrupción de error ECC no recuperable RxFIFO o TxFIFO ocurre en MAC más que el valor de umbral dentro del intervalo de tiempo. Los errores ECC irrecuperables no se pueden corregir con la lógica ECC. Cuando se produce un error irrecuperable durante la lectura RxFIFO, el paquete al que pertenecen los datos se marca con EOP/Abort en la interfaz de recepción SPI4 y se descarta por las capas superiores.
Esto se debe al hardware y se corrige una vez que recargamos el SIP/SPA. La solución permanente es reemplazar el SIP/SPA para evitar los errores.
Otros tipos de caída son, con diferencia, menos comunes que los dos mencionados anteriormente. En la mayoría de los casos, el comando diag debe indicar si la tarjeta debe ser reemplazada o no. Si la tarjeta pasa la prueba de diagnóstico correctamente, considere actualizar el software.
Si todavía necesita ayuda después de seguir los pasos de solución de problemas anteriores y desea abrir una solicitud de servicio (sólo clientes registrados) con el TAC de Cisco, asegúrese de incluir la siguiente información: |
---|
Nota: No recargue ni apague manualmente el router antes de recopilar la información anterior, a menos que sea necesario para resolver un desperfecto de la tarjeta de línea en el router de Internet de la serie 12000 de Cisco, ya que esto puede causar la pérdida de información importante necesaria para determinar la causa raíz del problema. |
Revisión | Fecha de publicación | Comentarios |
---|---|---|
1.0 |
23-Apr-2007 |
Versión inicial |