Introdução
Este documento descreve como identificar edições da memória em ASR5K-PSC-32G (cartão 2 dos serviços de pacote de informação (PSC2)) e ASR5K-PSC-64G (cartão 3 dos serviços de pacote de informação (PSC3)) cartões. O sintoma considerado quando o problema esta presente é que as reinicializações de placa próprio. Toda a informação exigida pesquisando defeitos está disponível no detalhe do apoio da mostra (SSD).
Pré-requisitos
Requisitos
Cisco recomenda que você tem o conhecimento básico do CLI do roteador 5000 dos serviços da agregação (ASR5K).
Este documento não se restringe a versões de software e hardware específicas.
As informações neste documento foram criadas a partir de dispositivos em um ambiente de laboratório específico. Todos os dispositivos utilizados neste documento foram iniciados com uma configuração (padrão) inicial. Se a sua rede estiver ativa, certifique-se de que entende o impacto potencial de qualquer comando.
Problemas com memória
Os serviços de pacote de informação cardam 2 (PSC2), serviços de pacote de informação que o cartão 3 (PSC3) pode causar um crash o éter devido do “ao impacto núcleo” ou “à pulsação do coração de falta”.
Impacto do núcleo
O impacto do núcleo pode acontecer quando o cartão experimenta “erros de memória corrigíveis múltiplos ou um único “erro de memória do incorrigível”. Para identificar se a edição é impacto do núcleo siga as etapas alistadas abaixo:
- No SSD, verifique da “a lista do impacto mostra” para ver se há o impacto de núcleo:
<snip>
******** show crash list *******
== =================== ======= ========== =========== ================
# Time Process Card/CPU/ SW HW_SER_NUM
PID VERSION SMC / Crash Card
== =================== ======= ========== =========== ================
86 2012-Jun-07+18:28:21 sessmgr 15/0/04453 12.2(42876) PLB30103469/PLB40098624
87 2012-Jun-15+04:02:34 kernel 16/0/NA 12.2(NA) PLB30103469/PLB39098500
88 2012-Jun-15+04:50:38 sessmgr 02/0/04372 12.2(42876) PLB30103469/PLB40098609
<snip>
Uma vez o número do impacto para o impacto do núcleo é identificado, verifica os detalhes do impacto para ver se há o número do impacto da “na lista do impacto mostra”. No exemplo acima, o impacto 87 aconteceu no cartão 16.
<snip>
********************* CRASH #87 ***********************
2.6.38-staros-v3-hw-64 #1 SMP PREEMPT Wed Apr 18 14:32:38 EDT 2012 1 0 PLB39098500 428760, label "": Corrected error (Socket=0 channel=0 dimm=0)
<4>[52569.305831] EDAC MC0: CE row 0, channel 0, label "": Corrected error (Socket=0 channel=0 dimm=0)
<4>[52569.314566] EDAC MC0: CE row 0, channel 0, label "": Corrected error (Socket=0 channel=0 dimm=0)
<4>[52579.321273] edac_mc_handle_fbd_ce: 449 callbacks suppressed
<4>[52579.326820] EDAC MC0: CE row 0, channel 0, label "": Corrected error (Socket=0 channel=0 dimm=0)
????..
<0>[52668.605978] [Hardware Error]: CPU 0: Machine Check Exception: 4 Bank 8: fe0000000001009f
<0>[52668.614014] [Hardware Error]: TSC 66946ea1b05a ADDR 44f307280 MISC 4c43688800045941
<0>[52668.621767] [Hardware Error]: PROCESSOR 0:106a5 TIME 1339732830 SOCKET 0 APIC 0
<0>[52668.629028] [Hardware Error]: Machine check: Processor context corrupt
<0>[52668.635520] Kernel panic - not syncing: Fatal Machine check
<snip>
O “EDAC MC0: Fileira 0 CE, canal 0, "" da etiqueta: Erro corrigido” junto com? Pânico do núcleo? o impacto indica que a falha de memória e o RMA estão exigidos.
Memória não detectada
A placa de linha PSC2/PSC3 pode recarregar com indicação “da pulsação do coração de falta”. Uma razão é que o sistema detectou o DIMM ruim. Quando o DIMM ruim é detectado, o cartão tentará recarregar épocas múltiplas antes de entrar no estado “autónomo”.
Para o cartão PSC2, na saída? debugar o processador central 0 do cartão x do console? encontrado no SSD, os seguintes erros serão considerados.
1338537199.891 card 6-cpu0: ERROR: Memory size 24576 MB for cpu0 not matching with value 32768 MB in IDEEPROM 1338537199.891 card 6-cpu0:
1338537199.891 card 6-cpu0: ERROR: Bus 255 CPU 0 Chan 0 DIMM 0 NotPresent
O Syslog será povoado igualmente com o seguinte erro:
The Packet Services Card 2 with serial number SAD154403TT in slot 6 has failed and will be brought down and brought back online. (Device=CPU_0, Reason=CARD_BOOT_TIMEOUT_EXPIRED, Status=[CPU0 MB: CFE_FAILURE] [CPU1] [CPU2] [CPU3] [GPIO_IN: 00,ff,ff,ff] [GPIO_OUT: 01,ff,00,ff]
Para o cartão PSC3, na saída 'debugar o processador central 0' do cartão x do console encontrado no SSD, os seguintes erros será visto:
1412147713.299 card 7-cpu0: WARNING: Memory size 49152 MB for cpu0 not matching with value 65536 MB in IDEEPROM
Carde a experimentação deste problema precisa de ser substituído.