Introdução
Este documento descreve como limpar erros de memória UECC (Uncorrectable Error Correction Code) transitórios no Cisco Unified Computing Systems (UCS).
Pré-requisitos
Requisitos
Não existem requisitos específicos para este documento.
Componentes Utilizados
Este documento é válido para todos os servidores das gerações M5, M6 e M7.
As informações neste documento foram criadas a partir de dispositivos em um ambiente de laboratório específico. Todos os dispositivos utilizados neste documento foram iniciados com uma configuração (padrão) inicial. Se a rede estiver ativa, certifique-se de que você entenda o impacto potencial de qualquer comando.
Informações de Apoio
No caso de servidores que não exibem instâncias anteriores de erros de ECC (Error Correction Code — Código de Correção de Erros) ou de UECC (Uncorrectable Error Correction Code — Código de Correção de Erros Incorrigível), determinados módulos de memória podem exibir erros de memória UECC no POST do BIOS durante uma reinicialização em operações normais. Os módulos DIMM (Dual In-Line Memory Modules) afetados são mostrados como blocos listados, mas nenhum erro novo é relatado após a limpeza subsequente dos dados da lista de blocos ou durante uma análise de falha após uma RMA (Return Materials Authorization, autorização para devolução de materiais). Isso indica a natureza transitória potencial dos erros de memória do UCS. Os DIMMs podem continuar a ser usados após a limpeza dos dados de erro de listagem de bloco.
Erros transitórios ou não persistentes podem ocorrer sem aviso. Os erros corrigíveis nem sempre ocorrem necessariamente dentro de um DIMM antes da ocorrência de um erro de treinamento do DIMM ou de um erro de vários bits. O escopo do que ocorre durante o treinamento de memória difere muito do que ocorre quando a memória é usada em tempo de execução. Portanto, a estabilidade dos módulos de memória não necessariamente está correlacionada entre o POST do servidor e o Runtime.
Defeitos conhecidos
O comportamento descrito anteriormente é descrito pelos bugs listados:
1. ID de bug da Cisco CSCwa75339
2. ID de bug da Cisco CSCwk28210
3. ID de bug da Cisco CSCwo62396
Etapas para eliminar erros de POST UECC
Servidor blade
Note: Selecione a ID do chassi e a ID do servidor corretas necessárias para seu ambiente específico. A imagem exibida é para fins de demonstração.
Desligue o servidor.
O servidor requer que o esteja fisicamente desligado, caso contrário os erros de UECC podem persistir na reinicialização.
Note: Os dados de SPD do DIMM não são atualizados porque o CIMC consulta os dados de SPD do DIMM somente quando o servidor é ligado. Se houver um DIMM realmente problemático, o erro retorna na reinicialização e o Suporte da Cisco pode fornecer um RMA para o DIMM.
Método de GUI para o UCS Manager
Navegue até Equipment > Chassis > Chassis ID > Servers > Server ID > Actions > System > Reset All Memory Errors. (Equipamento > Chassi > ID do chassi > Servidores > ID do servidor > Ações > Sistema > Redefinir todos os erros de memória)

Método GUI para Modo Gerenciado de Intervisão (IMM)

Note: Essas etapas também se aplicam aos servidores C-Series integrados.
Método da interface de linha de comando (CLI)
Inicie uma sessão SSH para o endereço IP virtual do UCS Manager. Certifique-se de que o servidor em questão esteja desligado antes de prosseguir com as etapas descritas.

Depois de concluído, verifique se nenhum novo erro é incrementado no sistema.
Servidor rack
Desligue o servidor.
O servidor requer que o esteja fisicamente desligado, caso contrário os erros de UECC podem persistir na reinicialização.
Note: Os dados de SPD do DIMM não são atualizados porque o CIMC consulta os dados de SPD do DIMM somente quando o servidor é ligado. Se houver um DIMM realmente problemático, o erro retorna na reinicialização e o Suporte da Cisco pode fornecer um RMA para o DIMM.
Método GUI
Se o servidor não for gerenciado com o modo gerenciado de interceptação (IMM), o método da interface de linha de comando (CLI) será necessário. Caso contrário, as etapas anteriores serão aplicáveis.
Método CLI
Note: A imagem exibida é para fins de demonstração.
Inicie uma sessão SSH no endereço IP do CIMC do servidor. Certifique-se de que o servidor em questão esteja desligado antes de continuar com as etapas descritas.

Depois de concluído, verifique se nenhum novo erro é incrementado no sistema.