Introduction
Ce document décrit comment supprimer les erreurs de mémoire UECC (Uncorritable Error Correction Code) transitoires sur Cisco Unified Computing Systems (UCS).
Conditions préalables
Exigences
Aucune exigence spécifique n'est associée à ce document.
Composants utilisés
Ce document est valable pour tous les serveurs des générations M5, M6 et M7.
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. Si votre réseau est en ligne, assurez-vous de bien comprendre l’incidence possible des commandes.
Informations générales
Dans le cas de serveurs qui n'affichent pas d'instances antérieures d'erreurs de code de correction d'erreur (ECC) ou de code de correction d'erreur non corrigible (UECC), certains modules de mémoire peuvent présenter des erreurs de mémoire UECC lors de l'auto-test de démarrage (POST) du BIOS pendant un redémarrage en fonctionnement normal. Les modules DIMM (Dual In-Line Memory Modules) affectés sont répertoriés comme blocs, mais aucune nouvelle erreur n'est signalée lors de l'effacement ultérieur des données de la liste de blocs ou lors d'une analyse de défaillance après une autorisation de retour de matériel (RMA). Cela indique la nature transitoire potentielle des erreurs de mémoire UCS. Les modules DIMM peuvent continuer à être utilisés après avoir effacé les données d'erreur de liste de blocage.
Des erreurs passagères ou non persistantes peuvent se produire sans avertissement. Les erreurs corrigibles ne se produisent pas toujours dans une barrette DIMM avant l'apparition d'une erreur d'apprentissage de barrettes DIMM ou d'une erreur multibit. La portée de ce qui se produit pendant l'apprentissage de la mémoire diffère grandement de ce qui se produit lorsque la mémoire est utilisée au moment de l'exécution. Par conséquent, la stabilité des modules de mémoire n'est pas nécessairement corrélée entre le serveur POST et le Runtime.
Défauts connus
Le comportement décrit précédemment est décrit par les bogues listés :
1. ID de bogue Cisco CSCwa75339
2. ID de bogue Cisco CSCwk28210
3. ID de bogue Cisco CSCwo62396
Étapes de suppression des erreurs POST UECC
Serveur lame
Remarque : Sélectionnez l'ID de châssis et l'ID de serveur corrects requis pour votre environnement spécifique. L'image affichée est à des fins de démonstration.
Mettez le serveur hors tension.
Le serveur doit être physiquement mis hors tension, sinon les erreurs UECC peuvent persister au redémarrage.
Remarque : Les données SPD DIMM ne sont pas mises à jour car CIMC interroge les données SPD DIMM uniquement lors de la mise sous tension du serveur. Si un module DIMM pose réellement problème, l'erreur réapparaît au redémarrage et l'assistance Cisco peut fournir une RMA pour le module DIMM.
Méthode GUI pour UCS Manager
Accédez à Equipment > Chassis > Chassis ID > Servers > Server ID > Actions > System > Reset All Memory Errors.

Méthode GUI pour le mode IMM (Intersight Managed Mode)

Remarque : Ces étapes s'appliquent également aux serveurs de la gamme C intégrée.
Méthode CLI (Command Line Interface)
Lancez une session SSH vers l'adresse IP virtuelle UCS Manager. Assurez-vous que le serveur en question est hors tension avant de procéder aux étapes décrites ci-dessus.

Une fois l'opération terminée, vérifiez qu'aucune nouvelle erreur ne s'incrémente dans le système.
Serveur rack
Mettez le serveur hors tension.
Le serveur doit être physiquement mis hors tension, sinon les erreurs UECC peuvent persister au redémarrage.
Remarque : Les données SPD DIMM ne sont pas mises à jour car CIMC interroge les données SPD DIMM uniquement lors de la mise sous tension du serveur. Si un module DIMM pose réellement problème, l'erreur réapparaît au redémarrage et l'assistance Cisco peut fournir une RMA pour le module DIMM.
Méthode GUI
Si le serveur n'est pas géré avec le mode IMM (Intersight Managed Mode), la méthode CLI (Command Line Interface) est requise. Sinon, les étapes précédentes s'appliquent.
CLI, méthode
Remarque : L'image affichée est à des fins de démonstration.
Lancez une session SSH vers l'adresse IP CIMC du serveur. Assurez-vous que le serveur en question est hors tension avant de poursuivre les étapes comme indiqué.

Une fois l'opération terminée, vérifiez qu'aucune nouvelle erreur ne s'incrémente dans le système.