Einleitung
In diesem Dokument wird beschrieben, wie vorübergehende Speicherfehler mit nicht korrigierbarem Fehlerkorrekturcode (UECC) in Cisco Unified Computing Systems (UCS) gelöscht werden.
Voraussetzungen
Anforderungen
Es gibt keine spezifischen Anforderungen für dieses Dokument.
Verwendete Komponenten
Dieses Dokument gilt für alle Server der Generationen M5, M6 und M7.
Die Informationen in diesem Dokument beziehen sich auf Geräte in einer speziell eingerichteten Testumgebung. Alle Geräte, die in diesem Dokument benutzt wurden, begannen mit einer gelöschten (Nichterfüllungs) Konfiguration. Wenn Ihr Netzwerk in Betrieb ist, stellen Sie sicher, dass Sie die möglichen Auswirkungen aller Befehle kennen.
Hintergrundinformationen
Im Fall von Servern, die keine vorherigen Instanzen von Fehlerkorrekturcode (ECC) oder nicht korrigierbarem Fehlerkorrekturcode (UECC) anzeigen, können bestimmte Speichermodule während eines Neustarts im Normalbetrieb UECC-Speicherfehler beim BIOS POST aufweisen. Die betroffenen Dual In-Line Memory Modules (DIMMs) werden als Block gelistet angezeigt, es werden jedoch keine neuen Fehler gemeldet, wenn die Block Listing-Daten anschließend gelöscht werden oder während einer Fehleranalyse nach einer Retourengenehmigung (Return Materials Authorization, RMA). Dies zeigt die mögliche transiente Natur von UCS-Speicherfehlern an. DIMMs können auch nach Löschen der Daten für Fehler in der Sperrliste verwendet werden.
Vorübergehende oder nicht-anhaltende Fehler können ohne Vorwarnung auftreten. Korrigierbare Fehler treten nicht immer notwendigerweise innerhalb eines DIMMs auf, bevor ein DIMM-Trainingsfehler oder ein Multibit-Fehler auftritt. Der Umfang dessen, was während des Gedächtnistrainings geschieht, unterscheidet sich erheblich von dem, was geschieht, wenn der Speicher zur Laufzeit verwendet wird. Die Stabilität der Speichermodule korreliert daher nicht unbedingt zwischen Server POST und Runtime.
Bekannte Fehler
Das zuvor beschriebene Verhalten wird durch die aufgelisteten Bugs beschrieben:
1. Cisco Bug-ID CSCwa75339
2. Cisco Bug-ID CSCwk28210
3. Cisco Bug-ID CSCwo62396
Schritte zum Löschen von POST-UECC-Fehlern
Blade Server
Anmerkung: Wählen Sie die Chassis-ID und Server-ID aus, die für Ihre jeweilige Umgebung erforderlich sind. Das angezeigte Bild dient zu Demonstrationszwecken.
Schalten Sie den Server aus.
Der Server muss physisch ausgeschaltet werden, andernfalls können die UECC-Fehler beim Neustart bestehen bleiben.
Anmerkung: Die DIMM-SPD-Daten werden nicht aktualisiert, da der CIMC die DIMM-SPD-Daten nur beim Einschalten des Servers abfragt. Wenn ein DIMM wirklich problematisch ist, tritt der Fehler nach dem Neustart wieder auf, und der Cisco Support kann eine RMA für das DIMM erstellen.
GUI-Methode für UCS Manager
Navigieren Sie zu Equipment > Chassis > Chassis ID > Servers > Server ID > Actions > System > Reset All Memory Errors (Geräte > Gehäuse > Chassis-ID > Server-ID > Aktionen > System > Alle Speicherfehler zurücksetzen).

GUI-Methode für Intersight Managed Mode (IMM)

Anmerkung: Diese Schritte gelten auch für integrierte Server der C-Serie.
CLI-Methode (Command Line Interface)
Starten Sie eine SSH-Sitzung mit der virtuellen IP-Adresse von UCS Manager. Stellen Sie sicher, dass der betreffende Server ausgeschaltet ist, bevor Sie mit den beschriebenen Schritten fortfahren.

Stellen Sie nach Abschluss des Vorgangs sicher, dass keine neuen Fehler im System auftreten.
Rack-Server
Schalten Sie den Server aus.
Der Server muss physisch ausgeschaltet werden, andernfalls können die UECC-Fehler beim Neustart bestehen bleiben.
Anmerkung: Die DIMM-SPD-Daten werden nicht aktualisiert, da der CIMC die DIMM-SPD-Daten nur beim Einschalten des Servers abfragt. Wenn ein DIMM wirklich problematisch ist, tritt der Fehler nach dem Neustart wieder auf, und der Cisco Support kann eine RMA für das DIMM erstellen.
GUI-Methode
Wenn der Server nicht mit dem Intersight Managed Mode (IMM) verwaltet wird, ist die CLI-Methode (Command Line Interface) erforderlich. Andernfalls können Sie die vorherigen Schritte durchführen.
CLI-Methode
Anmerkung: Das angezeigte Bild dient zu Demonstrationszwecken.
Starten Sie eine SSH-Sitzung mit der CIMC-IP-Adresse des Servers. Stellen Sie sicher, dass der betreffende Server ausgeschaltet ist, bevor Sie mit den Schritten wie folgt fortfahren.

Stellen Sie nach Abschluss des Vorgangs sicher, dass keine neuen Fehler im System auftreten.