簡介
本檔案介紹如何清除思科整合運算系統(UCS)上的暫時性無法更正錯誤更正代碼(UECC)記憶體錯誤。
必要條件
需求
本文件沒有特定需求。
採用元件
本文檔適用於所有M5、M6和M7代伺服器。
本文中的資訊是根據特定實驗室環境內的裝置所建立。文中使用到的所有裝置皆從已清除(預設)的組態來啟動。如果您的網路運作中,請確保您瞭解任何指令可能造成的影響。
背景資訊
如果伺服器未顯示先前發生的糾錯碼(ECC)或不可糾正的糾錯碼(UECC)錯誤,則某些記憶體模組在正常操作下的重新啟動過程中,在BIOS POST時可能會出現UECC記憶體錯誤。受影響的雙列直插式記憶體模組(DIMM)顯示為塊清單,但隨後清除塊清單資料或在退貨授權(RMA)後進行故障分析時,不會報告新的錯誤。 這表示UCS記憶體錯誤的潛在瞬態性質。清除塊清單錯誤資料後,可以繼續使用DIMM。
發生暫時性或非持續性錯誤時不會發出警告。在DIMM培訓錯誤或多位錯誤發生之前,DIMM中不一定總是會發生可更正錯誤。在記憶訓練過程中所發生事情的範圍與運行時使用記憶所發生的情形相差甚遠。因此,記憶體模組的穩定性不一定與伺服器POST和Runtime相關。
已知瑕疵
所列出的錯誤概述了先前描述的行為:
1.思科錯誤ID CSCwa75339
2.思科錯誤ID CSCwk28210
3.思科錯誤ID CSCwo62396
清除POST UECC錯誤的步驟
刀鋒伺服器
附註:請選擇您的特定環境所需的正確的機箱ID和伺服器ID。顯示的影象用於演示。
關閉伺服器電源。
伺服器需要關閉物理電源,否則UECC錯誤會在重新啟動後繼續存在。
附註:DIMM SPD資料不會更新,因為CIMC僅在伺服器通電時輪詢DIMM SPD資料。如果DIMM確實有問題,則重新啟動後會返回錯誤,思科支援可以為DIMM提供RMA。
UCS Manager的GUI方法
導航至Equipment > Chassis > Chassis ID > Servers > Server ID > Actions > System > Reset All Memory Errors。

Intersight管理模式(IMM)的GUI方法

命令列介面(CLI)方法
啟動UCS Manager虛擬IP地址的SSH會話。繼續上述步驟之前,請確保關閉相關伺服器的電源。

完成後,確認系統中沒有新錯誤增加。
機架式伺服器
關閉伺服器電源。
伺服器需要關閉物理電源,否則UECC錯誤會在重新啟動後繼續存在。
附註:DIMM SPD資料不會更新,因為CIMC僅在伺服器通電時輪詢DIMM SPD資料。如果DIMM確實有問題,則重新啟動後會返回錯誤,思科支援可以為DIMM提供RMA。
GUI方法
如果未使用Intersight管理模式(IMM)管理伺服器,則需要使用命令列介面(CLI)方法。否則,以上步驟適用。
CLI方法
啟動到伺服器CIMC IP地址的SSH會話。在繼續按照概述的步驟之前,請確保相關伺服器已關閉。

完成後,確認系統中沒有新錯誤增加。