症状
注意:本文不適用於以 14G AMD 為基礎的 PowerEdge 伺服器,例如 64x5 或 74x5 平台,因為它們沒有此套件修復後自動重新安裝功能,即使 DIMM 本身提供支援。
透過企業級記憶體的可靠性、存取性和檢修性 (RAS) 功能的演進,Dell 採取保守的方式為客戶提供透明度。隨著持續演進,Dell 的錯誤報告方法也在持續演進,相較於主要為資訊性質的通知,您可以專注於需要更緊急回應的通知。
隨著基於DRAM的記憶體幾何形狀不斷縮小,為客戶提供他們所需的更高性能,預計越來越多的可糾正錯誤是均勻縮放的自然組成部分。
原因
在全球伺服器產業中,Dell 越來越接受一種共識,認為部分可修正的 DIMM 錯誤是無法避免的,且不保證必須立即更換記憶體模組,甚至不保證必須立即重新開機以自動重新安裝。
解决方案
繼續操作回報可修正錯誤的系統,而不需要重新開機進行自我修復,並不會增加遇到無法修正的錯誤的風險,而這可能會導致非預期的停機時間。業界其他人則公開表示,他們的記憶體處理不會報告可更正的錯誤。
在 14G Intel PowerEdge BIOS 2.5.4 版和更新版本中,新增了名為「可修正錯誤記錄」的 BIOS 設定,讓客戶能選擇停用可修正錯誤報告,而且許多客戶都有。即使沒有記錄,BIOS 仍會針對可修正的閾值事件繼續排程自動重新安裝。此排定的自動重新安裝會在後續系統重新開機時自動執行。
為了更符合業界需求並持續獲得客戶意見回饋,自 2022 年 3 月起,Dell PowerEdge BIOS 更新會將「可修正錯誤記錄」BIOS 設定變更為預設為停用。若客戶想要繼續看到可修正的記憶體閾值事件,可以重新啟用此 BIOS 選項。包含此 BIOS 設定變更的 BIOS 版本包括:
- 14G Intel 平台 - BIOS 版本 2.13.3 或更新版本
- 15G AMD 平台 - BIOS 版本 2.6.5 或更新版本
- 15G Intel 平台 - BIOS 版本 1.5.5 或更新版本。
DDR4 DIMM 在系統重新開機時自我修復的優點:
- 無需從系統卸下即可修復 DDR4 DIMM;所有 Dell 來源的 DDR4 DIMM 均支援記憶體自我修復功能。
注意:14G AMD PowerEdge 伺服器沒有此自動重新安裝功能。
- 使用架構在 DRAM 中的可用備用行,其中壞行通過電保險信永久替換為已知的良好行。
- 隨後的記憶體再訓練通過重新校準中心點來優化「數據眼」,以確保記憶體總線以最高級別的信令完整性運行。
針對啟用「可修正錯誤記錄」BIOS 設定 的可修正閾值事件,如果發生記憶體閾值事件,Dell Technologies 建議您按照客戶的定期維護排程重新開機,以使排定的記憶體自動重新安裝或自我修正。重新開機後,會為關聯的 DIMM 記錄成功或失敗的自動重新安裝事件。
在「可修正錯誤記錄」BIOS 設定 Di停用後,Dell Technologies 建議您按照客戶的定期維護排程重新開機。重新開機時,會自動執行任何排定的自動重新安裝作業。如果自動重新安裝或自我更正作業失敗,系統會記錄事件 (MEM0805 或 MEM7114 類型事件),並進一步建議實體更換受影響的 DIMM。
建議:
Dell 記憶體工程部門建議使用舊版 BIOS 的 PowerEdge 伺服器客戶 (在 2022 年 3 月區塊發行前),將「可修正錯誤記錄」BIOS 設定變更為 「停用」。這可消除其伺服器基礎結構中零星的可修正記憶體閾值事件 (例如 MEM0802 或 MEM5104 類型事件),這些事件建議伺服器重新開機,以便自動重新安裝或自我更正。如前所述,當伺服器重新開機並報告任何故障時,任何計劃的自動重新安裝或自我更正操作都會自動運行。
「可修正錯誤記錄」BIOS 設定可透過將伺服器重新開機至 F2 設定或使用 iDRAC WebUI 來變更。
若要從 F2 系統設定變更 BIOS 設定:
若要使用 iDRAC WebUI 變更 BIOS 設定:
- 登入 iDRAC WebUI
- 在 組態 >BIOS 設定下,展開 記憶體設定 區段
- 將 可修正錯誤記錄設定變更為 停用
- 按一下 套用 按鈕以儲存記憶體設定
- 請記得選取套用並重新開機按鈕 (可立即重新開機) 或下次重新開機時按鈕 以套用 BIOS 變更。
現有的記憶體相關文章和白皮書已更新,以反映此建議的更改。
注意:經核准的客戶專用訊息會以檔案形式附加至本文 - 」Managing Correctable Error Notices Dec 2021 v1.pdf.」
當有新資訊可用時,本文會更新。
受影响的产品
Storage Spaces Direct R740xd Ready Node, Storage Spaces Direct R740xd2 Ready node, PowerEdge XR2, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R840, OEMR R940, OEMR R940xa, Poweredge C4140, PowerEdge C6420, PowerEdge C6520
, PowerEdge C6525, PowerEdge MX740C, PowerEdge MX750c, PowerEdge MX840C, PowerEdge R350, PowerEdge R440, PowerEdge R450, PowerEdge R540, PowerEdge R550, PowerEdge R640, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R840, PowerEdge R940, PowerEdge R940xa, PowerEdge T340, PowerEdge T350, PowerEdge T360, PowerEdge T440, PowerEdge T550, PowerEdge T560, PowerEdge T640, PowerEdge XE2420, PowerEdge XE7420, PowerEdge XE7440, PowerEdge XE8545, PowerEdge XR11, PowerEdge XR12, PowerEdge XR4510c, PowerEdge XR4520c, VxFlex Ready Node R740xd, Dell EMC vSAN R740 Ready Node, Dell EMC vSAN R740xd Ready Node, Dell EMC vSAN R840 Ready Node, PowerFlex appliance R740XD, PowerFlex appliance R840, VxFlex Ready Node R840
...
产品
Dell EMC XC Series XC6420 Appliance, Dell EMC XC Core 6420 System, Storage Spaces Direct R440 Ready Node, Storage Spaces Direct R640 Ready Node, Storage Spaces Direct R740xd Ready Node, Storage Spaces Direct R740xd2 Ready node, OEMR R340, OEMR R440
, PowerEdge XR2, OEMR R540, OEMR R640, OEMR XL R640, OEMR R650, OEMR R650xs, OEMR R6515, OEMR R6525, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R750, OEMR R750xa, OEMR R750xs, OEMR R7515, OEMR R7525, OEMR R840, OEMR R940, OEMR R940xa, OEMR T440, OEMR T550, OEMR T640, OEMR XL T640, OEMR XL R340, PowerEdge C6420, PowerEdge C6525, PowerEdge MX740C, PowerEdge MX840C, PowerEdge R340, PowerEdge R540, PowerEdge R640, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R740XD, PowerEdge R740XD2, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R840, PowerEdge R940, PowerEdge R940xa, PowerEdge T440, PowerEdge T550, PowerEdge T640, PowerFlex appliance R650, PowerFlex appliance R6525, Powerflex appliance R750, PowerFlex custom node R650, PowerFlex custom node R6525, PowerFlex custom node R750, VxFlex Ready Node R640, VxFlex Ready Node R740xd, Dell EMC vSAN R750 Ready Node, Dell EMC vSAN R7515 Ready Node, Dell EMC vSAN R840 Ready Node, PowerFlex appliance R640, PowerFlex appliance R740XD, PowerFlex appliance R840, VxFlex Ready Node R840, Dell EMC XC Core XC7525
...