症状
提醒:本文不适用于基于 14G AMD 的 PowerEdge 服务器,例如 64x5 或 74x5 平台,因为它们不具备此开机自检软件包修复自动重新安装功能,即使 DIMM 本身也支持此功能。
随着企业级内存可靠性、可访问性和可服务性 (RAS) 功能的演变,戴尔在为客户提供透明度方面采取了保守的方法。随着这种发展的继续,戴尔的错误报告方法也在不断发展,与本质上主要是信息性的通知相比,能够专注于需要更紧急响应的通知。
随着基于 DRAM 的内存几何形状不断缩小,从而为客户提供所需的更高性能,预计在统一扩展过程中,可纠正错误会越来越多。
原因
在全球服务器行业内,越来越多的人认同以下观点:每个 DIMM 的某些可纠正错误是不可避免的,并不代表一定需要更换内存模块,甚至不需要立即重新启动来启动自动重新安装。
解决方案
在不重新启动进行自我修复的情况下继续运行报告可纠正错误的系统不会增加遇到不可纠正错误(可能导致计划外停机)的风险。业内其他公司也公开表示,他们的内存处理不报告可纠正错误。
在第 14 代英特尔 PowerEdge BIOS 版本 2.5.4 及更高版本中,添加了一项名为“可纠正的错误日志记录”的 BIOS 设置,以允许客户选择禁用可纠正错误报告(许多客户已经这样做了)。即使没有日志记录,BIOS 仍会继续为可纠正阈值事件计划自动重新安装。此计划的自动重新安装将在后续系统重新启动期间自动进行。
为了更符合行业需求和持续的客户反馈,从 2022 年 3 月开始,Dell PowerEdge BIOS 更新会将“可纠正错误日志记录”BIOS 设置更改为默认禁用。对于希望继续查看可纠正内存阈值事件的客户,可以重新启用此 BIOS 选项。包括此 BIOS 设置更改的 BIOS 版本包括:
- 第 14 代英特尔平台 — BIOS 版本 2.13.3 或更高版本
- 15G AMD 平台 - BIOS 版本 2.6.5 或更高版本
- 15G 英特尔平台 - BIOS 版本 1.5.5 或更高版本。
DDR4 DIMM 通过系统重新启动进行自我修复的好处:
- 它支持修复 DDR4 DIMM,而无需从系统中卸下;所有源自戴尔的 DDR4 DIMM 都支持内存自我修复功能。
提醒:第 14 代 AMD PowerEdge 服务器不具有此自动重新安装功能。
- 使用架构到 DRAM 中的可用备用行,其中坏行通过电气熔断永久替换为已知好行。
- 随后的内存重新训练通过重新校准中心点来优化“数据眼”,以确保内存总线以最高级别的信号完整性运行。
对于 BIOS 设置已启用“可纠正错误日志记录”的可纠正阈值事件,如果发生内存阈值事件,Dell Technologies 建议按客户的定期维护计划重新启动,以允许执行计划的内存自动重新安装或自我纠正。重新启动后,将记录关联 DIMM 的成功或失败自动重新安装事件。
在“Correctable Error Logging”(可纠正的错误日志记录)BIOS 设置处于启用状态的情况下,Dell Technologies 建议按客户的定期维护计划重新启动。重新启动后,所有计划的自动重新安装作都将自动运行。如果自动重新安装或自我纠正作失败,系统将记录一个事件(MEM0805或MEM7114类型事件),并进一步建议以物理方式更换受影响的 DIMM。
建议:
Dell 内存工程部门建议使用较旧 BIOS 版本(在 2022 年 3 月块之前的版本)的 PowerEdge 服务器客户,将“可纠正的错误日志记录”BIOS 设置更改为 “已禁用”。这消除了服务器基础架构中零星的可纠正内存阈值事件(例如MEM0802或MEM5104类型事件),这些事件建议重新启动服务器以允许进行自动重新安装或自我纠正。如前所述,当服务器重新启动并报告任何故障时,任何计划的自动重新安装或自我纠正作都将自动运行。
通过将服务器重新启动至 F2 设置或使用 iDRAC WebUI,可以更改“Correctable Error Logging”BIOS 设置。
要从 F2 系统设置更改 BIOS 设置,请执行以下作:
要使用 iDRAC WebUI 更改 BIOS 设置,请执行以下作:
- 登录 iDRAC WebUI
- 在 配置 >BIOS 设置下,展开 内存设置 部分
- 将 “可纠正的错误日志记录”设置更改为 “已禁用”
- 单击 应用 按钮以保存内存设置
- 不要忘记选择应用并重新启动按钮(立即重新启动)或下一次重新启动时按钮 以应用 BIOS 更改。
更新了现有的内存相关文章和白皮书,以反映此建议的更改。
提醒:经批准的面向客户的宣传信息作为文件附加到本文 — ”Managing Correctable Error Notices Dec 2021 v1.pdf”的输出。
本文将在有新信息可用时进行更新。
受影响的产品
Storage Spaces Direct R740xd Ready Node, Storage Spaces Direct R740xd2 Ready node, PowerEdge XR2, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R840, OEMR R940, OEMR R940xa, Poweredge C4140, PowerEdge C6420, PowerEdge C6520
, PowerEdge C6525, PowerEdge MX740C, PowerEdge MX750c, PowerEdge MX840C, PowerEdge R350, PowerEdge R440, PowerEdge R450, PowerEdge R540, PowerEdge R550, PowerEdge R640, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R840, PowerEdge R940, PowerEdge R940xa, PowerEdge T340, PowerEdge T350, PowerEdge T360, PowerEdge T440, PowerEdge T550, PowerEdge T560, PowerEdge T640, PowerEdge XE2420, PowerEdge XE7420, PowerEdge XE7440, PowerEdge XE8545, PowerEdge XR11, PowerEdge XR12, PowerEdge XR4510c, PowerEdge XR4520c, VxFlex Ready Node R740xd, Dell EMC vSAN R740 Ready Node, Dell EMC vSAN R740xd Ready Node, Dell EMC vSAN R840 Ready Node, PowerFlex appliance R740XD, PowerFlex appliance R840, VxFlex Ready Node R840
...
产品
Dell EMC XC Series XC6420 Appliance, Dell EMC XC Core 6420 System, Storage Spaces Direct R440 Ready Node, Storage Spaces Direct R640 Ready Node, Storage Spaces Direct R740xd Ready Node, Storage Spaces Direct R740xd2 Ready node, OEMR R340, OEMR R440
, PowerEdge XR2, OEMR R540, OEMR R640, OEMR XL R640, OEMR R650, OEMR R650xs, OEMR R6515, OEMR R6525, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R750, OEMR R750xa, OEMR R750xs, OEMR R7515, OEMR R7525, OEMR R840, OEMR R940, OEMR R940xa, OEMR T440, OEMR T550, OEMR T640, OEMR XL T640, OEMR XL R340, PowerEdge C6420, PowerEdge C6525, PowerEdge MX740C, PowerEdge MX840C, PowerEdge R340, PowerEdge R540, PowerEdge R640, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R740XD, PowerEdge R740XD2, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R840, PowerEdge R940, PowerEdge R940xa, PowerEdge T440, PowerEdge T550, PowerEdge T640, PowerFlex appliance R650, PowerFlex appliance R6525, Powerflex appliance R750, PowerFlex custom node R650, PowerFlex custom node R6525, PowerFlex custom node R750, VxFlex Ready Node R640, VxFlex Ready Node R740xd, Dell EMC vSAN R750 Ready Node, Dell EMC vSAN R7515 Ready Node, Dell EMC vSAN R840 Ready Node, PowerFlex appliance R640, PowerFlex appliance R740XD, PowerFlex appliance R840, VxFlex Ready Node R840, Dell EMC XC Core XC7525
...