PowerEdge:第 17 代服务器冷启动期间的 SYS565 内存模块温度警告
Summary: 在服务器冷引导顺序期间,Dell PowerEdge 第 17 代英特尔服务器可能会在生命周期日志和系统事件日志中记录内存模块温度警告事件。
Symptoms
冷功耗循环 具有 iDRAC10 1.20.70.50(或更高版本)固件的 Dell 17G PowerEdge Intel 服务器在与较旧的现场可编程门阵列 (FPGA) 固件配对时生成 SYS565 事件。iDRAC10 生命周期日志 (LCLOG) 和系统事件日志 (SEL) 都会记录内存模块温度超过警告阈值事件。
受影响的服务器:
- PowerEdge R470
- PowerEdge R570
- PowerEdge R670
- PowerEdge R770
生命周期日志示例:
2025-10-20 11:17:34 SYS566 The memory module temperature has returned to its normal value.
2025-10-20 11:16:54 SYS565 The memory module temperature has exceeded the warning threshold value.
2025-10-20 11:16:49 RAC1195 User requested state / configuration change to PowerControl using Redfish.
2025-10-20 11:16:48 SYS1005 The server power action is initiated because the management controller initiated a power-down operation.
2025-10-20 11:16:48 RAC0702 Requested system powercycle.
系统事件日志示例:
The memory module temperature has returned to its normal value. Mon Oct 20 2025 11:17:34
The memory module temperature has exceeded the warning threshold value. Mon Oct 20 2025 11:16:54
Cause
2025 年 11 月 iDRAC10 v1.20.70.50 和相关平台 FPGA 固件为第 17 代英特尔 PowerEdge 服务器引入了新的 MEMHOT 功能。将添加了此功能支持的 iDRAC10 固件与不支持 MEMHOT 的 FPGA 固件混合使用会导致此事件出现。
Resolution
FPGA 固件引入了对 MEMHOT 功能的支持,与 iDRAC10 固件 1.20.70.50 一致。将 17G 英特尔 PowerEdge 服务器更新到此固件或更高版本可修复此发现。当此不匹配的固件配对发生 SYS5565 错误时,该错误会自我纠正并在 LCLOG 和 SEL 中记录 SYS566 事件。
引入MEMHOT支持的FPGA版本:
- R470/R570 FPGA 版本:107.132.000
- R670/R770 FPGA 版本:108.124.104