PowerEdge:SYS565 内存模块温度警告(带已启用电源冷冗余)
Summary: Dell PowerEdge 第 17 代服务器在 iDRAC10 固件版本 1.20.80.50 中添加了 MEMHOT 错误监视功能,并结合了受支持的现场可编程门阵列 (FPGA) 固件。配置了电源冷冗余功能的服务器可以记录随机 SYS565 内存温度警告事件。
Symptoms
冷冗余和冷冗余电源装置 (PSU) 轮换策略设置为优化输入功耗,而不会危及冗余策略。冷冗余策略允许备份 PSU 保持非活动状态,直至主 PSU 出现故障。而
冷冗余 PSU 轮换策略每 24 小时在冷冗余 PSU 与活动 PSU 之间切换一次。在启用了冷冗余功能的情况下,在服务器冷启动或冷冗余 PSU 轮换期间,可能会发生 SYS565 事件。
生命周期日志示例:
2025-10-22 17:15:35 SYS566 The memory module temperature has returned to its normal value.
2025-10-22 17:13:44 SYS565 The memory module temperature has exceeded the warning threshold value.
系统事件日志示例:
The memory module temperature has returned to its normal value. Wed Oct 22 2025 17:15:34
The memory module temperature has exceeded the warning threshold value. Wed Oct 22 2025 17:13:44
在以下固件版本中,Dell 17G PowerEdge 英特尔服务器中添加了 MEMHOT 传感器支持:
- R470/R570 FPGA 版本:107.132.000
- R670/R770 FPGA 版本:108.124.104
- iDRAC10 版本:1.20.70.50
Cause
更新到受支持的固件版本以支持 MEMHOT 后,PSU 的冷冗余流量可能会无意中触发 MEMHOT 传感器断言。
Resolution
FPGA和iDRAC10的2026年3月固件版本更正了触发这些错误MEMHOT断言的情况。
- R470/R570 FPGA 版本:待定
- R670/R770 FPGA 版本:109.126.104
- iDRAC10 版本:1.30.10.50
解决办法:
在 iDRAC10 控制器中禁用电源冷冗余可防止这些误报 SYS565 事件发生。
iDRAC10 UI >> 配置 >> 电源管理电源配置 >> 示例:

RACADM 示例:
racadm>>racadm set system.serverpwr.coldredundancy False Object value modified successfully
REDFISH 修补程序示例:
curl -sk -X PATCH -H "Content-Type: application/json" -u 'root:calvin' https://iDRAC_IP/redfish/v1/Chassis/System.Embedded.1/PowerSubsystem -d '{"Oem" :{"Dell" :{"PowerSubsystemColdRedundancy": {"ColdRedunancyEnable": false}}}}'