PowerEdge:在 17G 伺服器冷開機期間,SYS565 記憶體模組溫度警告
Summary: 在伺服器冷開機順序中,Dell PowerEdge 17G Intel 伺服器可能會在生命週期記錄和系統事件記錄中記錄記憶體模組溫度警告事件。
Symptoms
冷電源重新啟動 搭載 iDRAC10 1.20.70.50 (或更新版本) 韌體的 Dell 17G PowerEdge Intel 伺服器與舊版現場可程式化閘道陣列 (FPGA) 韌體配對時,會產生 SYS565 事件。iDRAC10 生命週期記錄 (LCLOG) 和系統事件記錄 (SEL) 皆會記錄記憶體模組溫度超過警告閾值的事件。
受影響的伺服器:
- PowerEdge R470
- PowerEdge R570
- PowerEdge R670
- PowerEdge R770
生命週期記錄範例:
2025-10-20 11:17:34 SYS566 The memory module temperature has returned to its normal value.
2025-10-20 11:16:54 SYS565 The memory module temperature has exceeded the warning threshold value.
2025-10-20 11:16:49 RAC1195 User requested state / configuration change to PowerControl using Redfish.
2025-10-20 11:16:48 SYS1005 The server power action is initiated because the management controller initiated a power-down operation.
2025-10-20 11:16:48 RAC0702 Requested system powercycle.
系統事件記錄範例:
The memory module temperature has returned to its normal value. Mon Oct 20 2025 11:17:34
The memory module temperature has exceeded the warning threshold value. Mon Oct 20 2025 11:16:54
Cause
2025 年 11 月,iDRAC10 v1.20.70.50 和相關平台 FPGA 韌體為 17G Intel PowerEdge 伺服器推出了新的 MEMHOT 功能。將新增了此功能支援的 iDRAC10 韌體與不支援 MEMHOT 的 FPGA 韌體混用,導致此事件目失。
Resolution
FPGA 韌體與 iDRAC10 韌體 1.20.70.50 同步推出 MEMHOT 功能支援。將 17G Intel PowerEdge 伺服器更新為此韌體或更新版本,可修正此狀況。當此不匹配的韌體配對發生SYS5565錯誤時,錯誤會自行修正,並在 LCLOG 和 SEL 中記錄 SYS566 事件。
導入 MEMHOT 支援的 FPGA 版本:
- R470/R570 FPGA 版本:107.132.000
- R670/R770 FPGA 版本:108.124.104