PowerEdge: SYS565-Speichermodul-Temperaturwarnungen bei aktivierter Kaltredundanz des Netzteils
Summary: Dell PowerEdge-Server der 17. Generation haben die MEMHOT-Fehlerüberwachung in der iDRAC10-Firmwareversion 1.20.80.50 in Kombination mit unterstützter FPGA-Firmware (Field-Programmable Gate Array) hinzugefügt. Server, die mit aktivierter Netzteil-Kaltredundanzfunktion konfiguriert sind, können zufällige SYS565-Speichertemperatur-Warnungsereignisse aufzeichnen. ...
Symptoms
Cold-Redundanz und Cold-Redundanz Die Rotationsrichtlinien der Stromversorgungseinheit (PSU) sind so eingestellt, dass der Eingangsstromverbrauch optimiert wird, ohne die Redundanzrichtlinie zu gefährden. Mit der Policy für kalte Redundanz kann das Backup-Netzteil inaktiv bleiben, bis das primäre Netzteil ausfällt. Die Spalte
Die Policy für die PSU-Rotation mit Cold-Redundanz wechselt alle 24 Stunden zwischen dem kalten, redundanten und dem aktiven Netzteil. SYS565-Ereignisse können während des Server-Kaltstarts oder während der PSU-Rotation mit kalter Redundanz auftreten, während die Cold-Redundanz-Funktion aktiviert ist.
Beispiel für ein Lebenszyklusprotokoll:
2025-10-22 17:15:35 SYS566 The memory module temperature has returned to its normal value.
2025-10-22 17:13:44 SYS565 The memory module temperature has exceeded the warning threshold value.
Beispiel für ein Systemereignisprotokoll:
The memory module temperature has returned to its normal value. Wed Oct 22 2025 17:15:34
The memory module temperature has exceeded the warning threshold value. Wed Oct 22 2025 17:13:44
Die Unterstützung für MEMHOT-Sensoren wurde zu Dell PowerEdge Intel Servern der 17. Generation in den folgenden Firmwareversionen hinzugefügt:
- FPGA-Version R470/R570: 107.132.000
- R670/R770 FPGA-Version: 108.124.104
- iDRAC10-Version: 1.20.70.50
Cause
Nach der Aktualisierung auf die unterstützten Firmwareversionen zur Unterstützung von MEMHOT kann der Cold-Redundanz-Datenverkehr zu den Netzteilen versehentlich eine Assert des MEMHOT-Sensors auslösen.
Resolution
Die Firmwareversionen von FPGA und iDRAC10 vom März 2026 korrigieren die Bedingungen, die diese falschen MEMHOT-Assertionen auslösen.
- FPGA-Version R470/R570: Noch festzulegen
- R670/R770 FPGA-Version: 109.126.104
- iDRAC10-Version: 1.30.10.50
Problemumgehung:
Das Deaktivieren der Netzteil-Kaltredundanz innerhalb des iDRAC10-Controllers verhindert, dass diese falsch positiven SYS565-Ereignisse auftreten.
iDRAC10-UI-Konfiguration Energiemanagement Stromkonfigurationsbeispiel>>:>>>>

RACADM-Beispiel:
racadm>>racadm set system.serverpwr.coldredundancy False Object value modified successfully
Beispiel für einen REDFISH-PATCH:
curl -sk -X PATCH -H "Content-Type: application/json" -u 'root:calvin' https://iDRAC_IP/redfish/v1/Chassis/System.Embedded.1/PowerSubsystem -d '{"Oem" :{"Dell" :{"PowerSubsystemColdRedundancy": {"ColdRedunancyEnable": false}}}}'