PowerEdge: Ostrzeżenia o temperaturze modułu pamięci SYS565 z włączoną nadmiarowością zimnego zasilacza
Summary: W serwerach Dell PowerEdge 17G dodano monitorowanie błędów MEMHOT w oprogramowaniu wewnętrznym kontrolera iDRAC10 w wersji 1.20.80.50 w połączeniu z obsługiwanym oprogramowaniem wewnętrznym programowalnej macierzy bramek (FPGA). Serwery skonfigurowane z włączoną funkcją nadmiarowości zasilaczy zimnych mogą rejestrować losowe zdarzenia ostrzegawcze dotyczące temperatury pamięci SYS565. ...
Symptoms
Zasady rotacji nadmiarowości zimnego i zimnego zasilacza (PSU) są ustawione w taki sposób, aby zoptymalizować zużycie energii wejściowej bez narażania na szwank zasad nadmiarowości. Zasada zimnej nadmiarowości umożliwia pozostawienie nieaktywnego zasilacza zapasowego aż do awarii zasilacza podstawowego. Polecenie
Zasada rotacji zimnego zasilacza nadmiarowego polega na przełączaniu się co 24 godziny między zimnym zasilaczem nadmiarowym a aktywnym zasilaczem. Zdarzenia SYS565 mogą wystąpić podczas zimnego rozruchu serwera lub podczas rotacji zimnej nadmiarowości zasilaczy, gdy funkcja zimnej nadmiarowości jest włączona.
Przykładowy wpis dziennika cyklu eksploatacji:
2025-10-22 17:15:35 SYS566 The memory module temperature has returned to its normal value.
2025-10-22 17:13:44 SYS565 The memory module temperature has exceeded the warning threshold value.
Przykładowy wpis dziennika zdarzeń systemu:
The memory module temperature has returned to its normal value. Wed Oct 22 2025 17:15:34
The memory module temperature has exceeded the warning threshold value. Wed Oct 22 2025 17:13:44
Dodano obsługę czujnika MEMHOT do serwerów Dell 17G PowerEdge Intel w następujących wersjach oprogramowania wewnętrznego:
- Wersja układu FPGA R470/R570: 107.132.000
- Wersja układu FPGA R670/R770: 108.124.104
- Wersja kontrolera iDRAC10: 1.20.70.50
Cause
Po zaktualizowaniu do obsługiwanych wersji oprogramowania wewnętrznego w celu obsługi funkcji MEMHOT, ruch zimnej nadmiarowości do zasilaczy może przypadkowo wyzwolić asercję czujnika MEMHOT.
Resolution
Wersje oprogramowania wewnętrznego układów FPGA i iDRAC10 z marca 2026 r. korygują warunki, które wyzwalają te fałszywe potwierdzenia MEMHOT.
- Wersja układu FPGA R470/R570: Do ustalenia
- Wersja układu FPGA R670/R770: 109.126.104
- Wersja kontrolera iDRAC10: 1.30.10.50
Obejście problemu:
Wyłączenie nadmiarowości zimnego zasilacza w kontrolerze iDRAC10 zapobiega wystąpieniu tych fałszywie dodatnich zdarzeń SYS565.
Przykład >> konfiguracji zasilania systemu zarządzania energią >> konfiguracji interfejsu użytkownika >> kontrolera iDRAC10:

Przykład narzędzia RACADM:
racadm>>racadm set system.serverpwr.coldredundancy False Object value modified successfully
Przykład poprawki REDFISH:
curl -sk -X PATCH -H "Content-Type: application/json" -u 'root:calvin' https://iDRAC_IP/redfish/v1/Chassis/System.Embedded.1/PowerSubsystem -d '{"Oem" :{"Dell" :{"PowerSubsystemColdRedundancy": {"ColdRedunancyEnable": false}}}}'