PowerEdge: Ostrzeżenia o temperaturze modułu pamięci SYS565 z włączoną nadmiarowością zimnego zasilacza
Summary: W serwerach Dell PowerEdge 17G dodano monitorowanie błędów MEMHOT w oprogramowaniu wewnętrznym kontrolera iDRAC10 w wersji 1.20.80.50 w połączeniu z obsługiwanym oprogramowaniem wewnętrznym programowalnej macierzy bramek (FPGA). Serwery skonfigurowane z włączoną funkcją nadmiarowości zasilaczy zimnych mogą rejestrować losowe zdarzenia ostrzegawcze dotyczące temperatury pamięci SYS565. ...
Symptoms
Zasady rotacji nadmiarowości zimnego i zimnego zasilacza (PSU) są ustawione w taki sposób, aby zoptymalizować zużycie energii wejściowej bez narażania na szwank zasad nadmiarowości. Zasada zimnej nadmiarowości umożliwia pozostawienie nieaktywnego zasilacza zapasowego aż do awarii zasilacza podstawowego. Polecenie
Zasada rotacji zimnego zasilacza nadmiarowego polega na przełączaniu się co 24 godziny między zimnym zasilaczem nadmiarowym a aktywnym zasilaczem. SYS565 zdarzenia mogą wystąpić podczas zimnego rozruchu serwera lub podczas rotacji zasilacza z zimną redundancją, gdy funkcja zimnej nadmiarowości jest włączona.
Przykładowy wpis dziennika cyklu eksploatacji:
2025-10-22 17:15:35 SYS566 The memory module temperature has returned to its normal value.
2025-10-22 17:13:44 SYS565 The memory module temperature has exceeded the warning threshold value.
Przykładowy wpis dziennika zdarzeń systemu:
The memory module temperature has returned to its normal value. Wed Oct 22 2025 17:15:34
The memory module temperature has exceeded the warning threshold value. Wed Oct 22 2025 17:13:44
MEMHOT Obsługa czujników została dodana do serwerów Dell PowerEdge Intel 17G w następujących wersjach oprogramowania wewnętrznego:
R470/R570 FPGA Version: 107.132.000R670/R770 FPGA Version: 108.124.104iDRAC10 Version: 1.20.70.50
Cause
Po zaktualizowaniu do obsługiwanych wersji oprogramowania wewnętrznego w celu obsługi MEMHOT, ruch zimnej nadmiarowości do zasilaczy może przypadkowo wyzwolić MEMHOT czujnik do asercji.
Resolution
Wersje oprogramowania wewnętrznego układów FPGA i iDRAC10 z marca 2026 r. korygują warunki, które wyzwalają te fałszywe MEMHOT Potwierdzeń.
R470/R570 FPGA Version: TBDR670/R770 FPGA Version: 109.126.104iDRAC10 Version: 1.30.10.50
Obejście problemu:
Wyłączenie nadmiarowości zimnego zasilacza w kontrolerze iDRAC10 zapobiega wystąpieniu tych fałszywie dodatnich zdarzeń SYS565.
Przykład >> konfiguracji zasilania systemu zarządzania energią >> konfiguracji interfejsu użytkownika >> kontrolera iDRAC10:

Przykład narzędzia RACADM:
racadm>>racadm set system.serverpwr.coldredundancy False Object value modified successfully
Przykład poprawki REDFISH:
curl -sk -X PATCH -H "Content-Type: application/json" -u 'root:calvin' https://iDRAC_IP/redfish/v1/Chassis/System.Embedded.1/PowerSubsystem -d '{"Oem" :{"Dell" :{"PowerSubsystemColdRedundancy": {"ColdRedunancyEnable": false}}}}'