PowerEdge: TMP0203: Temperatura procesora CPU jest wyższa niż górny próg krytyczny
Summary: Serwery PowerEdge z kontrolerem iDRAC9 mogą zgłaszać zdarzenia dotyczące temperatury procesora x powyżej górnego progu krytycznego, gdy obciążenie robocze procesora wzrasta na poziomie CPU PowerMax lub w jego pobliżu. ...
Symptoms
Serwery PowerEdge z kontrolerem iDRAC9 mogą zgłaszać zdarzenia dotyczące temperatury procesora wyższej niż górny próg krytyczny, gdy obciążenie robocze procesora wzrasta na poziomie maksimum mocy procesora lub w jego pobliżu. W przypadku przejściowych skoków napięcia w celu zaspokojenia dodatkowego zapotrzebowania procesora temperatura procesora może na krótko przekroczyć górny próg krytyczny. Na przykład serwer, który działa na poziomie 50–60% wykorzystania i wzrasta do 100% przez 5–20 sekund, może na krótko przekroczyć górny próg krytyczny temperatury procesora. Po przekroczeniu tego progu zdarzenia są rejestrowane w systemowym rejestrze zdarzeń i dzienniku cyklu eksploatacji. Gdy szczytowy przejściowy skok minie, a temperatura procesora powróci do normy, rejestrowane jest zdarzenie wskazujące, że temperatura procesora x procesor mieści się w zakresie.
W przypadku przejściowych skoków, takich jak ten, te dwa zdarzenia zwykle występują w odstępie 5-20 sekund. Zapoznaj się z poniższymi przykładami jako wskazówkami dotyczącymi tego typu zdarzeń przejściowych.
Dziennik zdarzeń systemowych:
2020-04-09 11:14:11 85 CPU 2 temperature is within range.
2020-04-09 11:14:06 84 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 09:16:31 83 CPU 2 temperature is within range.
2020-04-09 09:16:16 82 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 08:58:33 81 CPU 2 temperature is within range.
2020-04-09 08:58:17 80 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 08:25:47 79 CPU 2 temperature is within range.
2020-04-09 08:25:27 78 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 06:57:02 77 CPU 2 temperature is within range.
2020-04-09 06:56:57 76 CPU 2 temperature is greater than the upper critical threshold.
Dziennik cyklu eksploatacji:
2020-04-09 00:44:15 7851 TMP0205 CPU 2 temperature is within range.
2020-04-09 00:44:07 7850 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 22:46:31 7773 TMP0205 CPU 2 temperature is within range.
2020-04-08 22:46:18 7772 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 22:28:34 7769 TMP0205 CPU 2 temperature is within range.
2020-04-08 22:28:18 7768 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 21:55:49 7736 TMP0205 CPU 2 temperature is within range.
2020-04-08 21:55:29 7735 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 20:27:03 7697 TMP0205 CPU 2 temperature is within range.
2020-04-08 20:26:58 7696 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
Po osiągnięciu tych progów temperatury procesory Intel mogą obniżyć zużycie energii i tym samym temperaturę.
Cause
Resolution
Chociaż tego typu przejściowe skoki wydajności procesora nie są zjawiskiem nienormalnym, zespół inżynieryjny kontrolera iDRAC9 nadal dostraja algorytm termiczny, aby zapobiegać takim zdarzeniom. Na przykład kontrolery iDRAC9 4.22.00.00 i iDRAC9 4.40.00.00 zawierają ulepszenia termiczne specyficzne dla tej sekwencji. Aby zapewnić zainstalowanie najnowszych dynamicznych algorytmów termicznych na serwerach PowerEdge, należy zaktualizować oprogramowanie wewnętrzne kontrolera iDRAC9 do najnowszej wersji.
Obejścia:
Użytkownicy końcowi mogą ręcznie modyfikować temperaturę systemu, aby zapobiec przejściowym zdarzeniom powiązanym ze skokami temperatury procesora. Użyj jednego z poniższych obejść, aby zwiększyć podstawową prędkość wentylatora i utrzymać niższą temperaturę procesora.
Profil maksymalnej wydajności
Optymalizację profilu termicznego systemu można zmodyfikować pod kątem maksymalnej wydajności (optymalizacja pod kątem wydajności). Ten profil termiczny ma następujące zalety:
- Zmniejszone prawdopodobieństwo ograniczenia pamięci lub procesora
- Zwiększono prawdopodobieństwo aktywacji trybu turbo
- Ogólnie rzecz biorąc, wyższe prędkości wentylatora przy obciążeniach biegu jałowego i obciążeniach
Optymalizację profilu termicznego można modyfikować w następujący sposób:
Interfejs użytkownika >kontrolera iDRAC9Konfiguracja>Ustawienia> systemowe Ustawienia> sprzętowe Konfiguracja chłodzenia
racadm set System.ThermalSettings.ThermalProfile
racadm>>racadm set System.ThermalSettings.ThermalProfile 1
[Key=System.Embedded.1#ThermalSettings.1]
Object value modified successfully
Supported Values:
0 - Default Thermal Profile Settings
1 - Maximum Performance
2 - Minimum Power
3 - Sound Cap
Regulacja prędkości wentylatora
Regulacja prędkości wentylatora umożliwia zwiększenie prędkości wentylatora systemowego za pomocą czterech poziomów. Poziomy te są równo podzielone pomiędzy standardową prędkość podstawową a prędkość maksymalną wentylatora systemowego serwera. Przesunięcie prędkości wentylatora powoduje zwiększenie prędkości wentylatora (o wartość przesunięcia wyrażaną w %) w stosunku do podstawowych prędkości wentylatora obliczonych przez algorytm kontroli temperatury. Możliwe wartości to:
- Niska prędkość wentylatora — zwiększa prędkość wentylatora do umiarkowanej.
- Średnia prędkość wentylatora — prędkość wentylatora jest bliska średniej.
- Wysoka prędkość wentylatora — prędkość wentylatora jest zbliżona do pełnej prędkości.
- Maksymalna prędkość wentylatora — prędkość wentylatora osiąga pełną prędkość.
- Wyłączone — przesunięcie prędkości wentylatora jest wyłączone. Jest to wartość domyślna. Gdy opcja jest wyłączona, wartość procentowa nie jest wyświetlana. Domyślna prędkość wentylatora jest stosowana bez przesunięcia. I odwrotnie, maksymalne ustawienie powoduje, że wszystkie wentylatory pracują z maksymalną prędkością.
Przesunięcie prędkości wentylatora można modyfikować w następujący sposób:
Interfejs użytkownika >kontrolera iDRAC9Konfiguracja>Ustawienia> systemowe Ustawienia> sprzętowe Konfiguracja chłodzenia
racadm set System.ThermalSettings.FanSpeedOffset
racadm>>racadm set System.ThermalSettings.FanSpeedOffset 2
[Key=System.Embedded.1#ThermalSettings.1]
Object value modified successfully
Supported Values:
0 - Low
1 - High
2 - Medium
3 - Max
255 - Off
Uwaga: Zwiększenie wartości bazowych prędkości wentylatorów zwiększa ich zużycie energii i poprawia akustykę wentylatorów.