PowerEdge: TMP0203: Die CPU-Temperatur ist höher als der obere kritische Schwellenwert
Summary: PowerEdge-Server mit iDRAC9 melden möglicherweise, dass die Temperatur CPU x höher als der obere kritische Schwellenwert ist, wenn die CPU-Workload Spitzen bei oder nahe CPU PowerMax erreicht. ...
Symptoms
PowerEdge-Server mit iDRAC9 melden möglicherweise, dass die Temperatur der CPU x höher als der obere kritische Schwellenwert ist, wenn die CPU-Workload-Spitzen bei oder nahe der maximalen CPU-Leistung liegen. Wenn vorübergehende Stromspitzen auftreten, um zusätzliche CPU-Anforderungen zu erfüllen, kann die Prozessortemperatur kurzzeitig den oberen kritischen Schwellenwert überschreiten. Beispielsweise kann ein Server, der mit einer Auslastung von 50 bis 60 % betrieben wird und für 5 bis 20 Sekunden eine Auslastung von 100 % erreicht, den oberen kritischen Schwellenwert für die CPU-Temperatur kurzzeitig überschreiten. Wenn dieser Schwellenwert überschritten wird, werden die Ereignisse im Systemereignisprotokoll und im Lebenszyklusprotokoll aufgezeichnet. Wenn die vorübergehende Spitzenspitze vorbei ist und die CPU-Temperatur wieder normal ist, wird ein Ereignis aufgezeichnet, das darauf hinweist, dass sich die Temperatur von CPU x innerhalb des Bereichs befindet.
Wenn vorübergehende Spitzen wie diese auftreten, treten die beiden Ereignisse in der Regel innerhalb von 5 bis 20 Sekunden auf. Die folgenden Beispiele dienen als Anhaltspunkte für diese Art von vorübergehenden Ereignissen.
Systemereignisprotokoll:
2020-04-09 11:14:11 85 CPU 2 temperature is within range.
2020-04-09 11:14:06 84 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 09:16:31 83 CPU 2 temperature is within range.
2020-04-09 09:16:16 82 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 08:58:33 81 CPU 2 temperature is within range.
2020-04-09 08:58:17 80 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 08:25:47 79 CPU 2 temperature is within range.
2020-04-09 08:25:27 78 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 06:57:02 77 CPU 2 temperature is within range.
2020-04-09 06:56:57 76 CPU 2 temperature is greater than the upper critical threshold.
Lifecycle-Protokoll:
2020-04-09 00:44:15 7851 TMP0205 CPU 2 temperature is within range.
2020-04-09 00:44:07 7850 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 22:46:31 7773 TMP0205 CPU 2 temperature is within range.
2020-04-08 22:46:18 7772 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 22:28:34 7769 TMP0205 CPU 2 temperature is within range.
2020-04-08 22:28:18 7768 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 21:55:49 7736 TMP0205 CPU 2 temperature is within range.
2020-04-08 21:55:29 7735 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 20:27:03 7697 TMP0205 CPU 2 temperature is within range.
2020-04-08 20:26:58 7696 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
Wenn diese Temperaturschwellenwerte erreicht sind, werden Intel Prozessoren möglicherweise gedrosselt, um den Stromverbrauch und die CPU-Temperatur zu senken.
Cause
Resolution
Obwohl diese Arten von vorübergehenden CPU-Leistungsspitzen nicht ungewöhnlich sind, arbeitet iDRAC9 Engineering weiterhin an der Feinabstimmung des Temperaturalgorithmus, um diese Ereignisse zu verhindern. Beispiel: iDRAC9 4.22.00.00 und iDRAC9 4.40.00.00 enthalten thermische Verbesserungen speziell für diese Sequenz. Um sicherzustellen, dass die neuesten dynamischen thermischen Algorithmen auf PowerEdge-Servern installiert sind, aktualisieren Sie auf die neueste verfügbare iDRAC9-Firmware.
Problemumgehungen:
EndnutzerInnen können die Systemtemperatur manuell ändern, um zu verhindern, dass diese vorübergehenden Ereignisse die CPU-Temperatur überhöhen. Verwenden Sie einen der folgenden Workarounds, um die Lüftergeschwindigkeit bei der Baseline zu erhöhen und eine niedrigere CPU-Temperatur aufrechtzuerhalten.
Max. Leistungsprofil
Die Einstellung „Optimierung des thermischen Profils des Systems“ kann auf „Maximale Leistung“ (leistungsoptimiert) geändert werden. Dieses thermische Profil bietet die folgenden Vorteile:
- Geringere Wahrscheinlichkeit einer Speicher- oder CPU-Drosselung
- Erhöhte Wahrscheinlichkeit der Aktivierung des Turbo-Modus
- Im Allgemeinen höhere Lüftergeschwindigkeiten im Leerlauf und bei Spannungsbelastungen
Die Einstellung „Optimierung des thermischen Profils“ kann mithilfe der folgenden Methoden geändert werden:
iDRAC9-Benutzeroberfläche>Konfiguration>Systemeinstellungen>Hardwareeinstellungen>Kühlungskonfiguration
racadm set System.ThermalSettings.ThermalProfile
racadm>>racadm set System.ThermalSettings.ThermalProfile 1
[Key=System.Embedded.1#ThermalSettings.1]
Object value modified successfully
Supported Values:
0 - Default Thermal Profile Settings
1 - Maximum Performance
2 - Minimum Power
3 - Sound Cap
Lüftergeschwindigkeits-Offset
Mit dem Lüftergeschwindigkeits-Offset können Sie die Lüftergeschwindigkeit des Systems in vier inkrementellen Schritten erhöhen. Diese Schritte sind gleichmäßig auf die typische Baseline-Geschwindigkeit und die maximale Geschwindigkeit der Serversystemlüfter aufgeteilt. Ein Lüftergeschwindigkeits-Offset führt dazu, dass die Lüftergeschwindigkeit gegenüber der Baseline-Lüftergeschwindigkeit (um den Offset-Wert in %) steigt, die vom thermischen Überwachungsalgorithmus berechnet wird. Mögliche Werte sind:
- Niedrige Lüftergeschwindigkeit – Bewirkt eine moderate Lüftergeschwindigkeit.
- Mittlere Lüftergeschwindigkeit – Bewirkt eine mittlere Lüftergeschwindigkeit.
- Hohe Lüftergeschwindigkeit – Bewirkt eine nahezu volle Lüftergeschwindigkeit.
- Max. Lüftergeschwindigkeit – Bewirkt volle Lüftergeschwindigkeit.
- Aus: Der Offset für die Lüftergeschwindigkeit ist auf Aus gesetzt. Dies ist die Standardeinstellung. Wenn diese Option auf „Aus“ gesetzt ist, wird der Prozentsatz nicht angezeigt. Die Standard-Lüftergeschwindigkeit wird ohne Offset angewendet. Umgekehrt führt die maximale Einstellung dazu, dass alle Lüfter mit maximaler Drehzahl laufen.
Der Lüftergeschwindigkeits-Offset kann mithilfe der folgenden Methoden geändert werden:
iDRAC9-Benutzeroberfläche>Konfiguration>Systemeinstellungen>Hardwareeinstellungen>Kühlungskonfiguration
racadm set System.ThermalSettings.FanSpeedOffset
racadm>>racadm set System.ThermalSettings.FanSpeedOffset 2
[Key=System.Embedded.1#ThermalSettings.1]
Object value modified successfully
Supported Values:
0 - Low
1 - High
2 - Medium
3 - Max
255 - Off
Hinweis: Das Erhöhen der Baselines für die Lüftergeschwindigkeit erhöht den Stromverbrauch des Lüfters und erhöht die Lüfterakustik.