PowerEdge: TMP0203: Die CPU-Temperatur ist höher als der obere kritische Schwellenwert

Summary: PowerEdge-Server mit iDRAC9 melden möglicherweise, dass die Temperatur CPU x höher als der obere kritische Schwellenwert ist, wenn die CPU-Workload Spitzen bei oder nahe CPU PowerMax erreicht. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

PowerEdge-Server mit iDRAC9 melden möglicherweise, dass die Temperatur der CPU x höher als der obere kritische Schwellenwert ist, wenn die CPU-Workload-Spitzen bei oder nahe der maximalen CPU-Leistung liegen. Wenn vorübergehende Stromspitzen auftreten, um zusätzliche CPU-Anforderungen zu erfüllen, kann die Prozessortemperatur kurzzeitig den oberen kritischen Schwellenwert überschreiten. Beispielsweise kann ein Server, der mit einer Auslastung von 50 bis 60 % betrieben wird und für 5 bis 20 Sekunden eine Auslastung von 100 % erreicht, den oberen kritischen Schwellenwert für die CPU-Temperatur kurzzeitig überschreiten. Wenn dieser Schwellenwert überschritten wird, werden die Ereignisse im Systemereignisprotokoll und im Lebenszyklusprotokoll aufgezeichnet. Wenn die vorübergehende Spitzenspitze vorbei ist und die CPU-Temperatur wieder normal ist, wird ein Ereignis aufgezeichnet, das darauf hinweist, dass sich die Temperatur von CPU x innerhalb des Bereichs befindet.

Wenn vorübergehende Spitzen wie diese auftreten, treten die beiden Ereignisse in der Regel innerhalb von 5 bis 20 Sekunden auf. Die folgenden Beispiele dienen als Anhaltspunkte für diese Art von vorübergehenden Ereignissen.

Systemereignisprotokoll:

2020-04-09 11:14:11  85  CPU 2 temperature is within range.

2020-04-09 11:14:06  84  CPU 2 temperature is greater than the upper critical threshold.

2020-04-09 09:16:31  83  CPU 2 temperature is within range.

2020-04-09 09:16:16  82  CPU 2 temperature is greater than the upper critical threshold.

2020-04-09 08:58:33  81  CPU 2 temperature is within range.

2020-04-09 08:58:17  80  CPU 2 temperature is greater than the upper critical threshold.

2020-04-09 08:25:47  79  CPU 2 temperature is within range.

2020-04-09 08:25:27  78  CPU 2 temperature is greater than the upper critical threshold.

2020-04-09 06:57:02  77  CPU 2 temperature is within range.

2020-04-09 06:56:57  76  CPU 2 temperature is greater than the upper critical threshold.

Lifecycle-Protokoll:

2020-04-09 00:44:15  7851  TMP0205  CPU 2 temperature is within range.

2020-04-09 00:44:07  7850  TMP0203  CPU 2 temperature is greater than the upper critical threshold.

2020-04-08 22:46:31  7773  TMP0205  CPU 2 temperature is within range.

2020-04-08 22:46:18  7772  TMP0203  CPU 2 temperature is greater than the upper critical threshold.

2020-04-08 22:28:34  7769  TMP0205  CPU 2 temperature is within range.

2020-04-08 22:28:18  7768  TMP0203  CPU 2 temperature is greater than the upper critical threshold.

2020-04-08 21:55:49  7736  TMP0205  CPU 2 temperature is within range.

2020-04-08 21:55:29  7735  TMP0203  CPU 2 temperature is greater than the upper critical threshold.

2020-04-08 20:27:03  7697  TMP0205  CPU 2 temperature is within range.

2020-04-08 20:26:58  7696  TMP0203  CPU 2 temperature is greater than the upper critical threshold.

Wenn diese Temperaturschwellenwerte erreicht sind, werden Intel Prozessoren möglicherweise gedrosselt, um den Stromverbrauch und die CPU-Temperatur zu senken.

Cause

Probleme treten auf, wenn die CPU-Temperatur in der Nähe des Ziels für eine optimale Leistung liegt und die CPU zu höheren Workloads übergeht. Dieser vorübergehende Temperaturanstieg kann häufig auftreten, wenn der C-State des Prozessorkerns aktiviert oder der Turbomodus des Prozessors aufgerufen wird.

Resolution

Obwohl diese Arten von vorübergehenden CPU-Leistungsspitzen nicht ungewöhnlich sind, arbeitet iDRAC9 Engineering weiterhin an der Feinabstimmung des Temperaturalgorithmus, um diese Ereignisse zu verhindern. Beispiel: iDRAC9 4.22.00.00 und iDRAC9 4.40.00.00 enthalten thermische Verbesserungen speziell für diese Sequenz. Um sicherzustellen, dass die neuesten dynamischen thermischen Algorithmen auf PowerEdge-Servern installiert sind, aktualisieren Sie auf die neueste verfügbare iDRAC9-Firmware.

Problemumgehungen:

EndnutzerInnen können die Systemtemperatur manuell ändern, um zu verhindern, dass diese vorübergehenden Ereignisse die CPU-Temperatur überhöhen. Verwenden Sie einen der folgenden Workarounds, um die Lüftergeschwindigkeit bei der Baseline zu erhöhen und eine niedrigere CPU-Temperatur aufrechtzuerhalten.

Max. Leistungsprofil

Die Einstellung „Optimierung des thermischen Profils des Systems“ kann auf „Maximale Leistung“ (leistungsoptimiert) geändert werden. Dieses thermische Profil bietet die folgenden Vorteile:

  • Geringere Wahrscheinlichkeit einer Speicher- oder CPU-Drosselung
  • Erhöhte Wahrscheinlichkeit der Aktivierung des Turbo-Modus
  • Im Allgemeinen höhere Lüftergeschwindigkeiten im Leerlauf und bei Spannungsbelastungen

Die Einstellung „Optimierung des thermischen Profils“ kann mithilfe der folgenden Methoden geändert werden:

iDRAC9-Benutzeroberfläche>Konfiguration>Systemeinstellungen>Hardwareeinstellungen>Kühlungskonfiguration

Seite  

racadm set System.ThermalSettings.ThermalProfile

racadm>>racadm set System.ThermalSettings.ThermalProfile 1

[Key=System.Embedded.1#ThermalSettings.1]

Object value modified successfully



Supported Values:

0 - Default Thermal Profile Settings

1 - Maximum Performance

2 - Minimum Power

3 - Sound Cap

Lüftergeschwindigkeits-Offset

Mit dem Lüftergeschwindigkeits-Offset können Sie die Lüftergeschwindigkeit des Systems in vier inkrementellen Schritten erhöhen. Diese Schritte sind gleichmäßig auf die typische Baseline-Geschwindigkeit und die maximale Geschwindigkeit der Serversystemlüfter aufgeteilt. Ein Lüftergeschwindigkeits-Offset führt dazu, dass die Lüftergeschwindigkeit gegenüber der Baseline-Lüftergeschwindigkeit (um den Offset-Wert in %) steigt, die vom thermischen Überwachungsalgorithmus berechnet wird. Mögliche Werte sind:

  • Niedrige Lüftergeschwindigkeit – Bewirkt eine moderate Lüftergeschwindigkeit.
  • Mittlere Lüftergeschwindigkeit – Bewirkt eine mittlere Lüftergeschwindigkeit.
  • Hohe Lüftergeschwindigkeit – Bewirkt eine nahezu volle Lüftergeschwindigkeit.
  • Max. Lüftergeschwindigkeit – Bewirkt volle Lüftergeschwindigkeit.
  • Aus: Der Offset für die Lüftergeschwindigkeit ist auf Aus gesetzt. Dies ist die Standardeinstellung. Wenn diese Option auf „Aus“ gesetzt ist, wird der Prozentsatz nicht angezeigt. Die Standard-Lüftergeschwindigkeit wird ohne Offset angewendet. Umgekehrt führt die maximale Einstellung dazu, dass alle Lüfter mit maximaler Drehzahl laufen.

Der Lüftergeschwindigkeits-Offset kann mithilfe der folgenden Methoden geändert werden:

iDRAC9-Benutzeroberfläche>Konfiguration>Systemeinstellungen>Hardwareeinstellungen>Kühlungskonfiguration

IDRAC-Kühlungskonfiguration Offset für Lüftergeschwindigkeit 

racadm set System.ThermalSettings.FanSpeedOffset



racadm>>racadm set System.ThermalSettings.FanSpeedOffset 2

[Key=System.Embedded.1#ThermalSettings.1]

Object value modified successfully



Supported Values:

0 - Low

1 - High

2 - Medium

3 - Max

255 - Off

Hinweis: Das Erhöhen der Baselines für die Lüftergeschwindigkeit erhöht den Stromverbrauch des Lüfters und erhöht die Lüfterakustik.

Affected Products

iDRAC9, OEMR R440, OEMR R450, OEMR R540, OEMR R550, OEMR R5500, OEMR R640, OEMR XL R640, OEMR R650, OEMR R650xs, OEMR R660, OEMR XL R660, OEMR R660xs, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R750, OEMR R750xa , OEMR R750xs, OEMR R760, OEMR R760xa, OEMR R760XD2, OEMR XL R760, OEMR R760xs, OEMR R840, OEMR R860, OEMR R940, OEMR R940xa, OEMR R960, OEMR T440, OEMR T550, OEMR T560, OEMR T640, OEMR XL T640, OEMR XL R660xs, OEMR XL R760xs, Poweredge C4140, PowerEdge C6420, PowerEdge C6520, PowerEdge C6525, PowerEdge C6615, PowerEdge C6620, PowerEdge FC640, PowerEdge HS5610, PowerEdge HS5620, PowerEdge M640, PowerEdge MX740C, PowerEdge MX750c, PowerEdge MX760c, PowerEdge MX840C, PowerEdge R440, PowerEdge R450, PowerEdge R540, PowerEdge R550, PowerEdge R640, PowerEdge R650, PowerEdge R650xs, PowerEdge R660, PowerEdge R660xs, PowerEdge R740, PowerEdge R740XD, PowerEdge R740XD2, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R760, PowerEdge R760XA, PowerEdge R760xd2, PowerEdge R760xs, PowerEdge R840, PowerEdge R860, PowerEdge R940, PowerEdge R940xa, PowerEdge R960, PowerEdge T440, PowerEdge T550, PowerEdge T560, PowerEdge T640, PowerEdge XE7420, PowerEdge XE7440, PowerEdge XE8640, PowerEdge XE9640, PowerEdge XE9680, PowerEdge XE9680L, PowerFlex appliance R650, PowerFlex appliance R660, Powerflex appliance R750, PowerFlex appliance R760, PowerFlex appliance R7625, PowerFlex custom node R650, PowerFlex custom node R660, PowerFlex custom node R750, PowerFlex custom node R760, PowerFlex custom node R860, VxFlex Ready Node R640, VxFlex Ready Node R740xd, Dell EMC vSAN MX740c Ready Node, Dell EMC vSAN MX750c Ready Node, Dell vSAN Ready Node MX760c, Dell EMC vSAN R440 Ready Node, Dell EMC vSAN R640 Ready Node, Dell EMC vSAN R650 Ready Node, vSAN Ready Node R660, Dell EMC vSAN R740 Ready Node, Dell EMC vSAN R740xd Ready Node, Dell EMC vSAN R750 Ready Node, Dell EMC vSAN R760 Ready Node, Dell EMC vSAN R840 Ready Node, PowerFlex appliance R640, PowerFlex appliance R740XD, VxFlex Ready Node R840 ...
Article Properties
Article Number: 000123186
Article Type: Solution
Last Modified: 20 Aug 2025
Version:  13
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.