PowerEdge: TMP0203: CPU-temperatuur is hoger dan de bovenste kritieke drempelwaarde
Summary: PowerEdge servers met iDRAC9 kunnen een CPU x-temperatuur rapporteren die hoger is dan de bovenste kritieke drempelwaarde wanneer de CPU-workload piekt op of nabij CPU PowerMax.
Symptoms
PowerEdge servers met iDRAC9 kunnen een CPU x-temperatuur rapporteren die hoger is dan de bovenste kritieke drempelwaarde wanneer de CPU-workload piekt op of nabij CPU Power Max. Wanneer tijdelijke stroomonderbrekingen optreden om aan de extra CPU-vraag te voldoen, kan de processortemperatuur kortstondig de bovenste kritieke drempelwaarde overschrijden. Een server met een gebruikspercentage van 50-60% en een piek naar 100% van het gebruik gedurende 5-20 seconden kan de bovenste kritieke drempelwaarde voor CPU-temperatuur kortstondig overschrijden. Wanneer deze drempelwaarde wordt overschreden, worden gebeurtenissen vastgelegd in het systeemgebeurtenislogboek en het levenscycluslogboek. Wanneer de piek van de tijdelijke piekpiek voorbij is en de CPU-temperatuur weer normaal is, wordt er een gebeurtenis geregistreerd die aangeeft dat de CPU x temperatuur binnen het bereik ligt.
Wanneer tijdelijke pieken zoals deze optreden, vinden de twee gebeurtenissen meestal plaats binnen 5-20 seconden van elkaar. Zie onderstaande voorbeelden als richtlijn voor dit soort tijdelijke gebeurtenissen.
Systeemgebeurtenislogboek:
2020-04-09 11:14:11 85 CPU 2 temperature is within range.
2020-04-09 11:14:06 84 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 09:16:31 83 CPU 2 temperature is within range.
2020-04-09 09:16:16 82 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 08:58:33 81 CPU 2 temperature is within range.
2020-04-09 08:58:17 80 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 08:25:47 79 CPU 2 temperature is within range.
2020-04-09 08:25:27 78 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 06:57:02 77 CPU 2 temperature is within range.
2020-04-09 06:56:57 76 CPU 2 temperature is greater than the upper critical threshold.
Logboek levenscyclus:
2020-04-09 00:44:15 7851 TMP0205 CPU 2 temperature is within range.
2020-04-09 00:44:07 7850 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 22:46:31 7773 TMP0205 CPU 2 temperature is within range.
2020-04-08 22:46:18 7772 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 22:28:34 7769 TMP0205 CPU 2 temperature is within range.
2020-04-08 22:28:18 7768 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 21:55:49 7736 TMP0205 CPU 2 temperature is within range.
2020-04-08 21:55:29 7735 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 20:27:03 7697 TMP0205 CPU 2 temperature is within range.
2020-04-08 20:26:58 7696 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
Wanneer aan deze temperatuurdrempels wordt voldaan, kunnen Intel-processors terugschakelen om het energieverbruik te verminderen en de CPU-temperatuur te verlagen.
Cause
Resolution
Hoewel dit soort tijdelijke CPU-prestatiepieken niet abnormaal zijn, blijft iDRAC9 Engineering het thermische algoritme verfijnen om deze gebeurtenissen te voorkomen. iDRAC9 4.22.00.00 en iDRAC9 4.40.00.00 bevatten bijvoorbeeld thermische verbeteringen die specifiek zijn voor deze reeks. Om ervoor te zorgen dat de nieuwste dynamische thermische algoritmen op PowerEdge servers zijn geïnstalleerd, moet u bijwerken naar de nieuwste beschikbare iDRAC9-firmware.
Tijdelijke oplossingen:
Eindgebruikers kunnen de temperatuurregeling van het systeem handmatig aanpassen om te voorkomen dat deze tijdelijke gebeurtenissen de CPU-temperatuur doen stijgen. Gebruik een van de volgende tijdelijke oplossingen om de ventilatorsnelheid bij de basislijn te verhogen en de CPU-temperatuur lager te houden.
Maximaal prestatieprofiel
Optimalisatie van thermisch profiel van systeem kan worden gewijzigd in Maximale prestaties (geoptimaliseerd voor prestaties). Dit thermische profiel heeft de volgende voordelen:
- Verminderde kans op geheugen- of CPU-beperkingen
- Grotere kans dat de turbomodus wordt geactiveerd
- Over het algemeen hogere ventilatorsnelheden bij stationair draaien en stressbelasting
Optimalisatie van thermisch profiel kan op de volgende manieren worden aangepast:
iDRAC9 UI>Configuratie>Systeeminstellingen>Hardware-instellingen>Koelconfiguratie
racadm set System.ThermalSettings.ThermalProfile
racadm>>racadm set System.ThermalSettings.ThermalProfile 1
[Key=System.Embedded.1#ThermalSettings.1]
Object value modified successfully
Supported Values:
0 - Default Thermal Profile Settings
1 - Maximum Performance
2 - Minimum Power
3 - Sound Cap
Offset ventilatorsnelheid
Met offset van de ventilatorsnelheid kunt u de snelheid van de systeemventilator in vier stappen verhogen. Deze stappen zijn gelijkmatig verdeeld over de standaardsnelheid en de maximumsnelheid van de ventilatoren van het serversysteem. Een offset van de ventilatorsnelheid zorgt ervoor dat de ventilatorsnelheden toenemen (met de offset % waarde) ten opzichte van de basisventilatorsnelheden die zijn berekend door het algoritme voor temperatuurregeling. Mogelijke waarden zijn:
- Lage ventilatorsnelheid: brengt de ventilatorsnelheden op een gematigde ventilatorsnelheid.
- Gemiddelde ventilatorsnelheid: hiermee wordt de snelheid van de ventilator bijna gemiddeld.
- Hoge ventilatorsnelheid: zorgt voor ventilatorsnelheden die dicht bij de maximale snelheid komen.
- Maximale ventilatorsnelheid: hiermee worden de ventilatorsnelheden op volle snelheid gebracht.
- Uit - Offset ventilatorsnelheid is ingesteld op Uit. Dit is de standaardwaarde. Als deze functie is uitgeschakeld, wordt het percentage niet weergegeven. De standaardventilatorsnelheid wordt toegepast zonder offset. Omgekeerd zorgt de maximale instelling ervoor dat alle ventilatoren op maximale snelheid draaien.
Offset ventilatorsnelheid kan op de volgende manieren worden aangepast:
iDRAC9 UI>Configuratie>Systeeminstellingen>Hardware-instellingen>Koelconfiguratie
racadm set System.ThermalSettings.FanSpeedOffset
racadm>>racadm set System.ThermalSettings.FanSpeedOffset 2
[Key=System.Embedded.1#ThermalSettings.1]
Object value modified successfully
Supported Values:
0 - Low
1 - High
2 - Medium
3 - Max
255 - Off
Opmerking: Door de basislijnen van de ventilatorsnelheid te verhogen, verhoogt u het energieverbruik van de ventilator en verhoogt u de akoestiek van de ventilator.