PowerEdge: TMP0203: CPU-temperaturen er højere end den øvre kritiske grænse
Summary: PowerEdge-servere med iDRAC9 kan rapportere CPU x-temperaturer, der er højere end hændelser med øvre kritiske grænseværdier, når CPU-workloaden spidser til eller i nærheden af CPU PowerMax. ...
Symptoms
PowerEdge-servere med iDRAC9 kan rapportere CPU x-temperaturer, der er højere end hændelserne i den øvre kritiske grænse, når CPU-workloaden spidser til eller tæt på CPU-strømmaksimum. Når der opstår forbigående strømafbrydelser for at opfylde yderligere CPU-behov, kan processortemperaturen kortvarigt overstige den øvre kritiske grænse. En server, der f.eks. kører med 50-60 % udnyttelse og stiger til 100 % udnyttelse i 5-20 sek., kan kortvarigt overskride den øvre kritiske grænse for CPU-temperaturen. Når denne grænse overskrides, registreres hændelser i systemets hændelseslog og livscykluslog. Når den maksimale forbigående spids er overstået, og CPU-temperaturen vender tilbage til normal, registreres en hændelse, der angiver, at CPU x-temperaturen er inden for rækkevidde.
Når forbigående pigge som denne forekommer, forekommer de to hændelser typisk inden for 5-20 s fra hinanden. Se eksempler nedenfor som vejledning til disse typer af forbigående hændelser.
Systemhændelseslog:
2020-04-09 11:14:11 85 CPU 2 temperature is within range.
2020-04-09 11:14:06 84 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 09:16:31 83 CPU 2 temperature is within range.
2020-04-09 09:16:16 82 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 08:58:33 81 CPU 2 temperature is within range.
2020-04-09 08:58:17 80 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 08:25:47 79 CPU 2 temperature is within range.
2020-04-09 08:25:27 78 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 06:57:02 77 CPU 2 temperature is within range.
2020-04-09 06:56:57 76 CPU 2 temperature is greater than the upper critical threshold.
Livscykluslog:
2020-04-09 00:44:15 7851 TMP0205 CPU 2 temperature is within range.
2020-04-09 00:44:07 7850 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 22:46:31 7773 TMP0205 CPU 2 temperature is within range.
2020-04-08 22:46:18 7772 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 22:28:34 7769 TMP0205 CPU 2 temperature is within range.
2020-04-08 22:28:18 7768 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 21:55:49 7736 TMP0205 CPU 2 temperature is within range.
2020-04-08 21:55:29 7735 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 20:27:03 7697 TMP0205 CPU 2 temperature is within range.
2020-04-08 20:26:58 7696 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
Når disse temperaturtærskler er nået, kan Intel-processorer drosle ned for at reducere strømforbruget og sænke CPU-temperaturen.
Cause
Resolution
Selvom disse typer af forbigående CPU-ydeevnestigninger ikke er unormale, fortsætter iDRAC9 Engineering med at finjustere den termiske algoritme for at forhindre disse hændelser. For eksempel inkluderer iDRAC9 4.22.00.00 og iDRAC9 4.40.00.00 termiske forbedringer, der er specifikke for denne sekvens. For at sikre, at de nyeste dynamiske termiske algoritmer installeres på PowerEdge-servere, skal du opdatere til den nyeste tilgængelige iDRAC9-firmware.
Løsninger:
Slutbrugere kan manuelt ændre systemets termiske egenskaber for at forhindre, at disse forbigående hændelser får CPU-temperaturen til at stige. Brug en af følgende løsninger til at øge blæserhastigheden ved baseline og opretholde en lavere CPU-temperatur.
Maksimal ydeevneprofil
Optimering af systemets termiske profil kan ændres til Maksimal ydeevne (ydeevneoptimeret). Denne termiske profil har følgende fordele:
- Reduceret sandsynlighed for hukommelse eller CPU-begrænsning
- Øget sandsynlighed for aktivering af turbotilstand
- Generelt højere blæserhastigheder ved tomgangs- og belastningsbelastninger
Optimering af termisk profil kan ændres ved hjælp af følgende metoder:
iDRAC9-brugergrænsefladen>Konfiguration>Systemindstillinger>Hardwareindstillinger>Kølekonfiguration
racadm set System.ThermalSettings.ThermalProfile
racadm>>racadm set System.ThermalSettings.ThermalProfile 1
[Key=System.Embedded.1#ThermalSettings.1]
Object value modified successfully
Supported Values:
0 - Default Thermal Profile Settings
1 - Maximum Performance
2 - Minimum Power
3 - Sound Cap
Forskydning af blæserhastighed
Blæserhastighedsforskydning giver dig mulighed for at øge systemets blæserhastighed med fire trinvise trin. Disse trin er ligeligt fordelt mellem den typiske basishastighed og den maksimale hastighed for serversystemblæserne. En blæserhastighedsforskydning får blæserhastighederne til at stige (med forskydningsprocentværdien) i forhold til basisblæserhastighederne beregnet af den termiske styringsalgoritme. Mulige værdier er:
- Lav blæserhastighed – Driver blæserhastigheden til en moderat blæserhastighed.
- Medium blæserhastighed – Drev blæserhastigheder tæt på medium.
- Høj blæserhastighed – Driver blæserhastigheder tæt på fuld hastighed.
- Maks. blæserhastighed – Driver blæserhastighederne til fuld hastighed.
- Slukket – Blæserhastighedsforskydningen er indstillet til Fra. Dette er standardværdien. Når den er indstillet til off, vises procentdelen ikke. Standardblæserhastigheden anvendes uden forskydning. Omvendt resulterer den maksimale indstilling i, at alle blæsere kører med maksimal hastighed.
Blæserhastighedsforskydningen kan ændres på følgende måder:
iDRAC9-brugergrænsefladen>Konfiguration>Systemindstillinger>Hardwareindstillinger>Kølekonfiguration
racadm set System.ThermalSettings.FanSpeedOffset
racadm>>racadm set System.ThermalSettings.FanSpeedOffset 2
[Key=System.Embedded.1#ThermalSettings.1]
Object value modified successfully
Supported Values:
0 - Low
1 - High
2 - Medium
3 - Max
255 - Off
Bemærk: Højere blæserhastighedsbasislinjer øger blæserens strømforbrug og øger blæserakustikken.