PowerEdge: TMP0203: CPU-temperaturen er større enn den øvre kritiske terskelen
Summary: PowerEdge-servere med iDRAC9 kan rapportere CPU x temperatur som er større enn de øvre kritiske terskelhendelsene når CPU-workloaden øker på eller nær CPU PowerMax.
Symptoms
PowerEdge-servere med iDRAC9 kan rapportere CPU x temperatur som er større enn de øvre kritiske terskelhendelsene når CPU-workloaden øker ved eller nær CPU Power Max. Når det oppstår forbigående strømbrudd for å dekke ytterligere CPU-behov, kan prosessortemperaturen en kort stund overskride den øvre kritiske terskelen. For eksempel kan en server som opererer ved 50–60 % utnyttelse og topper til 100 % utnyttelse i 5–20 sekunder, overskride den øvre kritiske terskelen for CPU-temperatur en kort stund. Når denne terskelen overskrides, registreres hendelser i systemhendelsesloggen og livssyklusloggen. Når den forbigående topptoppen er over og CPU-temperaturen går tilbake til normal, registreres en hendelse som indikerer at CPU x-temperaturen er innenfor rekkevidde.
Når forbigående pigger som dette oppstår, oppstår de to hendelsene vanligvis innen 5-20 s fra hverandre. Se eksempler nedenfor som veiledning for denne typen forbigående hendelser.
Systemhendelseslogg:
2020-04-09 11:14:11 85 CPU 2 temperature is within range.
2020-04-09 11:14:06 84 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 09:16:31 83 CPU 2 temperature is within range.
2020-04-09 09:16:16 82 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 08:58:33 81 CPU 2 temperature is within range.
2020-04-09 08:58:17 80 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 08:25:47 79 CPU 2 temperature is within range.
2020-04-09 08:25:27 78 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 06:57:02 77 CPU 2 temperature is within range.
2020-04-09 06:56:57 76 CPU 2 temperature is greater than the upper critical threshold.
Livssykluslogg:
2020-04-09 00:44:15 7851 TMP0205 CPU 2 temperature is within range.
2020-04-09 00:44:07 7850 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 22:46:31 7773 TMP0205 CPU 2 temperature is within range.
2020-04-08 22:46:18 7772 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 22:28:34 7769 TMP0205 CPU 2 temperature is within range.
2020-04-08 22:28:18 7768 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 21:55:49 7736 TMP0205 CPU 2 temperature is within range.
2020-04-08 21:55:29 7735 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 20:27:03 7697 TMP0205 CPU 2 temperature is within range.
2020-04-08 20:26:58 7696 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
Når disse temperaturtersklene er nådd, kan Intel-prosessorer strupe for å redusere strømforbruket og senke CPU-temperaturen.
Cause
Resolution
Selv om disse typene forbigående topper i CPU-ytelsen ikke er unormale, fortsetter iDRAC9 Engineering å finjustere varmealgoritmen for å forhindre slike hendelser. For eksempel inkluderer iDRAC9 4.22.00.00 og iDRAC9 4.40.00.00 varmeforbedringer som er spesifikke for denne sekvensen. For å sikre at de nyeste dynamiske varmealgoritmene er installert på PowerEdge-servere, må du oppdatere til den nyeste tilgjengelige iDRAC9-fastvaren.
Midlertidige løsninger:
Sluttbrukere kan manuelt endre systemvarmen for å forhindre at disse forbigående hendelsene øker CPU-temperaturen. Bruk en av de følgende midlertidige løsningene for å øke viftehastigheten ved grunnlinjen og opprettholde lavere CPU-temperatur.
Maks. ytelsesprofil
Optimalisering av varmeprofilen for systemet kan endres til maksimal ytelse (optimalisert for ytelse). Denne termiske profilen har følgende fordeler:
- Redusert sannsynlighet for minne- eller CPU-begrensning
- Økt sannsynlighet for turbomodusaktivering
- Generelt høyere viftehastigheter ved tomgang og belastning
Optimalisering av varmeprofil kan endres på følgende måter:
iDRAC9-brukergrensesnitt>Konfigurasjon>Systeminnstillinger>Maskinvareinnstillinger>Kjølekonfigurasjon
racadm set System.ThermalSettings.ThermalProfile
racadm>>racadm set System.ThermalSettings.ThermalProfile 1
[Key=System.Embedded.1#ThermalSettings.1]
Object value modified successfully
Supported Values:
0 - Default Thermal Profile Settings
1 - Maximum Performance
2 - Minimum Power
3 - Sound Cap
Forskyvning av viftehastighet
Forskyvning av viftehastighet gjør det mulig å øke systemviftehastigheten med fire trinnvise trinn. Disse trinnene er likt delt mellom den vanlige basishastigheten og den maksimale hastigheten til serversystemviftene. Forskyvning av viftehastighet fører til at viftehastighetene øker (med den prosentvise forskyvningen) i forhold til viftehastigheter som beregnes av varmekontrollalgoritmen. Mulige verdier er:
- Lav viftehastighet – driver viftehastigheten til moderat viftehastighet.
- Middels viftehastighet – driver viftehastigheter nær middels.
- Høy viftehastighet – driver viftehastigheter nær full hastighet.
- Maks. viftehastighet – fører til full hastighet for viftehastigheten.
- Av – Forskyvning av viftehastighet er angitt til av. Dette er standardverdien. Når prosentandelen er angitt til av, vises den ikke. Standard viftehastighet aktiveres uten forskyvning. Omvendt vil den maksimale innstillingen resultere i at alle viftene kjører med maksimal hastighet.
Forskyvning av viftehastighet kan endres på følgende måter:
iDRAC9-brukergrensesnitt>Konfigurasjon>Systeminnstillinger>Maskinvareinnstillinger>Kjølekonfigurasjon
racadm set System.ThermalSettings.FanSpeedOffset
racadm>>racadm set System.ThermalSettings.FanSpeedOffset 2
[Key=System.Embedded.1#ThermalSettings.1]
Object value modified successfully
Supported Values:
0 - Low
1 - High
2 - Medium
3 - Max
255 - Off
Merk: Økende grunnlinjer for viftehastighet øker strømforbruket til viften og øker vifteakustikken.