PowerEdge: TMP0203: Událost „CPU temperature is greater than the upper critical threshold“
Summary: Servery PowerEdge s řadičem iDRAC9 mohou hlásit, že teplota procesoru x je vyšší než horní kritická prahová hodnota, když pracovní zatížení procesoru na úrovni PowerMax nebo blízko ní vzroste. ...
Symptoms
Servery PowerEdge s řadičem iDRAC9 mohou hlásit, že teplota procesoru x je vyšší než horní kritická prahová hodnota, když pracovní zatížení procesoru dosáhne maximální úrovně výkonu procesoru nebo blízko ní. Pokud dojde k přechodným výpadkům napájení, aby se vyhovělo dalším požadavkům na procesor, může teplota procesoru krátce překročit horní kritickou prahovou hodnotu. Například server, který pracuje s 50–60% využitím a špičkami na 100% využití po dobu 5–20 s může krátce překročit horní kritickou prahovou hodnotu teploty procesoru. Při překročení této prahové hodnoty se události zaznamenávají do protokolu systémových událostí a protokolu životního cyklu. Když přechodová špička ve špičce skončí a teplota procesoru se vrátí k normálu, zaznamená se událost oznamující, že teplota CPU x je v rozmezí.
Když dojde k přechodným špičkám, jako je tato, tyto dvě události se obvykle vyskytují do 5 až 20 s od sebe. Podívejte se na níže uvedené příklady, které slouží jako vodítko pro tyto typy přechodných událostí.
Protokol systémových událostí:
2020-04-09 11:14:11 85 CPU 2 temperature is within range.
2020-04-09 11:14:06 84 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 09:16:31 83 CPU 2 temperature is within range.
2020-04-09 09:16:16 82 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 08:58:33 81 CPU 2 temperature is within range.
2020-04-09 08:58:17 80 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 08:25:47 79 CPU 2 temperature is within range.
2020-04-09 08:25:27 78 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 06:57:02 77 CPU 2 temperature is within range.
2020-04-09 06:56:57 76 CPU 2 temperature is greater than the upper critical threshold.
Protokol LifeCycle:
2020-04-09 00:44:15 7851 TMP0205 CPU 2 temperature is within range.
2020-04-09 00:44:07 7850 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 22:46:31 7773 TMP0205 CPU 2 temperature is within range.
2020-04-08 22:46:18 7772 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 22:28:34 7769 TMP0205 CPU 2 temperature is within range.
2020-04-08 22:28:18 7768 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 21:55:49 7736 TMP0205 CPU 2 temperature is within range.
2020-04-08 21:55:29 7735 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 20:27:03 7697 TMP0205 CPU 2 temperature is within range.
2020-04-08 20:26:58 7696 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
Pokud jsou dosaženy tyto teplotní prahové hodnoty, procesory Intel mohou omezit výkon za účelem snížení spotřeby energie a teploty procesoru.
Cause
Resolution
I když tyto typy přechodných výkyvů výkonu procesoru nejsou neobvyklé, technický tým řadiče iDRAC9 nadále dolaďuje tepelný algoritmus, aby k těmto událostem nedocházelo. Například řadiče iDRAC9 4.22.00.00 a iDRAC9 4.40.00.00 obsahují vylepšení chlazení specifická pro tuto sekvenci. Chcete-li mít jistotu, že jsou na serverech PowerEdge nainstalovány nejnovější dynamické algoritmy chlazení, proveďte aktualizaci na nejnovější dostupný firmware řadiče iDRAC9.
Zástupná řešení:
Koncoví uživatelé mohou ručně upravit teplotu systému, aby zabránili těmto přechodným událostem ve zvyšování teploty procesoru. Pomocí některého z následujících zástupných řešení můžete zvýšit základní otáčky ventilátoru a zachovat nižší teplotu procesoru.
Profil maximálního výkonu
Optimalizaci teplotního profilu systému lze nastavit na maximální výkon (Performance Optimized). Tento teplotní profil přináší následující výhody:
- Snížená pravděpodobnost omezování paměti nebo procesoru
- Zvýšená pravděpodobnost aktivace turbo režimu
- Obecně platí, že vyšší otáčky ventilátoru při volnoběhu a zátěži při namáhání
Optimalizaci teplotního profilu lze upravit následujícími metodami:
Uživatelské rozhraní >řadiče iDRAC9Konfigurace>Nastavení> systému Nastavení> hardwaru Konfigurace chlazení
racadm set System.ThermalSettings.ThermalProfile
racadm>>racadm set System.ThermalSettings.ThermalProfile 1
[Key=System.Embedded.1#ThermalSettings.1]
Object value modified successfully
Supported Values:
0 - Default Thermal Profile Settings
1 - Maximum Performance
2 - Minimum Power
3 - Sound Cap
Odchylka otáček ventilátoru
Odchylka otáček ventilátoru umožňuje zvýšit otáčky ventilátoru systému pomocí čtyř přírůstkových kroků. Tyto kroky jsou rovnoměrně rozděleny mezi typickou základní rychlost a maximální rychlost ventilátorů serverového systému. Odchylka otáček ventilátoru způsobí zvýšení otáček (o procentuální hodnotu odchylky) oproti základním otáčkám vypočteným algoritmem řízení teploty. Mezi možné hodnoty patří:
- Nízké otáčky ventilátoru – řídí rychlost ventilátoru na střední úroveň.
- Střední rychlost ventilátoru – rychlost ventilátoru se blíží střední.
- Vysoká rychlost ventilátoru – rychlost ventilátoru se blíží plné rychlosti.
- Maximální rychlost ventilátoru – Nastaví otáčky ventilátoru na maximální otáčky.
- Vypnuto – odchylka otáček ventilátoru je nastavena na vypnuto. Jedná se o výchozí hodnotu. Pokud je odchylka vypnutá, nezobrazí se procentuální hodnota. Výchozí otáčky ventilátoru nemají žádnou odchylku. Naopak maximální nastavení způsobí, že všechny ventilátory poběží na maximální otáčky.
Odchylku otáček ventilátoru lze upravit následujícími způsoby:
Uživatelské rozhraní >řadiče iDRAC9Konfigurace>Nastavení> systému Nastavení> hardwaru Konfigurace chlazení
racadm set System.ThermalSettings.FanSpeedOffset
racadm>>racadm set System.ThermalSettings.FanSpeedOffset 2
[Key=System.Embedded.1#ThermalSettings.1]
Object value modified successfully
Supported Values:
0 - Low
1 - High
2 - Medium
3 - Max
255 - Off
Poznámka: Zvýšení základních otáček ventilátoru zvyšuje spotřebu energie ventilátoru a zvyšuje hlučnost ventilátoru.