PowerEdge: TMP0203: CPU temperature is greater than the upper critical threshold
Summary: I server PowerEdge con iDRAC9 possono segnalare una temperatura della CPU x superiore agli eventi della soglia critica superiore quando il carico di lavoro della CPU raggiunge o si avvicina a CPU PowerMax. ...
Symptoms
I server PowerEdge con iDRAC9 possono segnalare una temperatura della CPU x superiore agli eventi della soglia critica superiore quando il carico di lavoro della CPU raggiunge o si avvicina alla potenza massima della CPU. Quando si verificano burst di alimentazione transitori per soddisfare la domanda aggiuntiva della CPU, la temperatura del processore può superare brevemente la soglia critica superiore. Ad esempio, un server che opera al 50-60% di utilizzo e raggiunge il 100% di utilizzo per 5-20 secondi può superare brevemente la soglia critica superiore per la temperatura della CPU. Quando questa soglia viene superata, gli eventi vengono registrati nel registro eventi di sistema e nel registro del ciclo di vita. Quando il picco transitorio di picco è terminato e la temperatura della CPU torna alla normalità, viene registrato un evento che indica che la temperatura della CPU x rientra nell'intervallo.
Quando si verificano picchi transitori come questo, i due eventi si verificano in genere entro 5-20 secondi l'uno dall'altro. Vedere gli esempi riportati di seguito come linee guida per questi tipi di eventi temporanei.
Registro eventi di sistema:
2020-04-09 11:14:11 85 CPU 2 temperature is within range.
2020-04-09 11:14:06 84 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 09:16:31 83 CPU 2 temperature is within range.
2020-04-09 09:16:16 82 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 08:58:33 81 CPU 2 temperature is within range.
2020-04-09 08:58:17 80 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 08:25:47 79 CPU 2 temperature is within range.
2020-04-09 08:25:27 78 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 06:57:02 77 CPU 2 temperature is within range.
2020-04-09 06:56:57 76 CPU 2 temperature is greater than the upper critical threshold.
Registro del ciclo di vita:
2020-04-09 00:44:15 7851 TMP0205 CPU 2 temperature is within range.
2020-04-09 00:44:07 7850 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 22:46:31 7773 TMP0205 CPU 2 temperature is within range.
2020-04-08 22:46:18 7772 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 22:28:34 7769 TMP0205 CPU 2 temperature is within range.
2020-04-08 22:28:18 7768 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 21:55:49 7736 TMP0205 CPU 2 temperature is within range.
2020-04-08 21:55:29 7735 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 20:27:03 7697 TMP0205 CPU 2 temperature is within range.
2020-04-08 20:26:58 7696 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
Quando vengono raggiunte queste soglie di temperatura, i processori Intel potrebbero rallentare la velocità per ridurre il consumo energetico e la temperatura della CPU.
Cause
Resolution
Sebbene questi tipi di picchi temporanei delle prestazioni della CPU non siano anomali, iDRAC9 Engineering continua a perfezionare l'algoritmo termico per evitare questi eventi. Ad esempio, iDRAC9 4.22.00.00 e iDRAC9 4.40.00.00 includono miglioramenti termici specifici per questa sequenza. Per garantire che i più recenti algoritmi termici dinamici siano installati sui server PowerEdge, eseguire l'aggiornamento al firmware iDRAC9 più recente disponibile.
Soluzioni alternative:
Gli utenti finali possono modificare manualmente le condizioni termiche del sistema per evitare che questi eventi temporanei determinino un picco della temperatura della CPU. Utilizzare una delle seguenti soluzioni alternative per aumentare la velocità della ventola alla baseline e mantenere una temperatura della CPU più bassa.
Profilo di prestazioni massime
L'ottimizzazione del profilo termico del sistema può essere modificata in Maximum Performance (Performance Optimized). Questo profilo termico presenta i seguenti vantaggi:
- Riduzione della probabilità di limitazione della memoria o della CPU
- Maggiore probabilità di attivazione della modalità turbo
- In genere, velocità della ventola più elevate con carichi inattivi e di stress
L'opzione Thermal Profile Optimization può essere modificata nei seguenti modi:
Interfaccia utente >di iDRAC9Configurazione>Impostazioni> di sistema Impostazioni> hardware Configurazione di raffreddamento
racadm set System.ThermalSettings.ThermalProfile
racadm>>racadm set System.ThermalSettings.ThermalProfile 1
[Key=System.Embedded.1#ThermalSettings.1]
Object value modified successfully
Supported Values:
0 - Default Thermal Profile Settings
1 - Maximum Performance
2 - Minimum Power
3 - Sound Cap
Fan Speed Offset
L'opzione Fan Speed Offset consente di aumentare la velocità della ventola di sistema con quattro passaggi incrementali. Questi passaggi sono suddivisi equamente tra la velocità baseline tipica e la velocità massima delle ventole di sistema del server. Un offset della velocità della ventola accelera la velocità della ventola (del valore percentuale di offset) rispetto alle velocità della ventola baseline calcolate dall'algoritmo di controllo termico. I valori possibili sono:
- Low fan speed: porta la velocità della ventola a una velocità moderata.
- Velocità della ventola media - Consente di aumentare la velocità della ventola quasi media.
- High fan speed - Consente di aumentare la velocità della ventola quasi alla velocità massima.
- Max fan speed: porta la velocità della ventola alla velocità massima.
- Spento: l'offset della velocità della ventola è disattivato. Questo è il valore predefinito. Se è impostata su Off, la percentuale non viene visualizzata. La velocità predefinita della ventola viene applicata senza offset. Al contrario, l'impostazione massima comporta il funzionamento di tutte le ventole alla velocità massima.
L'opzione Fan Speed Offset può essere modificata nei seguenti modi:
Interfaccia utente >di iDRAC9Configurazione>Impostazioni> di sistema Impostazioni> hardware Configurazione di raffreddamento
racadm set System.ThermalSettings.FanSpeedOffset
racadm>>racadm set System.ThermalSettings.FanSpeedOffset 2
[Key=System.Embedded.1#ThermalSettings.1]
Object value modified successfully
Supported Values:
0 - Low
1 - High
2 - Medium
3 - Max
255 - Off
Nota: L'aumento delle linee di base della velocità della ventola aumenta il consumo energetico della ventola e aumenta la sua acustica.