PowerEdge : TMP0203 : La température du processeur est supérieure au seuil supérieur critique
Summary: Les serveurs PowerEdge avec iDRAC9 peuvent signaler des événements de température du processeur x supérieure au seuil critique supérieur lorsque la charge applicative du processeur atteint des pics au niveau ou à proximité du processeur PowerMax. ...
Symptoms
Les serveurs PowerEdge avec iDRAC9 peuvent signaler une température du processeur x supérieure au seuil critique supérieur lorsque la charge applicative du processeur atteint ou est proche de la puissance maximale du processeur. Lorsque des pics de puissance transitoires se produisent pour répondre à une demande supplémentaire du processeur, la température du processeur peut brièvement dépasser le seuil critique supérieur. Par exemple, un serveur qui fonctionne à 50-60 % d’utilisation et qui atteint des pics d’utilisation de 100 % pendant 5 à 20 secondes peut dépasser brièvement le seuil critique supérieur de température du processeur. Lorsque ce seuil est dépassé, les événements sont enregistrés dans le journal des événements système et le journal Lifecycle. Lorsque le pic transitoire optimal est passé et que la température du processeur revient à la normale, un événement est enregistré indiquant que la température du processeur x est dans la plage.
Lorsque des pics transitoires comme celui-ci se produisent, les deux événements se produisent généralement à 5-20 secondes d’intervalle. Reportez-vous aux exemples ci-dessous pour obtenir des conseils sur ces types d’événements transitoires.
Journal des événements système :
2020-04-09 11:14:11 85 CPU 2 temperature is within range.
2020-04-09 11:14:06 84 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 09:16:31 83 CPU 2 temperature is within range.
2020-04-09 09:16:16 82 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 08:58:33 81 CPU 2 temperature is within range.
2020-04-09 08:58:17 80 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 08:25:47 79 CPU 2 temperature is within range.
2020-04-09 08:25:27 78 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 06:57:02 77 CPU 2 temperature is within range.
2020-04-09 06:56:57 76 CPU 2 temperature is greater than the upper critical threshold.
Journal du cycle de vie :
2020-04-09 00:44:15 7851 TMP0205 CPU 2 temperature is within range.
2020-04-09 00:44:07 7850 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 22:46:31 7773 TMP0205 CPU 2 temperature is within range.
2020-04-08 22:46:18 7772 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 22:28:34 7769 TMP0205 CPU 2 temperature is within range.
2020-04-08 22:28:18 7768 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 21:55:49 7736 TMP0205 CPU 2 temperature is within range.
2020-04-08 21:55:29 7735 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 20:27:03 7697 TMP0205 CPU 2 temperature is within range.
2020-04-08 20:26:58 7696 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
Lorsque ces seuils de température sont atteints, les processeurs Intel peuvent réguler pour réduire la consommation électrique et la température du processeur.
Cause
Resolution
Bien que ces types de pics de performances transitoires du processeur ne soient pas anormaux, l’équipe d’ingénierie iDRAC9 continue d’affiner l’algorithme thermique pour éviter ces événements. Par exemple, iDRAC9 4.22.00.00 et iDRAC9 4.40.00.00 incluent des améliorations thermiques spécifiques à cette séquence. Pour vous assurer que les algorithmes thermiques dynamiques les plus récents sont installés sur les serveurs PowerEdge, effectuez une mise à jour vers la dernière version du firmware iDRAC9 disponible.
Solutions de contournement :
Les utilisateurs finaux peuvent modifier manuellement les paramètres thermiques du système afin d'éviter que ces événements transitoires ne s'appliquent à la température du processeur. Utilisez l’une des solutions de contournement suivantes pour augmenter la vitesse du ventilateur au départ et maintenir une température du processeur plus basse.
Profil de performances maximales
L'optimisation du profil thermique du système peut être modifiée en performances maximales (performances optimisées). Ce profil thermique présente les avantages suivants :
- Réduction de la probabilité de limitation de la mémoire ou du processeur
- Augmentation de la probabilité d’activation du mode turbo
- En règle générale, des vitesses de ventilateur plus élevées à l’état de charges inactif et de contrainte
L'optimisation du profil thermique peut être modifiée à l'aide des méthodes suivantes :
Interface utilisateur >iDRAC9Configuration>Paramètres> système Paramètres matériels>Configuration du refroidissement
racadm set System.ThermalSettings.ThermalProfile
racadm>>racadm set System.ThermalSettings.ThermalProfile 1
[Key=System.Embedded.1#ThermalSettings.1]
Object value modified successfully
Supported Values:
0 - Default Thermal Profile Settings
1 - Maximum Performance
2 - Minimum Power
3 - Sound Cap
Décalage de vitesse du ventilateur
Le décalage de vitesse du ventilateur vous permet d'augmenter la vitesse du ventilateur du système en quatre étapes incrémentielles. Ces étapes sont réparties de manière égale entre la vitesse de base standard et la vitesse maximale des ventilateurs du système de serveur. Un décalage de la vitesse du ventilateur entraîne une augmentation de la vitesse des ventilateurs (par la valeur de décalage en %) par rapport aux vitesses de base des ventilateurs calculées par l'algorithme de régulation thermique. Les valeurs possibles sont les suivantes :
- Faible vitesse du ventilateur : ramène la vitesse des ventilateurs à une vitesse de ventilation modérée.
- Vitesse de ventilateur moyenne : ramène la vitesse des ventilateurs à une vitesse moyenne.
- Vitesse de ventilateur élevée : ramène la vitesse des ventilateurs à une vitesse de ventilation maximale.
- Vitesse maximale du ventilateur : ramène la vitesse des ventilateurs à la vitesse maximale.
- Désactivé : le décalage de la vitesse du ventilateur est défini sur Désactivé. Il s’agit de la valeur par défaut. Lorsque cette option est désactivée, le pourcentage ne s'affiche pas. La vitesse du ventilateur par défaut est appliquée sans décalage. À l’inverse, le réglage maximal entraîne le fonctionnement de tous les ventilateurs à la vitesse maximale.
Le décalage de vitesse du ventilateur peut être modifié à l'aide des méthodes suivantes :
Interface utilisateur >iDRAC9Configuration>Paramètres> système Paramètres matériels>Configuration du refroidissement
racadm set System.ThermalSettings.FanSpeedOffset
racadm>>racadm set System.ThermalSettings.FanSpeedOffset 2
[Key=System.Embedded.1#ThermalSettings.1]
Object value modified successfully
Supported Values:
0 - Low
1 - High
2 - Medium
3 - Max
255 - Off
Remarque : L’augmentation des valeurs de référence de vitesse des ventilateurs augmente la consommation électrique des ventilateurs et augmente le bruit des ventilateurs.