PowerEdge: TMP0203: CPU sıcaklığı üst kritik eşiğin üstünde
Summary: iDRAC9'a sahip PowerEdge sunucuları, CPU iş yükü CPU PowerMax hızında veya yakınında ani bir artış olduğunda üst kritik eşiğin üzerinde CPU x sıcaklığı olayları bildirebilir.
Symptoms
iDRAC9'a sahip PowerEdge sunucuları, CPU iş yükü CPU Power Max'te veya yakınında ani bir artış gösterdiğinde, üst kritik eşiğin üzerinde CPU x sıcaklığı olayları bildirebilir. Ek CPU talebini karşılamak için geçici güç patlamaları meydana geldiğinde, işlemci sıcaklığı kısa bir süreliğine üst kritik eşiği aşabilir. Örneğin, %50-60 kullanımda çalışan ve 5-20 saniye boyunca %100 kullanıma yükselen bir sunucu, kısa süreliğine CPU sıcaklığı için üst kritik eşiği aşabilir. Bu eşik aşıldığında, olaylar Sistem olay günlüğüne ve Yaşam Döngüsü Günlüğüne kaydedilir. En yüksek geçici ani artış sona erdiğinde ve CPU sıcaklığı normale döndüğünde, CPU x sıcaklığının aralık dahilinde olduğunu belirten bir olay kaydedilir.
Bunun gibi geçici ani artışlar meydana geldiğinde, iki olay tipik olarak birbirinden 5-20 s içinde meydana gelir. Bu tür geçici olaylar için rehber olarak aşağıdaki örneklere bakın.
Sistem olay günlüğü:
2020-04-09 11:14:11 85 CPU 2 temperature is within range.
2020-04-09 11:14:06 84 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 09:16:31 83 CPU 2 temperature is within range.
2020-04-09 09:16:16 82 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 08:58:33 81 CPU 2 temperature is within range.
2020-04-09 08:58:17 80 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 08:25:47 79 CPU 2 temperature is within range.
2020-04-09 08:25:27 78 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 06:57:02 77 CPU 2 temperature is within range.
2020-04-09 06:56:57 76 CPU 2 temperature is greater than the upper critical threshold.
Yaşam Döngüsü Günlüğü:
2020-04-09 00:44:15 7851 TMP0205 CPU 2 temperature is within range.
2020-04-09 00:44:07 7850 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 22:46:31 7773 TMP0205 CPU 2 temperature is within range.
2020-04-08 22:46:18 7772 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 22:28:34 7769 TMP0205 CPU 2 temperature is within range.
2020-04-08 22:28:18 7768 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 21:55:49 7736 TMP0205 CPU 2 temperature is within range.
2020-04-08 21:55:29 7735 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 20:27:03 7697 TMP0205 CPU 2 temperature is within range.
2020-04-08 20:26:58 7696 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
Bu sıcaklık eşikleri karşılandığında, Intel işlemciler güç tüketimini azaltmak ve CPU sıcaklığını düşürmek için kısıtlanabilir.
Cause
Resolution
Bu tür geçici CPU performans artışları anormal olmasa da iDRAC9 Mühendislik Ekibi, bu olayları önlemek için termal algoritmada ince ayar yapmaya devam etmektedir. Örneğin, iDRAC9 4.22.00.00 ve iDRAC9 4.40.00.00, bu diziye özel termal iyileştirmeler içerir. PowerEdge sunucularında en yeni dinamik termal algoritmaların kurulu olduğundan emin olmak için mevcut en güncel iDRAC9 bellenimine güncelleştirin.
Geçici çözümler:
Son kullanıcılar, bu geçici olayların CPU sıcaklığını yükseltmesini önlemek için sistem termallerini manuel olarak değiştirebilir. Başlangıçta fan hızını artırmak ve daha düşük CPU sıcaklığını korumak için aşağıdaki geçici çözümlerden birini kullanın.
Max Performance Profile (Maks. Performans Profili)
Sistem Termal Profili Optimizasyonu, Maximum Performance (Performance Optimized) [Maksimum Performans (Performansa Göre Optimize Edilmiş)] olarak değiştirilebilir. Bu termal profil aşağıdaki avantajları sağlar:
- Daha düşük bellek veya CPU kısıtlaması olasılığı
- Daha yüksek turbo modu etkinleştirme olasılığı
- Genel olarak, boşta ve stres yüklerinde daha yüksek fan hızları
Thermal Profile Optimization (Termal Profil Optimizasyonu) aşağıdaki yöntemlerle değiştirilebilir:
iDRAC9 Kullanıcı Arayüzü>Konfigürasyon>Sistem Ayarları>Donanım Ayarları>Soğutma Yapılandırması
racadm set System.ThermalSettings.ThermalProfile
racadm>>racadm set System.ThermalSettings.ThermalProfile 1
[Key=System.Embedded.1#ThermalSettings.1]
Object value modified successfully
Supported Values:
0 - Default Thermal Profile Settings
1 - Maximum Performance
2 - Minimum Power
3 - Sound Cap
Fan Speed Offset (Fan Hızı Ofseti)
Fan hızı ofseti, sistem fan hızını dört kademeli adımlarla artırmanıza olanak tanır. Bu adımlar, sunucu sistem fanlarının tipik taban değerindeki hızı ile maksimum hızı arasında eşit olarak bölünebilir. Fan hızı ofseti, Termal Kontrol algoritması tarafından hesaplanan taban fan hızı değeri üzerinden fan hızlarının (% ofset değerine göre) artışına neden olur. Olası değerler şunlardır:
- Düşük fan hızı - Fan hızlarını orta bir fan hızına yükseltir.
- Orta fan hızı - Fan hızlarını orta hıza yaklaştırır.
- Yüksek fan hızı - Fan hızlarını tam hıza yaklaştırır.
- Maksimum fan hızı - Fan hızlarını tam hıza çıkarır.
- Kapalı - Fan hızı ofseti kapalı olarak ayarlıdır. Bu, varsayılan değerdir. Kapalı olarak ayarlandığında yüzde görüntülenmez. Varsayılan fan hızı ofset olmadan uygulanır. Tersi durumda maksimum ayar, tüm fanların maksimum hızda çalışmasına neden olur.
Fan Speed Offset (Fan Hızı Ofseti) aşağıdaki yöntemlerle değiştirilebilir:
iDRAC9 Kullanıcı Arayüzü>Konfigürasyon>Sistem Ayarları>Donanım Ayarları>Soğutma Yapılandırması
racadm set System.ThermalSettings.FanSpeedOffset
racadm>>racadm set System.ThermalSettings.FanSpeedOffset 2
[Key=System.Embedded.1#ThermalSettings.1]
Object value modified successfully
Supported Values:
0 - Low
1 - High
2 - Medium
3 - Max
255 - Off
Not: Artan fan hızı taban değerleri, fan güç tüketimini ve fan seslerini artırır.