VxRail: Düğüm yüksek giriş sıcaklığı uyarısını tetikler
Summary: VxRail düğümü yüksek Giriş sıcaklığı uyarıları bildiriyor. Bu genellikle klima sorunu gibi bir ortam faktöründen kaynaklanmaktadır.
Symptoms
VxRail düğümü, yaşam döngüsü denetleyicisinde şu uyarıları tetikler:
2024-06-03 02:18:00 2586 TMPS0103 Inlet temperature is above critical level for extended duration.
2024-05-07 08:41:37 355 TMP0121 The system inlet temperature is greater than the upper critical threshold.
Olay günlüğü eşleşen olay girişlerini oluşturur:
2024-05-07 04:49:36 7 The system inlet temperature is within range.
2024-05-07 04:47:19 6 The system inlet temperature is greater than the upper warning threshold.
2024-05-06 19:41:37 5 The system inlet temperature is greater than the upper critical threshold.
2024-05-06 19:12:49 4 The system inlet temperature is greater than the upper warning threshold.
Sunucu kritik olay altındaysa otomatik olarak indirgenmiş modda çalışır. Durum uzun sürerse kapanır.
Bu ekran görüntüsünde iDRAC günlüğü, uyarı ve kritik eşikleriyle birlikte CPU veya sistem kartındaki sıcaklığı okur. 38 uyarı ve 42 kritik olarak.
Cause
Bunun nedeni, havalandırmanın iyi olmadığı çevresel durumdur. Bu, VxRail düğümünün yüksek sıcaklık üretmesine neden olur. Fan modülü dahili bileşen sıcaklığını soğutmak için hızı ayarlayamadığında termal olay, sunucunun düşük performanslı modda çalışmasına neden olur ve donanım hasarını önlemek için sunucuyu kapatır. Bu işlem, iDRAC'taki sıcaklık uyarısı ayarının ayarına bağlıdır.
Giriş yüksek sıcaklığı: Sıcaklık uyarısı ayarlanmamışsa uzun bir süre 42 derece ve üzerine çıktığında önce düşük performanslı modda çalışır ve sunucuyu soğutmak için fan modülünü kullanmaya çalışır. Uzun bir süre sonra sunucuyu kapatır.
Resolution
- VxRail düğümleri, fan modülü ve uyarı ve kritik tanım eşikleriyle kötü çevresel durumla başa çıkmak için dahili bir mekanizmaya sahiptir. Kritik durumla karşılaştıktan sonra yukarıda belirtildiği gibi:
A. IDRAC-configuration-system>> settings-alert configuration-alerts-alert>>> configuration altında> sıcaklığı genişletin. İlk kritik hat Güç kapalıyken ise kritik sıcaklığa ulaştıktan sonra CPU termal hatası tarafından hemen kapatılır.
Aşağıdaki iDRAC komutu da aynı etkiye sahiptir:
racadm>>racadm eventfilters get -c idrac.alert.system.TMP.critical
B. Bu parametre Eylem Yok ise iDRAC, fan modülünü önce sistemi soğutacak şekilde ayarlamaya çalışır. CPU, uzun döngüler çalıştırdıktan sonra sunucuyu sürekli sıcaklıktan dolayı donanım bileşeninin zarar görmesini önlemek için kapatabilir.
2. Bu yüksek Giriş sıcaklığından kaçınmak için müşteriler, giriş sıcaklıklarının optimum performans için aralık dahilinde olmasını sağlamalıdır.