VxRail: Node löst Warnung bei hoher Einlasstemperatur aus
Summary: VxRail-Node meldet Warnmeldungen zu hoher Eingangstemperatur. Dies ist in der Regel auf einen Umweltfaktor wie ein Problem mit der Klimaanlage zurückzuführen.
Symptoms
Der VxRail-Node löst diese Warnmeldungen im Lifecycle Controller aus:
2024-06-03 02:18:00 2586 TMPS0103 Inlet temperature is above critical level for extended duration.
2024-05-07 08:41:37 355 TMP0121 The system inlet temperature is greater than the upper critical threshold.
Das Ereignisprotokoll erzeugt die entsprechenden Ereigniseinträge:
2024-05-07 04:49:36 7 The system inlet temperature is within range.
2024-05-07 04:47:19 6 The system inlet temperature is greater than the upper warning threshold.
2024-05-06 19:41:37 5 The system inlet temperature is greater than the upper critical threshold.
2024-05-06 19:12:49 4 The system inlet temperature is greater than the upper warning threshold.
Wenn auf dem Server das kritische Ereignis auftritt, wird er automatisch in einem heruntergestuften Modus ausgeführt. Wenn die Situation lange andauert, schaltet sie sich ab.
In diesem Screenshot würde das iDRAC-Protokoll die Temperatur auf der CPU oder Systemplatine zusammen mit dem Warn- und kritischen Schwellenwert lesen. 38 als Warnung und 42 als kritisch.
Cause
Dies liegt daran, dass die Belüftung aufgrund der Umweltsituation nicht gut ist. Dies führt dazu, dass der VxRail-Node eine hohe Temperatur erzeugt. Wenn das Lüftermodul die Geschwindigkeit nicht anpassen kann, um die Temperatur der internen Komponenten abzukühlen, führt das thermische Ereignis dazu, dass der Server in einem herabgesetzten Modus ausgeführt wird, und fährt den Server herunter, um Hardwareschäden zu vermeiden. Dieser Vorgang hängt von der Einstellung der Temperaturwarnungseinstellung im iDRAC ab.
Hohe Eingangstemperatur: Wenn die Temperaturwarnung nicht eingestellt ist, läuft sie beim Erreichen von 42 Grad oder mehr über einen längeren Zeitraum zunächst im heruntergestuften Modus und versucht, das Lüftermodul zum Abkühlen des Servers zu verwenden. Nach längerer Zeit wird der Server heruntergefahren.
Resolution
- VxRail-Nodes verfügen über einen internen Mechanismus, um mit der schlechten Umgebungssituation mit dem Lüftermodul und den Definitionsschwellenwerten "Warnung" und "Kritisch" umzugehen. Wie oben nach dem Stoßen auf kritisch erwähnt:
Ein. Erweitern Sie unter iDRAC-configuration-system>> settings-alert> configuration-alerts-alert>> configuration die> Temperatur. Wenn die erste Zeile kritisch im ausgeschalteten Zustand ist, wird sie nach Erreichen der kritischen Temperatur sofort durch thermische CPU-Auslösung heruntergefahren.
Es stellt sich heraus, dass der folgende iDRAC-Befehl den gleichen Effekt hat:
racadm>>racadm eventfilters get -c idrac.alert.system.TMP.critical
B. Wenn dieser Parameter auf "No Action" festgelegt ist, versucht der iDRAC zuerst, das Lüftermodul so einzustellen, dass das System abgekühlt wird. Nach der Ausführung längerer Zyklen würde eine thermische CPU-Auslösung den Server ausschalten, um Schäden an Hardwarekomponenten durch kontinuierliche Temperatur zu vermeiden.
2. Um diese hohe Einlasstemperatur zu vermeiden, müssen Kunden sicherstellen, dass die Einlasstemperaturen innerhalb des Bereichs für eine optimale Leistung liegen.