VxRail: Uzel spouští upozornění na vysokou vstupní teplotu.
Summary: Uzel VxRail hlásí výstrahy na vysokou vstupní teplotu. To je obvykle způsobeno faktorem prostředí, jako je problém s klimatizací.
Symptoms
Uzel VxRail aktivuje tyto výstrahy v modulu Life Cycle Controller:
2024-06-03 02:18:00 2586 TMPS0103 Inlet temperature is above critical level for extended duration.
2024-05-07 08:41:37 355 TMP0121 The system inlet temperature is greater than the upper critical threshold.
Protokol událostí generuje odpovídající položky událostí:
2024-05-07 04:49:36 7 The system inlet temperature is within range.
2024-05-07 04:47:19 6 The system inlet temperature is greater than the upper warning threshold.
2024-05-06 19:41:37 5 The system inlet temperature is greater than the upper critical threshold.
2024-05-06 19:12:49 4 The system inlet temperature is greater than the upper warning threshold.
Pokud se server nachází v kritickém stavu, bude automaticky spuštěn v režimu sníženého výkonu. Pokud situace trvá dlouho, vypne se.
Na tomto snímku obrazovky protokol řadiče iDRAC načte teplotu procesoru nebo základní desky spolu s varováním a kritickou prahovou hodnotou. 38 jako varování a 42 jako kritické.
Cause
Je to kvůli situaci v prostředí, že ventilace není dobrá. To způsobí, že uzel VxRail generuje vysokou teplotu. Pokud modul ventilátoru nedokáže upravit rychlost tak, aby ochladil teplotu vnitřní komponenty, tepelná událost způsobí, že server poběží v omezeném režimu a vypne server, aby nedošlo k poškození hardwaru. Tato operace závisí na nastavení teplotních výstrah v řadiči iDRAC.
Vysoká vstupní teplota: Pokud výstraha teploty není nastavena, pak když teplota dosáhne 42 stupňů nebo delší dobu, nejprve se spustí v režimu sníženého výkonu a pokusí se použít modul ventilátoru k ochlazení serveru. Po delší době server vypne.
Resolution
- Uzly VxRail mají interní mechanismus, který se vypořádává se špatným prostředím pomocí modulu ventilátoru a definičních prahových hodnot varování a kritického stavu. Jak je uvedeno výše po spuštění kritického:
A. V části iDRAC-configuration-system>> settings-alert> configuration-alerts-alert>> configuration rozbalte> teplotu. Pokud je první řádek kritický s vypnutým napájením, po dosažení kritické teploty se okamžitě vypne kvůli tepelné ztrátě procesoru.
Ukázalo se, že následující příkaz řadiče iDRAC má stejný účinek:
racadm>>racadm eventfilters get -c idrac.alert.system.TMP.critical
B. Pokud je tento parametr No Action, řadič iDRAC se pokusí upravit modul ventilátoru tak, aby nejprve systém ochladil. Po delších cyklech by tepelný výpadek procesoru vypnul server, aby nedošlo k poškození hardwarových komponent trvalou teplotou.
2. Aby se předešlo této vysoké vstupní teplotě, musí zákazníci zajistit, aby vstupní teploty byly v rozmezí pro optimální výkon.