VxRail: Вузол спрацьовує попередження про високу температуру на вході
Summary: Вузол VxRail повідомляє про високі сповіщення про температуру на вході. Зазвичай це пов'язано з таким фактором навколишнього середовища, як проблема з кондиціонером.
Symptoms
Вузол VxRail запускає такі сповіщення в контролері життєвого циклу:
2024-06-03 02:18:00 2586 TMPS0103 Inlet temperature is above critical level for extended duration.
2024-05-07 08:41:37 355 TMP0121 The system inlet temperature is greater than the upper critical threshold.
У журналі подій генеруються відповідні записи подій:
2024-05-07 04:49:36 7 The system inlet temperature is within range.
2024-05-07 04:47:19 6 The system inlet temperature is greater than the upper warning threshold.
2024-05-06 19:41:37 5 The system inlet temperature is greater than the upper critical threshold.
2024-05-06 19:12:49 4 The system inlet temperature is greater than the upper warning threshold.
Якщо сервер перебуває під критичною подією, він автоматично працюватиме в погіршеному режимі. Якщо ситуація триває довго, він відключається.
На цьому знімку екрана журнал iDRAC зчитує температуру на центральному процесорі або системній платі разом із їхнім попередженням і критичним порогом. 38 як застереження і 42 як критичне.
Cause
Це пов'язано з екологічною ситуацією, що вентиляція погана. Це призводить до того, що вузол VxRail генерує високу температуру. Коли модуль вентилятора не може відрегулювати швидкість, щоб охолодити внутрішню температуру компонента, теплова подія спричиняє роботу сервера в погіршеному режимі та вимикає сервер, щоб уникнути пошкодження обладнання. Ця операція залежить від налаштувань температурного оповіщення в iDRAC.
Висока температура на вході: Якщо попередження про температуру не встановлено, то коли вона досягає 42 градусів або вище протягом тривалого часу, він спочатку працює в погіршеному режимі та намагається використовувати модуль вентилятора для охолодження сервера. Через тривалий час сервер вимикається.
Resolution
- Вузли VxRail мають внутрішній механізм для боротьби з поганою екологічною ситуацією за допомогою модуля вентилятора та з визначенням порогів попередження та критичного. Як вже говорилося вище, після зіткнення з критичними:
A. У розділі iDRAC-configuration-system>> settings-alert> configuration-alerts-alert>> configuration -> розгорніть температуру. Якщо перша лінія критична при вимкненому живленні, то після досягнення критичної температури вона негайно відключиться тепловим відключенням процесора.
Наступна команда iDRAC матиме такий самий ефект:
racadm>>racadm eventfilters get -c idrac.alert.system.TMP.critical
B. Якщо цей параметр не виконує жодних дій, iDRAC намагається налаштувати модуль вентилятора, щоб спочатку охолодити систему. Після виконання тривалих циклів тепловий відключення процесора вимкне сервер, щоб уникнути пошкодження апаратних компонентів постійною температурою.
2. Щоб уникнути цієї високої температури на вході, клієнти повинні переконатися, що температура на вході знаходиться в межах діапазону для оптимальної роботи.