PowerEdge: TMP0203: Температура процесора перевищує верхній критичний поріг
Summary: Сервери PowerEdge з iDRAC9 можуть повідомляти про температуру процесора x вище верхнього критичного порогу подій, коли робоче навантаження на процесор зростає на рівні PowerMax CPU або близько до нього. ...
Symptoms
Сервери PowerEdge з iDRAC9 можуть повідомляти про температуру процесора x вище верхнього критичного порогу, коли робоче навантаження на процесор зростає на рівні CPU Power Max або близько до нього. Коли виникають перехідні сплески напруги для задоволення додаткової потреби в процесорі, температура процесора може короткочасно перевищити верхній критичний поріг. Наприклад, сервер, який працює при 50-60% завантаженні та стрибках до 100% використання протягом 5-20 секунд, може ненадовго перевищити верхній критичний поріг температури процесора. При перевищенні цього порогу події записуються в журнал системних подій і журнал життєвого циклу. Коли піковий перехідний сплеск закінчується і температура процесора повертається до норми, реєструється подія, яка вказує на те, що температура процесора x знаходиться в межах діапазону.
Коли відбуваються такі перехідні сплески, ці дві події зазвичай відбуваються протягом 5-20 секунд одна від одної. Нижче наведено приклади як орієнтири для таких типів тимчасових подій.
Журнал системних подій:
2020-04-09 11:14:11 85 CPU 2 temperature is within range.
2020-04-09 11:14:06 84 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 09:16:31 83 CPU 2 temperature is within range.
2020-04-09 09:16:16 82 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 08:58:33 81 CPU 2 temperature is within range.
2020-04-09 08:58:17 80 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 08:25:47 79 CPU 2 temperature is within range.
2020-04-09 08:25:27 78 CPU 2 temperature is greater than the upper critical threshold.
2020-04-09 06:57:02 77 CPU 2 temperature is within range.
2020-04-09 06:56:57 76 CPU 2 temperature is greater than the upper critical threshold.
Журнал життєвого циклу:
2020-04-09 00:44:15 7851 TMP0205 CPU 2 temperature is within range.
2020-04-09 00:44:07 7850 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 22:46:31 7773 TMP0205 CPU 2 temperature is within range.
2020-04-08 22:46:18 7772 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 22:28:34 7769 TMP0205 CPU 2 temperature is within range.
2020-04-08 22:28:18 7768 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 21:55:49 7736 TMP0205 CPU 2 temperature is within range.
2020-04-08 21:55:29 7735 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
2020-04-08 20:27:03 7697 TMP0205 CPU 2 temperature is within range.
2020-04-08 20:26:58 7696 TMP0203 CPU 2 temperature is greater than the upper critical threshold.
Коли ці температурні пороги досягнуті, процесори Intel можуть дроселювати, щоб зменшити споживання енергії та знизити температуру процесора.
Cause
Resolution
Хоча ці типи перехідних стрибків продуктивності процесора не є ненормальними, iDRAC9 Engineering продовжує тонко налаштовувати тепловий алгоритм, щоб запобігти цим подіям. Наприклад, iDRAC9 4.22.00.00 та iDRAC9 4.40.00.00 включають теплові покращення, специфічні для цієї послідовності. Щоб переконатися, що на серверах PowerEdge встановлено найновіші динамічні теплові алгоритми, оновіть мікропрограму iDRAC9 до останньої доступної.
Обхідні шляхи:
Кінцеві користувачі можуть вручну змінювати температуру системи, щоб запобігти різкому підвищенню температури процесора цими перехідними подіями. Використовуйте будь-який із наведених нижче обхідних шляхів, щоб збільшити швидкість вентилятора на базовому рівні та підтримувати нижчу температуру процесора.
Профіль максимальної продуктивності
Система оптимізації теплового профілю може бути модифікована на Maximum Performance (Оптимізація продуктивності). Даний термопрофіль несе в собі наступні переваги:
- Знижена ймовірність троттлінгу пам'яті або процесора
- Підвищена ймовірність активації турборежиму
- Як правило, вищі швидкості вентилятора при холостому ходу та стресових навантаженнях
Оптимізація термічного профілю може бути модифікована за допомогою наступних методів:
Інтерфейс >користувача iDRAC9Конфігурації>Системні параметри>Налаштування> обладнання Конфігурація охолодження
racadm set System.ThermalSettings.ThermalProfile
racadm>>racadm set System.ThermalSettings.ThermalProfile 1
[Key=System.Embedded.1#ThermalSettings.1]
Object value modified successfully
Supported Values:
0 - Default Thermal Profile Settings
1 - Maximum Performance
2 - Minimum Power
3 - Sound Cap
Зміщення швидкості вентилятора
Зміщення швидкості вентилятора дозволяє збільшувати швидкість вентилятора системи з чотирма кроками. Ці кроки порівну розподіляються між типовою базовою швидкістю та максимальною швидкістю вентиляторів серверної системи. Зсув швидкості вентилятора призводить до збільшення швидкості вентилятора (на % зсуву) порівняно з базовими швидкостями вентиляторів, розрахованими за алгоритмом Thermal Control. Можливі значення:
- Низька швидкість вентилятора - Збільшує швидкість вентилятора до помірної.
- Середня швидкість вентилятора – приводить швидкість вентилятора, близьку до середньої.
- Висока швидкість вентилятора - Приводить швидкість вентилятора, близьку до повної швидкості.
- Максимальна швидкість вентилятора – доводить швидкість вентилятора до повної швидкості.
- Off - Зміщення швидкості вентилятора встановлено в положення вимкнено. Це значення за замовчуванням. Якщо встановлено значення «вимкнено», відсоток не відображається. Швидкість вентилятора за замовчуванням застосовується без зміщення. І навпаки, максимальне налаштування призводить до того, що всі вентилятори працюють на максимальній швидкості.
Зсув швидкості вентилятора можна змінити за допомогою таких методів:
Інтерфейс >користувача iDRAC9Конфігурації>Системні параметри>Налаштування> обладнання Конфігурація охолодження
racadm set System.ThermalSettings.FanSpeedOffset
racadm>>racadm set System.ThermalSettings.FanSpeedOffset 2
[Key=System.Embedded.1#ThermalSettings.1]
Object value modified successfully
Supported Values:
0 - Low
1 - High
2 - Medium
3 - Max
255 - Off
Примітка: Збільшення базових швидкостей вентилятора збільшує енергоспоживання вентилятора та збільшує акустику вентиляторів.