ЕКС: RAP015: збій температурного режиму; Код симптому: 2010

Summary: Датчик температури на вузлі повідомляє про те, що критичний рівень досягнутий.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Датчик температури зафіксував температуру, яка перевищує критичний поріг.
Можливо, компонент працює неправильно, через що датчик температури повідомляє про досягнення критичного рівня.
Датчик температури на вузлі повідомляє про те, що досягнуто критичного рівня.

Cause

Сталася проблема, через яку датчик температури перевищив критичний рівень.

Resolution

Для Gen2 прокрутіть донизу.

Апаратне забезпечення 3-го покоління: 

1. Перевірте стан датчиків температури за допомогою cs_hal на повідомленому вузлі.

Команда: 
#cs_hal sensors temp
 
Приклад: Для Gen3 є лише три датчики Temp, як показано нижче.
 
admin@n1-mgmt:~>  cs_hal sensors temp
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      53 Degrees Celsius
Processor         Temperature         Temp              OK      54 Degrees Celsius
System Board      Temperature         Inlet Temp        CRIT    40 Degrees Celsius; above critical threshold
System Board      Temperature         Exhaust Temp      OK      50 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.
admin@n1-mgmt:~>
2. Перевірте всі вузли в стійці та подивіться, чи інші вузли повідомляють, що датчик температури не «ОК»

Команда: 
viprexec -i  cs_hal sensors temp

Приклад: У цьому прикладі кілька вузлів у верхній половині стійки повідомляють про занадто високу температуру на вході. 
admin@n1-mgmt:~> viprexec -i  cs_hal sensors temp

Output from host : 192.168.219.1
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      53 Degrees Celsius
Processor         Temperature         Temp              OK      53 Degrees Celsius
System Board      Temperature         Inlet Temp        CRIT    40 Degrees Celsius; above critical threshold
System Board      Temperature         Exhaust Temp      OK      50 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.2
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      47 Degrees Celsius
Processor         Temperature         Temp              OK      49 Degrees Celsius
System Board      Temperature         Inlet Temp        CRIT    39 Degrees Celsius; above critical threshold
System Board      Temperature         Exhaust Temp      OK      50 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.3
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      46 Degrees Celsius
Processor         Temperature         Temp              OK      46 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      35 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      47 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.4
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      48 Degrees Celsius
Processor         Temperature         Temp              OK      50 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      35 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      47 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.5
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      48 Degrees Celsius
Processor         Temperature         Temp              OK      50 Degrees Celsius
System Board      Temperature         Inlet Temp        WARN    38 Degrees Celsius; above non-critical threshold
System Board      Temperature         Exhaust Temp      OK      49 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.6
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      50 Degrees Celsius
Processor         Temperature         Temp              OK      52 Degrees Celsius
System Board      Temperature         Inlet Temp        CRIT    39 Degrees Celsius; above critical threshold
System Board      Temperature         Exhaust Temp      OK      51 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.7
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      45 Degrees Celsius
Processor         Temperature         Temp              OK      48 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      36 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      47 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.8
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      51 Degrees Celsius
Processor         Temperature         Temp              OK      49 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      31 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      43 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.9
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      52 Degrees Celsius
Processor         Temperature         Temp              OK      51 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      30 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      42 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.10
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      54 Degrees Celsius
Processor         Temperature         Temp              OK      51 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      28 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      41 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.
 192.168.219.7
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      45 Degrees Celsius
Processor         Temperature         Temp              OK      48 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      36 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      47 Degrees Celsius

Output from host : 192.168.219.11
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      56 Degrees Celsius
Processor         Temperature         Temp              OK      55 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      27 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      40 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.12
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      59 Degrees Celsius
Processor         Temperature         Temp              OK      59 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      26 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      38 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.13
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      51 Degrees Celsius
Processor         Temperature         Temp              OK      49 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      26 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      36 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.14
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      57 Degrees Celsius
Processor         Temperature         Temp              OK      60 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      26 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      38 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.15
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      59 Degrees Celsius
Processor         Temperature         Temp              OK      59 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      26 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      39 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.16
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      56 Degrees Celsius
Processor         Temperature         Temp              OK      56 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      26 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      38 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.
admin@n1-mgmt:~>

3. Можливі варіанти розвитку подій:
  1. Один вузол повідомляє лише про датчик або більше: Якщо проблема спостерігається лише на одному вузлі, де температура повідомляє не «ОК», то це, швидше за все, вказує на проблему з деталлю або на вузол не має хорошого потоку повітря через, швидше за все, внутрішню проблему, ніж проблему зі стійкою.
  2. Це впливає на кілька вузлів , це скоріше екологічна проблема всередині самої стійки або, можливо, центру обробки даних


4. Перевірте, чи все гаразд вентиляторів. Якщо ні, то, можливо, потрібна заміна вентилятора.

Команда:

#cs_hal sensors fan
Приклад: 
admin@ecs:~>cs_hal sensors fan

Output from host : 192.168.219.1
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
System Board      Fan                 Fan1              OK      12600 RPM
System Board      Fan                 Fan2              OK      12600 RPM
System Board      Fan                 Fan3              OK      16920 RPM
System Board      Fan                 Fan4              OK      16800 RPM
System Board      Fan                 Fan5              OK      17040 RPM
System Board      Fan                 Fan6              OK      16920 RPM
System Board      Fan                 Fan Redundancy    OK      fully redundant;

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.
3. Якщо всі вентилятори повідомляють, що все гаразд, це означає, що проблем із системами вентиляторів немає. Залучіть команду Power Edge , щоб перевірити, чи потребує деталь заміни. Якщо хтось із уболівальників повідомляє про проблему, слідкуйте за ECS: Наберіть додому: вихід з ладу вентилятора; Код симптому: 2008

р.4. Важливий: Використовуйте https://central.dell.com/case-lookup/  та знайдіть PSNT (тег серійного номера продукту), щоб перевірити історію. Подивіться, скільки випадків сталося за останні 3-6 місяців. Перевірте, чи проблема була постійною і зачіпала кілька вузлів, чи постраждала ціла стійка з температурою на вході вищою за норму, тоді це вказує на постійні екологічні проблеми, які потрібно вирішити. Не закривайте справу як дублюючу, якщо немає чіткого плану дій та висновків щодо вирішення проблеми з температурою. 

5. Якщо команда PE не виявить проблему або якщо історія містить багато випадків з одного і того ж оповіщення (протягом 3 місяців або більше), проконсультуйтеся з L2 over Swarm і підготуйтеся до роботи, замовте CE для перегляду умов навколишнього середовища стійки та вузлів, які зазнали впливу. 
 
Покоління 2: 
 
1. Перевірте стан датчиків температури за допомогою cs_hal.
Приклад:
# cs_hal sensors temp
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
System Board      Temperature         SSB Therm Trip    OK
System Board      Temperature         BB Inlet Temp     OK      32 Degrees Celsius
CPU (DCMI Compat) Temperature         HSBP Temp         OK      -222 Degrees Celsius
System Board      Temperature         SSB Temp          OK      60 Degrees Celsius
System Board      Temperature         BB BMC Temp       OK      51 Degrees Celsius
System Board      Temperature         P1 VR Temp        OK      38 Degrees Celsius
System Board      Temperature         IB Temp           OK      46 Degrees Celsius
System Board      Temperature         Exit Air Temp     OK      54 Degrees Celsius
Front Panel       Temperature         IOM Temp          OK      43 Degrees Celsius
Drive Backplane   Temperature         HSBP PSOC         OK      37 Degrees Celsius
Front Panel       Temperature         LAN NIC Temp      OK      67 Degrees Celsius
Power Supply      Temperature         PS1 Temperature   OK      34 Degrees Celsius
Power Supply      Temperature         PS2 Temperature   OK      34 Degrees Celsius
Processor         Temperature         P1 Therm Margin   OK      216 Degrees Celsius
Processor         Temperature         P2 Therm Margin   OK      206 Degrees Celsius
Processor         Temperature         P1 Therm Ctrl %   OK      0 Unspecified
Processor         Temperature         P2 Therm Ctrl %   OK      0 Unspecified
Processor         Temperature         P1 DTS Therm Mgn  OK      216 Degrees Celsius
Processor         Temperature         P2 DTS Therm Mgn  OK      206 Degrees Celsius
Processor         Temperature         P1 VRD Hot        OK
Processor         Temperature         P2 VRD Hot        OK
System Board      Temperature         DIMM Thrm Mrgn 1  OK      201 Degrees Celsius
System Board      Temperature         DIMM Thrm Mrgn 2  OK      200 Degrees Celsius
System Board      Temperature         DIMM Thrm Mrgn 3  OK      198 Degrees Celsius
System Board      Temperature         DIMM Thrm Mrgn 4  OK      197 Degrees Celsius
System Board      Temperature         Agg Thrm Mgn 1    OK      233 Degrees Celsius
2. Виконайте ті самі кроки, що й для Gen 3 (але не повідомляйте про це PowerEdge), більш детальна інформація буде оновлена для Gen2 у майбутньому. 

Affected Products

ECS Appliance

Products

ECS Appliance
Article Properties
Article Number: 000046763
Article Type: Solution
Last Modified: 30 Apr 2024
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.