ECS:RAP015: 温度障害;現象コード: 2010

Summary: ノードの温度センサーが、重大なレベルに達したことを報告しています。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

温度センサーが、危険しきい値を超える温度を検出しました。
コンポーネントが正しく作動していないため、温度センサーが危険レベルに達したと報告している可能性があります。
ノードの温度センサーが、重大レベルに達したことを報告しています。

Cause

温度センサーが危険なレベルを超える原因となる問題が発生しました。

Resolution

Gen2の場合は、一番下までスクロールします。

Gen3ハードウェア: 

1.報告されたノードのcs_halを使用して、温度センサーのステータスを確認します。

コマンド: 
#cs_hal sensors temp
 
Example: Gen3 の場合、温度センサーは次のように 3 つしかありません。
 
admin@n1-mgmt:~>  cs_hal sensors temp
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      53 Degrees Celsius
Processor         Temperature         Temp              OK      54 Degrees Celsius
System Board      Temperature         Inlet Temp        CRIT    40 Degrees Celsius; above critical threshold
System Board      Temperature         Exhaust Temp      OK      50 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.
admin@n1-mgmt:~>
2. ラック内のすべてのノードを確認し、他のノードが温度センサーが「OK」

ではないと報告しているかどうかを確認します。コマンド: 
viprexec -i  cs_hal sensors temp

Example: この例では、ラックの上半分にある複数のノードが吸気口温度が高すぎると報告しています。 
admin@n1-mgmt:~> viprexec -i  cs_hal sensors temp

Output from host : 192.168.219.1
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      53 Degrees Celsius
Processor         Temperature         Temp              OK      53 Degrees Celsius
System Board      Temperature         Inlet Temp        CRIT    40 Degrees Celsius; above critical threshold
System Board      Temperature         Exhaust Temp      OK      50 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.2
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      47 Degrees Celsius
Processor         Temperature         Temp              OK      49 Degrees Celsius
System Board      Temperature         Inlet Temp        CRIT    39 Degrees Celsius; above critical threshold
System Board      Temperature         Exhaust Temp      OK      50 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.3
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      46 Degrees Celsius
Processor         Temperature         Temp              OK      46 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      35 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      47 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.4
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      48 Degrees Celsius
Processor         Temperature         Temp              OK      50 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      35 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      47 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.5
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      48 Degrees Celsius
Processor         Temperature         Temp              OK      50 Degrees Celsius
System Board      Temperature         Inlet Temp        WARN    38 Degrees Celsius; above non-critical threshold
System Board      Temperature         Exhaust Temp      OK      49 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.6
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      50 Degrees Celsius
Processor         Temperature         Temp              OK      52 Degrees Celsius
System Board      Temperature         Inlet Temp        CRIT    39 Degrees Celsius; above critical threshold
System Board      Temperature         Exhaust Temp      OK      51 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.7
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      45 Degrees Celsius
Processor         Temperature         Temp              OK      48 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      36 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      47 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.8
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      51 Degrees Celsius
Processor         Temperature         Temp              OK      49 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      31 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      43 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.9
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      52 Degrees Celsius
Processor         Temperature         Temp              OK      51 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      30 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      42 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.10
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      54 Degrees Celsius
Processor         Temperature         Temp              OK      51 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      28 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      41 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.
 192.168.219.7
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      45 Degrees Celsius
Processor         Temperature         Temp              OK      48 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      36 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      47 Degrees Celsius

Output from host : 192.168.219.11
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      56 Degrees Celsius
Processor         Temperature         Temp              OK      55 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      27 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      40 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.12
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      59 Degrees Celsius
Processor         Temperature         Temp              OK      59 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      26 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      38 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.13
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      51 Degrees Celsius
Processor         Temperature         Temp              OK      49 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      26 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      36 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.14
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      57 Degrees Celsius
Processor         Temperature         Temp              OK      60 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      26 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      38 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.15
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      59 Degrees Celsius
Processor         Temperature         Temp              OK      59 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      26 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      39 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.

Output from host : 192.168.219.16
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
Processor         Temperature         Temp              OK      56 Degrees Celsius
Processor         Temperature         Temp              OK      56 Degrees Celsius
System Board      Temperature         Inlet Temp        OK      26 Degrees Celsius
System Board      Temperature         Exhaust Temp      OK      38 Degrees Celsius

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.
admin@n1-mgmt:~>

3.考えられるシナリオ:
  1. センサーのみをレポートするノードが1つ以上: 温度が「OK」ではないと報告されている1つのノードでのみ問題が発生する場合、ほとんどの場合、ラックの問題ではなく内部の問題が原因で、パーツの問題またはノードのエアフローが良好でないことを示しています。
  2. 複数のノード が影響を受けます。これはラック内の環境の問題、またはデータ センター内の環境の問題である可能性もあります


4.ファンが正常に動作していることを確認します。そうでない場合は、ファンの交換が必要になる可能性があります。

コマンド:

#cs_hal sensors fan
Example: 
admin@ecs:~>cs_hal sensors fan

Output from host : 192.168.219.1
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
System Board      Fan                 Fan1              OK      12600 RPM
System Board      Fan                 Fan2              OK      12600 RPM
System Board      Fan                 Fan3              OK      16920 RPM
System Board      Fan                 Fan4              OK      16800 RPM
System Board      Fan                 Fan5              OK      17040 RPM
System Board      Fan                 Fan6              OK      16920 RPM
System Board      Fan                 Fan Redundancy    OK      fully redundant;

NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.
3.すべてのファンがOKと報告されている場合は、ファン システムに問題がないことを意味します。Power Edgeチームと連携して、パーツの交換が必要かどうかを確認します。問題を報告しているファンがいる場合は、ECS: ダイヤル ホール:ファンの障害;SymptomCode: 2008

年4.重要:https://central.dell.com/case-lookup/ を使用して PSNT(製品シリアル番号タグ)を検索し、履歴を確認します。   過去 3 か月から 6 か月間に発生した発生数を確認します。問題が継続的に発生し、複数のノードに影響しているかどうか、または吸気温度が通常よりも高くなることでラック全体が影響を受けているかどうかを確認します。これは解決が必要な環境の問題が続いていることを示しています。温度の問題を解決するための明確なアクション プランと結論がない限り、ケースを重複として閉じないでください。

5.PEチームが問題を見つけられない場合、または履歴に同じアラート(3か月以上)の発生が多数含まれている場合は、 Swarmを介してL2 に相談し、影響を受けるラックとノードの環境条件を確認するための 作業オーダー、CE を準備します。 
 
Gen 2: 
 
1.cs_halを使用して温度センサーのステータスを確認します。
Example:
# cs_hal sensors temp
Entity            Type                Label             Status  Info
-----             -----               -----             -----   -----
System Board      Temperature         SSB Therm Trip    OK
System Board      Temperature         BB Inlet Temp     OK      32 Degrees Celsius
CPU (DCMI Compat) Temperature         HSBP Temp         OK      -222 Degrees Celsius
System Board      Temperature         SSB Temp          OK      60 Degrees Celsius
System Board      Temperature         BB BMC Temp       OK      51 Degrees Celsius
System Board      Temperature         P1 VR Temp        OK      38 Degrees Celsius
System Board      Temperature         IB Temp           OK      46 Degrees Celsius
System Board      Temperature         Exit Air Temp     OK      54 Degrees Celsius
Front Panel       Temperature         IOM Temp          OK      43 Degrees Celsius
Drive Backplane   Temperature         HSBP PSOC         OK      37 Degrees Celsius
Front Panel       Temperature         LAN NIC Temp      OK      67 Degrees Celsius
Power Supply      Temperature         PS1 Temperature   OK      34 Degrees Celsius
Power Supply      Temperature         PS2 Temperature   OK      34 Degrees Celsius
Processor         Temperature         P1 Therm Margin   OK      216 Degrees Celsius
Processor         Temperature         P2 Therm Margin   OK      206 Degrees Celsius
Processor         Temperature         P1 Therm Ctrl %   OK      0 Unspecified
Processor         Temperature         P2 Therm Ctrl %   OK      0 Unspecified
Processor         Temperature         P1 DTS Therm Mgn  OK      216 Degrees Celsius
Processor         Temperature         P2 DTS Therm Mgn  OK      206 Degrees Celsius
Processor         Temperature         P1 VRD Hot        OK
Processor         Temperature         P2 VRD Hot        OK
System Board      Temperature         DIMM Thrm Mrgn 1  OK      201 Degrees Celsius
System Board      Temperature         DIMM Thrm Mrgn 2  OK      200 Degrees Celsius
System Board      Temperature         DIMM Thrm Mrgn 3  OK      198 Degrees Celsius
System Board      Temperature         DIMM Thrm Mrgn 4  OK      197 Degrees Celsius
System Board      Temperature         Agg Thrm Mgn 1    OK      233 Degrees Celsius
2.Gen 3と同じ手順に従います(ただし、PowerEdgeには報告しません)。Gen2についても、将来、詳細がアップデートされます。 

Affected Products

ECS Appliance

Products

ECS Appliance
Article Properties
Article Number: 000046763
Article Type: Solution
Last Modified: 30 Apr 2024
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.