ECS: 시스템이 노드에서 고온을 감지함

Summary: 시스템이 노드에서 고온 센서 판독값을 감지했다는 이메일 알림을 받으면 무엇을 확인할 수 있습니까?

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

  1. 알림이 발생한 노드의 하드웨어를 확인합니다.

    admin@node1:~> sudo xdoctor -x
    Telegraf Version: 3.8.0.2-1549.73c8abc2
    Fabric Version: 3.8.0.2-4347.d30cd09
    Fabric-Zookeeper Version: 3.8.0.2-120.b4a1c5c
    Utilities Version: 3.7.0.4-1166.b78f3fe
    Influxdb Version: 3.8.0.2-1549.73c8abc2
    Grafana Version: 3.8.0.2-1549.73c8abc2
    Syslog Version: 3.8.0.2-4347.d30cd09
    Service Version: 9.0.0.0-22840.479b013c74
    Os Version: 3.8.0.2-2113.3fa664c.3
    Fluxd Version: 3.8.0.2-1549.73c8abc2
    Throttler Version: 3.8.0.2-1549.73c8abc2
    Object Image Version: 3.8.0.2-138636.7343cd5c2c3
    --------------------
    ECS Version: 3.8.0.2
    --------------------
    HW Gen  : 2
    HW Model: U-Series
    HW Code : S2600KP
    -------------------------
    xDoctor Version: 4.8-98.0
    -------------------------
    

    Gen 1/2 노드의 경우 지원이 필요하다는 이메일 양식에 응답합니다. Gen 3 노드의 경우 이 KB의 나머지 부분을 따르십시오.

  2. 온도 센서의 현재 상태를 확인합니다. 아래에는 두 노드에 문제가 있음을 나타내는 "CRIT"가 표시되어 있습니다. 모든 노드가 "OK"로 보고되지만 이 알림이 최근에 여러 번 수신된 경우 반복되는 문제일 수 있습니다. 있는 경우 반복 온도 경고와 함께 지원이 필요하다는 이메일 양식에 응답하십시오.

    admin@node1:~> viprexec -i  cs_hal sensors temp
    
    Output from host : xxx.xxx.xxx.xxx
    Entity            Type                Label             Status  Info
    -----             -----               -----             -----   -----
    Processor         Temperature         Temp              OK      53 Degrees Celsius
    Processor         Temperature         Temp              OK      53 Degrees Celsius
    System Board      Temperature         Inlet Temp        CRIT    40 Degrees Celsius; above critical threshold
    System Board      Temperature         Exhaust Temp      OK      50 Degrees Celsius
    
    NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.
    
    Output from host : xxx.xxx.xxx.xxx
    Entity            Type                Label             Status  Info
    -----             -----               -----             -----   -----
    Processor         Temperature         Temp              OK      47 Degrees Celsius
    Processor         Temperature         Temp              OK      49 Degrees Celsius
    System Board      Temperature         Inlet Temp        CRIT    39 Degrees Celsius; above critical threshold
    System Board      Temperature         Exhaust Temp      OK      50 Degrees Celsius
    
    NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.
    
    Output from host : xxx.xxx.xxx.xxx
    Entity            Type                Label             Status  Info
    -----             -----               -----             -----   -----
    Processor         Temperature         Temp              OK      46 Degrees Celsius
    Processor         Temperature         Temp              OK      46 Degrees Celsius
    System Board      Temperature         Inlet Temp        OK      35 Degrees Celsius
    System Board      Temperature         Exhaust Temp      OK      47 Degrees Celsius
    
    NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.
    
    ...
    ...
    ...

    여러 노드가 "양호"하지 않은 것으로 보고되는 경우 데이터 센터 환경 내의 문제일 수 있습니다. ECS가 위치한 영역에 ECS 온도를 상승시킬 수 있는 문제가 없는지 확인합니다.

  3. ECS 팬의 상태를 확인합니다.

    admin@ecs:~>cs_hal sensors fan
    
    Output from host : xxx.xxx.xxx.xxx
    Entity            Type                Label             Status  Info
    -----             -----               -----             -----   -----
    System Board      Fan                 Fan1              OK      12600 RPM
    System Board      Fan                 Fan2              OK      12600 RPM
    System Board      Fan                 Fan3              OK      16920 RPM
    System Board      Fan                 Fan4              OK      16800 RPM
    System Board      Fan                 Fan5              OK      17040 RPM
    System Board      Fan                 Fan6              OK      16920 RPM
    System Board      Fan                 Fan Redundancy    OK      fully redundant;
    
    NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.
  4. 온도 센서 출력과 팬 출력을 포함하여 도움이 필요하다는 이메일 양식에 응답합니다.

 

Affected Products

ECS
Article Properties
Article Number: 000227188
Article Type: How To
Last Modified: 30 Jul 2024
Version:  2
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.