ECS: RAP015: temperatuurstoring; Symptoomcode: 2010
Summary: Een temperatuursensor op het knooppunt rapporteert dat een kritiek niveau is bereikt.
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Een temperatuursensor heeft een temperatuur gedetecteerd die boven een kritieke drempelwaarde ligt.
Een component werkt mogelijk niet correct waardoor een temperatuursensor meldt dat een kritiek niveau is bereikt.
Een temperatuursensor op het knooppunt meldt dat een kritiek niveau is bereikt.
Een component werkt mogelijk niet correct waardoor een temperatuursensor meldt dat een kritiek niveau is bereikt.
Een temperatuursensor op het knooppunt meldt dat een kritiek niveau is bereikt.
Cause
Er is een probleem opgetreden waardoor een temperatuursensor boven een kritiek niveau is gekomen.
Resolution
Voor Gen2 scrol je naar beneden.
Gen3 Hardware:
1. Controleer de status van de temperatuursensoren met behulp van cs_hal op het gerapporteerde knooppunt.
Opdracht:
Gen3 Hardware:
1. Controleer de status van de temperatuursensoren met behulp van cs_hal op het gerapporteerde knooppunt.
Opdracht:
#cs_hal sensors temp
Voorbeeld: Voor Gen3 zijn er slechts drie temperatuursensoren, als volgt.
admin@n1-mgmt:~> cs_hal sensors temp Entity Type Label Status Info ----- ----- ----- ----- ----- Processor Temperature Temp OK 53 Degrees Celsius Processor Temperature Temp OK 54 Degrees Celsius System Board Temperature Inlet Temp CRIT 40 Degrees Celsius; above critical threshold System Board Temperature Exhaust Temp OK 50 Degrees Celsius NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information. admin@n1-mgmt:~>
2. Controleer alle knooppunten in het rack en kijk of andere knooppunten aangeven dat temperatuursensor niet "OK"
isOpdracht:
Voorbeeld: In dit voorbeeld melden meerdere knooppunten in de bovenste helft van het rack een te hoge inlaattemperatuur.
3. Mogelijke scenario's:
4. Belangrijk: Gebruik https://central.dell.com/case-lookup/ en zoek de PSNT (Product Serial Number Tag) op om de geschiedenis te controleren. Controleer hoeveel voorvallen zich in de afgelopen 3-6 maanden hebben voorgedaan. Controleer of het probleem aanhoudend was en meerdere knooppunten treft, of dat een heel rack wordt beïnvloed doordat de inlaattemperatuur hoger is dan normaal. Dit duidt op aanhoudende omgevingsproblemen die moeten worden opgelost. Sluit de case niet als duplicaat, tenzij er een duidelijk actieplan en conclusies zijn om het temperatuurprobleem op te lossen.
5. Als het PE-team geen probleem vindt of als de geschiedenis veel voorvallen van dezelfde waarschuwing bevat (gedurende 3 maanden of langer), neem dan contact op met een L2 over zwerm en bereid u voor om aan het werk te gaan, bestel een CE om de omgevingsomstandigheden van het betreffende rack en de betrokken knooppunten te beoordelen.
isOpdracht:
viprexec -i cs_hal sensors temp
Voorbeeld: In dit voorbeeld melden meerdere knooppunten in de bovenste helft van het rack een te hoge inlaattemperatuur.
admin@n1-mgmt:~> viprexec -i cs_hal sensors temp Output from host : 192.168.219.1 Entity Type Label Status Info ----- ----- ----- ----- ----- Processor Temperature Temp OK 53 Degrees Celsius Processor Temperature Temp OK 53 Degrees Celsius System Board Temperature Inlet Temp CRIT 40 Degrees Celsius; above critical threshold System Board Temperature Exhaust Temp OK 50 Degrees Celsius NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information. Output from host : 192.168.219.2 Entity Type Label Status Info ----- ----- ----- ----- ----- Processor Temperature Temp OK 47 Degrees Celsius Processor Temperature Temp OK 49 Degrees Celsius System Board Temperature Inlet Temp CRIT 39 Degrees Celsius; above critical threshold System Board Temperature Exhaust Temp OK 50 Degrees Celsius NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information. Output from host : 192.168.219.3 Entity Type Label Status Info ----- ----- ----- ----- ----- Processor Temperature Temp OK 46 Degrees Celsius Processor Temperature Temp OK 46 Degrees Celsius System Board Temperature Inlet Temp OK 35 Degrees Celsius System Board Temperature Exhaust Temp OK 47 Degrees Celsius NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information. Output from host : 192.168.219.4 Entity Type Label Status Info ----- ----- ----- ----- ----- Processor Temperature Temp OK 48 Degrees Celsius Processor Temperature Temp OK 50 Degrees Celsius System Board Temperature Inlet Temp OK 35 Degrees Celsius System Board Temperature Exhaust Temp OK 47 Degrees Celsius NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information. Output from host : 192.168.219.5 Entity Type Label Status Info ----- ----- ----- ----- ----- Processor Temperature Temp OK 48 Degrees Celsius Processor Temperature Temp OK 50 Degrees Celsius System Board Temperature Inlet Temp WARN 38 Degrees Celsius; above non-critical threshold System Board Temperature Exhaust Temp OK 49 Degrees Celsius NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information. Output from host : 192.168.219.6 Entity Type Label Status Info ----- ----- ----- ----- ----- Processor Temperature Temp OK 50 Degrees Celsius Processor Temperature Temp OK 52 Degrees Celsius System Board Temperature Inlet Temp CRIT 39 Degrees Celsius; above critical threshold System Board Temperature Exhaust Temp OK 51 Degrees Celsius NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information. Output from host : 192.168.219.7 Entity Type Label Status Info ----- ----- ----- ----- ----- Processor Temperature Temp OK 45 Degrees Celsius Processor Temperature Temp OK 48 Degrees Celsius System Board Temperature Inlet Temp OK 36 Degrees Celsius System Board Temperature Exhaust Temp OK 47 Degrees Celsius NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information. Output from host : 192.168.219.8 Entity Type Label Status Info ----- ----- ----- ----- ----- Processor Temperature Temp OK 51 Degrees Celsius Processor Temperature Temp OK 49 Degrees Celsius System Board Temperature Inlet Temp OK 31 Degrees Celsius System Board Temperature Exhaust Temp OK 43 Degrees Celsius NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information. Output from host : 192.168.219.9 Entity Type Label Status Info ----- ----- ----- ----- ----- Processor Temperature Temp OK 52 Degrees Celsius Processor Temperature Temp OK 51 Degrees Celsius System Board Temperature Inlet Temp OK 30 Degrees Celsius System Board Temperature Exhaust Temp OK 42 Degrees Celsius NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information. Output from host : 192.168.219.10 Entity Type Label Status Info ----- ----- ----- ----- ----- Processor Temperature Temp OK 54 Degrees Celsius Processor Temperature Temp OK 51 Degrees Celsius System Board Temperature Inlet Temp OK 28 Degrees Celsius System Board Temperature Exhaust Temp OK 41 Degrees Celsius NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information. 192.168.219.7 Entity Type Label Status Info ----- ----- ----- ----- ----- Processor Temperature Temp OK 45 Degrees Celsius Processor Temperature Temp OK 48 Degrees Celsius System Board Temperature Inlet Temp OK 36 Degrees Celsius System Board Temperature Exhaust Temp OK 47 Degrees Celsius Output from host : 192.168.219.11 Entity Type Label Status Info ----- ----- ----- ----- ----- Processor Temperature Temp OK 56 Degrees Celsius Processor Temperature Temp OK 55 Degrees Celsius System Board Temperature Inlet Temp OK 27 Degrees Celsius System Board Temperature Exhaust Temp OK 40 Degrees Celsius NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information. Output from host : 192.168.219.12 Entity Type Label Status Info ----- ----- ----- ----- ----- Processor Temperature Temp OK 59 Degrees Celsius Processor Temperature Temp OK 59 Degrees Celsius System Board Temperature Inlet Temp OK 26 Degrees Celsius System Board Temperature Exhaust Temp OK 38 Degrees Celsius NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information. Output from host : 192.168.219.13 Entity Type Label Status Info ----- ----- ----- ----- ----- Processor Temperature Temp OK 51 Degrees Celsius Processor Temperature Temp OK 49 Degrees Celsius System Board Temperature Inlet Temp OK 26 Degrees Celsius System Board Temperature Exhaust Temp OK 36 Degrees Celsius NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information. Output from host : 192.168.219.14 Entity Type Label Status Info ----- ----- ----- ----- ----- Processor Temperature Temp OK 57 Degrees Celsius Processor Temperature Temp OK 60 Degrees Celsius System Board Temperature Inlet Temp OK 26 Degrees Celsius System Board Temperature Exhaust Temp OK 38 Degrees Celsius NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information. Output from host : 192.168.219.15 Entity Type Label Status Info ----- ----- ----- ----- ----- Processor Temperature Temp OK 59 Degrees Celsius Processor Temperature Temp OK 59 Degrees Celsius System Board Temperature Inlet Temp OK 26 Degrees Celsius System Board Temperature Exhaust Temp OK 39 Degrees Celsius NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information. Output from host : 192.168.219.16 Entity Type Label Status Info ----- ----- ----- ----- ----- Processor Temperature Temp OK 56 Degrees Celsius Processor Temperature Temp OK 56 Degrees Celsius System Board Temperature Inlet Temp OK 26 Degrees Celsius System Board Temperature Exhaust Temp OK 38 Degrees Celsius NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information. admin@n1-mgmt:~>
3. Mogelijke scenario's:
- Eén knooppunt dat alleen een sensor of meer meldt: Als het probleem zich voordoet op slechts één knooppunt waar de temperatuur niet "OK" aangeeft, duidt dit waarschijnlijk op een onderdeelprobleem of dat het knooppunt geen goede luchtstroom heeft vanwege waarschijnlijker een intern probleem dan een rackprobleem.
- Meerdere knooppunten worden beïnvloed, dit is meer een omgevingsprobleem in het rack zelf of mogelijk het datacenter
4. Controleer of de ventilatoren goed werken. Zo niet, dan is een ventilator mogelijk aan vervanging toe.
Opdracht:
#cs_hal sensors fanVoorbeeld:
admin@ecs:~>cs_hal sensors fan Output from host : 192.168.219.1 Entity Type Label Status Info ----- ----- ----- ----- ----- System Board Fan Fan1 OK 12600 RPM System Board Fan Fan2 OK 12600 RPM System Board Fan Fan3 OK 16920 RPM System Board Fan Fan4 OK 16800 RPM System Board Fan Fan5 OK 17040 RPM System Board Fan Fan6 OK 16920 RPM System Board Fan Fan Redundancy OK fully redundant; NOTE: on Axum and EX-series, use "sudo -i racadm getsensorinfo" to obtain sensor information.3. Als alle ventilatoren zich goed melden, betekent dit dat er geen problemen zijn met de ventilatorsystemen. Neem contact op met het Power Edge team om te controleren of een onderdeel aan vervanging toe is. Als fans een probleem melden, volg dan ECS: Dial Home: ventilatorstoring; Symptoomcode: Januari 2008
4. Belangrijk: Gebruik https://central.dell.com/case-lookup/ en zoek de PSNT (Product Serial Number Tag) op om de geschiedenis te controleren. Controleer hoeveel voorvallen zich in de afgelopen 3-6 maanden hebben voorgedaan. Controleer of het probleem aanhoudend was en meerdere knooppunten treft, of dat een heel rack wordt beïnvloed doordat de inlaattemperatuur hoger is dan normaal. Dit duidt op aanhoudende omgevingsproblemen die moeten worden opgelost. Sluit de case niet als duplicaat, tenzij er een duidelijk actieplan en conclusies zijn om het temperatuurprobleem op te lossen.
5. Als het PE-team geen probleem vindt of als de geschiedenis veel voorvallen van dezelfde waarschuwing bevat (gedurende 3 maanden of langer), neem dan contact op met een L2 over zwerm en bereid u voor om aan het werk te gaan, bestel een CE om de omgevingsomstandigheden van het betreffende rack en de betrokken knooppunten te beoordelen.
Gen 2:
1. Controleer de status van de temperatuursensoren met behulp van cs_hal.
Voorbeeld:
# cs_hal sensors temp Entity Type Label Status Info ----- ----- ----- ----- ----- System Board Temperature SSB Therm Trip OK System Board Temperature BB Inlet Temp OK 32 Degrees Celsius CPU (DCMI Compat) Temperature HSBP Temp OK -222 Degrees Celsius System Board Temperature SSB Temp OK 60 Degrees Celsius System Board Temperature BB BMC Temp OK 51 Degrees Celsius System Board Temperature P1 VR Temp OK 38 Degrees Celsius System Board Temperature IB Temp OK 46 Degrees Celsius System Board Temperature Exit Air Temp OK 54 Degrees Celsius Front Panel Temperature IOM Temp OK 43 Degrees Celsius Drive Backplane Temperature HSBP PSOC OK 37 Degrees Celsius Front Panel Temperature LAN NIC Temp OK 67 Degrees Celsius Power Supply Temperature PS1 Temperature OK 34 Degrees Celsius Power Supply Temperature PS2 Temperature OK 34 Degrees Celsius Processor Temperature P1 Therm Margin OK 216 Degrees Celsius Processor Temperature P2 Therm Margin OK 206 Degrees Celsius Processor Temperature P1 Therm Ctrl % OK 0 Unspecified Processor Temperature P2 Therm Ctrl % OK 0 Unspecified Processor Temperature P1 DTS Therm Mgn OK 216 Degrees Celsius Processor Temperature P2 DTS Therm Mgn OK 206 Degrees Celsius Processor Temperature P1 VRD Hot OK Processor Temperature P2 VRD Hot OK System Board Temperature DIMM Thrm Mrgn 1 OK 201 Degrees Celsius System Board Temperature DIMM Thrm Mrgn 2 OK 200 Degrees Celsius System Board Temperature DIMM Thrm Mrgn 3 OK 198 Degrees Celsius System Board Temperature DIMM Thrm Mrgn 4 OK 197 Degrees Celsius System Board Temperature Agg Thrm Mgn 1 OK 233 Degrees Celsius
2. Volg dezelfde stappen voor Gen 3 (maar rapporteer niet aan PowerEdge), meer details worden in de toekomst bijgewerkt voor Gen2.
Affected Products
ECS ApplianceProducts
ECS ApplianceArticle Properties
Article Number: 000046763
Article Type: Solution
Last Modified: 30 Apr 2024
Version: 6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.