VxRail: Node utløser varsel om høy innløpstemperatur
Summary: VxRail-noden rapporterer høye varsler om temperatur ved innløp. Dette skyldes vanligvis en miljøfaktor som klimaanleggsproblem.
Symptoms
VxRail-noden utløser disse varslene i livssykluskontrolleren:
2024-06-03 02:18:00 2586 TMPS0103 Inlet temperature is above critical level for extended duration.
2024-05-07 08:41:37 355 TMP0121 The system inlet temperature is greater than the upper critical threshold.
Hendelsesloggen genererer samsvarende hendelsesoppføringer:
2024-05-07 04:49:36 7 The system inlet temperature is within range.
2024-05-07 04:47:19 6 The system inlet temperature is greater than the upper warning threshold.
2024-05-06 19:41:37 5 The system inlet temperature is greater than the upper critical threshold.
2024-05-06 19:12:49 4 The system inlet temperature is greater than the upper warning threshold.
Hvis serveren er under den kritiske hendelsen, vil den automatisk kjøre i en degradert modus. Hvis situasjonen varer lenge, stenger den ned.
I dette skjermbildet leser iDRAC-loggen temperaturen på CPU-en eller hovedkortet sammen med advarselen og den kritiske terskelen. 38 som advarsel og 42 som kritisk.
Cause
Dette er på grunn av miljøsituasjonen at ventilasjonen ikke er god. Dette fører til at VxRail-noden genererer en høy temperatur. Når viftemodulen ikke er i stand til å justere hastigheten for å kjøle ned den interne komponenttemperaturen, fører varmehendelsen til at serveren kjører i redusert modus og slår av serveren for å unngå skade på maskinvaren. Denne operasjonen avhenger av innstillingen for innstillingen av temperaturvarsling i iDRAC.
Innløp høy temperatur: Hvis temperaturvarselet ikke er innstilt, kjører det først i degradert modus når det når til 42 grader eller høyere i lengre tid, og prøver å bruke viftemodulen til å kjøle ned serveren. Etter en lengre tid slår den av serveren.
Resolution
- VxRail-noder har en intern mekanisme for å håndtere den dårlige miljøsituasjonen med viftemodulen og med definisjonstersklene for advarsel og kritisk. Som nevnt ovenfor etter å ha kjørt inn i kritisk:
En. Utvid temperaturen under iDRAC-konfigurasjon-systeminnstillinger-varsel-konfigurasjon-varsler-varslingskonfigurasjon>>>>>>. Hvis den første linjen er kritisk med Slå av, etter å ha nådd den kritiske temperaturen, vil den umiddelbart slå seg av med CPU-termisk utkobling.
Følgende iDRAC-kommando vil vise seg å ha samme effekt:
racadm>>racadm eventfilters get -c idrac.alert.system.TMP.critical
B. Hvis denne parameteren ikke er noen handling, prøver iDRAC å justere viftemodulen for å kjøle ned systemet først. Etter at den har kjørt i lengre sykluser, vil en termisk utkobling av CPU slå av serveren for å unngå skade på maskinvarekomponenter ved kontinuerlig temperatur.
2. For å unngå denne høye innløpstemperaturen må kundene sørge for at innløpstemperaturene er innenfor rekkevidde for optimal ytelse.