VxRail: Il nodo attiva un avviso di temperatura di ingresso elevata
Summary: Il nodo VxRail segnala avvisi di temperatura di ingresso elevata. Ciò è solitamente dovuto a un fattore ambientale come il problema del condizionatore d'aria.
Symptoms
Il nodo VxRail attiva questi avvisi nel Life Cycle Controller:
2024-06-03 02:18:00 2586 TMPS0103 Inlet temperature is above critical level for extended duration.
2024-05-07 08:41:37 355 TMP0121 The system inlet temperature is greater than the upper critical threshold.
Il registro eventi genera le voci di evento corrispondenti:
2024-05-07 04:49:36 7 The system inlet temperature is within range.
2024-05-07 04:47:19 6 The system inlet temperature is greater than the upper warning threshold.
2024-05-06 19:41:37 5 The system inlet temperature is greater than the upper critical threshold.
2024-05-06 19:12:49 4 The system inlet temperature is greater than the upper warning threshold.
Se il server si trova sotto l'evento critico, verrà eseguito automaticamente in modalità danneggiata. Se la situazione dura a lungo, si chiude.
In questa schermata, il registro iDRAC legge la temperatura sulla CPU o sulla scheda di sistema insieme alla relativa soglia di avviso e critica. 38 come avvertimento e 42 come critico.
Cause
Ciò è dovuto alla situazione ambientale che la ventilazione non è buona. In questo modo il nodo VxRail genera una temperatura elevata. Quando il modulo della ventola non è in grado di regolare la velocità per raffreddare la temperatura del componente interno, l'evento termico fa funzionare il server in modalità danneggiata e arresta il server per evitare danni all hardware. Questa operazione dipende dall'impostazione dell'avviso di temperatura in iDRAC.
Alta temperatura di ingresso: Se l'avviso di temperatura non è impostato, quando raggiunge i 42 gradi o oltre per un periodo di tempo prolungato, viene eseguito prima in modalità danneggiata e tenta di utilizzare il modulo della ventola per raffreddare il server. Dopo un periodo di tempo prolungato, arresta il server.
Resolution
- I nodi VxRail dispongono di un meccanismo interno per gestire la situazione ambientale sfavorevole con il relativo modulo ventola e con le soglie di definizione di avvertenza e criticità. Come accennato in precedenza, dopo aver riscontrato un problema critico:
Un. In iDRAC-configuration-system>> settings-alert> configuration-alerts-alert>> configuration,> espandere la temperatura. Se la prima linea critica è con alimentazione spenta, dopo aver raggiunto la temperatura critica si spegnerebbe immediatamente per intervento termico della CPU.
Il seguente comando iDRAC avrebbe lo stesso effetto:
racadm>>racadm eventfilters get -c idrac.alert.system.TMP.critical
B. Se questo parametro è impostato su No Action, iDRAC tenta di regolare prima il modulo della ventola per raffreddare il sistema. Dopo aver eseguito cicli prolungati, un intervento termico della CPU spegnerebbe il server per evitare danni ai componenti hardware causati dalla temperatura continua.
2. Per evitare questa elevata temperatura di ingresso, i clienti devono assicurarsi che le temperature di ingresso rientrino nell'intervallo per ottenere prestazioni ottimali.