VxRail: El nodo activa la alerta de temperatura de entrada alta
Summary: El nodo de VxRail informa alertas de temperatura de entrada alta. Por lo general, esto se debe a un factor ambiental, como un problema con el aire acondicionado.
Symptoms
El nodo de VxRail activa estas alertas en Lifecycle Controller:
2024-06-03 02:18:00 2586 TMPS0103 Inlet temperature is above critical level for extended duration.
2024-05-07 08:41:37 355 TMP0121 The system inlet temperature is greater than the upper critical threshold.
El registro de eventos genera las entradas de eventos coincidentes:
2024-05-07 04:49:36 7 The system inlet temperature is within range.
2024-05-07 04:47:19 6 The system inlet temperature is greater than the upper warning threshold.
2024-05-06 19:41:37 5 The system inlet temperature is greater than the upper critical threshold.
2024-05-06 19:12:49 4 The system inlet temperature is greater than the upper warning threshold.
Si el servidor se encuentra bajo el evento crítico, se ejecutará automáticamente en un modo degradado. Si la situación dura mucho tiempo, se cierra.
En esta captura de pantalla, el registro de iDRAC leerá la temperatura en la CPU o la tarjeta madre junto con su umbral crítico y de advertencia. 38 como advertencia y 42 como crítico.
Cause
Esto se debe a la situación ambiental que la ventilación no es buena. Esto hace que el nodo de VxRail genere una temperatura alta. Cuando el módulo del ventilador no puede ajustar la velocidad para enfriar la temperatura del componente interno, el evento térmico hace que el servidor se ejecute en un modo degradado y apaga el servidor para evitar daños en el hardware. Esta operación depende de la configuración de la alerta de temperatura en iDRAC.
Alta temperatura de entrada: Si la alerta de temperatura no está configurada, cuando llegue a 42 grados o más durante un tiempo prolongado, primero se ejecutará en modo degradado e intentará utilizar el módulo del ventilador para enfriar el servidor. Después de un tiempo prolongado, el servidor se apaga.
Resolution
- Los nodos de VxRail cuentan con un mecanismo interno para lidiar con situaciones ambientales deficientes con su módulo de ventilador y con los umbrales de definición de advertencia y crítico. Como se mencionó anteriormente después de encontrarse con críticos:
Un. En iDRAC-configuration-system>> settings-alert> configuration-alerts-alert> configuration,>> expanda la temperatura. Si la primera línea crítica está con Power off, después de alcanzar la temperatura crítica, se apagará inmediatamente por disparo térmico de la CPU.
El siguiente comando de iDRAC tendría el mismo efecto:
racadm>>racadm eventfilters get -c idrac.alert.system.TMP.critical
B. Si el parámetro está en No Action, iDRAC intenta ajustar el módulo del ventilador para enfriar el sistema en primer lugar. Después de ejecutar ciclos extendidos, un disparo térmico de la CPU apagaría el servidor para evitar daños en los componentes de hardware debido a la temperatura continua.
2. Para evitar esta alta temperatura de entrada, los clientes deben asegurarse de que las temperaturas de entrada estén dentro del rango para un rendimiento óptimo.