ECS: xDoctor: RAP072: xDoctor informa un evento de hardware: la temperatura de entrada del sistema es superior al umbral crítico superior

Resumen: La temperatura de entrada del sistema es mayor que el umbral crítico máximo.

Este artículo se aplica a Este artículo no se aplica a Este artículo no está vinculado a ningún producto específico. No se identifican todas las versiones del producto en este artículo.

Síntomas

El nodo de ECS registró un evento de hardware en uno de sus componentes.
---------------------------------------------------
ERROR - xDoctor detected a hardware event.
--------------------------------------------------
Node = Nodes
Extra = {"Nodes": {"169.254.1.8": {"model": "ECSv3_R740XD2", "errors": {"TMP0121": {"category": "System", "severity": "Critical", "timestamp": "2023-10-21 14:05:22", "seq_number": "330430", "dell_model": "", "message": "The system inlet temperature is greater than the upper critical threshold."}}, "service_tag": "BBXXXX"}}} 
RAP = RAP072
Solution = KB 521400
Timestamp = 2023-11-16_125259
PSNT = CKM00xxxxxxx @ 4.8-94.1

Causa

La temperatura de entrada se utiliza para detectar la temperatura ambiente alrededor del nodo.

Resolución

Revise los registros de SEL para ver la alerta en otros nodos de ECS.
admin@ecsnode1: svc_exec "sudo ipmitool sel elist | grep Temp"
svc_exec v1.0.6 (svc_tools v2.14.0)                 Started 2023-11-22 07:10:02

Output from node: r1n1                                retval: 1

Output from node: r1n2                                retval: 1

Output from node: r1n3                                retval: 1

Output from node: r1n4                                retval: 1

Output from node: r1n5                                retval: 1

Output from node: r1n6                                retval: 0
   c | 10/21/2023 | 13:48:59 | Temperature Inlet Temp | Upper Non-critical going high | Asserted | Reading 37 > Threshold 37 degrees C
   d | 10/21/2023 | 14:20:50 | Temperature Inlet Temp | Upper Non-critical going high | Deasserted | Reading 34 > Threshold 37 degrees C

Output from node: r1n7                                retval: 0
   c | 10/21/2023 | 13:50:13 | Temperature Inlet Temp | Upper Non-critical going high | Asserted | Reading 37 > Threshold 37 degrees C
   d | 10/21/2023 | 14:20:41 | Temperature Inlet Temp | Upper Non-critical going high | Deasserted | Reading 34 > Threshold 37 degrees C

Output from node: r1n8                                retval: 0
   e | 10/21/2023 | 13:52:17 | Temperature Inlet Temp | Upper Non-critical going high | Asserted | Reading 37 > Threshold 37 degrees C
   f | 10/21/2023 | 14:05:21 | Temperature Inlet Temp | Upper Critical going high | Asserted | Reading 39 > Threshold 39 degrees C
  10 | 10/21/2023 | 14:20:52 | Temperature Inlet Temp | Upper Critical going high | Deasserted | Reading 36 > Threshold 39 degrees C
  11 | 10/21/2023 | 14:21:21 | Temperature Inlet Temp | Upper Non-critical going high | Deasserted | Reading 34 > Threshold 37 degrees C

Output from node: r1n9                                retval: 0
   c | 10/21/2023 | 13:56:51 | Temperature Inlet Temp | Upper Non-critical going high | Asserted | Reading 37 > Threshold 37 degrees C
   d | 10/21/2023 | 14:14:28 | Temperature Inlet Temp | Upper Critical going high | Asserted | Reading 39 > Threshold 39 degrees C
   e | 10/21/2023 | 14:20:44 | Temperature Inlet Temp | Upper Critical going high | Deasserted | Reading 36 > Threshold 39 degrees C
   f | 10/21/2023 | 14:21:04 | Temperature Inlet Temp | Upper Non-critical going high | Deasserted | Reading 34 > Threshold 37 degrees C

Output from node: r1n10                               retval: 0
   e | 10/21/2023 | 13:59:00 | Temperature Inlet Temp | Upper Non-critical going high | Asserted | Reading 37 > Threshold 37 degrees C
   f | 10/21/2023 | 14:21:07 | Temperature Inlet Temp | Upper Non-critical going high | Deasserted | Reading 34 > Threshold 37 degrees C

En el ejemplo anterior, la alerta se ve en varios nodos del rack. Hay un problema de alimentación o CA en el centro de datos, como que la CA no funciona correctamente. Esto habría provocado un aumento de la temperatura de entrada de los nodos.

El usuario debe verificar su centro de datos en busca de tales problemas de alimentación o CA.

Si no se encuentran problemas en el centro de datos, abra una solicitud de servicio con el soporte de Dell ECS para realizar una investigación más detallada.

Productos afectados

ECS
Propiedades del artículo
Número del artículo: 000220323
Tipo de artículo: Solution
Última modificación: 21 mar 2024
Versión:  3
Encuentre respuestas a sus preguntas de otros usuarios de Dell
Servicios de soporte
Compruebe si el dispositivo está cubierto por los servicios de soporte.