DLM: DLMV0198E Solución de problemas de errores corregibles de la verificación de máquina
Summary: La alerta DLmV0198E señala una comprobación de máquina en un sensor de CPU, lo que apunta a una falla en la unidad central de procesamiento (CPU) o en la controladora de interrupción programable avanzada (APIC), y puede afectar la memoria. ...
Symptoms
DLmV0198E: Processor sensor CPUMachineCheck - Correctable machine check error (CPU 2 | APIC ID 32 ) Asserted
DLmV0198E: Processor sensor CPUMachineCheck - Correctable machine check error (CPU 1 | APIC ID 4 ) Asserted
Y demás
Cause
Se emite un error de hardware y se genera una alerta con el mensaje de error DLmV0198E.
Resolution
Se debe revisar el registro de eventos del sistema de VTE correspondiente en busca de errores. El mensaje de error DLmV0198E es genérico y no siempre revela la falla real.
Puede comprobar el error mediante RACADM o mediante la conexión al VTE<
Si puede conectarse a la unidad mediante la línea de comandos o Putty, el siguiente comando debería revelar uno o más errores.
racadm getsel
O bien,
ipmitool sel list
Los errores son de la misma fecha que la alerta.
Record: 17 Date/Time: 03/08/2020 05:19:04 Source: system Severity: Critical Description: Correctable memory error logging disabled for a memory device at lo cation DIMM_B1.
En el ejemplo anterior, se muestra un error de tarjeta de memoria (DIMM).
Clientes: si reciben una notificación de este mensaje de alerta, comprueben si se envió una alerta Call Home a Dell a través del sitio de soporte. Este error genera una llamada a casa y, si ya se creó un caso, el personal de soporte de Dell realiza un seguimiento de la alerta. Por lo general, se tarda menos de una hora en recibir una alerta de Call Home de esta naturaleza.
Si ha perdido acceso a la unidad o DLm no monta cintas, comuníquese con el soporte de DLm inmediatamente.
Personal de soporte: Solucione la alerta utilizando la información obtenida del registro de eventos del sistema. Si no puede conectarse a la línea de comandos, intente conectarse a la interfaz de iDRAC para ver si se puede realizar un ciclo de apagado y encendido de la unidad. Si la unidad no responde a los comandos de iDRAC, envíe un recurso de campo al sitio para reemplazar el VTE, si es necesario.
Si se puede acceder a la unidad, recopile la información necesaria para solucionar la alerta.