Dlm: DLMV0198E Solução de problemas de erro corrigível de verificação de máquina
Summary: O alerta DLmV0198E sinaliza uma verificação de máquina em um sensor da CPU, apontando para uma falha na Unidade de Processamento Central (CPU) ou no Controlador de Interrupção Programável Avançado (APIC), e pode afetar a memória. ...
Symptoms
DLmV0198E: Processor sensor CPUMachineCheck - Correctable machine check error (CPU 2 | APIC ID 32 ) Asserted
DLmV0198E: Processor sensor CPUMachineCheck - Correctable machine check error (CPU 1 | APIC ID 4 ) Asserted
E assim por diante
Cause
Um erro de hardware é emitido e um alerta é gerado na mensagem de erro DLmV0198E.
Resolution
O respectivo registro de eventos do sistema VTE deve ser analisado em busca de erros. A mensagem de erro DLmV0198E é genérica e nem sempre revela a falha real.
Você pode verificar o erro usando o RACADM ou conectando-se ao VTE<
Se você puder se conectar à unidade pela linha de comando ou pelo Putty, o comando a seguir deve revelar um ou mais erros.
racadm getsel
Ou
ipmitool sel list
Os erros são da mesma data que o alerta.
Record: 17 Date/Time: 03/08/2020 05:19:04 Source: system Severity: Critical Description: Correctable memory error logging disabled for a memory device at lo cation DIMM_B1.
O exemplo acima mostra um erro de placa de memória (DIMM).
Clientes: se você for notificado sobre essa mensagem de alerta, verifique se um alerta de Call Home foi enviado à Dell por meio do site de suporte. Esse erro gera um call home e, se um caso já tiver sido criado, a equipe de suporte Dell fará o acompanhamento do alerta. Geralmente leva menos de uma hora para receber um alerta de call home dessa natureza.
Se você perdeu o acesso à unidade ou se o DLm não está montando fitas, entre em contato com o suporte do DLm imediatamente.
Equipe de apoio: Solucione o problema do alerta usando as informações obtidas do registro de eventos do sistema. Se você não conseguir se conectar à linha de comando, tente se conectar à interface do iDRAC para ver se é possível desligar e religar a unidade. Se a unidade não responder aos comandos do iDRAC, envie um recurso de campo ao local para substituir o VTE, se necessário.
Se a unidade estiver acessível, reúna as informações necessárias para solucionar o problema do alerta.