PowerEdge: Erros de verificação da máquina CPU0704 refletem o índice impreciso da CPU
Resumo: Os servidores Dell PowerEdge 17G registram o índice impreciso da CPU no registro de ciclo de vida (LCLOG) e no registro de eventos do sistema (SEL) do iDRAC10 quando o evento de verificação da máquina (MCE) é registrado. ...
Sintomas
Os servidores Dell PowerEdge 17G adotaram a arquitetura de sistema de hardware modular de data center (DC-MHS) do Open Compute Project. Como parte do padrão, as CPUs são indexadas começando com "0" no Módulo do processador de host (HPM). A biblioteca interna aproveitada pelo iDRAC10 é compartilhada com gerações anteriores de servidores PowerEdge que iniciaram a indexação da CPU com "1". As versões de firmware do iDRAC10 anteriores à v1.20.80.50 refletem de forma imprecisa o número do índice da CPU nos eventos CPU0704 MCE. O SEL e o LOG de LufeCYcle (LC) refletem um valor +1 dentro da string da mensagem de erro.
Visão geral do>>sistema >> da interface do usuário>>do iDRAC10 Componentes >> Exemplo de indexação do processador:

Nos exemplos de SEL e LCLOG abaixo, o erro de verificação da máquina da CPU ocorreu na CPU1, enquanto a string de eventos indica que ocorreu um erro na CPU2. Um evento MCE em CPU0 seria registrado como CPU1 na string de evento.
Exemplo de SEL:
2025-07-07 17:50:51 1004 CPU 2 machine check error detected.
Exemplo de LCLOG:
2025-07-07 17:50:51 5617 CPU0704 CPU 2 machine check error detected.
2025-07-07 17:50:51 5615 CPU0000 Internal error has occurred check for additional logs.
2025-07-07 17:48:15 5591 CPU0704 CPU 2 machine check error detected.
2025-07-07 17:48:14 5589 CPU0000 Internal error has occurred check for additional logs.
Causa
O iDRAC10 aproveita uma biblioteca compartilhada com o iDRAC9 que anteriormente analisava a indexação de CPU começando com o valor 1 ao processar o argumento para a string de evento de erro CPU0704.
Resolução
As versões do BIOS do firmware 1.20.80.50 do iDRAC10 e do servidor PowerEdge 17G (Tabela 1.0) adicionam lógica para analisar corretamente as informações de índice da CPU recebidas do BIOS do servidor.
As versões do BIOS variam de acordo com o modelo do produto de servidor. Consulte a tabela abaixo para obter as versões do BIOS que apresentam o suporte de enumeração corrigida para o iDRAC10.
Tabela 1.0
|
|
|
|
|
|
|
|
|