「PowerEdge:CPU0704マシン チェック エラーがiDRAC10 Lifecycleログの不正確なCPUインデックスを反映している
Summary: Dell PowerEdge 17Gサーバーでは、マシン チェック イベント(MCE)が記録されると、iDRAC10ライフサイクル ログ(LCLOG)とシステム イベント ログ(SEL)内に不正確なCPUインデックスが記録されます。
Symptoms
Dell PowerEdge 17Gサーバーは、Open Compute ProjectのData Center Modular Hardware System(DC-MHS)アーキテクチャを採用しています。標準の一部として、CPUはホスト プロセッサー モジュール(HPM)で「0」から始まるインデックスが付けられています。iDRAC10が活用する内部ライブラリーは、CPUインデックス作成を「1」で開始した旧世代のPowerEdgeサーバーと共有されています。v1.20.80.50より前のiDRAC10ファームウェア バージョンでは、MCEイベント内のCPUインデックス番号が正しく反映されていませんCPU0704。SEL と LCLOG の両方で、エラー メッセージ文字列内の +1 値が反映されます。
iDRAC10 UI >> システム >> の概要 >> コンポーネント >> プロセッサーのインデックス作成の例:

次のSELおよびLCLOGの例では、CPU1でCPUマシン チェック エラーが発生しましたが、イベント文字列はCPU2でエラーが発生したことを示しています。CPU0 の MCE イベントは、イベント文字列に CPU1 として記録されます。
SELの例:
2025-07-07 17:50:51 1004 CPU 2 machine check error detected.
LCLOGの例:
2025-07-07 17:50:51 5617 CPU0704 CPU 2 machine check error detected.
2025-07-07 17:50:51 5615 CPU0000 Internal error has occurred check for additional logs.
2025-07-07 17:48:15 5591 CPU0704 CPU 2 machine check error detected.
2025-07-07 17:48:14 5589 CPU0000 Internal error has occurred check for additional logs.
Cause
iDRAC10は、CPU0704エラー イベント文字列の引数を処理する際に、以前は値1から始まるCPUインデックスを解析していたiDRAC9との共有ライブラリーを活用します。
Resolution
iDRAC10ファームウェア1.20.80.50および2025年12月17G PowerEdgeサーバーBIOSリリースでは、サーバーBIOSから受信したCPUインデックス情報を適切に解析するためのロジックが追加されています
BIOSのリリース バージョンは、サーバー製品モデルによって異なります。iDRAC10の修正された列挙サポートを導入するBIOSリリースについては、次の表を参照してください。
|
|
|
|
|
|
|
|
|