PowerEdge:在啟用 NVIDIA Bluefield 3 的伺服器上,POST 期間會顯示「找不到記憶體」事件

Summary: 最近結合資料處理器 (DPU) 韌體、複雜可程式化邏輯裝置 (CPLD) 韌體和 iDRAC,啟用正常關機功能。執行某些工作可能會在開機期間導致「找不到記憶體」事件。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

最近結合資料處理器 (DPU) 韌體、複雜可程式化邏輯裝置 (CPLD) 韌體和 iDRAC,啟用正常關機功能。執行某些工作可能會在開機期間導致「找不到記憶體」事件。這些工作的範例包括 BIOS 更新、PCIe 交換器板 (PSB) 更新、BIOS 組態變更,或伺服器冷重新開機。然後在後續重新開機時,伺服器可能會遇到此錯誤。

此功能可啟用 DPU 的順利關機。

這會影響所有支援 DPU 的平台。
  • R660
  • R760
  • R760XA
  • XE9680
這會影響已啟用 DPU 模式的 NVIDIA BlueField-3 DPU。
  • NVIDIA Bluefield-3 B3210e
  • NVIDIA Bluefield-3 B3220
注意:NVIDIA Bluefield-3 B3140H 以超級網路介面卡模式設定。如果已變更為 DPU 模式,也可能會遇到此事件。

開機自我測試 (POST) 期間的錯誤範例:
POST 錯誤:找不到記憶體

生命週期記錄中的錯誤範例:
image.png

Cause

新增此新功能後,功能需要對受影響平台的 NVIDIA BlueField-3、iDRAC 和 CPLD 韌體進行變更。在某些任務之後的電源重新啟動過程中,各種狀態機的計時不同步,從而導致事件。

 

注意:當 iDRAC 發現至少有一個以 DPU 模式執行的 DPU 時,即會執行此操作。如果 DPU 以超級網路介面卡模式執行,則不會遇到此問題。

受影響的 CPLD 版本:

  • 1.1.5
  • 1.1.7
受影響的 iDRAC 版本:
  • 7.10.50.00
受影響的 BlueField-3 版本:
  • 32.40.1000

Resolution

在即將推出的 CPLD 版本中已停用順利關機。
 

當未偵測到記憶體時:

伺服器在 BIOS 中維持在錯誤訊息狀態,如以上螢幕擷取畫面所示。伺服器處於此狀態並等待大約 1 分鐘,然後自動重新開機。伺服器重新開機後,即會完全運作,並正常顯示記憶體。

    Affected Products

    PowerEdge R660, PowerEdge R760, PowerEdge R760XA, PowerEdge XE9680
    Article Properties
    Article Number: 000227031
    Article Type: Solution
    Last Modified: 09 Jul 2025
    Version:  2
    Find answers to your questions from other Dell users
    Support Services
    Check if your device is covered by Support Services.