「PowerEdge:BlueField-3 DPU PCIe初期化エラー
Summary: BlueField-3(BF3)データ処理ユニット(DPU)カード(DPN: HFWRM)です。
Symptoms
Peripheral Component Interconnect Express(PCIe)初期化の失敗が繰り返されたため、Lifecycle Controllerログ(LCログ)に次のエラーが報告されます。
2025-07-27 17:38:59 294 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B8(NIC in Slot 33 Port 1 Partition 1)
2025-07-27 17:38:58 293 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B9(NIC in Slot 33 Port 2 Partition 1)
2025-07-17 17:30:57 189 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B8(NIC in Slot 33 Port 1 Partition 1)
2025-07-17 17:30:57 188 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B9(NIC in Slot 33 Port 2 Partition 1)
2025-05-11 17:29:46 46 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B8(NIC in Slot 33 Port 1 Partition 1)
2025-05-11 17:29:46 45 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B9(NIC in Slot 33 Port 2 Partition 1)
Cause
この問題は、2025年8月14日にリリースされたファームウェア バージョンv32.46.3048で確認され、解決されました
これはNVIDIAの既知の問題です。デバイス ファームウェアは、PCIeネットワークの初期化中のトレーニング プロセスに影響を与えました。この問題は、ファームウェア バージョン v32.46.3048以降で解決されました。
ファームウェア アルゴリズムが最適化され、PCIeリンクの安定性が向上しました。新しく出荷されたNVIDIAカードには、アップデートされたファームウェアバージョンv32.46.3048以降がすでに含まれていることが確認されています。
Resolution
交換用ネットワーク カードをすぐにディスパッチしないでください。まず、フル パワー サイクルを実行して、カードが再び検出可能になるかどうかを確認します。
- 電源を入れ直した後に障害が発生したカードが回復した場合は、次の手順を実行します。
BlueField-3 ファームウェアを v32.46.3048 以降にアップデートし、 BFB イメージがアップデートされたファームウェアと一致していることを確認します。NVIDIA DOCA Software Framework:
を使用して、適切なファイルをダウンロードできます https://developer.nvidia.com/doca-downloads?deployment_platform=BlueField&deployment_package=BF-FW-Bundle&installer_type=BFB - 電源を入れ直した後もカードが検出されない場合は、次の手順を実行します。
交換用カードのディスパッチを続行して問題を解決します。