PowerEdge: BlueField-3-DPU-PCIe-Initialisierungsfehler
Zusammenfassung: Auftreten von PR8-Fehlern im Lifecycle-Protokoll (LC) bei Verwendung einer BlueField-3 (BF3)-Karte für Datenverarbeitungseinheiten (DPU) (DPN: HFWRM).
Symptome
Die LifeCycle Controller-Protokolle (LC-Protokoll) melden die folgenden Fehler aufgrund wiederholter PCIe-Initialisierungsfehler (Peripheral Component Interconnect Express):
2025-07-27 17:38:59 294 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B8(NIC in Slot 33 Port 1 Partition 1)
2025-07-27 17:38:58 293 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B9(NIC in Slot 33 Port 2 Partition 1)
2025-07-17 17:30:57 189 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B8(NIC in Slot 33 Port 1 Partition 1)
2025-07-17 17:30:57 188 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B9(NIC in Slot 33 Port 2 Partition 1)
2025-05-11 17:29:46 46 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B8(NIC in Slot 33 Port 1 Partition 1)
2025-05-11 17:29:46 45 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B9(NIC in Slot 33 Port 2 Partition 1)
Ursache
Das Problem wurde in der Firmwareversion v32.46.3048, die am 14. August 2025 veröffentlicht wurde, bestätigt und behoben.
Dies ist ein bekanntes NVIDIA-Problem. Die Gerätefirmware hat sich während der PCIe-Netzwerkinitialisierung auf den Schulungsprozess ausgewirkt. Das Problem wurde ab der Firmwareversion v32.46.3048 behoben.
Der Firmwarealgorithmus wurde optimiert, um die PCIe-Verbindungsstabilität zu verbessern. Es wird bestätigt, dass neu ausgelieferte NVIDIA-Karten bereits die aktualisierte Firmwareversion v32.46.3048 oder höher enthalten.
Lösung
Versenden Sie NICHT sofort eine Ersatz-Netzwerkkarte. Schalten Sie zunächst das System vollständig aus und wieder ein, um zu überprüfen, ob die Karte wieder erkannt wird.
- Wenn die fehlerhafte Karte nach dem Aus- und Einschalten wieder verfügbar ist:
Aktualisieren Sie die BlueField-3-Firmware auf v32.46.3048 oder höher und stellen Sie sicher, dass das BFB-Image an der aktualisierten Firmware ausgerichtet ist. Sie können die entsprechenden Dateien mit dem NVIDIA DOCA Software Framework herunterladen:https://developer.nvidia.com/doca-downloads?deployment_platform=BlueField&deployment_package=BF-FW-Bundle&installer_type=BFB
- Wenn die Karte nach dem Aus- und Einschalten nicht erkannt wird:
Fahren Sie mit dem Versand einer Ersatzkarte fort, um das Problem zu beheben.