PowerEdge: Errore inizializzazione PCIe DPU BlueField-3
Riepilogo: Riscontro di errori PR8 nel registro LifeCycle (LC) quando si utilizza una scheda DPU (Data Processing Unit) BlueField-3 (BF3) (DPN: HFWRM)
Sintomi
I registri di Lifecycle Controller (registro LC) riportano i seguenti errori dovuti a ripetuti errori di inizializzazione di PCIe (Peripheral Component Interconnect Express):
2025-07-27 17:38:59 294 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B8(NIC in Slot 33 Port 1 Partition 1) 2025-07-27 17:38:58 293 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B9(NIC in Slot 33 Port 2 Partition 1) 2025-07-17 17:30:57 189 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B8(NIC in Slot 33 Port 1 Partition 1) 2025-07-17 17:30:57 188 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B9(NIC in Slot 33 Port 2 Partition 1) 2025-05-11 17:29:46 46 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B8(NIC in Slot 33 Port 1 Partition 1) 2025-05-11 17:29:46 45 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B9(NIC in Slot 33 Port 2 Partition 1)
Causa
Il problema è stato confermato ed è stato risolto nella versione del firmware 32.46.3048, rilasciata il 14 agosto 2025.
Si tratta di un problema noto di NVIDIA. Il firmware del dispositivo ha influito sul processo di addestramento durante l'inizializzazione della rete PCIe e la questione è stata risolta a partire dalla versione firmware 32.46.3048.
L'algoritmo del firmware è stato ottimizzato per migliorare la stabilità del collegamento PCIe. È confermato che le schede NVIDIA appena spedite includono già il firmware aggiornato alla versione 32.46.3048 o successiva.
Risoluzione
Eseguire un ciclo di alimentazione completo per verificare se la scheda diventa nuovamente rilevabile.
- Se la scheda guasta viene ripristinata dopo un ciclo di alimentazione:
Aggiornare il firmware BlueField-3 alla versione 32.46.3048 o successiva e assicurarsi che l'immagine BFB sia allineata con il firmware aggiornato. È possibile scaricare i file appropriati utilizzando il framework software NVIDIA DCA:
https://developer.nvidia.com/doca-downloads?deployment_platform=BlueField&deployment_package=BF-FW-Bundle&installer_type=BFB - Se la scheda non è ancora rilevabile dopo il ciclo di accensione/spegnimento:
Per risolvere il problema, procedere con l'apertura di una Service Request relativa a una scheda sostitutiva.