PowerEdge: BlueField-3 DPU PCIe 초기화 실패
요약: BlueField-3(BF3) DPU(Data Processing Unit) 카드(DPN: HFWRM)을 사용합니다.
증상
반복되는 PCIe(Peripheral Component Interconnect Express) 초기화 실패로 인해 LC(LifeCycle Controller 로그)에 다음과 같은 오류가 보고됩니다.
2025-07-27 17:38:59 294 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B8(NIC in Slot 33 Port 1 Partition 1)
2025-07-27 17:38:58 293 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B9(NIC in Slot 33 Port 2 Partition 1)
2025-07-17 17:30:57 189 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B8(NIC in Slot 33 Port 1 Partition 1)
2025-07-17 17:30:57 188 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B9(NIC in Slot 33 Port 2 Partition 1)
2025-05-11 17:29:46 46 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B8(NIC in Slot 33 Port 1 Partition 1)
2025-05-11 17:29:46 45 PR8 Device not detected: Nvidia Network Adapter - 5C:25:73:5A:4C:B9(NIC in Slot 33 Port 2 Partition 1)
원인
이 문제는 2025년 8월 14일에 릴리스된 펌웨어 버전 v32.46.3048에서 확인되고 해결되었습니다.
이는 알려진 NVIDIA 문제입니다. 장치 펌웨어는 PCIe 네트워크 초기화 중에 교육 프로세스에 영향을 미쳤으며 펌웨어 버전 v32.46.3048부터 문제가 해결되었습니다.
펌웨어 알고리듬은 PCIe 링크 안정성을 개선하기 위해 최적화되었습니다. 새로 제공된 NVIDIA 카드에는 이미 업데이트된 펌웨어 버전 v32.46.3048 이상이 포함되어 있는 것이 확인되었습니다.
해결
교체용 네트워크 카드를 즉시 디스패치하지 마십시오. 먼저, 전체 전원 주기를 실행하여 카드가 다시 감지 가능한지 확인합니다.
- 전원 주기 후 장애가 발생한 카드가 복구되는 경우:
BlueField-3 펌웨어를 v32.46.3048 이상으로 업데이트하고 BFB 이미지가 업데이트된 펌웨어와 정렬되었는지 확인합니다. NVIDIA DOCA 소프트웨어 프레임워크를 사용하여 적절한 파일을 다운로드할 수 있습니다 https://developer.nvidia.com/doca-downloads?deployment_platform=BlueField&deployment_package=BF-FW-Bundle&installer_type=BFB
- 전원을 껐다 켠 후에도 카드가 감지되지 않는 경우:
문제를 해결하려면 교체 카드를 디스패치합니다.