R750 DSS: NVIDIA Mellanox BlueField-2 DPU-kort, DPN-GRNMC Fel vid PCIe-länkutbildning
Riepilogo: PowerEdge R750 datacenterskalbara lösningar (DSS) kan få fel när äldre versioner av Data Center-on-a-Chip Architecture (DOCA) körs med NVIDIA Mellanox BlueField-2-DPU-kortet (Data Processing Unit). ...
Questo articolo si applica a
Questo articolo non si applica a
Questo articolo non è legato a un prodotto specifico.
Non tutte le versioni del prodotto sono identificate in questo articolo.
Sintomi
NVIDIA Mellanox MT42822 BlueField-2 100G DPU-kanalkort, DPN# GRNMC, är en DSS-kvalificerad DPU-adapter som kan vara utrustad med vissa DSS-konfigurerade PowerEdge-servrar enligt vissa DSS/RCI-användarspecifika krav.
Denna adapter är kvalificerad och stöds av NVIDIA DOCA 1.5.1 eller senare versioner av Dell DSS/RCI-teknikteamet.
Om DOCA-avbildningen ändras till en tidigare version än 1.5.1 på det här specifika kortet kan flera felsymptom observeras på servern.
Till exempel:
1. Fel på PCIe-länkutbildning UEFI0067 loggas i iDRAC/LifeCycle-loggen:
2. Värdoperativsystemet (OS) kan inte initiera DPU-adaptern.
3. Allvarliga PCIe-bussfelhändelser loggas i iDRAC/livscykelloggen och pekar på den kortplats där DPU-adaptern är installerad.

Denna adapter är kvalificerad och stöds av NVIDIA DOCA 1.5.1 eller senare versioner av Dell DSS/RCI-teknikteamet.
Om DOCA-avbildningen ändras till en tidigare version än 1.5.1 på det här specifika kortet kan flera felsymptom observeras på servern.
Till exempel:
1. Fel på PCIe-länkutbildning UEFI0067 loggas i iDRAC/LifeCycle-loggen:
2. Värdoperativsystemet (OS) kan inte initiera DPU-adaptern.
[ 133.575847] kernel: mlx5_core 0000:ca:00.1: firmware version: 24.35.2000 [ 133.576304] kernel: mlx5_core 0000:ca:00.1: 252.048 Gb/s available PCIe bandwidth (16.0 GT/s PCIe x16 link) [ 153.576974] kernel: mlx5_core 0000:ca:00.1: wait_fw_init:195:(pid 821): Waiting for FW initialization, timeout abort in 100s [ 173.584974] kernel: mlx5_core 0000:ca:00.1: wait_fw_init:195:(pid 821): Waiting for FW initialization, timeout abort in 79s [ 193.592974] kernel: mlx5_core 0000:ca:00.1: wait_fw_init:195:(pid 821): Waiting for FW initialization, timeout abort in 59s [ 213.600975] kernel: mlx5_core 0000:ca:00.1: wait_fw_init:195:(pid 821): Waiting for FW initialization, timeout abort in 39s [ 233.608975] kernel: mlx5_core 0000:ca:00.1: wait_fw_init:195:(pid 821): Waiting for FW initialization, timeout abort in 19s [ 253.584980] kernel: mlx5_core 0000:ca:00.1: mlx5_function_setup:960:(pid 821): Firmware over 120000 MS in pre-initializing state, aborting [ 253.586029] kernel: mlx5_core 0000:ca:00.1: init_one:1366:(pid 821): mlx5_load_one failed with error code -16 [ 253.587272] kernel: mlx5_core: probe of 0000:ca:00.1 failed with error -16
3. Allvarliga PCIe-bussfelhändelser loggas i iDRAC/livscykelloggen och pekar på den kortplats där DPU-adaptern är installerad.

Causa
DSS/RCI-tekniker kvalificerade två modeller av Mellanox BlueField-2 DPU-kanaladaptern.
Från och med DOCA 1.5.1 LTS-versionen stöds båda modellerna, DPN#CH5RM och DPN#GRNMC.
NVIDIA Mellanox rekommenderar DOCA-paket (LTS) 1.5.7 eller senare.
- 32 GB NVIDIA Mellanox BlueField2 DPU-kort (DPN#CH5RM, modell# MBF2H516A-CEEOT)
- 128 G NVIDIA Mellanox BlueField2 DPU-kort (DPN#GRNMC, modell# MBF2H516C-CECOT)
Från och med DOCA 1.5.1 LTS-versionen stöds båda modellerna, DPN#CH5RM och DPN#GRNMC.
NVIDIA Mellanox rekommenderar DOCA-paket (LTS) 1.5.7 eller senare.
Risoluzione
Om Dell PowerEdge-servern upplever de nämnda felsymptomen med den DSS-kvalificerade NVIDIA Mellanox BlueField2 DPU-adaptern (DPN#GRNMC), se till att DOCA 1.5.1 LTS eller en senare version är korrekt installerad.
Om DOCA-avbildningen uppdateras till en äldre version som inte stöds på den här 128G DPU-adaptern använder du följande procedur för att återställa DPU:n:
Om DOCA-avbildningen uppdateras till en äldre version som inte stöds på den här 128G DPU-adaptern använder du följande procedur för att återställa DPU:n:
Installera DOCA-värddrivrutiner som finns i https://developer.nvidia.com/networking/doca
exempel: För Ubuntu 20.04-värdoperativsystemet
- WGET https://content.mellanox.com/DOCA/DOCA_v2.7.0/host/doca-host_2.7.0-204000-24.04-ubuntu2004_amd64.deb
-
dpkg -i doca-host_2.7.0-204000-24.04-ubuntu2004_amd64.deb apt-get update apt install doca-all
Ladda ner och installera det senaste BF2 DOCA-paketet.
- WGET https://content.mellanox.com/BlueField/BFBs/Ubuntu22.04/bf-bundle-2.7.0-33_24.04_ubuntu-22.04_prod.bfb
-
bfb-install --bfb bf-bundle-2.7.0-33_24.04_ubuntu-22.04_prod.bfb --rshim rshim0
När DOCA-installationen på BF2 är klar, återställ BF2.
-
echo "SW_RESET 1" > /dev/rshim0/mis
Prodotti interessati
Datacenter Scalable Solutions, Mellanox Family of AdaptersProprietà dell'articolo
Numero articolo: 000228342
Tipo di articolo: Solution
Ultima modifica: 03 ott 2024
Versione: 2
Trova risposta alle tue domande dagli altri utenti Dell
Support Services
Verifica che il dispositivo sia coperto dai Servizi di supporto.