L'output della GPU NVIDIA H100 NVIDIA-SMI riporta un valore SRAM aggregato correggibile errato

Summary: L'output nvidia-smi per l'unità di elaborazione grafica (GPU) NVIDIA H100 potrebbe restituire un valore errato per il contatore correggibile SRAM (Static Random Access Memory) aggregato. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Output di esempio da "nvidia-smi -q -d ECC":

 

Output del registro NVSMI con valore SRAM aggregato correggibile di 18446744073709551615

Nell'esempio precedente, il valore correggibile SRAM aggregato di 18446744073709551615 è insolitamente alto e non corretto.

 

Cause

Il contatore SRAM è stato calcolato in modo errato.

Resolution

Eseguire l'aggiornamento al pacchetto di driver NVIDIA H100 versione 570.124.06 o successiva.

Affected Products

PowerEdge XE8640, PowerEdge XE9640, PowerEdge XE9680
Article Properties
Article Number: 000317812
Article Type: Solution
Last Modified: 12 May 2025
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.