NVIDIA H100 GPU nvidia-SMI 输出报告不正确的聚合 SRAM 可纠正值

摘要: NVIDIA H100 图形处理单元 (GPU) 的 nvidia-SMI 输出可能会报告聚合静态随机存取存储器 (SRAM) 可纠正计数器的值不正确。

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

输出示例来自”nvidia-smi -q -d ECC" 命令配合使用的常见选项:

 

NVSMI 日志输出,带有聚合 SRAM 可纠正值 18446744073709551615

在上面的例子中,18446744073709551615的总SRAM可纠正值异常高且不正确。

 

原因

SRAM计数器计算错误。

解决方案

更新到 NVIDIA H100 驱动程序包版本 570.124.06 或更高版本。

受影响的产品

PowerEdge XE8640, PowerEdge XE9640, PowerEdge XE9680
文章属性
文章编号: 000317812
文章类型: Solution
上次修改时间: 22 1月 2026
版本:  2
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。