PowerEdge:IR7000:M7725 ConnectX-8 在高系统负载期间出现PCI3040错误断开连接

摘要: 在极少数情况下,例如 CPU、内存、NVIDIA ConnectX-8 InfiniBand 卡和其他 PCIe 卡处于繁重的工作负载之下,ConnectX-8 连接会中断约五秒钟。发生这种情况时,系统事件日志 (SEL) 中将记录PCI3039或PCI3040错误。

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

在极少数极端情况下,当 M7725 配置了 NVIDIA ConnectX-8 (P/N:NYKN5)、 LC/SEL 日志报告 PCI3039 or PCI3040: A high-severity issue is detected CX-8 InfiniBand 卡上出错。

SELlog 中的屏幕截图或错误

同时,操作系统日志记录了 CmpltTO (Completion TimeOut) PCIe fatal 错误,然后在大约 5 秒后成功恢复。

OSlog 硬件错误

恢复后 OSLog 链路处于活动状态

原因

未知

解决方案

按照 NVIDIA 性能调整指南本超链接将引导您访问非 Dell Technologies 运营的网站。在 ConnectX-8 卡上启用简化订购 (RO)。

NVIDIA 简化订购

受影响的产品

Mellanox Family of Adapters, PowerEdge M7725
文章属性
文章编号: 000357077
文章类型: Solution
上次修改时间: 18 3月 2026
版本:  3
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。