Windows Server:在 PCI 扫描期间,多个 A16 GPU 可能会导致蓝屏错误
Summary: 本文讨论了在具有多个 A16 GPU 的 Windows Server 2019 或 2022 中,PCI 扫描期间可能会显示蓝屏错误。
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
用户可能会注意到蓝屏错误并显示停止代码 SYSTEM_THREAD_EXCEPTION_NOT_HANDLED (7e) 如果安装了多个 A16 GPU。
注意:蓝屏错误出现后,系统可以引导回操作系统。
注意:Windows Server 2016 也会受到影响,但已停售。
重现步骤:
在服务器中安装两台或更多台 NVIDIA A16。
安装 Windows Server 2019 或 Windows Server 2022 操作系统。
安装芯片组驱动程序、SWRAID (S140/S150/S160) 驱动程序,或通过设备管理器执行 PCI 扫描。
Cause
对于 Windows Server 2022 或之前的操作系统版本,操作系统遵循 ARI 设备的特定算法。
如果子节点的最大有效负载大小 (MPS) 小于父节点,则上游端口可以发送子节点无法应答的指令。
如果发生这种情况,端点将生成错误,并导致设备断开连接或蓝屏错误。在故障情况下,GPU 显示 MPS 值 256,而父级(USP 和 Rootport)支持 MPS 值 512。
Resolution
Windows Server 2022 修复:2024 年 3 月 12 日 - KB5035857(操作系统内部版本 20348.2340)- Microsoft支持
HCI 23H2 修复:2024 年 3 月 12 日 - KB5035856(操作系统内部版本 25398.763)- Microsoft支持
Affected Products
Microsoft Windows Server 2016, Microsoft Windows Server 2019, Microsoft Windows Server 2022Article Properties
Article Number: 000216458
Article Type: Solution
Last Modified: 05 Dec 2024
Version: 3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.