Windows Server:PCIスキャン中に複数のA16 GPUがブルー スクリーン エラーを引き起こす可能性がある
Summary: この記事では、Windows Server 2019または2022で、複数のA16 GPUを使用すると、PCIスキャン中にブルー スクリーン エラーが表示される場合があるについて説明します。
Symptoms
STOPコードでブルー スクリーン エラーが発生することがある SYSTEM_THREAD_EXCEPTION_NOT_HANDLED (7e) 複数のA16 GPUが取り付けられている場合
手記:ブルー スクリーン エラーが発生した後、システムはオペレーティング システムを再起動して起動できます。
手記:Windows Server 2016も影響を受けますが、ライフサイクルは終了しています。
再現手順:
サーバーに2台以上のNVIDIA A16ユニットを設置します。
Windows Server 2019またはWindows Server 2022オペレーティング システムをインストールします。
チップセット ドライバー、SWRAID (S140/S150/S160)ドライバーをインストールするか、デバイス マネージャーを使用してPCIスキャンを実行します。
Cause
Windows Server 2022以前のオペレーティング システム バージョンの場合、OSはARIデバイスの特定のアルゴリズムに従います
子の最大ペイロード サイズ(MPS)が親の最大ペイロード サイズ(MPS)よりも小さい場合、アップストリーム ポートは子が応答できない命令を送信できます。
その場合、エンドポイントはエラーを生成し、デバイスの切断またはブルー スクリーン エラーが発生します。失敗した場合、親(USPおよびルートポート)がMPSの値512をサポートしているときに、GPUはMPSに256のMPSを表示します。
Resolution
Windows Server 2022の修正: 2024 年 3 月 12 日 — KB5035857 (OS ビルド 20348.2340) - Microsoft サポート
HCI 23H2の修正: 2024 年 3 月 12 日 — KB5035856 (OS ビルド 25398.763) - Microsoft サポート