Windows Server: Mehrere A16-GPUs können während eines PCI-Scans zu Bluescreen-Fehlern führen
Summary: In diesem Artikel wird darüber gesprochen, dass in Windows Server 2019 oder 2022 mit mehreren A16-GPUs während eines PCI-Scans möglicherweise ein Bluescreen-Fehler angezeigt wird.
Symptoms
NutzerInnen bemerken möglicherweise einen Bluescreen-Fehler mit Stoppcode. SYSTEM_THREAD_EXCEPTION_NOT_HANDLED (7e) wenn mehrere A16-GPUs installiert sind.
Anmerkung: Das System kann nach dem Bluescreen-Fehler wieder mit dem Betriebssystem starten.
Anmerkung: Windows Server 2016 ist ebenfalls betroffen, befindet sich jedoch am Ende der Nutzungsdauer.
Schritte zur Reproduktion:
Installieren Sie zwei oder mehr Einheiten NVIDIA A16 im Server.
Installieren Sie das Betriebssystem Windows Server 2019 oder Windows Server 2022.
Installieren Sie den Chipsatztreiber und den SWRAID-Treiber (S140/S150/S160) oder führen Sie einen PCI-Scan über Device Manager durch.
Cause
Bei Windows Server 2022 oder früheren Betriebssystemversionen folgt das Betriebssystem einem bestimmten Algorithmus für ARI-Geräte.
Wenn die MPS (Max Payload Size) des untergeordneten Elements kleiner ist als die des übergeordneten Elements, kann der Upstream-Port Anweisungen senden, die das untergeordnete Element nicht beantworten kann.
In diesem Fall erzeugt der Endpunkt einen Fehler, der entweder zu einer Trennung des Geräts oder zu einem Bluescreen-Fehler führt. Im fehlgeschlagenen Fall zeigt die GPU MPS von 256 an, während das übergeordnete Element (USP und Rootport) die Werte von 512 für MPS unterstützt.
Resolution
Fehlerbehebung für Windows Server 2022: 12. März 2024 – KB5035857 (OS Build 20348.2340) – Microsoft Support
HCI 23H2-Korrektur: 12. März 2024 – KB5035856 (OS Build 25398.763) – Microsoft Support