Windows Server: Várias GPUs A16 podem causar erro de tela azul durante uma verificação de PCI
Summary: Este artigo fala sobre isso no Windows Server 2019 ou 2022, com várias GPUs A16, um erro de tela azul pode aparecer durante uma verificação de PCI.
Symptoms
O usuário pode notar um erro de tela azul com o código de parada SYSTEM_THREAD_EXCEPTION_NOT_HANDLED (7e) se houver várias GPUs A16 instaladas.
Nota: O sistema pode inicializar novamente o sistema operacional após o erro de tela azul.
Nota: O Windows Server 2016 também é afetado, mas está no fim da vida útil.
Etapas para reprodução:
Instale duas ou mais unidades da NVIDIA A16 no servidor.
Instale o sistema operacional Windows Server 2019 ou Windows Server 2022.
Instale o driver do chipset, o driver SWRAID (S140/S150/S160) ou execute a varredura PCI através do Gerenciador de dispositivos.
Cause
Para o Windows Server 2022 ou versões anteriores do sistema operacional, o sistema operacional segue um determinado algoritmo para dispositivos ARI.
Se o tamanho máximo de carga útil (MPS) da criança for menor do que o do pai, a porta upstream poderá enviar instruções que a criança não poderá responder.
Se isso acontecer, o endpoint produzirá um erro e resultará em uma desconexão do dispositivo ou em um erro de tela azul. No caso de falha, a GPU exibe MPS de 256 enquanto o pai (USP e Rootport) está suportando os valores de 512 para MPS.
Resolution
Correção do Windows Server 2022: 12 de março de 2024 — KB5035857 (compilação do SO 20348.2340) – Suporte da
MicrosoftCorreção da HCI 23H2: 12 de março de 2024 — KB5035856 (compilação 25398.763 do SO) — Suporte da Microsoft