PowerEdge: SK Hynix PS1010 e PS1030 NVMe relata erro fatal de barramento PCIe e PSOD do sistema operacional
Summary: Quando uma SSD NVMe PS1010 ou PS1030 é instalada, pode ocorrer uma PSOD durante a produção ou a coleta de logs do sistema operacional (SO).
Symptoms
Unidades SSD SK Hynix PS1010 e PS1030 NVMe com versão de firmware 1.0.0 podem apresentar um erro fatal no barramento PCIe e uma falha no sistema operacional.
Essa condição pode ser vista na produção enquanto as unidades estão sob uma carga de trabalho de E/S pesada. Isso também pode ser visto em alguns cenários, quando um vm-support é coletado ou quando um registro TSR com dados do sistema operacional é incluído.
Captura de tela do PSOD:
Exemplo de registro do ciclo de vida:
2024-09-11 01:41:59 PCI1318 A fatal error was detected on a component at bus 21 device 8 function 0.
2024-09-11 01:41:58 PCI1319 A high-severity issue is detected in the SSD bay 2, Slot 15.
2024-09-11 01:41:56 PCI1318 A fatal error was detected on a component at bus 21 device 8 function 0.
2024-09-11 01:41:54 PCI1319 A high-severity issue is detected in the SSD bay 2, Slot 15.
- O local onde ocorre o erro fatal do barramento pode variar dependendo da configuração da unidade.
- O problema foi relatado em ambientes vSAN ESA, mas também pode estar presente no vSAN OSA.
- Erros fatais de barramento PCIe em unidades PS10x0 podem ser vistos em sistemas operacionais Windows e Linux.
Cause
As unidades PS1010 e PS1030 NVMe podem ver esse erro devido a tarefas internas da unidade atrasadas e não concluídas dentro de um determinado período.
Resolution
Atualizar a SSD NVMe PS1010/PS1030 para a versão de firmware 1.2.0 ou posterior; O pacote de atualização de firmware é compatível com ambos os modelos de unidade.
https://www.dell.com/support/home/drivers/DriversDetails?driverID=3X8R4