La unidad NVMe Dell Kioxia CM6 informa un error irrecuperable de PCIe durante la actualización del firmware
Summary: Los servidores PowerEdge se bloquean con errores irrecuperables de PCIe durante la actualización del firmware de la unidad NVMe Kioxia CM6.
Symptoms
La actualización del firmware en las unidades NVMe CM6 de Kioxia puede provocar un bloqueo del sistema operativo (SO). Se informa un error irrecuperable en el registro de LifeCycle Controller para el switch PCIe asociado con las unidades NVMe.
Después de la falla del sistema operativo y el reinicio posterior, las unidades informarán que el firmware actualizado se instaló correctamente.
10/24/24 7:00 RED110 Informational Downloading the Express-Flash-PCIe-SSD_Firmware_GMM6V_WN64_2.2.2_A08.EXE update package.
10/24/24 7:00 RED054 Informational An update job JID_298144489144 was created.
10/24/24 7:00 RED002 Informational Package successfully downloaded.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 0 In Bay 1 to version 2.2.2.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 1 In Bay 1 to version 2.2.2.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 2 In Bay 1 to version 2.2.2.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 3 In Bay 1 to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 0 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 1 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 2 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 3 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 0 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 1 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 2 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 3 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:04 PCI1318 Critical A fatal error was detected on a component at bus 227 device 0 function 0.
10/24/24 7:04 PCI1318 Critical A fatal error was detected on a component at bus 226 device 2 function 0.Cause
El servidor detecta un tiempo de espera agotado de la unidad NVMe durante la actualización del firmware, lo que provoca que el sistema operativo host se bloquee, mientras que la iDRAC informa un error irrecuperable de PCIe.
Resolution
Dell Technologies lanzó la versión 2.2.2 del firmware de CM6 para resolver este comportamiento. Dell Technologies recomienda actualizar el firmware de la unidad durante una ventana de mantenimiento a fin de reducir el riesgo para la producción.
NOTA: Si bien el problema se resolvió en el firmware 2.2.2, las mejoras se harán efectivas solo después de que se complete la actualización. Este problema puede ocurrir durante una actualización a 2.2.2 o versiones posteriores desde cualquier firmware anterior.
Dell Kioxia CM6 y muchos otros dispositivos NVMe admiten actualizaciones de firmware sin reinicio que se aplican sin necesidad de reiniciar el servidor.
La iDRAC instala el firmware de inmediato en lugar de almacenarlo provisionalmente en LifeCycle Controller para su instalación en el siguiente reinicio. Se agregó soporte para actualizaciones de firmware sin reinicio en el firmware 6.10.00.00 de iDRAC9; Puede encontrar más detalles en las guías del usuario de iDRAC disponibles en el soporte de Dell.
Las soluciones que utilizan actualizaciones automáticas pueden verse afectadas si las actualizaciones de firmware se ejecutan antes de que los sistemas pasen al modo de mantenimiento.
Firmware 2.2.2 de Kioxia CM6 (GMM6V)
https://www.dell.com/support/home/drivers/DriversDetails?driverID=GMM6V
El firmware 2.2.2 de Kioxia CM6 contiene mejoras para extender las condiciones de tiempo de espera agotado mientras se actualiza el firmware de la unidad.