Dell Kioxia CM6 NVMe-schijf meldt fatale PCIe-fout tijdens het bijwerken van firmware
Summary: PowerEdge servers crashen met fatale PCIe-fouten tijdens het bijwerken van de Kioxia CM6 NVMe-schijffirmware.
Symptoms
Het bijwerken van de firmware op Kioxia CM6 NVMe-schijven kan leiden tot een crash van het besturingssysteem (OS). Er wordt een fatale fout gemeld in het LifeCycle controller-logboek voor de PCIe-switch die is gekoppeld aan de NVMe-schijven.
Na de crash van het besturingssysteem en de daaropvolgende herstart, melden de schijven dat de bijgewerkte firmware met succes is geïnstalleerd.
10/24/24 7:00 RED110 Informational Downloading the Express-Flash-PCIe-SSD_Firmware_GMM6V_WN64_2.2.2_A08.EXE update package.
10/24/24 7:00 RED054 Informational An update job JID_298144489144 was created.
10/24/24 7:00 RED002 Informational Package successfully downloaded.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 0 In Bay 1 to version 2.2.2.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 1 In Bay 1 to version 2.2.2.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 2 In Bay 1 to version 2.2.2.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 3 In Bay 1 to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 0 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 1 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 2 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 3 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 0 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 1 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 2 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 3 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:04 PCI1318 Critical A fatal error was detected on a component at bus 227 device 0 function 0.
10/24/24 7:04 PCI1318 Critical A fatal error was detected on a component at bus 226 device 2 function 0.Cause
De server detecteert een time-out van de NVMe-schijf tijdens de firmware-update, waardoor het hostbesturingssysteem crasht, terwijl de iDRAC een fatale PCIe-fout meldt.
Resolution
Dell Technologies heeft CM6 firmwareversie 2.2.2 uitgebracht om dit probleem op te lossen. Dell Technologies raadt aan om de schijffirmware bij te werken tijdens een onderhoudsvenster om het risico voor de productie te beperken.
OPMERKING: Hoewel het probleem is opgelost in firmware 2.2.2, worden verbeteringen pas van kracht nadat de update is voltooid. Dit probleem kan zich nog steeds voordoen tijdens een update naar 2.2.2 of latere versies van eerdere firmware.
De Dell Kioxia CM6 en vele andere NVMe-apparaten ondersteunen firmware-updates zonder opnieuw opstarten die van toepassing zijn zonder dat de server opnieuw hoeft te worden opgestart.
De iDRAC installeert de firmware onmiddellijk in plaats van deze naar de LifeCycle Controller te sturen voor installatie bij de volgende keer opstarten. Ondersteuning voor firmware-updates zonder opnieuw opstarten is toegevoegd in iDRAC9-firmware 6.10.00.00; Meer informatie vindt u in de iDRAC-gebruikershandleidingen die beschikbaar zijn bij Dell Support.
Oplossingen die gebruikmaken van geautomatiseerde updates kunnen worden beïnvloed als firmware-updates worden uitgevoerd voordat systemen naar de onderhoudsmodus worden verplaatst.
Kioxia CM6 2.2.2 firmware (GMM6V)
https://www.dell.com/support/home/drivers/DriversDetails?driverID=GMM6V
Kioxia CM6 firmware 2.2.2 bevat verbeteringen om time-outcondities te verlengen tijdens het bijwerken van schijffirmware.