Dell Kioxia CM6 NVMe-drev rapporterer fatal PCIe-fejl under opdatering af firmware
Summary: PowerEdge-servere går ned med fatale PCIe-fejl under opdatering af firmwaren til Kioxia CM6 NVMe-drev.
Symptoms
Opdatering af firmwaren på Kioxia CM6 NVMe-drev kan forårsage et operativsystemnedbrud (OS). Der rapporteres en alvorlig fejl i livscykluscontrollerloggen for PCIe-switchen, der er tilknyttet NVMe-drevene.
Efter OS-nedbruddet og efterfølgende genstart rapporterer drevene, at den opdaterede firmware er installeret korrekt.
10/24/24 7:00 RED110 Informational Downloading the Express-Flash-PCIe-SSD_Firmware_GMM6V_WN64_2.2.2_A08.EXE update package.
10/24/24 7:00 RED054 Informational An update job JID_298144489144 was created.
10/24/24 7:00 RED002 Informational Package successfully downloaded.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 0 In Bay 1 to version 2.2.2.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 1 In Bay 1 to version 2.2.2.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 2 In Bay 1 to version 2.2.2.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 3 In Bay 1 to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 0 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 1 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 2 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 3 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 0 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 1 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 2 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 3 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:04 PCI1318 Critical A fatal error was detected on a component at bus 227 device 0 function 0.
10/24/24 7:04 PCI1318 Critical A fatal error was detected on a component at bus 226 device 2 function 0.Cause
Serveren registrerer en timeout for NVMe-drev under firmwareopdateringen, hvilket får værtens operativsystem til at gå ned, mens iDRAC rapporterer en fatal PCIe-fejl.
Resolution
Dell Technologies har udgivet CM6-firmwareversion 2.2.2 for at løse dette problem. Dell Technologies anbefaler, at du opdaterer firmware til harddisken i et vedligeholdelsesvindue for at reducere risikoen for produktionen.
BEMÆRK: Mens problemet er løst i firmware 2.2.2, træder forbedringer først i kraft, når opdateringen er fuldført. Dette problem kan stadig opstå under en opdatering til 2.2.2 eller nyere versioner fra tidligere firmware.
Dell Kioxia CM6 og mange andre NVMe-enheder understøtter genstartsfri firmwareopdateringer, der gælder uden behov for en genstart af serveren.
iDRAC installerer firmwaren med det samme i stedet for at gemme den i Lifecycle-controlleren, så den kan installeres ved næste genstart. Understøttelse af firmwareopdateringer uden genstart blev tilføjet i iDRAC9-firmware 6.10.00.00; Du kan finde flere oplysninger i iDRAC-brugervejledningerne, som kan fås hos Dell Support.
Løsninger, der bruger automatiske opdateringer, kan blive påvirket, hvis firmwareopdateringer køres, før systemerne flyttes til vedligeholdelsestilstand.
Kioxia CM6 2.2.2-firmware (GMM6V)
https://www.dell.com/support/home/drivers/DriversDetails?driverID=GMM6V
Kioxia CM6-firmware 2.2.2 indeholder forbedringer til forlængelse af timeout-forhold, mens drevets firmware opdateres.