L'unità NVMe Dell Kioxia CM6 segnala un errore irreversibile PCIe durante l'aggiornamento del firmware
Summary: I server PowerEdge si arrestano in modo anomalo con errori irreversibili PCIe durante l'aggiornamento del firmware dell'unità NVMe Kioxia CM6.
Symptoms
L'aggiornamento del firmware sulle unità Kioxia CM6 NVMe può causare un arresto anomalo del sistema operativo (OS). Nel registro del Lifecycle Controller viene segnalato un errore irreversibile per lo switch PCIe associato alle unità NVMe.
Dopo l'arresto anomalo del sistema operativo e il successivo riavvio, le unità segnalano che il firmware aggiornato è stato installato correttamente.
10/24/24 7:00 RED110 Informational Downloading the Express-Flash-PCIe-SSD_Firmware_GMM6V_WN64_2.2.2_A08.EXE update package.
10/24/24 7:00 RED054 Informational An update job JID_298144489144 was created.
10/24/24 7:00 RED002 Informational Package successfully downloaded.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 0 In Bay 1 to version 2.2.2.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 1 In Bay 1 to version 2.2.2.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 2 In Bay 1 to version 2.2.2.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 3 In Bay 1 to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 0 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 1 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 2 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 3 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 0 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 1 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 2 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 3 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:04 PCI1318 Critical A fatal error was detected on a component at bus 227 device 0 function 0.
10/24/24 7:04 PCI1318 Critical A fatal error was detected on a component at bus 226 device 2 function 0.Cause
Il server rileva il timeout di un unità NVMe durante l'aggiornamento del firmware, causando l'arresto anomalo del sistema operativo host, mentre iDRAC segnala un errore irreversibile PCIe.
Resolution
Dell Technologies ha rilasciato la versione del firmware CM6 2.2.2 per risolvere questo problema. Dell Technologies consiglia di aggiornare il firmware dell'unità durante una finestra di manutenzione per ridurre i rischi per la produzione.
NOTA: Sebbene il problema sia stato risolto nel firmware 2.2.2, i miglioramenti diventano effettivi solo dopo il completamento dell'aggiornamento. Questo problema può comunque verificarsi durante un aggiornamento alla versione 2.2.2 o successiva da qualsiasi firmware precedente.
Dell Kioxia CM6 e molti altri dispositivi NVMe supportano aggiornamenti del firmware senza riavvio che si applicano senza la necessità di un riavvio del server.
L'iDRAC installa immediatamente il firmware anziché inviarlo temporaneamente a LifeCycle Controller per l'installazione al riavvio successivo. Il supporto per gli aggiornamenti del firmware senza riavvio è stato aggiunto nel firmware iDRAC9 6.10.00.00; ulteriori dettagli sono disponibili nelle guide utente di iDRAC disponibili presso il supporto Dell.
Le soluzioni che utilizzano aggiornamenti automatizzati possono essere interessate se gli aggiornamenti del firmware vengono eseguiti prima che i sistemi vengano spostati in modalità di manutenzione.
Firmware Kioxia CM6 2.2.2 (GMM6V)
https://www.dell.com/support/home/drivers/DriversDetails?driverID=GMM6V
Il firmware Kioxia CM6 2.2.2 contiene miglioramenti per estendere le condizioni di timeout durante l'aggiornamento del firmware dell'unità.