펌웨어를 업데이트하는 동안 Dell Kioxia CM6 NVMe 드라이브가 PCIe 치명적인 오류를 보고함
Summary: Kioxia CM6 NVMe 드라이브 펌웨어를 업데이트하는 동안 PCIe 치명적인 오류로 인해 PowerEdge 서버가 충돌합니다.
Symptoms
Kioxia CM6 NVMe 드라이브에서 펌웨어를 업데이트하면 OS(Operating System) 충돌이 발생할 수 있습니다. NVMe 드라이브와 연결된 PCIe 스위치의 수명주기 컨트롤러 로그에 치명적인 오류가 보고됩니다.
OS 충돌 및 후속 재부팅 후 드라이브에서 업데이트된 펌웨어가 성공적으로 설치되었다고 보고합니다.
10/24/24 7:00 RED110 Informational Downloading the Express-Flash-PCIe-SSD_Firmware_GMM6V_WN64_2.2.2_A08.EXE update package.
10/24/24 7:00 RED054 Informational An update job JID_298144489144 was created.
10/24/24 7:00 RED002 Informational Package successfully downloaded.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 0 In Bay 1 to version 2.2.2.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 1 In Bay 1 to version 2.2.2.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 2 In Bay 1 to version 2.2.2.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 3 In Bay 1 to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 0 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 1 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 2 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 3 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 0 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 1 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 2 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 3 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:04 PCI1318 Critical A fatal error was detected on a component at bus 227 device 0 function 0.
10/24/24 7:04 PCI1318 Critical A fatal error was detected on a component at bus 226 device 2 function 0.Cause
서버가 펌웨어 업데이트 중에 NVMe 드라이브 시간 초과를 감지하여 호스트 운영 체제가 충돌하고 iDRAC가 PCIe 치명적인 오류를 보고합니다.
Resolution
Dell Technologies는 이 문제를 해결하기 위해 CM6 펌웨어 버전 2.2.2를 출시했습니다. Dell Technologies는 운영 위험을 줄이기 위해 유지 보수 기간 중에 드라이브 펌웨어를 업데이트할 것을 권장합니다.
참고: 이 문제는 펌웨어 2.2.2에서 해결되었지만 업데이트 완료 후에만 개선 사항이 적용됩니다. 이 문제는 이전 펌웨어에서 2.2.2 이상 버전으로 업데이트하는 동안에도 발생할 수 있습니다.
Dell Kioxia CM6 및 기타 많은 NVMe 디바이스는 서버를 재부팅할 필요 없이 적용되는 재부팅 없는 펌웨어 업데이트를 지원합니다.
iDRAC는 다음 재부팅 시 설치를 위해 펌웨어를 LifeCycle Controller에 스테이징하지 않고 즉시 설치합니다. 재부팅 없는 펌웨어 업데이트에 대한 지원이 iDRAC9 펌웨어 6.10.00.00에 추가되었습니다. 자세한 내용은 Dell 지원에서 제공하는 iDRAC 사용자 가이드에서 확인할 수 있습니다.
시스템을 유지 보수 모드로 전환하기 전에 펌웨어 업데이트를 실행하면 자동 업데이트를 사용하는 솔루션에 영향을 미칠 수 있습니다.
Kioxia CM6 2.2.2 펌웨어(GMM6V)
https://www.dell.com/support/home/drivers/DriversDetails?driverID=GMM6V
Kioxia CM6 펌웨어 2.2.2에는 드라이브 펌웨어가 업데이트되는 동안 시간 초과 조건을 연장하기 위한 개선 사항이 포함되어 있습니다.