Dell Kioxia CM6 NVMeドライブがファームウェアのアップデート中にPCIeの致命的なエラーを報告する
Summary: Kioxia CM6 NVMeドライブ ファームウェアのアップデート中に、PCIe致命的なエラーが発生してPowerEdgeサーバーがクラッシュします。
Symptoms
Kioxia CM6 NVMeドライブのファームウェアをアップデートすると、オペレーティング システム(OS)がクラッシュする可能性があります。NVMeドライブに関連付けられているPCIeスイッチについて、LifeCycle Controllerログに致命的なエラーが報告されます。
OSがクラッシュし、その後再起動すると、ドライブはアップデートされたファームウェアが正常にインストールされたことを報告します。
10/24/24 7:00 RED110 Informational Downloading the Express-Flash-PCIe-SSD_Firmware_GMM6V_WN64_2.2.2_A08.EXE update package.
10/24/24 7:00 RED054 Informational An update job JID_298144489144 was created.
10/24/24 7:00 RED002 Informational Package successfully downloaded.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 0 In Bay 1 to version 2.2.2.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 1 In Bay 1 to version 2.2.2.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 2 In Bay 1 to version 2.2.2.
10/24/24 7:01 SUP0516 Informational Updating firmware for PCIe SSD In Slot 3 In Bay 1 to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 0 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 1 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 2 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 SUP0518 Informational Successfully updated the PCIe SSD In Slot 3 In Bay 1 firmware to version 2.2.2.
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 0 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 1 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 2 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:02 PR36 Informational Version change detected for PCIe SSD In Slot 3 In Bay 1 firmware. Previous version:2.2.0, Current version:2.2.2
10/24/24 7:04 PCI1318 Critical A fatal error was detected on a component at bus 227 device 0 function 0.
10/24/24 7:04 PCI1318 Critical A fatal error was detected on a component at bus 226 device 2 function 0.Cause
ファームウェア アップデート中にサーバーがNVMeドライブのタイムアウトを検出し、ホスト オペレーティング システムがクラッシュし、iDRACがPCIeの致命的エラーを報告します。
Resolution
デル・テクノロジーズは、この動作を解決するためにCM6ファームウェア バージョン2.2.2をリリースしました。デル・テクノロジーズでは、本番環境へのリスクを軽減するために、メンテナンス期間中にドライブ ファームウェアをアップデートすることを推奨しています。
メモ: この問題はファームウェア2.2.2で修正されていますが、拡張機能はアップデートが完了した後にのみ有効になります。この問題は、以前のファームウェアを2.2.2以降のバージョンにアップデートする際にも発生する可能性があります。
Dell Kioxia CM6およびその他の多くのNVMeデバイスは、サーバーの再起動を必要とせずに適用される再起動不要のファームウェア アップデートをサポートしています。
iDRACは、次回の再起動時にインストールするためにLifeCycle Controllerにファームウェアをステージングするのではなく、すぐにインストールします。再起動不要のファームウェア アップデートのサポートは、iDRAC9ファームウェア6.10.00.00に追加されました。詳細については、 Dellサポートから入手できるiDRACユーザー ガイドを参照してください。
自動アップデートを使用するソリューションは、システムがメンテナンス モードに移行する前にファームウェア アップデートが実行された場合に影響を受ける可能性があります。
キオクシアCM6 2.2.2ファームウェア(GMM6V)
https://www.dell.com/support/home/drivers/DriversDetails?driverID=GMM6V
Kioxia CM6ファームウェア2.2.2には、ドライブ ファームウェアのアップデート中にタイムアウト状態を延長するための改善が含まれています。