[PowerScale] F600: La SSD NVMe Kioxia CD5 de 7,68 TB puede fallar prematuramente cuando se ejecuta un firmware desactualizado

Summary: Se identificó un problema en las versiones de firmware para SSD NVMe Kioxia CD5 de 7,68 TB anteriores a la 1.1.5 que podrían provocar una falla prematura de la unidad. En algunos casos, este modo de falla puede provocar que el nodo entre en estado de alarma y se reinicie si ejecuta OneFS 9.1.0.4 o una versión anterior. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Se identificó un problema en las versiones de firmware para SSD NVMe Kioxia CD5 de 7,68 TB anteriores a la 1.1.5 que podrían provocar una falla prematura de la unidad. Si el nodo ejecuta OneFS 9.1.0.4 o una versión anterior, este modo de falla puede causar, en algunos casos, que el nodo entre en estado de alarma y se reinicie, lo que provocará que se registre un mensaje de alarma del kernel similar al siguiente en el registro del sistema:
panic @ time 1606735946.256, thread 0xfffff802cab45000: bio 0xfffff802cb64e060 cmd 1<BIO_READ> stuck in iosched nvd2 for over 240 seconds (240 seconds, cycle 40752ea883a294, arr 4074b401850eac), total_inprog 4, bio_rd_inprog 0, bio_wr_inprog 4, bio_rd_inqueue 1, bio_wr_inqueue 0

Cause

El fabricante de la unidad identificó un problema en la última versión disponible en el mercado del firmware para esta unidad, lo que puede provocar una falla prematura. El equipo de ingeniería de Dell EMC PowerScale identificó un problema en el código de OneFS que provoca que este modo de falla cause un estado de alarma en el kernel, en lugar de que se maneje correctamente.

Resolution

Para resolver el problema de firmware que causa una falla prematura de las unidades, actualícelas a la versión de firmware 1.1.5 o más reciente instalando el último paquete de soporte de unidades (1.37.2 o posterior) y ejecutando una actualización de firmware de unidad. El proceso de firmware de la unidad no es disruptivo y se puede ejecutar sin programar una ventana de mantenimiento. Las instrucciones para instalar un nuevo paquete de soporte de unidades (DSP) y actualizar el firmware de la unidad en el clúster se pueden encontrar en el documento de notas de la versión que acompaña a la versión de DSP.

Para resolver el problema de OneFS que provoca que los nodos de PowerScale entren en estado de alarma en determinadas situaciones de falla de unidad en OneFS versión 9.1.0.4 o anterior, instale el parche de implementación de OneFS más reciente (versión 9.1.0.6 o posterior) o actualice a OneFS 9.2 o una versión más nueva. Las instrucciones de instalación se pueden encontrar en el documento de notas de la versión que acompaña a la versión más reciente del parche de implementación (RUP) o OneFS.

Affected Products

PowerScale F600
Article Properties
Article Number: 000186477
Article Type: Solution
Last Modified: 05 Aug 2021
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.