PowerScale: Isilon: 6.ª generación: Es posible que los nodos F810 con firmware Mellanox5-EN0 obsoleto no conserven inesperadamente su registro del sistema de archivos durante los reinicios

Resumen: Un problema con versiones anteriores del firmware en el dispositivo Mellanox5-EN0, que se encuentra exclusivamente en los nodos F810, puede forzar el reinicio en frío inesperado de estos nodos cuando se solicita un reinicio en caliente o se activa por un estado de alarma u otro error. Si el nodo par también se reinicia en frío antes de que el nodo afectado pueda recuperar su registro, es posible que se pierda el registro en ambos nodos. ...

Este artículo se aplica a Este artículo no se aplica a Este artículo no está vinculado a ningún producto específico. No se identifican todas las versiones del producto en este artículo.

Síntomas

El nodo puede mostrar un IERR en el dispositivo NIC de compresión de back-end en el registro de SEL de BMC durante el reinicio, seguido de un mensaje de reinicio en frío. Cuando el nodo se reinicia, es posible que vea mensajes que indican que el registro del nodo no es válido y que se tuvo que recuperar del nodo par. Si la recuperación falla (debido a que el nodo par también se reinició en frío), el arranque se detiene con un mensaje de error que indica un registro no válido. También puede ver mensajes similares a los siguientes en el registro de mensajes del nodo:
2022-12-16T23:25:53-05:00 <3.4> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) WARNING: MLX5 device mce0 firmware unhealthy.
2022-12-16T23:25:53-05:00 <3.3> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) ERROR: MLX5 device unhealthy: mce0 -- {'irisc_index': 0, 'assert_return_address': 9413196L, 'assert_exit_pointer': 8455212L, 'firmware_version': 270012340L, 'miss_counter': 3L, 'syndrome': 7, 'hardware_device_id': 525L, 'assert_var4': 0L, 'assert_var3': 0L, 'assert_var2': 0L, 'assert_var1': 10338568L, 'assert_var0': 1L, 'extended_syndrome': '\x90@'}
2022-12-16T23:25:53-05:00 <3.4> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) WARNING: MLX5 device mce1 firmware unhealthy.
2022-12-16T23:25:53-05:00 <3.3> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) ERROR: MLX5 device unhealthy: mce1 -- {'irisc_index': 0, 'assert_return_address': 9413196L, 'assert_exit_pointer': 8455212L, 'firmware_version': 270012340L, 'miss_counter': 3L, 'syndrome': 7, 'hardware_device_id': 525L, 'assert_var4': 0L, 'assert_var3': 0L, 'assert_var2': 0L, 'assert_var1': 10338568L, 'assert_var0': 1L, 'extended_syndrome': '\x90@'}

Causa

Un problema con versiones anteriores a 16.28.1002+EMC0000000017 del firmware para el dispositivo Mellanox5-EN0, que se encuentra exclusivamente en los nodos F810, puede forzar el reinicio en frío inesperado de estos nodos cuando se solicita un reinicio en caliente o se desencadena por un estado de alarma u otro error. En circunstancias normales, el nodo recupera su registro desde la copia del nodo par. Sin embargo, si el nodo par tampoco puede conservar la integridad del registro, es posible que este se pierda.

Resolución

Este problema se resolvió en el firmware 16.28.1002+EMC0000000017 de Mellanox5-EN0, que se lanzó en abril del 2021 como parte de las versiones 11.1.3 y 10.3.6 del paquete de firmware de nodo. Cualquier cliente que aún ejecute una versión de firmware anterior a la anterior en cualquier nodo F810 debe instalar la versión más reciente del paquete de firmware de nodo y programar una actualización de firmware de nodo en su clúster lo antes posible.

Productos afectados

Isilon, Isilon F810
Propiedades del artículo
Número del artículo: 000207184
Tipo de artículo: Solution
Última modificación: 19 feb 2026
Versión:  4
Encuentre respuestas a sus preguntas de otros usuarios de Dell
Servicios de soporte
Compruebe si el dispositivo está cubierto por los servicios de soporte.