PowerScale: Isilon: Gen6: F810-Nodes mit veralteter Mellanox5-EN0-Firmware behalten ihr Dateisystemjournal bei Neustarts möglicherweise unerwartet nicht bei
Zusammenfassung: Ein Problem mit früheren Versionen der Firmware auf dem Mellanox5-EN0-Gerät, das ausschließlich in F810-Nodes auftritt, kann einen unerwarteten Kaltstart dieser Nodes erzwingen, wenn ein Warmstart angefordert oder durch eine Panik oder einen anderen Fehler ausgelöst wird. Wenn der Peer-Node ebenfalls kalt neu gestartet wird, bevor der betroffene Node sein Journal abrufen kann, kann das Journal auf beiden Nodes verloren gehen. ...
Dieser Artikel gilt für
Dieser Artikel gilt nicht für
Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden.
In diesem Artikel werden nicht alle Produktversionen aufgeführt.
Symptome
Der Node zeigt während des Neustarts möglicherweise ein IERR auf dem Back-end-Komprimierungs-NIC-Gerät im BMC-SEL-Protokoll an, gefolgt von einer Meldung zum Kaltstart. Wenn der Node neu gestartet wird, werden möglicherweise Meldungen angezeigt, die darauf hinweisen, dass das Node-Journal ungültig ist und vom Peer-Node abgerufen werden musste. Wenn der Abruf fehlschlägt (weil der Peer-Node ebenfalls kalt neu gestartet wurde), wird der Startvorgang mit einer Fehlermeldung beendet, die auf ein ungültiges Journal hinweist. Im Meldungsprotokoll des Node werden möglicherweise auch Meldungen ähnlich der folgenden angezeigt:
2022-12-16T23:25:53-05:00 <3.4> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) WARNING: MLX5 device mce0 firmware unhealthy.
2022-12-16T23:25:53-05:00 <3.3> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) ERROR: MLX5 device unhealthy: mce0 -- {'irisc_index': 0, 'assert_return_address': 9413196L, 'assert_exit_pointer': 8455212L, 'firmware_version': 270012340L, 'miss_counter': 3L, 'syndrome': 7, 'hardware_device_id': 525L, 'assert_var4': 0L, 'assert_var3': 0L, 'assert_var2': 0L, 'assert_var1': 10338568L, 'assert_var0': 1L, 'extended_syndrome': '\x90@'}
2022-12-16T23:25:53-05:00 <3.4> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) WARNING: MLX5 device mce1 firmware unhealthy.
2022-12-16T23:25:53-05:00 <3.3> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) ERROR: MLX5 device unhealthy: mce1 -- {'irisc_index': 0, 'assert_return_address': 9413196L, 'assert_exit_pointer': 8455212L, 'firmware_version': 270012340L, 'miss_counter': 3L, 'syndrome': 7, 'hardware_device_id': 525L, 'assert_var4': 0L, 'assert_var3': 0L, 'assert_var2': 0L, 'assert_var1': 10338568L, 'assert_var0': 1L, 'extended_syndrome': '\x90@'}
Ursache
Ein Problem mit Versionen älter als 16.28.1002+EMC0000000017 der Firmware für das Mellanox5-EN0-Gerät, das ausschließlich in F810-Nodes zu finden ist, kann einen unerwarteten Kaltneustart dieser Nodes erzwingen, wenn ein Warmstart angefordert oder durch einen Fehler ausgelöst wird. Unter normalen Umständen stellt der Node sein Journal aus der Peer-Node-Kopie wieder her. Wenn der Peer-Node jedoch auch nicht in der Lage ist, die Journalintegrität beizubehalten, kann das Journal verloren gehen.
Lösung
Dieses Problem wurde in der Mellanox5-EN0-Firmware 16.28.1002+EMC0000000017 behoben, die im April 2021 als Teil der Node-Firmwarepaket-Versionen 11.1.3 und 10.3.6 veröffentlicht wurde. Kunden, die noch eine ältere Firmwareversion als die oben genannte auf einem F810-Node ausführen, sollten die neueste Version des Node-Firmwarepakets installieren und so schnell wie möglich ein Node-Firmwareupdate auf ihrem Cluster planen.
Betroffene Produkte
Isilon, Isilon F810Artikeleigenschaften
Artikelnummer: 000207184
Artikeltyp: Solution
Zuletzt geändert: 16 Mai 2026
Version: 5
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.