PowerScale: Isilon: Gen6: F810-noder med inaktuell fast programvara för Mellanox5-EN0 kan oväntat misslyckas med att behålla sin filsystemjournal under omstart

Sammanfattning: Ett problem med tidigare versioner av den fasta programvaran på Mellanox5-EN0-enheten, som endast finns i F810-noder, kan tvinga dessa noder att oväntat kallstarta när en varm omstart begärs eller utlöses av en panik eller något annat fel. Om peer-noden också kallstartas om innan den berörda noden kan hämta sin journal kan journalen på båda noderna gå förlorad. ...

Den här artikeln gäller för Den här artikeln gäller inte för Den här artikeln är inte kopplad till någon specifik produkt. Alla produktversioner identifieras inte i den här artikeln.

Symptom

Noden kan visa en IERR på NIC-enheten för serverdelskomprimering i BMC SEL-loggen under omstart, följt av ett meddelande om kall omstart. När noden startas om kan du se meddelanden som anger att nodens journal är ogiltig och måste hämtas från peer-noden. Om hämtningen misslyckas (eftersom peer-noden också kallstartades) stoppas starten med ett felmeddelande som anger en ogiltig journal. Du kan också se meddelanden som liknar följande i nodens meddelandelogg:
2022-12-16T23:25:53-05:00 <3.4> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) WARNING: MLX5 device mce0 firmware unhealthy.
2022-12-16T23:25:53-05:00 <3.3> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) ERROR: MLX5 device unhealthy: mce0 -- {'irisc_index': 0, 'assert_return_address': 9413196L, 'assert_exit_pointer': 8455212L, 'firmware_version': 270012340L, 'miss_counter': 3L, 'syndrome': 7, 'hardware_device_id': 525L, 'assert_var4': 0L, 'assert_var3': 0L, 'assert_var2': 0L, 'assert_var1': 10338568L, 'assert_var0': 1L, 'extended_syndrome': '\x90@'}
2022-12-16T23:25:53-05:00 <3.4> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) WARNING: MLX5 device mce1 firmware unhealthy.
2022-12-16T23:25:53-05:00 <3.3> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) ERROR: MLX5 device unhealthy: mce1 -- {'irisc_index': 0, 'assert_return_address': 9413196L, 'assert_exit_pointer': 8455212L, 'firmware_version': 270012340L, 'miss_counter': 3L, 'syndrome': 7, 'hardware_device_id': 525L, 'assert_var4': 0L, 'assert_var3': 0L, 'assert_var2': 0L, 'assert_var1': 10338568L, 'assert_var0': 1L, 'extended_syndrome': '\x90@'}

Orsak

Ett problem med versioner som är äldre än 16.28.1002+EMC0000000017 av den fasta programvaran för Mellanox5-EN0-enheten, som endast finns i F810-noder, kan tvinga dessa noder att oväntat starta om kallt när en varm omstart begärs eller utlöses av en panik eller något annat fel. Under normala omständigheter återställer noden sin journal från peer-nodkopian. Men om peer-noden inte heller kan behålla journalintegriteten kan journalen gå förlorad.

Upplösning

Det här problemet åtgärdades i den fasta programvaran Mellanox5-EN0 16.28.1002+EMC0000000017, som släpptes i april 2021 som en del av versionerna 11.1.3 och 10.3.6 av den fasta programvaran för nod. Kunder som fortfarande kör en äldre version av fast programvara än ovanstående på en F810-nod bör installera den senaste versionen av paketet med fast nodprogramvara och schemalägga en uppdatering av den fasta programvaran för noden på klustret så fort som möjligt.

Berörda produkter

Isilon, Isilon F810
Artikelegenskaper
Artikelnummer: 000207184
Artikeltyp: Solution
Senast ändrad: 19 feb. 2026
Version:  4
Få svar på dina frågor från andra Dell-användare
Supporttjänster
Kontrollera om din enhet omfattas av supporttjänster.