PowerScale: Isilon: Gen6: Uzly F810 se zastaralým firmwarem Mellanox5-EN0 mohou během restartování neočekávaně selhat při uchování žurnálu systému souborů
Shrnutí: Problém se staršími verzemi firmwaru v zařízení Mellanox5-EN0, který se nachází výhradně v uzlech F810, může vynutit neočekávané restartování těchto uzlů, když je požadován teplý restart nebo je spuštěn panikou nebo jinou chybou. Pokud je partnerský uzel také restartován za studena, než dotčený uzel může načíst svůj deník, může dojít ke ztrátě deníku na obou uzlech. ...
Tento článek se vztahuje na
Tento článek se nevztahuje na
Tento článek není vázán na žádný konkrétní produkt.
V tomto článku nejsou uvedeny všechny verze produktu.
Příznaky
Uzel může během restartování zobrazit IERR na zařízení NIC s kompresí backendu v protokolu SEL BMC a následně zprávu o úplném restartování. Při restartování uzlu se mohou zobrazit zprávy oznamující, že deník uzlu je neplatný a bylo nutné jej načíst z partnerského uzlu. Pokud načítání selže (protože partnerský uzel byl také restartován za studena), spouštění se zastaví s chybovou zprávou oznamující neplatný deník. V protokolu zpráv uzlu se také mohou zobrazit zprávy podobné těm následujícím:
2022-12-16T23:25:53-05:00 <3.4> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) WARNING: MLX5 device mce0 firmware unhealthy.
2022-12-16T23:25:53-05:00 <3.3> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) ERROR: MLX5 device unhealthy: mce0 -- {'irisc_index': 0, 'assert_return_address': 9413196L, 'assert_exit_pointer': 8455212L, 'firmware_version': 270012340L, 'miss_counter': 3L, 'syndrome': 7, 'hardware_device_id': 525L, 'assert_var4': 0L, 'assert_var3': 0L, 'assert_var2': 0L, 'assert_var1': 10338568L, 'assert_var0': 1L, 'extended_syndrome': '\x90@'}
2022-12-16T23:25:53-05:00 <3.4> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) WARNING: MLX5 device mce1 firmware unhealthy.
2022-12-16T23:25:53-05:00 <3.3> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) ERROR: MLX5 device unhealthy: mce1 -- {'irisc_index': 0, 'assert_return_address': 9413196L, 'assert_exit_pointer': 8455212L, 'firmware_version': 270012340L, 'miss_counter': 3L, 'syndrome': 7, 'hardware_device_id': 525L, 'assert_var4': 0L, 'assert_var3': 0L, 'assert_var2': 0L, 'assert_var1': 10338568L, 'assert_var0': 1L, 'extended_syndrome': '\x90@'}
Příčina
Problém s verzemi firmwaru zařízení Mellanox5-EN0 staršími než 16.28.1002+EMC0000000017, který se nachází výhradně v uzlech F810, může vynutit neočekávané restartování těchto uzlů, když je požadován teplý restart nebo je vyvolán panikou nebo jinou chybou. Za normálních okolností uzel obnoví svůj deník z kopie partnerského uzlu. Pokud však partnerský uzel také není schopen zachovat integritu deníku, může dojít ke ztrátě deníku.
Řešení
Tento problém byl opraven ve firmwaru Mellanox5-EN0 16.28.1002+EMC0000000017, který byl vydán v dubnu 2021 jako součást balíčku firmwaru uzlu verze 11.1.3 a 10.3.6. Každý zákazník, který na některém uzlu F810 stále používá starší verzi firmwaru, než je výše uvedená, by měl nainstalovat nejnovější verzi balíčku firmwaru uzlu a naplánovat aktualizaci firmwaru uzlu na svém clusteru co nejdříve.
Dotčené produkty
Isilon, Isilon F810Vlastnosti článku
Číslo článku: 000207184
Typ článku: Solution
Poslední úprava: 19 úno 2026
Verze: 4
Najděte odpovědi na své otázky od ostatních uživatelů společnosti Dell
Služby podpory
Zkontrolujte, zda se na vaše zařízení vztahují služby podpory.