PowerScale: Isilon: Generacja 6: Węzły F810 z nieaktualnym oprogramowaniem wewnętrznym Mellanox5-EN0 mogą nieoczekiwanie nie zachować dziennika systemu plików podczas ponownego uruchamiania
Podsumowanie: Problem z wcześniejszymi wersjami oprogramowania wewnętrznego urządzenia Mellanox5-EN0, które znajduje się wyłącznie w węzłach F810, może wymusić nieoczekiwane ponowne uruchomienie tych węzłów po zażądaniu ciepłego ponownego uruchomienia lub wyzwoleniu przez awarię lub inny błąd. Jeśli węzeł równorzędny zostanie również ponownie uruchomiony na zimno, zanim dany węzeł będzie mógł pobrać swój dziennik, dziennik na obu węzłach może zostać utracony. ...
Ten artykuł dotyczy
Ten artykuł nie dotyczy
Ten artykuł nie jest powiązany z żadnym konkretnym produktem.
Nie wszystkie wersje produktu zostały zidentyfikowane w tym artykule.
Objawy
Węzeł może wyświetlić IERR na urządzeniu NIC kompresji zaplecza w dzienniku BMC SEL podczas ponownego uruchamiania, a następnie komunikat o zimnym ponownym uruchomieniu. Po ponownym uruchomieniu węzła mogą zostać wyświetlone komunikaty wskazujące, że dziennik węzła jest nieprawidłowy i musiał zostać pobrany z węzła równorzędnego. Jeśli pobieranie nie powiedzie się (ponieważ węzeł równorzędny również został ponownie uruchomiony na zimno), rozruch zatrzymuje się z komunikatem o błędzie wskazującym na nieprawidłowy dziennik. W dzienniku komunikatów węzła mogą również zostać wyświetlone komunikaty podobne do następujących:
2022-12-16T23:25:53-05:00 <3.4> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) WARNING: MLX5 device mce0 firmware unhealthy.
2022-12-16T23:25:53-05:00 <3.3> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) ERROR: MLX5 device unhealthy: mce0 -- {'irisc_index': 0, 'assert_return_address': 9413196L, 'assert_exit_pointer': 8455212L, 'firmware_version': 270012340L, 'miss_counter': 3L, 'syndrome': 7, 'hardware_device_id': 525L, 'assert_var4': 0L, 'assert_var3': 0L, 'assert_var2': 0L, 'assert_var1': 10338568L, 'assert_var0': 1L, 'extended_syndrome': '\x90@'}
2022-12-16T23:25:53-05:00 <3.4> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) WARNING: MLX5 device mce1 firmware unhealthy.
2022-12-16T23:25:53-05:00 <3.3> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) ERROR: MLX5 device unhealthy: mce1 -- {'irisc_index': 0, 'assert_return_address': 9413196L, 'assert_exit_pointer': 8455212L, 'firmware_version': 270012340L, 'miss_counter': 3L, 'syndrome': 7, 'hardware_device_id': 525L, 'assert_var4': 0L, 'assert_var3': 0L, 'assert_var2': 0L, 'assert_var1': 10338568L, 'assert_var0': 1L, 'extended_syndrome': '\x90@'}
Przyczyna
Problem z wersjami starszymi niż 16.28.1002+EMC0000000017 oprogramowania wewnętrznego urządzenia Mellanox5-EN0, które znajduje się wyłącznie w węzłach F810, może wymusić nieoczekiwane zimne ponowne uruchomienie tych węzłów w przypadku żądania ciepłego ponownego uruchomienia lub wyzwolenia przez awarię lub inny błąd. W normalnych warunkach węzeł odzyskuje swój dziennik z kopii węzła równorzędnego. Jeśli jednak węzeł równorzędny również nie jest w stanie zachować integralności dziennika, arkusz może zostać utracony.
Rozwiązanie
Ten problem został rozwiązany w oprogramowaniu wewnętrznym Mellanox5-EN0 w wersji 16.28.1002+EMC0000000017, które zostało wydane w kwietniu 2021 r. jako część pakietu oprogramowania wewnętrznego węzła w wersjach 11.1.3 i 10.3.6. Każdy klient, który nadal korzysta ze starszej wersji oprogramowania wewnętrznego niż powyższa w dowolnym węźle F810, powinien zainstalować najnowszą wersję pakietu oprogramowania wewnętrznego węzła i zaplanować aktualizację oprogramowania wewnętrznego węzła w swoim klastrze JAK NAJSZYBCIEJ.
Produkty, których dotyczy problem
Isilon, Isilon F810Właściwości artykułu
Numer artykułu: 000207184
Typ artykułu: Solution
Ostatnia modyfikacja: 19 lut 2026
Wersja: 4
Znajdź odpowiedzi na swoje pytania u innych użytkowników produktów Dell
Usługi pomocy technicznej
Sprawdź, czy Twoje urządzenie jest objęte usługą pomocy technicznej.