PowerScale: Isilon: Gen6: F810-knooppunten met verouderde Mellanox5-EN0-firmware behouden tijdens het opnieuw opstarten onverwacht hun bestandssysteemlogboek niet
Samenvatting: Een probleem met eerdere versies van de firmware op het Mellanox5-EN0-apparaat, dat uitsluitend in F810-knooppunten wordt aangetroffen, kan ertoe leiden dat deze knooppunten onverwacht koud opnieuw worden opgestart wanneer een warme herstart wordt aangevraagd of wordt geactiveerd door een panic of andere fout. Als het peerknooppunt ook koud opnieuw wordt opgestart voordat het betreffende knooppunt zijn logboek kan ophalen, kan het logboek op beide knooppunten verloren gaan. ...
Dit artikel is van toepassing op
Dit artikel is niet van toepassing op
Dit artikel is niet gebonden aan een specifiek product.
Niet alle productversies worden in dit artikel vermeld.
Symptomen
Het knooppunt kan tijdens het opnieuw opstarten een IERR weergeven op het back-end compressie-NIC-apparaat in het BMC SEL-logboek, gevolgd door een koud herstartbericht. Wanneer het knooppunt opnieuw wordt opgestart, ziet u mogelijk berichten die aangeven dat het logboek van het knooppunt ongeldig is en moest worden opgehaald van het peerknooppunt. Als het ophalen mislukt (omdat het peer-knooppunt ook koud opnieuw is opgestart), stopt het opstarten met een foutmelding die aangeeft dat er een ongeldig logboek is. Mogelijk ziet u ook berichten die lijken op de volgende in het berichtenlogboek van het knooppunt:
2022-12-16T23:25:53-05:00 <3.4> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) WARNING: MLX5 device mce0 firmware unhealthy.
2022-12-16T23:25:53-05:00 <3.3> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) ERROR: MLX5 device unhealthy: mce0 -- {'irisc_index': 0, 'assert_return_address': 9413196L, 'assert_exit_pointer': 8455212L, 'firmware_version': 270012340L, 'miss_counter': 3L, 'syndrome': 7, 'hardware_device_id': 525L, 'assert_var4': 0L, 'assert_var3': 0L, 'assert_var2': 0L, 'assert_var1': 10338568L, 'assert_var0': 1L, 'extended_syndrome': '\x90@'}
2022-12-16T23:25:53-05:00 <3.4> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) WARNING: MLX5 device mce1 firmware unhealthy.
2022-12-16T23:25:53-05:00 <3.3> CLUSTER-3(id3) isi_hwmon[2347]: (mlx5_health_v1) ERROR: MLX5 device unhealthy: mce1 -- {'irisc_index': 0, 'assert_return_address': 9413196L, 'assert_exit_pointer': 8455212L, 'firmware_version': 270012340L, 'miss_counter': 3L, 'syndrome': 7, 'hardware_device_id': 525L, 'assert_var4': 0L, 'assert_var3': 0L, 'assert_var2': 0L, 'assert_var1': 10338568L, 'assert_var0': 1L, 'extended_syndrome': '\x90@'}
Oorzaak
Een probleem met versies ouder dan 16.28.1002+EMC0000000017 van de firmware voor het Mellanox5-EN0-apparaat, die uitsluitend in F810-knooppunten wordt aangetroffen, kan ertoe leiden dat deze knooppunten onverwacht koud opnieuw worden opgestart wanneer een warme herstart wordt aangevraagd of wordt geactiveerd door een panic of andere fout. Onder normale omstandigheden herstelt het knooppunt zijn journaal van de kopie van het peerknooppunt. Als het peerknooppunt echter ook de integriteit van het tijdschrift niet kan behouden, kan het journaal verloren gaan.
Oplossing
Dit probleem is opgelost in Mellanox5-EN0 firmware 16.28.1002+EMC0000000017, die in april 2021 werd uitgebracht als onderdeel van nodefirmwarepakket versies 11.1.3 en 10.3.6. Elke klant die nog steeds een oudere firmwareversie dan de bovenstaande op een F810-knooppunt uitvoert, moet de nieuwste versie van het knooppuntfirmwarepakket installeren en zo snel mogelijk een knooppuntfirmware-update plannen op hun cluster.
Getroffen producten
Isilon, Isilon F810Artikeleigenschappen
Artikelnummer: 000207184
Artikeltype: Solution
Laatst aangepast: 16 mei 2026
Versie: 5
Vind antwoorden op uw vragen via andere Dell gebruikers
Support Services
Controleer of uw apparaat wordt gedekt door Support Services.