PowerScale (Isilon): Onderliggende of bovenliggende isi_hangdump-proces wordt niet uitgevoerd op één of meerdere knooppunten. (Gen5, Gen6, Gen6.5)

Shrnutí: Dit artikel biedt een overzicht van het oplossen van problemen met isi_hangdump berichten die in /var/log/messages spammen. Samenvatting: Onderliggende of bovenliggende isi_hangdump-proces wordt niet uitgevoerd op één of meerdere knooppunten. Om isi_hangdump goed te laten werken, moeten zowel het bovenliggende als het onderliggende proces worden uitgevoerd. ...

Tento článek se vztahuje na Tento článek se nevztahuje na Tento článek není vázán na žádný konkrétní produkt. V tomto článku nejsou uvedeny všechny verze produktu.

Příznaky

Meerdere knooppunten melden ping-time-outs, mogelijk naar één specifiek knooppunt.
OPMERKING: Dit geldt niet voor time-outs

voor RBM-ping Problematisch knooppunt vertoont symptomen van een voortdurende isi_hangdump lus.
Grote isi_hangdumps vindt ongeveer hetzelfde uur per uur plaats.

Dit kan ook prestatieproblemen veroorzaken.

Vergelijkbare berichten in /var/log/messages:

2021-04-04T01:30:50-04:00 CLUSTER-24 isi_hangdump: Clusterbrede hangdump2021-04-04T01
:30:50-04:00 CLUSTER-24 isi_hangdump: TIME-OUT VERGRENDELING OP 1617514250 UTC2021-04-04T01
:30:50-04:00 CLUSTER-24 isi_hangdump: Hangdump na 752602 seconden: Ping time-out2021-04-04T01
:31:00-04:00 CLUSTER-24 isi_hangdump: EINDE DUMP BIJ 1617514250 UTC2021-04-04T01
:31:00-04:00 CLUSTER-24 isi_hangdump: Hangdump starten op 26 knooppunten...
2021-04-04T01:31:09-04:00 CLUSTER-24 isi_hangdump: Skipping requested dump (Ping timeout)
2021-04-04T01:32:09-04:00 CLUSTER-24 isi_hangdump: Skipping requested dump (Ping timeout)
2021-04-04T01:35:12-04:00 CLUSTER-24 isi_hangdump: De aangevraagde dump overslaan (ping-time-out)
2021-04-04T01:36:13-04:00 CLUSTER-24 isi_hangdump: Aangevraagde dump overslaan (ping-time-out)
2021-04-04T01:52:27-04:00 CLUSTER-24 isi_hangdump: Skipping requested dump (Ping timeout)
2021-04-04T01:53:28-04:00 CLUSTER-24 isi_hangdump: Aangevraagde dump overslaan (ping-time-out)


Knooppunt 2 activeert de hangdump en het verschil is één uur
2020-08-20T00:53:48-07:00 CLUSTER-2 isi_hangdump: Clusterbrede hangdump activeren
2020-08-20T01:53:49-07:00 CLUSTER-2 isi_hangdump: Clusterbrede hangdump activeren
2020-08-20T02:53:49-07:00 CLUSTER-2 isi_hangdump: Clusterbrede hangdump activeren


Of

Alleen knooppunt 24 activeert de hangdumps en de frequentie is één uur:

CLUSTER-24# isi_for_array "grep -i triggering /var/log/messages | grep 2021-04"
CLUSTER-24:2021-04-01T00:30:12-04:00 CLUSTER-24 isi_hangdump: Clusterbrede hangdump activeren
CLUSTER-24:2021-04-01T01:30:12-04:00 CLUSTER-24 isi_hangdump: Clusterbrede hangdump activeren
CLUSTER-24:2021-04-01T02:30:12-04:00 CLUSTER-24 isi_hangdump: Clusterbrede hangdump activeren

Het aantal isi_hangdump processen kan 4 of 1 zijn.Het verwachte aantal isi_hangdump processen moet 2 zijn. Om te zien hoeveel isi_hangdump processen worden uitgevoerd op elk knooppunt:

# isi_for_array -s "ps awux | grep '[h]angdump'"


De oplossing is om isi_hangdump service opnieuw op te starten en te controleren op het aantal isi_hangdump processen.
Als het niet 2 is, start u het knooppunt zelf opnieuw op.

Příčina

Het bovenliggende of onderliggende proces van isi_hangdump wordt niet uitgevoerd.  Als het onderliggende (ping)-proces niet wordt uitgevoerd, stuurt dat knooppunt de interne pingberichten niet, waardoor hangdumps worden geactiveerd. Dit kan leiden tot prestatieproblemen als gevolg van de continue generatie hangdumps.

Řešení

Momenteel is de oplossing om "isi_hangdump opnieuw opstarten" uit te voeren (zoals wordt weergegeven in het onderstaande voorbeeld).

Als dat niet lukt, start u het knooppunt opnieuw op om de cores te krijgen en start u het isi_hangdump-proces opnieuw op.

CLUSTER-1# ps -auwx | grep -i isi_hangdump
root 1015 0,0 0,6 437876 38928 - S 25Mar21 0:57,01 /usr/libexec/isilon/isi_hangdump /usr/bin/isi_hangdump startroot
1016 0,0 0,5 398676 32200 - S 25Mar21 20:05.60 /usr/libexec/isilon/isi_hangdump /usr/bin/isi_hangdump startroot
32228 0.00 0,0 12344 2616 0 S+ 20:41 0:00.00 grep -i isi_hangdump

CLUSTER-1# isi_hangdump restartCLUSTER
-1# ps -auwx | grep -i isi_hangdump
root 32253 3.9 0,6 398808 35976 - S 20:41 0:00.01 /usr/libexec/isilon/isi_hangdump /usr/bin/isi_hangdump restartroot
1016 0.0 0.5 398676 32200 - S 25Mar21 20:05.61 /usr/libexec/isilon/isi_hangdump /usr/bin/isi_hangdump startroot
32260 0.0 0.0 12344 2616 0 S+ 20:41 0:00.00 grep -i isi_hangdump


In de tussentijd, engineering werkt aan een full-time oplossing.

Dotčené produkty

PowerScale OneFS
Vlastnosti článku
Číslo článku: 000185607
Typ článku: Solution
Poslední úprava: 12 led 2023
Verze:  6
Najděte odpovědi na své otázky od ostatních uživatelů společnosti Dell
Služby podpory
Zkontrolujte, zda se na vaše zařízení vztahují služby podpory.