PowerScale (Isilon): Proces podřízeného nebo nadřazeného isi_hangdump neběží na jednom nebo více uzlech. (5. generace, 6. generace, 5. generace)

Shrnutí: Tento článek obsahuje přehled řešení problémů s isi_hangdump zprávy, které se v umístění /var/log/messages nadměrně přehlasují. Summary: Proces podřízeného nebo nadřazeného isi_hangdump neběží na jednom nebo více uzlech. Aby isi_hangdump správně fungoval, musí být spuštěn proces nadřízený i podřízený. ...

Tento článek se vztahuje na Tento článek se nevztahuje na Tento článek není vázán na žádný konkrétní produkt. V tomto článku nejsou uvedeny všechny verze produktu.

Příznaky

Více uzlů hlásí vypršení časového limitu příkazu ping, pravděpodobně do jednoho konkrétního uzlu.
POZNÁMKA: Nejedná se o vypršení časového limitu

příkazu ping RBM. Problematický uzel vykazuje příznaky nepřetržité isi_hangdump smyčky.
K hlavním isi_hangdumps dochází přibližně stejnou dobu každou hodinu.

To může také způsobovat problémy s výkonem.

Podobné zprávy v umístění /var/log/messages:

2021-04-04T01:30:50-04:00 CLUSTER-24 isi_hangdump: Spuštění protokolu hangdump2021-04-04T01
:30:50-04:00 CLUSTER-24 isi_hangdump: ČASOVÝ LIMIT UZAMČENÍ NA 1617514250 UTC2021-04-04T01
:30:50-04:00 CLUSTER-24 isi_hangdump: Zamrznutí po 752602 sekundách: Ping timeout2021-04-04T01
:31:00-04:00 CLUSTER-24 isi_hangdump: KONEC VÝPISU NA 1617514250 UTC2021-04-04T01
:31:00-04:00 CLUSTER-24 isi_hangdump: Iniciování zasekávání protokolu hangdump na 26 uzlech...
2021-04-04T01:31:09-04:00 CLUSTER-24 isi_hangdump: Požadovaný výpis přeskočení (časový limit příkazu Ping)
2021-04-04T01:32:09-04:00 CLUSTER-24 isi_hangdump: Požadovaný výpis ze systému (časový limit příkazu Ping)
2021-04-04T01:35:12-04:00 CLUSTER-24 isi_hangdump: Požadovaný výpis ze systému (časový limit příkazu Ping)
2021-04-04T01:36:13-04:00 CLUSTER-24 isi_hangdump: Požadovaný výpis ze systému (časový limit příkazu Ping)
2021-04-04T01:52:27-04:00 CLUSTER-24 isi_hangdump: Požadovaný výpis přeskočení (časový limit příkazu Ping)
2021-04-04T01:53:28-04:00 CLUSTER-24 isi_hangdump: Požadovaný výpis přeskočení (časový limit příkazu Ping)


Uzel 2 spouští zamrznutí a rozdíl je jedna hodina
. 2020-08-20T00:53:48-07:00 CLUSTER-2 isi_hangdump: Spuštění protokolu hangdump
v celém clusteru 2020-08-20T01:53:49-07:00 CLUSTER-2 isi_hangdump: Spuštění protokolu hangdump v celém clusteru
2020-08-20T02:53:49-07:00 CLUSTER-2 isi_hangdump: Spuštění protokolu hangdump


v celém clusteru Nebo

Hangdumps se aktivuje pouze u uzlu 24 a frekvence je jedna hodina:

CLUSTER-24# isi_for_array "grep -i triggering /var/log/messages | grep 2021-04"
CLUSTER-24:2021-04-01T00:30:12-04:00 CLUSTER-24 isi_hangdump: Spuštění protokolu hangdump
v celém clusteru CLUSTER-24:2021-04-01T01:30:12-04:00 CLUSTER-24 isi_hangdump: Spuštění protokolu hangdump v celém clusteru
CLUSTER-24:2021-04-01T02:30:12-04:00 CLUSTER-24 isi_hangdump: Spuštění protokolu hangdump

v celém clusteru Počet isi_hangdump procesů může být 4 nebo 1.Očekávaný počet procesů isi_hangdump by měl být 2. Chcete-li zjistit, kolik isi_hangdump procesů běží na každém uzlu:

# isi_for_array -s "ps awux | grep '[h]angdump'"


Řešením je restartovat isi_hangdump službu a zkontrolovat počet isi_hangdump procesů.
Pokud nejsou 2, restartujte samotný uzel.

Příčina

Proces nadřazeného nebo podřízeného isi_hangdump není spuštěn.  Pokud není spuštěn proces podřízeného příkazu (ping), tento uzel neodesílá interní zprávy ping, což povede k aktivaci zamrznutí. To může potenciálně vést k problémům s výkonem v důsledku nepřetržité generace zamrzlů.

Řešení

V současné době je řešením spustit příkaz "isi_hangdump restart" (jak je znázorněno v příkladu níže).

Pokud tento postup selže, restartujte uzel, aby se získala jádra, a restartujte proces isi_hangdump.

CLUSTER-1# ps -auwx | grep -i isi_hangdump
root 1015 0.0 0.6 437876 38928 – S 25, 21.mark 0:: 57.01 /usr/libexec/isilon/isi_hangdump /usr/bin/isi_hangdump startroot
1016 0.0 0.5 398676 32200 – S 25.mar21 20:05.60 /usr/libexec/isilon/isi_hangdump /usr/bin/isi_hangdump startroot
32228 0.0 0.0 12344 2616 0 S+ 20:41 0:00.00 grep -i isi_hangdump

CLUSTER-1# isi_hangdump restartCLUSTER
-1# ps -auwx | grep -i isi_hangdump
root 32253 3.9 0.6 398808 35976 - S 20:41 0:00.01 /usr/libexec/isilon/isi_hangdump /usr/bin/isi_hangdump restartroot
1016 0.0 0.5 398676 32200 - S 25. března 21. 20:05.61 /usr/libexec/isilon/isi_hangdump /usr/bin/isi_hangdump startroot
32260 0.0 0.0 12344 2616 0 S+ 20:41 0:00.00 grep -i isi_hangdump


Mezitím technický tým pracuje na řešení problému na plný úvazek.

Dotčené produkty

PowerScale OneFS
Vlastnosti článku
Číslo článku: 000185607
Typ článku: Solution
Poslední úprava: 12 led 2023
Verze:  6
Najděte odpovědi na své otázky od ostatních uživatelů společnosti Dell
Služby podpory
Zkontrolujte, zda se na vaše zařízení vztahují služby podpory.