PowerScale (Isilon): Alt veya Üst isi_hangdump işlemi tek veya birden çok düğümde çalışmıyor. (Gen5, Gen6, Gen6.5)

Shrnutí: Bu makalede, /var/log/messages içinde istenmeyen isi_hangdump mesajlarıyla ilgili sorunların nasıl çözüleceğine ilişkin genel bakış sunulur. Özet: Alt veya Üst isi_hangdump işlemi tek veya birden çok düğümde çalışmıyor. isi_hangdump'ın düzgün şekilde çalışması için hem üst hem alt işlemin çalışması gerekir. ...

Tento článek se vztahuje na Tento článek se nevztahuje na Tento článek není vázán na žádný konkrétní produkt. V tomto článku nejsou uvedeny všechny verze produktu.

Příznaky

Birden çok düğüm, muhtemelen belirli bir düğüme ping zaman aşımları bildirir.
NOT: Bu, RBM ping zaman aşımları için geçerli değildir

Sorunlu düğüm, sürekli bir isi_hangdump döngüsünün belirtilerini gösterir.
Çok sayıda isi_hangdump her saat kabaca aynı zamanda gerçekleşir.

Bu da performans sorunlarına neden olabilir.

/var/log/messages içinde benzer mesajlar mevcuttur:

2021-04-04T01:30:50-04:00 CLUSTER-24 isi_hangdump: Triggering clusterwide hangdump
2021-04-04T01:30:50-04:00 CLUSTER-24 isi_hangdump: LOCK TIMEOUT AT 1617514250 UTC
2021-04-04T01:30:50-04:00 CLUSTER-24 isi_hangdump: Hangdump after 752602 seconds: Ping timeout
2021-04-04T01:31:00-04:00 CLUSTER-24 isi_hangdump: END OF DUMP AT 1617514250 UTC
2021-04-04T01:31:00-04:00 CLUSTER-24 isi_hangdump: Initiating hangdump on 26 nodes...
2021-04-04T01:31:09-04:00 CLUSTER-24 isi_hangdump: Skipping requested dump(Ping timeout)
2021-04-04T01:32:09-04:00 CLUSTER-24 isi_hangdump: Skipping requested dump(Ping timeout)
2021-04-04T01:35:12-04:00 CLUSTER-24 isi_hangdump: Skipping requested dump(Ping timeout)
2021-04-04T01:36:13-04:00 CLUSTER-24 isi_hangdump: Skipping requested dump(Ping timeout)
2021-04-04T01:52:27-04:00 CLUSTER-24 isi_hangdump: Skipping requested dump(Ping timeout)
2021-04-04T01:53:28-04:00 CLUSTER-24 isi_hangdump: Skipping requested dump(Ping timeout)


Düğüm 2, hangdump'u tetikliyor ve aradaki fark bir saat
2020-08-20T00:53:48-07:00 CLUSTER-2 isi_hangdump: Triggering clusterwide hangdump
2020-08-20T01:53:49-07:00 CLUSTER-2 isi_hangdump: Triggering clusterwide hangdump
2020-08-20T02:53:49-07:00 CLUSTER-2 isi_hangdump: Triggering clusterwide hangdump


veya

Yalnızca düğüm 24, hangdump'ları tetikliyor ve sıklık bir saat:

CLUSTER-24# isi_for_array "grep -i triggering /var/log/messages | grep 2021-04"
CLUSTER-24:2021-04-01T00:30:12-04:00 CLUSTER-24 isi_hangdump: Triggering clusterwide hangdump
CLUSTER-24:2021-04-01T01:30:12-04:00 CLUSTER-24 isi_hangdump: Triggering clusterwide hangdump
CLUSTER-24:2021-04-01T02:30:12-04:00 CLUSTER-24 isi_hangdump: Triggering clusterwide hangdump

isi_hangdump işlemlerinin sayısı 4 veya 1 olabilir.Beklenen isi_hangdump işlem sayısı 2 olmalıdır. Her bir düğümde kaç tane isi_hangdump işleminin çalıştığını görmek için:

# isi_for_array -s "ps awux | grep '[h]angdump'"


Çözüm, isi_hangdump hizmetini yeniden başlatmak ve isi_hangdump işlemlerinin sayısını kontrol etmektir.
Bu sayı 2 değilse düğümü yeniden başlatın.

Příčina

isi_hangdump Üst veya Alt işlemi çalışmıyor.  Alt (ping) işlem çalışmıyorsa ilgili düğüm, dahili ping mesajlarını göndermeyecek ve bu da hangdump'ların tetiklenmesine neden olacaktır. Bu, sürekli hangdump oluşumu nedeniyle performans sorunlarına yol açabilir.

Řešení

Şu anda çözüm "isi_hangdump restart" komutunu çalıştırmaktır (aşağıdaki örnekte gösterildiği üzere).

Bu başarısız olursa çekirdekleri almak için düğüme panik yeniden başlatma uygulayın ve isi_hangdump işlemini yeniden başlatın.

CLUSTER-1# ps -auwx | grep -i isi_hangdump
root 1015 0.0 0.6 437876 38928 - S 25Mar21 0:57.01 /usr/libexec/isilon/isi_hangdump /usr/bin/isi_hangdump start
root 1016 0.0 0.5 398676 32200 - S 25Mar21 20:05.60 /usr/libexec/isilon/isi_hangdump /usr/bin/isi_hangdump start
root 32228 0.0 0.0 12344 2616 0 S+ 20:41 0:00.00 grep -i isi_hangdump

CLUSTER-1# isi_hangdump restart
CLUSTER-1# ps -auwx | grep -i isi_hangdump
root 32253 3.9 0.6 398808 35976 - S 20:41 0:00.01 /usr/libexec/isilon/isi_hangdump /usr/bin/isi_hangdump restart
root 1016 0.0 0.5 398676 32200 - S 25Mar21 20:05.61 /usr/libexec/isilon/isi_hangdump /usr/bin/isi_hangdump start
root 32260 0.0 0.0 12344 2616 0 S+ 20:41 0:00.00 grep -i isi_hangdump


Bu arada mühendislik ekibi kalıcı bir çözüm üzerinde çalışmaktadır.

Dotčené produkty

PowerScale OneFS
Vlastnosti článku
Číslo článku: 000185607
Typ článku: Solution
Poslední úprava: 12 led 2023
Verze:  6
Najděte odpovědi na své otázky od ostatních uživatelů společnosti Dell
Služby podpory
Zkontrolujte, zda se na vaše zařízení vztahují služby podpory.