PowerScale OneFS 9.10: SnapshotDelete işini çalıştırırken nadir görülen performans sorunları
Summary: OneFS 9.10 veya 9.11'e yükseltilen kümelerde, birden fazla depolama havuzu varsa SnapshotDelete işi çalıştırıldığında performans sorunları yaşanabilir.
Symptoms
OneFS 9.10 veya daha sonraki bir sürüme yükseltilen iki veya daha fazla düğüm havuzuna sahip kümeler, bir SnapshotDelete İş çalışıyor. Duraklatma SnapshotDelete İşler anında rahatlama sağlar ancak iş devam ettirildiğinde sorun geri döner.
Uzun sona erme tarihleri olan anlık görüntülere sahip kümelerde sorun, OneFS yükseltmesi tamamlandıktan birkaç hafta veya ay sonrasına kadar belirgin olmayabilir.
Günlükler ve Hangdumps İş motorunu (isi_job_d) SnapshotDelete Bu örneğe benzer bir yığın izlemesine sahip bir LIN kilidini tutan iş parçacığı:
77886 isi_job_d:
...
thread 100637: je_worker_main at 0xfffffe8b55ea95c0 in state "running":
On cpu 5 for 3 ticks
Stack: --------------------------------------------------
kernel:btree_leaf_check_prefetch+0xde
kernel:btree_leaf_get_entry+0x349
kernel:stf_is_fake_entry+0x41
kernel:stf_iterate_block+0x66
kernel:ifs_snap_get_lins_helper+0xac
kernel:_sys_ifs_snap_get_lins+0x279
kernel:amd64_syscall+0x7b0
--------------------------------------------------
Cause
OneFS 9.10, Anlık Görüntü İzleme Dosyalarına (STF) Mantıksız Mantıksal iNode'lar (LIN'ler) sunar. Bu, yeni bir özellik olan MetadataIQ yu desteklemek için eklendi. STF, çeşitli benzersiz özelliklere sahip özel bir dosya türüdür ve anlık görüntülerin oluşturulması, depolanması, değiştirilmesi ve silinmesi dahil olmak üzere tam anlık görüntü yaşam döngüsünde yer alır.
Farklı havuzlar arasında veri geçişi yapılırken mantıksal olmayan LIN'ler STF'ye eklenir ve yavaş yavaş birikebilir. Anlık görüntülerin süresi dolduğunda ve silindiğinde ve bir anlık görüntünün STA'sında çok fazla mantıksız LIN olduğunda performans sorunları oluşur.
Bir kümenin bu sorun için risk altında olup olmadığı nasıl belirlenir?
Aşağıdaki kriterleri karşılayan kümeler, OneFS 9.10 veya 9.11'e yükseltilirse bu sorunu yaşama riski daha yüksektir.
- SnapshotIQ lisanslı ve etkindir. Kümede anlık görüntüler oluşturuluyor ve süresi doldu.
- Küme birden fazla düğüm havuzu içerir.
Resolution
Kalıcı çözüm:
Düzeltmeyi içeren bu OneFS sürümlerinden birine veya sonraki bir sürüme yükseltin:
- OneFS 9.10.1.4 PSP-4686 MR:[9.10.1.4_GA-MR][Çoklu Kullanıcı Alanı ve Çekirdek Düzeltmeleri](Ekim 2025)
- OneFS 9.11.0.5 PSP-4681 MR:[9.11.0.5_GA-MR][Çoklu Kullanıcı Alanı ve Çekirdek Düzeltmeleri](Eylül 2025)
Geçici çözüm:
Kalıcı bir çözüm uygulanana kadar aşağıdaki geçici çözüm kullanılmalıdır:
Mantıksal olmayan LIN'leri küme genelinde devre dışı bırakmak için aşağıdaki ayar değişikliğini uygulayın.
isi_sysctl_cluster efs.snapshot.stf_populate_illogical_lin_enabled=0
OneFS 9.10'a yükseltilmiş ve performans sorunları yaşayan kümelerde:
İptal edin ve devre dışı bırakın
SnapshotDelete Veri Noksanlığı (DU) durumundan kaçınma işi. Ardından, mantıksız LIN'ler içeren Anlık Görüntüleri kaldırma konusunda yardım almak için Dell Teknik Destek ile iletişime geçin.
Çalıştırmayı iptal etmek için
SnapshotDelete iş:
isi job cancel snapshotdelete
Devre dışı bırakmak için SnapshotDelete iş:
isi job types modify snapshotdelete --enabled=false
SnapshotDelete İşin çok uzun süre devre dışı bırakılması, düşük disk alanı kapasitesi sorunlarına neden olabilir. Mantıksal olmayan LIN'ler içeren Anlık Görüntülerin manuel olarak kaldırılmasına yardımcı olmak için mümkün olan en kısa sürede Dell Teknik Destek ile iletişime geçilmelidir. SnapshotDelete İş yeniden etkinleştirildi.