PowerScale OneFS 9.10:執行快照刪除工作時發生罕見的效能問題

Summary: 在升級至 OneFS 9.10 或 9.11 的叢集上,如果有多個儲存集區,則在執行 SnapshotDelete 工作時可能會遇到效能問題。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

如果叢集有兩個或更多個節點集區,且已升級至 OneFS 9.10 或更新版本,則可能在以下情況下遇到效能問題: SnapshotDelete 工作正在執行中。暫停 SnapshotDelete 工作會立即帶來緩解,但一旦工作恢復,問題就會再次出現。

在快照的叢集上,到期日很長,在 OneFS 升級完成後數週或數個月後,問題才會顯現。

記錄和 Hangdumps 顯示工作引擎 (isi_job_d) SnapshotDelete 工作線程持有具有類似於以下範例的堆疊追蹤的 LIN 鎖:

77886 isi_job_d:
...
  thread 100637: je_worker_main at 0xfffffe8b55ea95c0 in state "running":
    On cpu 5 for 3 ticks
    Stack: --------------------------------------------------
    kernel:btree_leaf_check_prefetch+0xde
    kernel:btree_leaf_get_entry+0x349
    kernel:stf_is_fake_entry+0x41
    kernel:stf_iterate_block+0x66
    kernel:ifs_snap_get_lins_helper+0xac
    kernel:_sys_ifs_snap_get_lins+0x279
    kernel:amd64_syscall+0x7b0
    --------------------------------------------------

    Cause

    OneFS 9.10 將 非邏輯 邏輯 iNode (LIN) 引入快照追蹤檔案 (STF)。新增此功能以支援新功能 MetadataIQ。STF 是一種具有多種獨特特徵的特殊檔類型,涉及整個快照生命週期,包括快照的創建、存儲、更改和刪除。

    在不同池之間遷移數據時,不合邏輯的 LIN 會添加到 STF 中,並可能逐漸累積。當快照過期並刪除,並且快照的 STF 中有太多不合邏輯的 LIN 時,會出現性能問題。

    如何判斷叢集是否有此問題的風險?
    符合下列準則的叢集如果升級到 OneFS 9.10 或 9.11,則有較高風險遇到此問題。 

    • SnapshotIQ 已授權並啟用。叢集正在建立快照並使其到期。
    • 叢集包含多個節點集區。 

    Resolution

    永久解決方案:
    升級至包含以下修正的其中一個 OneFS 版本或更新版本:

    • OneFS 9.10.1.4 PSP-4686 MR:[9.10.1.4_GA-MR][多重使用者空間和核心修正](2025 年 10 月)
    • OneFS 9.11.0.5 PSP-4681 MR:[9.11.0.5_GA-MR][多個使用者空間和核心修正](2025 年 9 月)

    因應措施:
    在套用永久解決方案之前,應使用下列因應措施:

    應用以下設置更改以禁用群集範圍內的非邏輯 LIN。 

    isi_sysctl_cluster efs.snapshot.stf_populate_illogical_lin_enabled=0

     

    注意:停用不合邏輯的 LIN 後,MetaDataIQ 提供的節點集區分析會隨著時間的推移而過時。否則,MetaDataIQ 提供的其餘資訊仍可使用。在禁用了不邏輯 LIN 的群集上,如果需要更新節點池資訊,則可以執行手動重新同步。

    在已升級至 OneFS 9.10 並遇到效能問題的叢集上:
    取消並停用 SnapshotDelete 避免資料不可用性 (DU) 情況的工作。然後聯絡 Dell 技術支援部門 ,以取得移除包含不邏輯 LIN 快照的協助。

    若要取消執行 SnapshotDelete 工作:
    isi job cancel snapshotdelete

    若要停用 SnapshotDelete 工作:

    isi job types modify snapshotdelete --enabled=false

     

    注意:離開 SnapshotDelete 作業停用時間過長可能會導致磁碟空間容量不足的問題。必須儘快聯絡 Dell 技術支援部門,以協助手動移除包含不邏輯 LIN 的快照,然後再 SnapshotDelete 工作已重新啟用。 

    Additional Information

     

      Article Properties
      Article Number: 000337012
      Article Type: Solution
      Last Modified: 07 Nov 2025
      Version:  6
      Find answers to your questions from other Dell users
      Support Services
      Check if your device is covered by Support Services.