PowerScale OneFS 9.10:运行 SnapshotDelete 作业时出现罕见的性能问题

Summary: 在升级到 OneFS 9.10 或 9.11 的群集上,如果有多个存储池,则在运行 SnapshotDelete 作业时可能会遇到性能问题。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

具有升级到 OneFS 9.10 或更高版本的两个或更多节点池的群集可能会在以下时刻遇到性能问题: SnapshotDelete 作业正在运行。暂停 SnapshotDelete 作业可立即缓解,但一旦作业恢复,问题又会再次出现。

在具有过期日期较长的快照的群集上,此问题可能要等到 OneFS 升级完成后的几周或几个月后才会显现出来。

日志和 Hangdumps 显示作业引擎 (isi_job_d) SnapshotDelete 使用类似于此示例的堆栈跟踪保存 LIN 锁的作业线程:

77886 isi_job_d:
...
  thread 100637: je_worker_main at 0xfffffe8b55ea95c0 in state "running":
    On cpu 5 for 3 ticks
    Stack: --------------------------------------------------
    kernel:btree_leaf_check_prefetch+0xde
    kernel:btree_leaf_get_entry+0x349
    kernel:stf_is_fake_entry+0x41
    kernel:stf_iterate_block+0x66
    kernel:ifs_snap_get_lins_helper+0xac
    kernel:_sys_ifs_snap_get_lins+0x279
    kernel:amd64_syscall+0x7b0
    --------------------------------------------------

    Cause

    OneFS 9.10 将 非逻辑 逻辑索引节点 (LIN) 引入快照跟踪文件 (STF)。添加此功能是为了支持新功能 MetadataIQ。STF 是一种特殊文件类型,具有多个独特特征,并且涉及整个快照生命周期,包括快照的创建、存储、更改和删除。

    在不同池之间迁移数据时,非逻辑 LIN 将添加到 STF 中,并且可以逐渐建立。当快照到期并正在删除,并且快照的 STF 中有太多不合逻辑的 LIN 时,会出现性能问题。

    如何确定群集是否存在此问题的风险?
    满足以下条件的群集在升级到 OneFS 9.10 或 9.11 后遇到此问题的风险更高。 

    • SnapshotIQ 已获得许可并已启用。正在群集上创建快照并使其过期。
    • 群集包含多个节点池。 

    Resolution

    永久性解决方案:
    升级到以下 OneFS 版本或更高版本,其中包括修复:

    • OneFS 9.10.1.4 PSP-4686 MR:[9.10.1.4_GA-MR][多个用户空间和内核修复](2025 年 10 月)
    • OneFS 9.11.0.5 PSP-4681 MR:[9.11.0.5_GA-MR][多个用户空间和内核修复](2025 年 9 月)

    解决方法:
    在应用永久解决方案之前,应使用以下解决方法:

    应用以下设置更改以在群集范围内禁用非逻辑 LIN。 

    isi_sysctl_cluster efs.snapshot.stf_populate_illogical_lin_enabled=0

     

    提醒:禁用非逻辑 LIN 后,MetaDataIQ 提供的节点池分析会随着时间的推移而过时。否则,MetaDataIQ 提供的其余信息仍然可用。在禁用了非逻辑 LIN 的群集上,如果节点池信息需要更新,则可以执行手动重新同步。

    在已升级到 OneFS 9.10 并遇到性能问题的群集上:
    取消并禁用 SnapshotDelete 作业,以避免出现数据不可用 (DU) 情况。然后联系 戴尔技术支持 ,以获取有关删除包含非逻辑 LIN 的快照的帮助。

    取消正在运行的 SnapshotDelete 工作:
    isi job cancel snapshotdelete

    要禁用 SnapshotDelete 工作:

    isi job types modify snapshotdelete --enabled=false

     

    提醒:离开 SnapshotDelete 作业禁用时间过长会导致磁盘空间不足的问题。必须尽快联系戴尔技术支持,以帮助手动删除包含非逻辑 LIN 的快照,然后再 SnapshotDelete 重新启用作业。 

    Additional Information

     

      Article Properties
      Article Number: 000337012
      Article Type: Solution
      Last Modified: 07 Nov 2025
      Version:  6
      Find answers to your questions from other Dell users
      Support Services
      Check if your device is covered by Support Services.