PowerScale OneFS 9.10 : Problèmes de performances rares lors de l’exécution d’une tâche SnapshotDelete

Summary: Sur les clusters mis à niveau vers OneFS 9.10 ou 9.11, des problèmes de performances peuvent être rencontrés lors de l’exécution d’une tâche SnapshotDelete s’il existe plusieurs pools de stockage. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Les clusters dotés d’au moins deux pools de nœuds qui ont été mis à niveau vers OneFS 9.10 ou une version supérieure peuvent rencontrer des problèmes de performances chaque fois qu’un SnapshotDelete La tâche est en cours d’exécution. Suspension de l’opération SnapshotDelete La tâche apporte un soulagement immédiat, mais le problème réapparaît une fois la tâche reprise. 

Sur les clusters avec des snapshots avec des dates d’expiration longues, le problème peut n’apparaître que plusieurs semaines ou mois après la fin de la mise à niveau de OneFS. 

Journaux et Hangdumps Afficher le moteur de tâches (isi_job_d) SnapshotDelete thread de tâche contenant un verrou LIN avec une trace de pile similaire à cet exemple :

77886 isi_job_d:
...
  thread 100637: je_worker_main at 0xfffffe8b55ea95c0 in state "running":
    On cpu 5 for 3 ticks
    Stack: --------------------------------------------------
    kernel:btree_leaf_check_prefetch+0xde
    kernel:btree_leaf_get_entry+0x349
    kernel:stf_is_fake_entry+0x41
    kernel:stf_iterate_block+0x66
    kernel:ifs_snap_get_lins_helper+0xac
    kernel:_sys_ifs_snap_get_lins+0x279
    kernel:amd64_syscall+0x7b0
    --------------------------------------------------

    Cause

    OneFS 9.10 introduit des iNodes logiques illogiques (LIN) dans les fichiers STF (Snapshot Tracking Files). Cela a été ajouté pour prendre en charge une nouvelle fonctionnalité, MetadataIQ. Un fichier STF est un type de fichier spécial doté de plusieurs caractéristiques uniques, qui intervient dans le cycle de vie complet des snapshots, y compris la création, le stockage, la modification et la suppression des snapshots.

    Lorsque les données sont migrées entre différents pools, les LIN illogiques sont ajoutés au STF et peuvent progressivement s’accumuler. Des problèmes de performances surviennent lorsque les snapshots ont expiré et sont supprimés, et qu’il y a trop de LIN illogiques dans le STF d’un snapshot.

    Comment déterminer si un cluster est exposé à ce problème ?
    Les clusters qui répondent aux critères suivants sont plus à risque de rencontrer ce problème s’ils sont mis à niveau vers OneFS 9.10 ou 9.11. 

    • SnapshotIQ est sous licence et activé. Des snapshots sont en cours de création et ont expiré sur le cluster.
    • Le cluster contient plusieurs pools de nœuds. 

    Resolution

    Solution définitive : 
    Effectuez une mise à niveau vers l’une de ces versions OneFS ou ultérieures qui inclut le correctif :

    • OneFS 9.10.1.4 PSP-4686 MR :[9.10.1.4_GA-MR][plusieurs correctifs d’espace utilisateur et de noyau](octobre 2025)
    • OneFS 9.11.0.5 PSP-4681 MR :[9.11.0.5_GA-MR][plusieurs correctifs d’espace utilisateur et de noyau](septembre 2025)

    Solution de contournement :
    Jusqu’à ce qu’une solution permanente soit appliquée, la solution de contournement suivante doit être utilisée :

     Appliquez la modification de paramètre suivante pour désactiver les LIN illogiques à l’échelle du cluster. 

    isi_sysctl_cluster efs.snapshot.stf_populate_illogical_lin_enabled=0

     

    Remarque : Lorsque les LIN illogiques sont désactivés, l’analytique du pool de nœuds fournie par MetaDataIQ devient obsolète au fil du temps. Sinon, le reste des informations fournies par MetaDataIQ est toujours utilisable. Sur les clusters avec des LIN illogiques désactivés, une resynchronisation manuelle peut être effectuée si les informations du pool de nœuds nécessitent une mise à jour.

    Sur les clusters qui ont été mis à niveau vers OneFS 9.10 et rencontrent des problèmes de performances :
    Annulez et désactivez l’option SnapshotDelete pour éviter une situation d’indisponibilité des données (DU). Contactez ensuite le support technique Dell pour obtenir de l’aide sur la suppression des snapshots contenant des LIN illogiques.

    Pour annuler une exécution SnapshotDelete travail:
    isi job cancel snapshotdelete

    Pour désactiver l’option SnapshotDelete travail:

    isi job types modify snapshotdelete --enabled=false

     

    Remarque : Quitter le SnapshotDelete Une tâche désactivée trop longtemps peut entraîner des problèmes de capacité d’espace disque faible. Le support technique Dell doit être contacté dès que possible pour vous aider à supprimer manuellement les snapshots contenant des LIN illogiques avant que SnapshotDelete La tâche est réactivée. 

    Additional Information

     

      Article Properties
      Article Number: 000337012
      Article Type: Solution
      Last Modified: 07 Nov 2025
      Version:  6
      Find answers to your questions from other Dell users
      Support Services
      Check if your device is covered by Support Services.