PowerScale OneFS 9.10: Problemas de rendimiento poco frecuentes cuando se ejecuta un trabajo de SnapshotDelete

Summary: En los clústeres actualizados a OneFS 9.10 o 9.11, es posible que se experimenten problemas de rendimiento cuando se ejecuta un trabajo de SnapshotDelete si hay varios pools de almacenamiento. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Los clústeres con dos o más pools de nodos que se actualizaron a OneFS 9.10 o una versión posterior pueden experimentar problemas de rendimiento cada vez que SnapshotDelete El trabajo está en ejecución. Pausar el SnapshotDelete El trabajo proporciona una solución inmediata, pero el problema vuelve una vez que se reanuda el trabajo. 

En los clústeres con instantáneas con fechas de vencimiento largas, es posible que el problema no sea evidente hasta varias semanas o meses después de que se completó la actualización de OneFS. 

Registros y Hangdumps Mostrar el motor de trabajos (isi_job_d). SnapshotDelete subproceso de trabajo que contiene un bloqueo LIN con un seguimiento de pila similar al de este ejemplo:

77886 isi_job_d:
...
  thread 100637: je_worker_main at 0xfffffe8b55ea95c0 in state "running":
    On cpu 5 for 3 ticks
    Stack: --------------------------------------------------
    kernel:btree_leaf_check_prefetch+0xde
    kernel:btree_leaf_get_entry+0x349
    kernel:stf_is_fake_entry+0x41
    kernel:stf_iterate_block+0x66
    kernel:ifs_snap_get_lins_helper+0xac
    kernel:_sys_ifs_snap_get_lins+0x279
    kernel:amd64_syscall+0x7b0
    --------------------------------------------------

    Cause

    OneFS 9.10 presenta iNodes lógicos ilógicos (LIN) en los archivos de rastreo de instantáneas (STF). Esto se agregó para admitir una nueva característica, MetadataIQ. Un STF es un tipo de archivo especial con varias características únicas y está involucrado en el ciclo de vida completo de las instantáneas, incluidas la creación, el almacenamiento, el cambio y la eliminación de instantáneas.

    Cuando los datos se migran entre diferentes pools, los LIN ilógicos se agregan al STF y se pueden acumular gradualmente. Los problemas de rendimiento se producen cuando las instantáneas vencen y se eliminan, y hay demasiados LIN ilógicos en el STF de una instantánea.

    ¿Cómo determinar si un clúster está en riesgo de sufrir este problema?
    Los clústeres que cumplen con los siguientes criterios corren un mayor riesgo de experimentar este problema si se actualizan a OneFS 9.10 o 9.11. 

    • SnapshotIQ tiene licencia y está habilitado. Las instantáneas se están creando y venciendo en el clúster.
    • El clúster contiene varios pools de nodos. 

    Resolution

    Solución permanente: 
    Actualice a una de estas versiones de OneFS o posterior, lo que incluye la corrección:

    • OneFS 9.10.1.4 PSP-4686 MR:[9.10.1.4_GA-MR][Múltiples correcciones de kernel y espacio de usuario](octubre de 2025)
    • OneFS 9.11.0.5 PSP-4681 MR:[9.11.0.5_GA-MR][Múltiples correcciones de espacio de usuario y kernel](septiembre de 2025)

    Solución alternativa:
    Hasta que se aplique una solución permanente, se debe utilizar la siguiente solución alternativa:

     Aplique el siguiente cambio de ajuste para deshabilitar los LIN ilógicos en todo el clúster. 

    isi_sysctl_cluster efs.snapshot.stf_populate_illogical_lin_enabled=0

     

    NOTA: Con los LIN ilógicos deshabilitados, el análisis del pool de nodos proporcionado por MetaDataIQ se vuelve obsoleto con el tiempo. De lo contrario, el resto de la información proporcionada por MetaDataIQ aún se puede utilizar. En los clústeres con LIN ilógicos deshabilitados, se puede realizar una resincronización manual si es necesario actualizar la información del pool de nodos.

    En los clústeres que se actualizaron a OneFS 9.10 y que experimentan problemas de rendimiento:
    Cancele y deshabilite el SnapshotDelete para evitar una situación de falta de disponibilidad de datos (DU). A continuación, comuníquese con el soporte técnico de Dell para obtener ayuda con la eliminación de las instantáneas que contienen LIN ilógicos.

    Para cancelar una ejecución SnapshotDelete trabajo:
    isi job cancel snapshotdelete

    Para desactivar el comando SnapshotDelete trabajo:

    isi job types modify snapshotdelete --enabled=false

     

    NOTA: Abandonando el SnapshotDelete Un trabajo deshabilitado durante demasiado tiempo puede causar problemas de capacidad de poco espacio de disco. Se debe contactar al soporte técnico de Dell tan pronto como sea posible para ayudar con la eliminación manual de las instantáneas que contienen LIN ilógicos antes de la SnapshotDelete El trabajo se vuelve a habilitar. 

    Additional Information

     

      Article Properties
      Article Number: 000337012
      Article Type: Solution
      Last Modified: 07 Nov 2025
      Version:  6
      Find answers to your questions from other Dell users
      Support Services
      Check if your device is covered by Support Services.