Dell Unity: La línea de espera de instantáneas grande o creciente causa problemas de rendimiento

Summary: Dell Unity: Una cola de instantáneas grande o creciente causa problemas de rendimiento y un alto nivel de CPU del procesador de almacenamiento (SP)

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  • El valor del objetivo de punto de recuperación (RPO) se redujo a algo que se considera más agresivo (es decir, 10 minutos). ”
    • "El objetivo de punto de recuperación (RPO) es un término aceptado en la industria que indica la cantidad aceptable de datos, medidos en unidades de tiempo, que se pueden perder en una falla. Cuando configura una sesión de replicación asíncrona, puede configurar la sincronización automática en función del RPO. Puede especificar un RPO desde un mínimo de 5 minutos hasta un máximo de 1,440 minutos (24 horas). El RPO predeterminado se establece en un intervalo de 60 minutos (1 hora). Para la replicación síncrona, el RPO se fija en 0".
  • Hay muchas instantáneas en estado de "destrucción" para un LUN.
  • La cantidad de instantáneas en estado "destruyendo" aumenta con el tiempo.
  • CPU de SP alto sin una carga de trabajo correlativa de IOPS/ancho de banda.
  • Los LUN y las unidades de back-end tienen colas y tiempos de respuesta elevados.


    Puede buscar en Unisphere en la sección "Block". Asegúrese de agregar la columna "Snapshots" para obtener una lectura por LUN. Si ve muchas instantáneas enumeradas para un LUN o varios LUN, esto indica algunas cosas

    La interfaz de usuario de Unisphere analiza los LUN

    : vaya al LUN individual y seleccione la pestaña "Snapshots" para comprobar el "State" (será "destroying") y "Taken por" (será "Replication") para confirmación:  

    La interfaz de usuario de Unisphere mira snanpshots 

     

Cause

Puede haber muchas causas para que se formen colas. Una de las principales causas se atribuye a un RPO que se considera "demasiado agresivo".

Replicación asíncrona nativa de bloques:
La replicación asíncrona nativa de bloques utiliza una delta entre dos instantáneas para transferir datos. Durante la vida útil de las sesiones de replicación, habrá varias "actualizaciones" de instantáneas que se llevarán a cabo cuando se transfieran los cambios.

Cuando se actualiza una instantánea, en realidad se está eliminando y recreando en segundo plano.

Las preocupaciones más notables son el consumo de CPU de SP y las I/O de back-end adicionales asociadas con la funcionalidad de instantáneas.


El arreglo Unity no puede eliminar por completo las instantáneas en un período de tiempo relativamente razonable, lo que hace que la tasa de instantáneas que ingresan a un estado "por eliminar" supere ampliamente la tasa de instantáneas que se eliminan por completo dentro de un período determinado. A medida que disminuye el valor de RPO, esto aumenta la cantidad de creaciones o eliminaciones de instantáneas dentro de un período determinado.

Resolution

Para el LUN que tiene la mayor cantidad de instantáneas en estado de destrucción, configure el RPO en al menos el valor predeterminado (60 minutos) hasta que la eliminación de instantáneas pueda ponerse al día. Es posible que desee dejar el valor en este nuevo RPO en función de la cantidad de instantáneas que se estaban poniendo en cola y juzgar en consecuencia.

 

"Dell Technologies recomienda incluir un nivel de flash en un pool híbrido donde las instantáneas estén activas.

 

Las instantáneas aumentan la carga general de CPU en el sistema y aumentan las IOPS generales de la unidad en el pool de almacenamiento.  Las instantáneas también utilizan la capacidad del pool para almacenar los datos más antiguos que rastrea la instantánea, lo que aumenta la cantidad de capacidad utilizada en el pool hasta que se elimina la instantánea.  Tenga en cuenta la sobrecarga de las instantáneas cuando planifique los requisitos de rendimiento y capacidad para el pool de almacenamiento.

 

Antes de habilitar las instantáneas en un objeto de almacenamiento, se recomienda monitorear el sistema y asegurarse de que los recursos existentes puedan cumplir con los requisitos de carga de trabajo adicionales (consulte la sección Pautas de funcionalidad de hardware, Tabla 2).  Habilite las instantáneas en algunos objetos de almacenamiento a la vez y, a continuación, monitoree el sistema para asegurarse de que aún esté dentro de los rangos de funcionamiento recomendados antes de habilitar más instantáneas.

 

Se recomienda escalonar las operaciones de instantáneas (creación, eliminación, etc.).  Esto se puede lograr mediante el uso de diferentes programas de instantáneas para diferentes conjuntos de objetos de almacenamiento.  También se recomienda programar operaciones de instantáneas después de que se hayan completado las reubicaciones de FAST VP.

 

El sistema elimina las instantáneas de manera asíncrona; cuando una instantánea está en proceso de eliminación, se marca como "Destroying".  Si el sistema está acumulando instantáneas de "destrucción" con el tiempo, puede ser un indicio de que los programas de instantáneas existentes son demasiado agresivos; La toma de instantáneas con menos frecuencia puede proporcionar niveles de rendimiento más predecibles. 

 

Dell Unity regulará las operaciones de eliminación de instantáneas para reducir el impacto en las I/O del host.  Las eliminaciones de instantáneas se producirán más rápidamente durante los períodos de baja utilización del sistema". Dell Unity: Guía de prácticas recomendadas

Additional Information


 

Affected Products

Dell EMC Unity Family

Products

Dell EMC Unity Family
Article Properties
Article Number: 000055095
Article Type: Solution
Last Modified: 20 Oct 2025
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.