Dell Unity: Cómo la replicación asíncrona y la recuperación de espacio afectan el rendimiento del arreglo

Summary: En este artículo, se explora el impacto de la replicación asíncrona en el rendimiento del arreglo durante la recuperación de espacio de máquinas virtuales (VM) grandes.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

La latencia masiva en TODOS los recursos de almacenamiento (arreglo completo) se puede ver cuando se reproducen los siguientes pasos:
 
1. Las máquinas virtuales (VM) en el host no se utilizan y están offline, sin I/O , completamente inactivas (destinadas a eliminarse).
2. La VM se está eliminando del host (recuperación de espacio).
3. Todo funciona correctamente. Todos los LUN y los hosts del arreglo tienen tiempos de respuesta esperados.
4. [Desencadenante] La replicación se inicia manualmente o según el objetivo de punto de recuperación (RPO). Aumentos de latencia en TODOS los LUN y hosts: los datos dejan de estar disponibles.

Cause

Replicación asíncrona:
- Cuando la sesión de replicación está en pausa, la tasa de recuperación no se detiene ni se ralentiza.
- Mientras la sesión de replicación está en pausa, el trabajo se acumula en el arreglo.
- Una vez que se reanuda la sesión de replicación (ya sea de forma manual o automática), esto envía el trabajo acumulado, desde que se pause.
- Dependiendo de la cantidad de trabajo acumulado, esto podría causar latencia, en este caso, severa.
- Esta es la función como diseño.

Recuperación de espacio:
- Según las prácticas recomendadas, 64 TB no se recomienda para los LUN de bloques ESXi, especialmente combinados con la replicación asíncrona. 
- Cuando el Array consulta a través de 40 TB de espacio vacío para encontrar bloques con el mapa de longitud variable para la lectura, esto es mucho trabajo sin valor agregado.
- Mientras eso sucede, la carga aumenta y afecta tanto al LUN como al arreglo (todos los recursos).

Resolution

Para evitar la latencia masiva cuando se cumplen estas condiciones, se recomienda lo siguiente:

1. Detenga y elimine la sesión de replicación.
2. Purgue el espacio delgado y no comprometido no utilizado (con migración de datos) a un LUN más pequeño. 
3. En su lugar, cree una nueva sesión de replicación desde el LUN más pequeño.
 

Como alternativa, si el almacén de datos de migración está obsoleto y está destinado a eliminarse, nuestras recomendaciones son las siguientes:

1. Elimine la sesión de replicación.
2. Elimine el LUN afectado.
3. Cree un LUN más pequeño en el futuro, siguiendo las prácticas recomendadas. 


Otras consideraciones: 
- La configuración incorrecta de los LUN, los hosts/VM de ESXi y la replicación puede tener consecuencias poco claras, incluso con las prácticas recomendadas implementadas.
- Para este caso en particular, esto es lo que estaba causando latencia a esta escala masiva.
- De acuerdo con Desarrollo, este es un comportamiento esperado y Unity está funcionando según lo diseñado.
 

Documentación de referencia:
- Dell EMC Unity: Prácticas recomendadas de VMware vSphere 
- vSphere Storage Appliance (comunidad: enlace externo)

Additional Information

Para confirmar que este es el mismo comportamiento, verifique que la replicación se esté activando o se haya activado, observe los siguientes archivos activos en el arreglo:

Live on Array:
- /EMC/backend/log/shared/EMCSystemLogFile.log
/EMC/C4Core/log/c4_safe_ktrace.log


 

Activada manualmente por el usuario administrador:
14:10:21 service@spb:~/user# tailf 00_emc_backend_log_shared/EMCSystemLogFile.log | grep -i "refresh the replication"
B       05/04/21 14:10:48.405 ReplicPlugin       610021 [INFO] Audit: User Admin started to refresh the replication session rep_sess_res_xx_res_xx_CKM00xxxxxxxxx_CKM00xxxxxxxxx.


Automáticamente, según el objetivo de punto de recuperación (RPO):
B       05/04/21 14:45:33.687 std              ddf1a70d c4_safe_ktrace   SASPMC 0 (BE99) API INFO set_dynamic_int_coalescing: nr_busy_ports=1 ict=100 icc=16
B       05/04/21 14:45:33.708 sade              9f3f70f c4_safe_ktrace   DIC: 6:[SVDM_B] Handle request /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607
B       05/04/21 14:45:33.708 sade              9f3f70f c4_safe_ktrace   DIC: 6:[SVDM_B] Send back /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607 response (200 OK)
B       05/04/21 14:45:33.708 sade              9f3f70f c4_safe_ktrace   DIC: 6:[SVDM_B] Response for /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607 sent
B       05/04/21 14:45:33.708 sade             e5243708 c4_safe_ktrace   XML: 6:[core] 
B       05/04/21 14:52:07.605 mlu               16d001c [INFO] System: Snapshot 81604378643_CKM00201901039_0000.ckpt000_3275157210146496.2_684 has been created for LUN 23.
B       05/04/21 14:52:07.710 mlu               12d0003 [INFO] System: Operation Create Replica started by 900002a4a on 9000000fd.
B       05/04/21 14:52:07.724 mlu               16d0027 [INFO] System: The new name for snapshot being destroyed is Destroying_20210106115207.694+00-000.
B       05/04/21 14:52:07.738 mlu               16d0027 [INFO] System: The new name for snapshot being destroyed is Destroying_20210106115207.694+00-001.
 

Nota: Cada vez que se alcanza el RPO o se inicia una actualización manual, se produce una actualización de instantáneas. Una sola actualización de instantánea se puede considerar una destrucción o recreación.

Affected Products

Dell EMC Unity, Dell EMC Unity Family |Dell EMC Unity All Flash, Dell EMC Unity Hybrid
Article Properties
Article Number: 000184863
Article Type: Solution
Last Modified: 21 Oct 2025
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.