Dell Unity : Effets de la réplication asynchrone et de la récupération d’espace sur les performances d’une baie

Summary: Cet article explore l’impact de la réplication asynchrone sur les performances d’une baie lors de la récupération d’espace à partir de grandes machines virtuelles (VM).

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Une latence massive sur TOUTES les ressources de stockage (baie entière) peut être observée lors de la reproduction des étapes suivantes :
 
1. Les machines virtuelles (VM) sur l’hôte ne sont pas utilisées et sont hors ligne : aucune E/S,totalement inactives (destinées à être supprimées).
2. La machine virtuelle est en cours de suppression de l’hôte (récupération d’espace).
3. Tout fonctionne correctement. Toutes les LUN et tous les hôtes de la baie ont des temps de réponse attendus.
4. [Déclencheur] La réplication démarre manuellement ou en fonction de la perte de données maximale admissible (RPO). Augmentation de la latence dans TOUS les LUN et tous les hôtes - Les données deviennent indisponibles.

Cause

Réplication asynchrone :
- Lorsque la session de réplication est suspendue, le taux de récupération ne s’arrête pas et ne ralentit pas.
- Pendant que la session de réplication est en pause, le travail s’accumule sur la baie.
- Une fois que la session de réplication est reprise (manuellement ou automatiquement), cela pousse le travail accumulé, à partir du moment où il a été mis en pause.
- En fonction de la quantité de travail accumulé, cela peut entraîner une latence, dans ce cas, sévère.
- Il s’agit de la fonction en tant que conception.

Récupération d’espace :
- Conformément aux pratiques d’excellence, 64 To n’est pas recommandé pour les LUN en mode bloc ESXi, en particulier combinées à la réplication asynchrone. 
- Lorsque le tableau interroge 40 To d’espace vide pour trouver des blocs avec une carte de lecture de longueur variable, c’est beaucoup de travail sans valeur ajoutée.
- Pendant ce temps, la charge augmente et a un impact à la fois sur la LUN et la baie (toutes les ressources).

Resolution

Pour éviter une latence massive lorsque ces conditions sont remplies, il est conseillé d’effectuer les opérations suivantes :

1. Arrêtez et supprimez la session de réplication.
2. Purger l’espace dynamique non utilisé et non validé (avec migration des données) vers une LUN plus petite. 
3. Créez plutôt une nouvelle session de réplication à partir de la LUN la plus petite.
 

Sinon, si le magasin de données de migration est obsolète et qu’il est destiné à être supprimé, nous vous recommandons les actions suivantes :

1. Supprimez la session de réplication.
2. Supprimez la LUN concernée.
3. Créez une LUN plus petite à l’avenir, en suivant les pratiques d’excellence. 


Autres considérations : 
- Une mauvaise configuration des LUN, des hôtes/machines virtuelles ESXi et de la réplication peut avoir des conséquences peu claires, même avec les meilleures pratiques en place.
- Dans ce cas en particulier, c’est ce qui provoquait la latence à cette échelle massive.
- Selon le développement, il s’agit d’un comportement attendu et Unity fonctionne comme prévu.
 

Documentation de référence :
- Dell EMC Unity : Pratiques
d’excellence VMware vSphere
- vSphere Storage Appliance (Communauté - Lien externe) 

Additional Information

Pour confirmer qu’il s’agit du même comportement, vérifiez que la réplication est ou était en cours de déclenchement, examinez les fichiers suivants en direct sur la baie :

Live on Array :
- /EMC/backend/log/shared/EMCSystemLogFile.log
/EMC/C4Core/log/c4_safe_ktrace.log


 

Déclenchement manuel par l’utilisateur administrateur :
14:10:21 service@spb:~/user# tailf 00_emc_backend_log_shared/EMCSystemLogFile.log | grep -i "refresh the replication"
B       05/04/21 14:10:48.405 ReplicPlugin       610021 [INFO] Audit: User Admin started to refresh the replication session rep_sess_res_xx_res_xx_CKM00xxxxxxxxx_CKM00xxxxxxxxx.


Automatiquement, en fonction de la perte de données maximale admissible (RPO) :
B       05/04/21 14:45:33.687 std              ddf1a70d c4_safe_ktrace   SASPMC 0 (BE99) API INFO set_dynamic_int_coalescing: nr_busy_ports=1 ict=100 icc=16
B       05/04/21 14:45:33.708 sade              9f3f70f c4_safe_ktrace   DIC: 6:[SVDM_B] Handle request /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607
B       05/04/21 14:45:33.708 sade              9f3f70f c4_safe_ktrace   DIC: 6:[SVDM_B] Send back /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607 response (200 OK)
B       05/04/21 14:45:33.708 sade              9f3f70f c4_safe_ktrace   DIC: 6:[SVDM_B] Response for /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607 sent
B       05/04/21 14:45:33.708 sade             e5243708 c4_safe_ktrace   XML: 6:[core] 
B       05/04/21 14:52:07.605 mlu               16d001c [INFO] System: Snapshot 81604378643_CKM00201901039_0000.ckpt000_3275157210146496.2_684 has been created for LUN 23.
B       05/04/21 14:52:07.710 mlu               12d0003 [INFO] System: Operation Create Replica started by 900002a4a on 9000000fd.
B       05/04/21 14:52:07.724 mlu               16d0027 [INFO] System: The new name for snapshot being destroyed is Destroying_20210106115207.694+00-000.
B       05/04/21 14:52:07.738 mlu               16d0027 [INFO] System: The new name for snapshot being destroyed is Destroying_20210106115207.694+00-001.
 

Remarque : Chaque fois que le RPO est atteint ou qu’une mise à jour manuelle est lancée, une actualisation de snapshot se produit. Une seule actualisation de snapshot peut être considérée comme une destruction ou une recréation.

Affected Products

Dell EMC Unity, Dell EMC Unity Family |Dell EMC Unity All Flash, Dell EMC Unity Hybrid
Article Properties
Article Number: 000184863
Article Type: Solution
Last Modified: 21 Oct 2025
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.