Dell Unity : Effets de la réplication asynchrone et de la récupération d’espace sur les performances d’une baie

Résumé: Cet article explore l’impact de la réplication asynchrone sur les performances d’une baie lors de la récupération d’espace à partir de grandes machines virtuelles (VM).

Cet article concerne Cet article ne concerne pas Cet article n’est associé à aucun produit spécifique. Toutes les versions du produit ne sont pas identifiées dans cet article.

Symptômes

Une latence massive sur TOUTES les ressources de stockage (baie entière) peut être observée lors de la reproduction des étapes suivantes :
 
1. Les machines virtuelles (VM) sur l’hôte ne sont pas utilisées et sont hors ligne : aucune E/S,totalement inactives (destinées à être supprimées).
2. La machine virtuelle est en cours de suppression de l’hôte (récupération d’espace).
3. Tout fonctionne correctement. Toutes les LUN et tous les hôtes de la baie ont des temps de réponse attendus.
4. [Déclencheur] La réplication démarre manuellement ou en fonction de la perte de données maximale admissible (RPO). Augmentation de la latence dans TOUS les LUN et tous les hôtes - Les données deviennent indisponibles.

Cause

Réplication asynchrone :
- Lorsque la session de réplication est suspendue, le taux de récupération ne s’arrête pas et ne ralentit pas.
- Pendant que la session de réplication est en pause, le travail s’accumule sur la baie.
- Une fois que la session de réplication est reprise (manuellement ou automatiquement), cela pousse le travail accumulé, à partir du moment où il a été mis en pause.
- En fonction de la quantité de travail accumulé, cela peut entraîner une latence, dans ce cas, sévère.
- Il s’agit de la fonction en tant que conception.

Récupération d’espace :
- Conformément aux pratiques d’excellence, 64 To n’est pas recommandé pour les LUN en mode bloc ESXi, en particulier combinées à la réplication asynchrone. 
- Lorsque le tableau interroge 40 To d’espace vide pour trouver des blocs avec une carte de lecture de longueur variable, c’est beaucoup de travail sans valeur ajoutée.
- Pendant ce temps, la charge augmente et a un impact à la fois sur la LUN et la baie (toutes les ressources).

Résolution

Pour éviter une latence massive lorsque ces conditions sont remplies, il est conseillé d’effectuer les opérations suivantes :

1. Arrêtez et supprimez la session de réplication.
2. Purger l’espace dynamique non utilisé et non validé (avec migration des données) vers une LUN plus petite. 
3. Créez plutôt une nouvelle session de réplication à partir de la LUN la plus petite.
 

Sinon, si le magasin de données de migration est obsolète et qu’il est destiné à être supprimé, nous vous recommandons les actions suivantes :

1. Supprimez la session de réplication.
2. Supprimez la LUN concernée.
3. Créez une LUN plus petite à l’avenir, en suivant les pratiques d’excellence. 


Autres considérations : 
- Une mauvaise configuration des LUN, des hôtes/machines virtuelles ESXi et de la réplication peut avoir des conséquences peu claires, même avec les meilleures pratiques en place.
- Dans ce cas en particulier, c’est ce qui provoquait la latence à cette échelle massive.
- Selon le développement, il s’agit d’un comportement attendu et Unity fonctionne comme prévu.
 

Documentation de référence :
- Dell EMC Unity : Pratiques
d’excellence VMware vSphere
- vSphere Storage Appliance (Communauté - Lien externe) 

Informations supplémentaires

Pour confirmer qu’il s’agit du même comportement, vérifiez que la réplication est ou était en cours de déclenchement, examinez les fichiers suivants en direct sur la baie :

Live on Array :
- /EMC/backend/log/shared/EMCSystemLogFile.log
/EMC/C4Core/log/c4_safe_ktrace.log


 

Déclenchement manuel par l’utilisateur administrateur :
14:10:21 service@spb:~/user# tailf 00_emc_backend_log_shared/EMCSystemLogFile.log | grep -i "refresh the replication"
B       05/04/21 14:10:48.405 ReplicPlugin       610021 [INFO] Audit: User Admin started to refresh the replication session rep_sess_res_xx_res_xx_CKM00xxxxxxxxx_CKM00xxxxxxxxx.


Automatiquement, en fonction de la perte de données maximale admissible (RPO) :
B       05/04/21 14:45:33.687 std              ddf1a70d c4_safe_ktrace   SASPMC 0 (BE99) API INFO set_dynamic_int_coalescing: nr_busy_ports=1 ict=100 icc=16
B       05/04/21 14:45:33.708 sade              9f3f70f c4_safe_ktrace   DIC: 6:[SVDM_B] Handle request /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607
B       05/04/21 14:45:33.708 sade              9f3f70f c4_safe_ktrace   DIC: 6:[SVDM_B] Send back /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607 response (200 OK)
B       05/04/21 14:45:33.708 sade              9f3f70f c4_safe_ktrace   DIC: 6:[SVDM_B] Response for /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607 sent
B       05/04/21 14:45:33.708 sade             e5243708 c4_safe_ktrace   XML: 6:[core] 
B       05/04/21 14:52:07.605 mlu               16d001c [INFO] System: Snapshot 81604378643_CKM00201901039_0000.ckpt000_3275157210146496.2_684 has been created for LUN 23.
B       05/04/21 14:52:07.710 mlu               12d0003 [INFO] System: Operation Create Replica started by 900002a4a on 9000000fd.
B       05/04/21 14:52:07.724 mlu               16d0027 [INFO] System: The new name for snapshot being destroyed is Destroying_20210106115207.694+00-000.
B       05/04/21 14:52:07.738 mlu               16d0027 [INFO] System: The new name for snapshot being destroyed is Destroying_20210106115207.694+00-001.
 

Remarque : Chaque fois que le RPO est atteint ou qu’une mise à jour manuelle est lancée, une actualisation de snapshot se produit. Une seule actualisation de snapshot peut être considérée comme une destruction ou une recréation.

Produits concernés

Dell EMC Unity, Dell EMC Unity Family |Dell EMC Unity All Flash, Dell EMC Unity Hybrid
Propriétés de l’article
Numéro d’article: 000184863
Type d’article: Solution
Dernière modification: 22 Apr 2026
Version:  6
Trouvez des réponses à vos questions auprès d’autres utilisateurs Dell
Services de support
Vérifiez si votre appareil est couvert par les services de support.