Dell Unity: Wie sich asynchrone Replikation und Speicherplatzrückgewinnung auf die Arrayperformance auswirken

Summary: In diesem Artikel werden die Auswirkungen der asynchronen Replikation auf die Arrayperformance während der Speicherplatzrückgewinnung von großen virtuellen Maschinen (VMs) untersucht.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Eine massive Latenz in ALLEN Storage-Ressourcen (gesamtes Array) ist bei der Reproduktion der folgenden Schritte zu beobachten:
 
1. Virtuelle Maschinen (VMs) auf dem Host werden nicht genutzt und sind offline – keine I/Ovollständig inaktiv – (sollen gelöscht werden).
2. Die VM wird vom Host gelöscht (Speicherplatzrückgewinnung).
3. Alles funktioniert einwandfrei. Für alle LUNs und Hosts im Array gelten erwartete Antwortzeiten.
4. [Auslöser] Die Replikation wird entweder manuell oder über das Recover Point Objective (RPO) gestartet. Latenz erhöht sich in ALLEN LUNs und Hosts – Daten sind nicht mehr verfügbar.

Cause

Asynchrone Replikation:
- Wenn die Replikationssitzung angehalten wird, wird die Rückgewinnungsrate weder gestoppt noch verlangsamt.
- Während die Replikationssitzung angehalten wird, sammelt sich die Arbeit auf dem Array an.
- Sobald die Replikationssitzung fortgesetzt wird (entweder manuell oder automatisch), wird die angesammelte Arbeit aus dem Zeitpunkt verschoben, an dem sie angehalten wurde.
- Abhängig von der Menge der angesammelten Arbeit kann dies zu Latenzzeiten führen, in diesem Fall zu schwerwiegenden Verzögerungen.
- Dies ist Funktion als Design.

Speicherplatzrückgewinnung:
- Gemäß Best Practices werden 64 TB nicht für ESXi-Block-LUNs empfohlen, speziell in Kombination mit asynchroner Replikation. 
- Wenn das Array 40 TB leeren Speicherplatz durchsucht, um Blöcke mit variabler Länge map-for-read zu finden, ist dies eine Menge Arbeit ohne Mehrwert.
- Währenddessen erhöht sich die Last und wirkt sich sowohl auf die LUN als auch auf das Array (alle Ressourcen) aus.

Resolution

Um massive Latenz zu vermeiden, wenn diese Bedingungen erfüllt sind, wird Folgendes empfohlen:

1. Beenden und löschen Sie die Replikationssitzung.
2. Bereinigen Sie den ungenutzten Thin- und nicht übernommenen Speicherplatz (mit Datenmigration) auf eine kleinere LUN. 
3. Erstellen Sie stattdessen eine neue Replikationssitzung aus der kleineren LUN.
 

Wenn der Migrationsdatenspeicher veraltet ist und entfernt werden soll, empfehlen wir Folgendes:

1. Löschen Sie die Replikationssitzung.
2. Löschen Sie die betroffene LUN.
3. Erstellen Sie in Zukunft eine kleinere LUN und befolgen Sie dabei die Best Practices. 


Weitere Überlegungen: 
- Die falsche Konfiguration von LUNs, ESXi-Hosts/VMs und Replikation kann selbst mit Best Practices unklare Folgen haben.
- Insbesondere in diesem Fall war dies der Grund für die Latenz in diesem massiven Ausmaß.
- Laut Entwicklung handelt es sich hierbei um ein erwartetes Verhalten, und Unity funktioniert wie vorgesehen.
 

Referenzdokumentation:
- Dell EMC Unity: Best Practices für VMware vSphere 
- vSphere Storage Appliance (Community – Link verlässt diese Seite)

Additional Information

Um zu bestätigen, dass es sich um dasselbe Verhalten handelt, überprüfen Sie, ob die Replikation ausgelöst wird oder wurde. Sehen Sie sich die folgenden Dateien live auf dem Array an:

Live auf dem Array:
/EMC/backend/log/shared/EMCSystemLogFile.log
/EMC/C4Core/log/c4_safe_ktrace.log


 

Manuell ausgelöst durch den Admin-Nutzer:
14:10:21 service@spb:~/user# tailf 00_emc_backend_log_shared/EMCSystemLogFile.log | grep -i "refresh the replication"
B       05/04/21 14:10:48.405 ReplicPlugin       610021 [INFO] Audit: User Admin started to refresh the replication session rep_sess_res_xx_res_xx_CKM00xxxxxxxxx_CKM00xxxxxxxxx.


Automatisch, nach Recovery Point Objective (RPO):
B       05/04/21 14:45:33.687 std              ddf1a70d c4_safe_ktrace   SASPMC 0 (BE99) API INFO set_dynamic_int_coalescing: nr_busy_ports=1 ict=100 icc=16
B       05/04/21 14:45:33.708 sade              9f3f70f c4_safe_ktrace   DIC: 6:[SVDM_B] Handle request /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607
B       05/04/21 14:45:33.708 sade              9f3f70f c4_safe_ktrace   DIC: 6:[SVDM_B] Send back /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607 response (200 OK)
B       05/04/21 14:45:33.708 sade              9f3f70f c4_safe_ktrace   DIC: 6:[SVDM_B] Response for /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607 sent
B       05/04/21 14:45:33.708 sade             e5243708 c4_safe_ktrace   XML: 6:[core] 
B       05/04/21 14:52:07.605 mlu               16d001c [INFO] System: Snapshot 81604378643_CKM00201901039_0000.ckpt000_3275157210146496.2_684 has been created for LUN 23.
B       05/04/21 14:52:07.710 mlu               12d0003 [INFO] System: Operation Create Replica started by 900002a4a on 9000000fd.
B       05/04/21 14:52:07.724 mlu               16d0027 [INFO] System: The new name for snapshot being destroyed is Destroying_20210106115207.694+00-000.
B       05/04/21 14:52:07.738 mlu               16d0027 [INFO] System: The new name for snapshot being destroyed is Destroying_20210106115207.694+00-001.
 

Hinweis: Jedes Mal, wenn das RPO erreicht oder ein manuelles Update gestartet wird, erfolgt eine Snapshot-Aktualisierung. Eine einzelne Snapshot-Aktualisierung kann als Löschvorgang oder Neuerstellung betrachtet werden.

Affected Products

Dell EMC Unity, Dell EMC Unity Family |Dell EMC Unity All Flash, Dell EMC Unity Hybrid
Article Properties
Article Number: 000184863
Article Type: Solution
Last Modified: 21 Oct 2025
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.