Dell Unity: Wie sich asynchrone Replikation und Speicherplatzrückgewinnung auf die Arrayperformance auswirken
Summary: In diesem Artikel werden die Auswirkungen der asynchronen Replikation auf die Arrayperformance während der Speicherplatzrückgewinnung von großen virtuellen Maschinen (VMs) untersucht.
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Eine massive Latenz in ALLEN Storage-Ressourcen (gesamtes Array) ist bei der Reproduktion der folgenden Schritte zu beobachten:
1. Virtuelle Maschinen (VMs) auf dem Host werden nicht genutzt und sind offline – keine I/O – vollständig inaktiv – (sollen gelöscht werden).
2. Die VM wird vom Host gelöscht (Speicherplatzrückgewinnung).
3. Alles funktioniert einwandfrei. Für alle LUNs und Hosts im Array gelten erwartete Antwortzeiten.
4. [Auslöser] Die Replikation wird entweder manuell oder über das Recover Point Objective (RPO) gestartet. Latenz erhöht sich in ALLEN LUNs und Hosts – Daten sind nicht mehr verfügbar.
2. Die VM wird vom Host gelöscht (Speicherplatzrückgewinnung).
3. Alles funktioniert einwandfrei. Für alle LUNs und Hosts im Array gelten erwartete Antwortzeiten.
4. [Auslöser] Die Replikation wird entweder manuell oder über das Recover Point Objective (RPO) gestartet. Latenz erhöht sich in ALLEN LUNs und Hosts – Daten sind nicht mehr verfügbar.
Cause
Asynchrone Replikation:
- Wenn die Replikationssitzung angehalten wird, wird die Rückgewinnungsrate weder gestoppt noch verlangsamt.
- Während die Replikationssitzung angehalten wird, sammelt sich die Arbeit auf dem Array an.
- Sobald die Replikationssitzung fortgesetzt wird (entweder manuell oder automatisch), wird die angesammelte Arbeit aus dem Zeitpunkt verschoben, an dem sie angehalten wurde.
- Abhängig von der Menge der angesammelten Arbeit kann dies zu Latenzzeiten führen, in diesem Fall zu schwerwiegenden Verzögerungen.
- Dies ist Funktion als Design.
Speicherplatzrückgewinnung:
- Gemäß Best Practices werden 64 TB nicht für ESXi-Block-LUNs empfohlen, speziell in Kombination mit asynchroner Replikation.
- Wenn das Array 40 TB leeren Speicherplatz durchsucht, um Blöcke mit variabler Länge map-for-read zu finden, ist dies eine Menge Arbeit ohne Mehrwert.
- Währenddessen erhöht sich die Last und wirkt sich sowohl auf die LUN als auch auf das Array (alle Ressourcen) aus.
- Wenn die Replikationssitzung angehalten wird, wird die Rückgewinnungsrate weder gestoppt noch verlangsamt.
- Während die Replikationssitzung angehalten wird, sammelt sich die Arbeit auf dem Array an.
- Sobald die Replikationssitzung fortgesetzt wird (entweder manuell oder automatisch), wird die angesammelte Arbeit aus dem Zeitpunkt verschoben, an dem sie angehalten wurde.
- Abhängig von der Menge der angesammelten Arbeit kann dies zu Latenzzeiten führen, in diesem Fall zu schwerwiegenden Verzögerungen.
- Dies ist Funktion als Design.
Speicherplatzrückgewinnung:
- Gemäß Best Practices werden 64 TB nicht für ESXi-Block-LUNs empfohlen, speziell in Kombination mit asynchroner Replikation.
- Wenn das Array 40 TB leeren Speicherplatz durchsucht, um Blöcke mit variabler Länge map-for-read zu finden, ist dies eine Menge Arbeit ohne Mehrwert.
- Währenddessen erhöht sich die Last und wirkt sich sowohl auf die LUN als auch auf das Array (alle Ressourcen) aus.
Resolution
Um massive Latenz zu vermeiden, wenn diese Bedingungen erfüllt sind, wird Folgendes empfohlen:
1. Beenden und löschen Sie die Replikationssitzung.
2. Bereinigen Sie den ungenutzten Thin- und nicht übernommenen Speicherplatz (mit Datenmigration) auf eine kleinere LUN.
3. Erstellen Sie stattdessen eine neue Replikationssitzung aus der kleineren LUN.
2. Bereinigen Sie den ungenutzten Thin- und nicht übernommenen Speicherplatz (mit Datenmigration) auf eine kleinere LUN.
3. Erstellen Sie stattdessen eine neue Replikationssitzung aus der kleineren LUN.
Wenn der Migrationsdatenspeicher veraltet ist und entfernt werden soll, empfehlen wir Folgendes:
1. Löschen Sie die Replikationssitzung.
2. Löschen Sie die betroffene LUN.
3. Erstellen Sie in Zukunft eine kleinere LUN und befolgen Sie dabei die Best Practices.
2. Löschen Sie die betroffene LUN.
3. Erstellen Sie in Zukunft eine kleinere LUN und befolgen Sie dabei die Best Practices.
Weitere Überlegungen:
- Die falsche Konfiguration von LUNs, ESXi-Hosts/VMs und Replikation kann selbst mit Best Practices unklare Folgen haben.
- Insbesondere in diesem Fall war dies der Grund für die Latenz in diesem massiven Ausmaß.
- Laut Entwicklung handelt es sich hierbei um ein erwartetes Verhalten, und Unity funktioniert wie vorgesehen.
Referenzdokumentation:
- Dell EMC Unity: Best Practices für VMware vSphere
- vSphere Storage Appliance (Community – Link verlässt diese Seite)
Additional Information
Um zu bestätigen, dass es sich um dasselbe Verhalten handelt, überprüfen Sie, ob die Replikation ausgelöst wird oder wurde. Sehen Sie sich die folgenden Dateien live auf dem Array an:
Live auf dem Array:/EMC/backend/log/shared/EMCSystemLogFile.log
- /EMC/C4Core/log/c4_safe_ktrace.log
Manuell ausgelöst durch den Admin-Nutzer:
14:10:21 service@spb:~/user# tailf 00_emc_backend_log_shared/EMCSystemLogFile.log | grep -i "refresh the replication"
B 05/04/21 14:10:48.405 ReplicPlugin 610021 [INFO] Audit: User Admin started to refresh the replication session rep_sess_res_xx_res_xx_CKM00xxxxxxxxx_CKM00xxxxxxxxx.
Automatisch, nach Recovery Point Objective (RPO):
B 05/04/21 14:45:33.687 std ddf1a70d c4_safe_ktrace SASPMC 0 (BE99) API INFO set_dynamic_int_coalescing: nr_busy_ports=1 ict=100 icc=16
B 05/04/21 14:45:33.708 sade 9f3f70f c4_safe_ktrace DIC: 6:[SVDM_B] Handle request /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607
B 05/04/21 14:45:33.708 sade 9f3f70f c4_safe_ktrace DIC: 6:[SVDM_B] Send back /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607 response (200 OK)
B 05/04/21 14:45:33.708 sade 9f3f70f c4_safe_ktrace DIC: 6:[SVDM_B] Response for /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607 sent
B 05/04/21 14:45:33.708 sade e5243708 c4_safe_ktrace XML: 6:[core]
B 05/04/21 14:52:07.605 mlu 16d001c [INFO] System: Snapshot 81604378643_CKM00201901039_0000.ckpt000_3275157210146496.2_684 has been created for LUN 23.
B 05/04/21 14:52:07.710 mlu 12d0003 [INFO] System: Operation Create Replica started by 900002a4a on 9000000fd.
B 05/04/21 14:52:07.724 mlu 16d0027 [INFO] System: The new name for snapshot being destroyed is Destroying_20210106115207.694+00-000.
B 05/04/21 14:52:07.738 mlu 16d0027 [INFO] System: The new name for snapshot being destroyed is Destroying_20210106115207.694+00-001.
Hinweis: Jedes Mal, wenn das RPO erreicht oder ein manuelles Update gestartet wird, erfolgt eine Snapshot-Aktualisierung. Eine einzelne Snapshot-Aktualisierung kann als Löschvorgang oder Neuerstellung betrachtet werden.
Affected Products
Dell EMC Unity, Dell EMC Unity Family |Dell EMC Unity All Flash, Dell EMC Unity HybridArticle Properties
Article Number: 000184863
Article Type: Solution
Last Modified: 21 Oct 2025
Version: 5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.