Dell Unity: Jak replikacja asynchroniczna i odzyskiwanie miejsca wpływają na wydajność macierzy

Summary: W tym artykule opisano wpływ replikacji asynchronicznej na wydajność macierzy podczas odzyskiwania miejsca z dużych maszyn wirtualnych (VM).

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Ogromne opóźnienia we WSZYSTKICH zasobach pamięci masowej (całej macierzy) można zauważyć podczas odtwarzania następujących kroków:
 
1. Maszyny wirtualne (VM) na hoście nie są używane i są w trybie offline — brak operacji we/wyw pełni bezczynne — (przeznaczone do usunięcia).
2. Maszyna wirtualna jest usuwana z hosta (odzyskiwanie miejsca).
3. Wszystko działa bez zarzutu. Wszystkie jednostki LUN i hosty w macierzy mają oczekiwane czasy reakcji.
4. [Wyzwalacz] Replikacja rozpoczyna się ręcznie lub według celu odzyskania (RPO). Wzrost opóźnień we WSZYSTKICH jednostkach LUN i hostach — dane stały się niedostępne.

Cause

Replikacja asynchroniczna:
- Gdy sesja replikacji jest wstrzymana, szybkość odzyskiwania nie zatrzymuje się ani nie zwalnia.
- Gdy sesja replikacji jest wstrzymana, praca kumuluje się w macierzy.
- Po wznowieniu sesji replikacji (ręcznie lub automatycznie) wypycha to skumulowaną pracę z momentu jej wstrzymania.
- W zależności od ilości skumulowanej pracy może to spowodować opóźnienie, w tym przypadku poważne.
- To jest funkcja jako projekt.

Odzyskiwanie przestrzeni:
- Zgodnie z najlepszymi praktykami 64 TB nie jest zalecane w przypadku jednostek LUN blokowych ESXi, szczególnie w połączeniu z replikacją asynchroniczną. 
- Gdy Array przeszukuje 40 TB pustego miejsca, aby znaleźć bloki z mapą o zmiennej długości do odczytu, jest to dużo pracy bez wartości dodanej.
- W tym czasie obciążenie wzrasta i wpływa zarówno na jednostkę LUN, jak i macierz (wszystkie zasoby).

Resolution

Aby uniknąć ogromnych opóźnień, gdy te warunki są spełnione, zaleca się wykonanie następujących czynności:

1. Zatrzymaj i usuń sesję replikacji.
2. Wyczyść nieużywane elastyczne i niezatwierdzone miejsce (z migracją danych) do mniejszej jednostki LUN. 
3. Zamiast tego utwórz nową sesję replikacji z mniejszej jednostki LUN.
 

Alternatywnie, jeśli magazyn danych migracji jest przestarzały i ma zostać usunięty, nasze zalecenia są następujące:

1. Usuń sesję replikacji.
2. Usuń jednostkę LUN, której dotyczy problem.
3. Utwórz mniejszą jednostkę LUN w przyszłości, postępując zgodnie z najlepszymi praktykami. 


Dalsze rozważania: 
- Nieprawidłowa konfiguracja jednostek LUN, hostów/maszyn wirtualnych ESXi i replikacji może mieć niejasne konsekwencje, nawet przy zastosowaniu najlepszych praktyk.
- Szczególnie w tym przypadku to właśnie powodowało opóźnienia na tak ogromną skalę.
- Według działu rozwoju jest to oczekiwane zachowanie, a Unity działa zgodnie z założeniami.
 

Dokumentacja referencyjna:
- Dell EMC Unity: Najlepsze praktyki
dotyczące oprogramowania VMware vSphere
- vSphere Storage Appliance (społeczność — łącze zewnętrzne) 

Additional Information

Aby potwierdzić, że jest to takie samo zachowanie, sprawdź, czy replikacja jest lub była wyzwalana, spójrz na następujące pliki na żywo w macierzy:

Live on Array:
- /EMC/backend/log/shared/EMCSystemLogFile.log
/EMC/C4Core/log/c4_safe_ktrace.log


 

Uruchamiane ręcznie przez użytkownika Admin:
14:10:21 service@spb:~/user# tailf 00_emc_backend_log_shared/EMCSystemLogFile.log | grep -i "refresh the replication"
B       05/04/21 14:10:48.405 ReplicPlugin       610021 [INFO] Audit: User Admin started to refresh the replication session rep_sess_res_xx_res_xx_CKM00xxxxxxxxx_CKM00xxxxxxxxx.


Automatycznie, według Recovery Point Objective (RPO):
B       05/04/21 14:45:33.687 std              ddf1a70d c4_safe_ktrace   SASPMC 0 (BE99) API INFO set_dynamic_int_coalescing: nr_busy_ports=1 ict=100 icc=16
B       05/04/21 14:45:33.708 sade              9f3f70f c4_safe_ktrace   DIC: 6:[SVDM_B] Handle request /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607
B       05/04/21 14:45:33.708 sade              9f3f70f c4_safe_ktrace   DIC: 6:[SVDM_B] Send back /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607 response (200 OK)
B       05/04/21 14:45:33.708 sade              9f3f70f c4_safe_ktrace   DIC: 6:[SVDM_B] Response for /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607 sent
B       05/04/21 14:45:33.708 sade             e5243708 c4_safe_ktrace   XML: 6:[core] 
B       05/04/21 14:52:07.605 mlu               16d001c [INFO] System: Snapshot 81604378643_CKM00201901039_0000.ckpt000_3275157210146496.2_684 has been created for LUN 23.
B       05/04/21 14:52:07.710 mlu               12d0003 [INFO] System: Operation Create Replica started by 900002a4a on 9000000fd.
B       05/04/21 14:52:07.724 mlu               16d0027 [INFO] System: The new name for snapshot being destroyed is Destroying_20210106115207.694+00-000.
B       05/04/21 14:52:07.738 mlu               16d0027 [INFO] System: The new name for snapshot being destroyed is Destroying_20210106115207.694+00-001.
 

Uwaga: Po każdym osiągnięciu celu RPO lub rozpoczęciu ręcznej aktualizacji następuje odświeżenie migawki. Odświeżenie pojedynczej migawki można uznać za zniszczenie lub ponowne utworzenie.

Affected Products

Dell EMC Unity, Dell EMC Unity Family |Dell EMC Unity All Flash, Dell EMC Unity Hybrid
Article Properties
Article Number: 000184863
Article Type: Solution
Last Modified: 21 Oct 2025
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.