Dell Unity: Hur asynkron replikering och utrymmesåtervinning påverkar disksystemets prestanda

Summary: I den här artikeln beskrivs effekten av asynkron replikering på disksystemprestanda under utrymmesåtertagning från stora virtuella datorer (VM).

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

En enorm latens för ALLA lagringsresurser (hela disksystemet) kan ses när du återskapar följande steg:
 
1. Virtuella maskiner (VM) på värden har ingen användning och är offline – ingen I/Ohelt inaktiva – (avsedda att tas bort).
2. Den virtuella datorn tas bort från värden (utrymmesåtertagning).
3. Allt fungerar bra. Alla LUN och värdar i disksystemet har förväntade svarstider.
4. [Avtryckare] Replikeringen startar antingen manuellt eller med målet för återställningspunkt (RPO). Ökad latens i ALLA LUN och värdar – data blev otillgängliga.

Cause

Asynkron replikering:
- När replikeringssessionen är pausad varken stoppas eller saktas reklamationshastigheten ned.
- När replikeringssessionen är pausad ackumuleras arbetet på disksystemet.
- När replikeringssessionen har återupptagits (antingen manuellt eller automatiskt) push-överför detta det ackumulerade arbetet från när det pausades.
- Beroende på hur mycket arbete som ackumuleras kan detta orsaka svarstider, i det här fallet allvarliga.
- Det här är Function As Design.

Återvinning av utrymme:
– Enligt bästa praxis rekommenderas inte 64 TB för ESXi-block-LUN, särskilt i kombination med asynkron replikering. 
- När matrisen frågar igenom 40 TB tomt utrymme för att hitta block med karta med variabel längd för läsning är detta mycket arbete utan mervärde.
- Medan det händer ökar belastningen och påverkar både LUN och matris (alla resurser).

Resolution

För att undvika massiv svarstid när dessa villkor är uppfyllda rekommenderar vi att:

1. Stoppa och ta bort replikeringssessionen.
2. Rensa det oanvända tunna och oallokerade utrymmet (med datamigrering) till ett mindre LUN. 
3. Skapa en ny replikeringssession från det mindre LUN i stället.
 

Alternativt, om migreringsdatalagret är föråldrat och det är avsett att tas bort, är våra rekommendationer:

1. Ta bort replikeringssessionen.
2. Ta bort berörda LUN.
3. Skapa ett mindre LUN i framtiden enligt bästa praxis. 


Ytterligare överväganden: 
- Felkonfigurering av LUN, ESXi-värdar/virtuella datorer och replikering kan få oklara konsekvenser, även med bästa praxis på plats.
- I det här fallet är det just detta som orsakade latensen i den här enorma skalan.
- Enligt Utveckling är detta ett förväntat beteende och Unity fungerar som avsett.
 

Referensdokumentation:
- Dell EMC Unity: VMware vSphere – bästa praxis 
- vSphere Storage Appliance (Community - Extern länk)

Additional Information

Om du vill bekräfta att det här är samma beteende kontrollerar du att replikeringen utlöses eller utlöses genom att titta på följande filer live på disksystemet:

Live på disksystemet:
/EMC/backend/log/shared/EMCSystemLogFile.log
/EMC/C4Core/log/c4_safe_ktrace.log


 

Utlöses manuellt av administratörsanvändaren:
14:10:21 service@spb:~/user# tailf 00_emc_backend_log_shared/EMCSystemLogFile.log | grep -i "refresh the replication"
B       05/04/21 14:10:48.405 ReplicPlugin       610021 [INFO] Audit: User Admin started to refresh the replication session rep_sess_res_xx_res_xx_CKM00xxxxxxxxx_CKM00xxxxxxxxx.


Automatiskt, efter mål för återställningspunkt (RPO):
B       05/04/21 14:45:33.687 std              ddf1a70d c4_safe_ktrace   SASPMC 0 (BE99) API INFO set_dynamic_int_coalescing: nr_busy_ports=1 ict=100 icc=16
B       05/04/21 14:45:33.708 sade              9f3f70f c4_safe_ktrace   DIC: 6:[SVDM_B] Handle request /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607
B       05/04/21 14:45:33.708 sade              9f3f70f c4_safe_ktrace   DIC: 6:[SVDM_B] Send back /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607 response (200 OK)
B       05/04/21 14:45:33.708 sade              9f3f70f c4_safe_ktrace   DIC: 6:[SVDM_B] Response for /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607 sent
B       05/04/21 14:45:33.708 sade             e5243708 c4_safe_ktrace   XML: 6:[core] 
B       05/04/21 14:52:07.605 mlu               16d001c [INFO] System: Snapshot 81604378643_CKM00201901039_0000.ckpt000_3275157210146496.2_684 has been created for LUN 23.
B       05/04/21 14:52:07.710 mlu               12d0003 [INFO] System: Operation Create Replica started by 900002a4a on 9000000fd.
B       05/04/21 14:52:07.724 mlu               16d0027 [INFO] System: The new name for snapshot being destroyed is Destroying_20210106115207.694+00-000.
B       05/04/21 14:52:07.738 mlu               16d0027 [INFO] System: The new name for snapshot being destroyed is Destroying_20210106115207.694+00-001.
 

Obs! Varje gång RPO nås eller en manuell uppdatering startas sker en uppdatering av ögonblicksbilden. En enda uppdatering av ögonblicksbilder kan betraktas som en förstöring eller återskapande.

Affected Products

Dell EMC Unity, Dell EMC Unity Family |Dell EMC Unity All Flash, Dell EMC Unity Hybrid
Article Properties
Article Number: 000184863
Article Type: Solution
Last Modified: 21 Oct 2025
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.