Dell Unity: Sådan påvirker asynkron replikering og pladsgenvinding systemets ydeevne

Oversigt: Denne artikel undersøger virkningen af asynkron replikering på systemets ydeevne under rumindvinding fra store virtuelle maskiner (VM).

Denne artikel gælder for Denne artikel gælder ikke for Denne artikel er ikke knyttet til et bestemt produkt. Det er ikke alle produktversioner, der er identificeret i denne artikel.

Symptomer

Massiv ventetid i ALLE lagerressourcer (hele arrayet) kan ses, når du gengiver følgende trin:
 
1. Virtuelle maskiner (VM) på værten har ingen brug og er offline – ingen I/Ofuldstændig inaktiv – (beregnet til at blive slettet).
2. VM slettes fra værten (rumindvinding).
3. Alt fungerer fint. Alle LUN'er og værter i systemet har forventede svartider.
4. [Udløser] Replikering starter enten manuelt eller af målet Genoprettelsespunkt (RPO). Stigninger i ventetiden i ALLE LUN er og værter – Data blev utilgængelige.

Årsag

Asynkron replikering:
- Når replikeringssessionen er sat på pause, stopper eller sænker genvindingshastigheden ikke.
- Mens replikeringssessionen er sat på pause, akkumuleres arbejdet på arrayet.
- Når replikeringssessionen genoptages (enten manuelt eller automatisk), skubber dette det akkumulerede arbejde fra det tidspunkt, hvor det blev sat på pause.
- Afhængigt af mængden af akkumuleret arbejde kan dette forårsage latenstid, i dette tilfælde alvorlig.
- Dette er funktion som design.

Genvinding af rummet:
- I henhold til bedste praksis, 64 TB anbefales det ikke til ESXi-blok LUN'er, specielt kombineret med asynkron replikation. 
- Når arrayet forespørger gennem 40 TB tom plads for at finde blokke med kort af variabel længde til læsning, er dette en masse arbejde uden værditilvækst.
- Mens det sker, øges belastningen og påvirker både LUN og Array (alle ressourcer).

Løsning

For at undgå massiv latenstid, når disse betingelser er opfyldt, anbefales det at:

1. Stop og slet replikeringssessionen.
2. Ryd den ubrugte, tynde og ikke-bundne plads (med datamigration) til en mindre LUN. 
3. Opret i stedet en ny replikeringssession fra den mindre LUN.
 

Alternativt, hvis overførselsdatalageret er forældet, og det er beregnet til at blive fjernet, er vores anbefalinger:

1. Slet replikeringssessionen.
2. Slet berørt LUN.
3. Opret en mindre LUN i fremtiden i henhold til bedste praksis. 


Yderligere overvejelser: 
- Forkert konfiguration af LUN'er, ESXi-værter/VM'er og replikering kan have uklare konsekvenser, selv med bedste praksis på plads.
- Især i dette tilfælde var det det, der forårsagede latenstid i denne massive skala.
- Ifølge udvikling er dette en forventet adfærd, og Unity fungerer som designet.
 

Referencedokumentation:
- Dell EMC-enhed: Bedste praksis
for VMware vSphere
- vSphere Storage Appliance (Fællesskab - Eksternt link) 

Flere oplysninger

For at bekræfte, at dette er den samme funktionsmåde, skal du kontrollere, at replikering er eller blev udløst, se på følgende filer live på arrayet:

- Live på matrix:
- /EMC/backend/log/shared/EMCSystemLogFile.log
– /EMC/C4Core/log/c4_safe_ktrace.log


 

Manuelt udløst af administratorbrugeren:
14:10:21 service@spb:~/user# tailf 00_emc_backend_log_shared/EMCSystemLogFile.log | grep -i "refresh the replication"
B       05/04/21 14:10:48.405 ReplicPlugin       610021 [INFO] Audit: User Admin started to refresh the replication session rep_sess_res_xx_res_xx_CKM00xxxxxxxxx_CKM00xxxxxxxxx.


Automatisk efter mål for genoprettelsespunkt (RPO):
B       05/04/21 14:45:33.687 std              ddf1a70d c4_safe_ktrace   SASPMC 0 (BE99) API INFO set_dynamic_int_coalescing: nr_busy_ports=1 ict=100 icc=16
B       05/04/21 14:45:33.708 sade              9f3f70f c4_safe_ktrace   DIC: 6:[SVDM_B] Handle request /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607
B       05/04/21 14:45:33.708 sade              9f3f70f c4_safe_ktrace   DIC: 6:[SVDM_B] Send back /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607 response (200 OK)
B       05/04/21 14:45:33.708 sade              9f3f70f c4_safe_ktrace   DIC: 6:[SVDM_B] Response for /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607 sent
B       05/04/21 14:45:33.708 sade             e5243708 c4_safe_ktrace   XML: 6:[core] 
B       05/04/21 14:52:07.605 mlu               16d001c [INFO] System: Snapshot 81604378643_CKM00201901039_0000.ckpt000_3275157210146496.2_684 has been created for LUN 23.
B       05/04/21 14:52:07.710 mlu               12d0003 [INFO] System: Operation Create Replica started by 900002a4a on 9000000fd.
B       05/04/21 14:52:07.724 mlu               16d0027 [INFO] System: The new name for snapshot being destroyed is Destroying_20210106115207.694+00-000.
B       05/04/21 14:52:07.738 mlu               16d0027 [INFO] System: The new name for snapshot being destroyed is Destroying_20210106115207.694+00-001.
 

Bemærk: Hver gang RPO nås, eller en manuel opdatering startes, sker der en opdatering af snapshottet. En opdatering af et enkelt snapshot kan betragtes som en ødelæggelse eller genskabelse.

Berørte produkter

Dell EMC Unity, Dell EMC Unity Family |Dell EMC Unity All Flash, Dell EMC Unity Hybrid
Artikelegenskaber
Artikelnummer: 000184863
Artikeltype: Solution
Senest ændret: 22 apr. 2026
Version:  6
Find svar på dine spørgsmål fra andre Dell-brugere
Supportservices
Kontrollér, om din enhed er dækket af supportservices.