Dell Unity: Grote of toenemende snapshotwachtrij die prestatieproblemen veroorzaakt

Summary: Dell Unity: Grote of toenemende snapshotwachtrij veroorzaakt prestatieproblemen en hoge CPU van de storageprocessor (SP)

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  • De waarde voor Recover Point Objective (RPO) is teruggebracht naar iets dat als agressiever wordt beschouwd (dat wil zeggen 10 minuten). "
    • "Recovery Point Objective (RPO) is een door de branche geaccepteerde term die de acceptabele hoeveelheid data aangeeft, die wordt gemeten in tijdseenheden, die verloren kan gaan bij een storing. Wanneer u een asynchrone replicatiesessie instelt, kunt u automatische synchronisatie configureren op basis van de RPO. U kunt een RPO opgeven van minimaal 5 minuten tot maximaal 1440 minuten (24 uur). De standaard RPO is ingesteld op een interval van 60 minuten (1 uur). Voor synchrone replicatie is RPO vastgesteld op 0."
  • Er zijn veel snapshots in de status "vernietigen" voor een LUN.
  • Het aantal snapshots in de status "vernietigen" neemt in de loop van de tijd toe.
  • Hoge SP CPU zonder een correlerende IOPS/bandbreedte-workload.
  • LUN's en back-endschijven hebben wachtrijen en verhoogde reactietijden.


    U kunt in Unisphere kijken in het gedeelte "Block". Zorg ervoor dat u de kolom "Snapshots" toevoegt om een uitlezing per LUN te krijgen. Als u veel snapshots voor een LUN of meerdere LUN's ziet staan, geeft dit een aantal dingen



    Unisphere UI Bekijk LUN'saan: Ga naar de afzonderlijke LUN en selecteer het tabblad "Snapshots" om de "State" (wordt "destroying") en "Taken by" (wordt "Replication") te controleren ter bevestiging:  

    Unisphere UI Bekijk snanpshots 

     

Cause

Er kunnen veel oorzaken zijn voor wachtrijen om op te bouwen. Een van de belangrijkste oorzaken wordt toegeschreven aan een RPO die als 'te agressief' wordt beschouwd.

Native asynchrone blokreplicatie:
Native asynchrone blokreplicatie maakt gebruik van een delta tussen twee snapshots om data over te dragen. Tijdens de levensduur van de replicatiesessies vinden er meerdere snapshotvernieuwingen plaats bij het overbrengen van wijzigingen.

Wanneer een snapshot wordt vernieuwd, wordt deze in werkelijkheid verwijderd en op de achtergrond opnieuw gemaakt.

De meest in het oog springende problemen zijn SP, CPU-verbruik en extra backend-I/O die zijn gekoppeld aan snapshot-functionaliteit.


De Unity array kan de snapshots niet volledig binnen een relatief redelijke tijd verwijderen, waardoor het aantal snapshots dat de status "te verwijderen" krijgt veel hoger is dan het aantal snapshots dat binnen een bepaalde tijd volledig wordt verwijderd. Als u de RPO-waarde verlaagt, neemt het aantal snapshots dat binnen een bepaalde tijd moet worden gemaakt of verwijderd, toe.

Resolution

Voor de LUN met de meeste snapshots in een vernietigende status, stelt u de RPO in op ten minste de standaardwaarde (60 minuten) totdat het verwijderen van snapshots de achterstand kan inhalen. Misschien wilt u de waarde bij deze nieuwe RPO laten, afhankelijk van het aantal snapshots dat in de wachtrij werd geplaatst, en dienovereenkomstig beoordelen.

 

"Dell Technologies raadt aan om een Flash-laag op te nemen in een hybride pool waar snapshots actief zijn.

 

Snapshots verhogen de algehele CPU-belasting van het systeem en verhogen de algehele schijf-IOPS in de storagepool.  Snapshots gebruiken ook groepscapaciteit om de oudere data op te slaan die door de snapshot worden bijgehouden, waardoor de hoeveelheid capaciteit die in de groep wordt gebruikt, toeneemt totdat de snapshot wordt verwijderd.  Houd rekening met de overhead van snapshots bij het plannen van zowel prestatie- als capaciteitsvereisten voor de storagepool.

 

Voordat u snapshots op een storageobject inschakelt, is het raadzaam om het systeem te controleren en ervoor te zorgen dat bestaande bronnen kunnen voldoen aan de aanvullende workloadvereisten (zie het gedeelte Richtlijnen voor hardwaremogelijkheden, tabel 2).  Schakel snapshots op enkele storageobjecten tegelijk in en controleer vervolgens het systeem om er zeker van te zijn dat het nog steeds binnen de aanbevolen operationele bereiken valt, voordat u meer snapshots inschakelt.

 

Het wordt aanbevolen om snapshotbewerkingen (maken, verwijderen, enzovoort) te spreiden.  Dit kan worden bereikt door verschillende snapshotschema's te gebruiken voor verschillende sets storageobjecten.  Het wordt ook aanbevolen om snapshotbewerkingen te plannen nadat eventuele FAST VP-verplaatsingen zijn voltooid.

 

Snapshots worden asynchroon door het systeem verwijderd; wanneer een snapshot wordt verwijderd, wordt deze gemarkeerd als "Destroying".  Als het systeem in de loop van de tijd "Destroying" snapshots verzamelt, kan dit een indicatie zijn dat bestaande snapshotschema's te agressief zijn; Minder vaak snapshots maken kan beter voorspelbare prestatieniveaus bieden. 

 

Dell Unity beperkt bewerkingen voor het verwijderen van snapshots om de impact op de host-I/O te verminderen.  Snapshotverwijderingen zullen sneller plaatsvinden tijdens perioden van laag systeemgebruik." Dell Unity: Handleiding met aanbevolen werkwijzen

Additional Information


 

Affected Products

Dell EMC Unity Family

Products

Dell EMC Unity Family
Article Properties
Article Number: 000055095
Article Type: Solution
Last Modified: 20 Oct 2025
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.