Dell Unity: Grote of toenemende snapshotwachtrij die prestatieproblemen veroorzaakt
Summary: Dell Unity: Grote of toenemende snapshotwachtrij veroorzaakt prestatieproblemen en hoge CPU van de storageprocessor (SP)
Symptoms
- De waarde voor Recover Point Objective (RPO) is teruggebracht naar iets dat als agressiever wordt beschouwd (dat wil zeggen 10 minuten). "
- "Recovery Point Objective (RPO) is een door de branche geaccepteerde term die de acceptabele hoeveelheid data aangeeft, die wordt gemeten in tijdseenheden, die verloren kan gaan bij een storing. Wanneer u een asynchrone replicatiesessie instelt, kunt u automatische synchronisatie configureren op basis van de RPO. U kunt een RPO opgeven van minimaal 5 minuten tot maximaal 1440 minuten (24 uur). De standaard RPO is ingesteld op een interval van 60 minuten (1 uur). Voor synchrone replicatie is RPO vastgesteld op 0."
- Er zijn veel snapshots in de status "vernietigen" voor een LUN.
- Het aantal snapshots in de status "vernietigen" neemt in de loop van de tijd toe.
- Hoge SP CPU zonder een correlerende IOPS/bandbreedte-workload.
- LUN's en back-endschijven hebben wachtrijen en verhoogde reactietijden.
U kunt in Unisphere kijken in het gedeelte "Block". Zorg ervoor dat u de kolom "Snapshots" toevoegt om een uitlezing per LUN te krijgen. Als u veel snapshots voor een LUN of meerdere LUN's ziet staan, geeft dit een aantal dingen
aan: Ga naar de afzonderlijke LUN en selecteer het tabblad "Snapshots" om de "State" (wordt "destroying") en "Taken by" (wordt "Replication") te controleren ter bevestiging:
Cause
Er kunnen veel oorzaken zijn voor wachtrijen om op te bouwen. Een van de belangrijkste oorzaken wordt toegeschreven aan een RPO die als 'te agressief' wordt beschouwd.
Native asynchrone blokreplicatie:
Native asynchrone blokreplicatie maakt gebruik van een delta tussen twee snapshots om data over te dragen. Tijdens de levensduur van de replicatiesessies vinden er meerdere snapshotvernieuwingen plaats bij het overbrengen van wijzigingen.
Wanneer een snapshot wordt vernieuwd, wordt deze in werkelijkheid verwijderd en op de achtergrond opnieuw gemaakt.
De meest in het oog springende problemen zijn SP, CPU-verbruik en extra backend-I/O die zijn gekoppeld aan snapshot-functionaliteit.
De Unity array kan de snapshots niet volledig binnen een relatief redelijke tijd verwijderen, waardoor het aantal snapshots dat de status "te verwijderen" krijgt veel hoger is dan het aantal snapshots dat binnen een bepaalde tijd volledig wordt verwijderd. Als u de RPO-waarde verlaagt, neemt het aantal snapshots dat binnen een bepaalde tijd moet worden gemaakt of verwijderd, toe.
Resolution
Voor de LUN met de meeste snapshots in een vernietigende status, stelt u de RPO in op ten minste de standaardwaarde (60 minuten) totdat het verwijderen van snapshots de achterstand kan inhalen. Misschien wilt u de waarde bij deze nieuwe RPO laten, afhankelijk van het aantal snapshots dat in de wachtrij werd geplaatst, en dienovereenkomstig beoordelen.
"Dell Technologies raadt aan om een Flash-laag op te nemen in een hybride pool waar snapshots actief zijn.
Snapshots verhogen de algehele CPU-belasting van het systeem en verhogen de algehele schijf-IOPS in de storagepool. Snapshots gebruiken ook groepscapaciteit om de oudere data op te slaan die door de snapshot worden bijgehouden, waardoor de hoeveelheid capaciteit die in de groep wordt gebruikt, toeneemt totdat de snapshot wordt verwijderd. Houd rekening met de overhead van snapshots bij het plannen van zowel prestatie- als capaciteitsvereisten voor de storagepool.
Voordat u snapshots op een storageobject inschakelt, is het raadzaam om het systeem te controleren en ervoor te zorgen dat bestaande bronnen kunnen voldoen aan de aanvullende workloadvereisten (zie het gedeelte Richtlijnen voor hardwaremogelijkheden, tabel 2). Schakel snapshots op enkele storageobjecten tegelijk in en controleer vervolgens het systeem om er zeker van te zijn dat het nog steeds binnen de aanbevolen operationele bereiken valt, voordat u meer snapshots inschakelt.
Het wordt aanbevolen om snapshotbewerkingen (maken, verwijderen, enzovoort) te spreiden. Dit kan worden bereikt door verschillende snapshotschema's te gebruiken voor verschillende sets storageobjecten. Het wordt ook aanbevolen om snapshotbewerkingen te plannen nadat eventuele FAST VP-verplaatsingen zijn voltooid.
Snapshots worden asynchroon door het systeem verwijderd; wanneer een snapshot wordt verwijderd, wordt deze gemarkeerd als "Destroying". Als het systeem in de loop van de tijd "Destroying" snapshots verzamelt, kan dit een indicatie zijn dat bestaande snapshotschema's te agressief zijn; Minder vaak snapshots maken kan beter voorspelbare prestatieniveaus bieden.
Dell Unity beperkt bewerkingen voor het verwijderen van snapshots om de impact op de host-I/O te verminderen. Snapshotverwijderingen zullen sneller plaatsvinden tijdens perioden van laag systeemgebruik." Dell Unity: Handleiding met aanbevolen werkwijzen
Additional Information