Data Domain systeem- en opschoningsprestatie-impact van converteren naar GZ-compressie
Summary: Dit artikel bevat informatie over verschillende compressiealgoritmen die worden ondersteund op de DDR, samen met de impact van het converteren van het systeem om het GZ-algoritme te gebruiken. ...
Instructions
OPLOSSING
DDOS ondersteunt momenteel vier verschillende compressietypen met verschillende niveaus van compressie CPU-belasting. De volgende tabel geeft een overzicht van de kenmerken van elke optie:
type expected-comp CPU-load ---------- -------------------- -------------- none 1.0x 0x lz(default) 2.0x 1x gzfast 2.5x 2x gz 3.0x 5x
Het gz-compressiealgoritme geeft bijvoorbeeld ongeveer 3x lokale compressie, maar gebruikt ongeveer 5x meer CPU om het compressiegedeelte van de code uit te voeren dan lz. De verwachte compressiewaarden kunnen sterk variëren, afhankelijk van het gegevenstype. Voor sommige gegevenstypen is gz mogelijk slechts 10% beter dan lz, terwijl het voor andere gegevenstypen 2x of beter is dan lz.
Over het algemeen hebben bestanden met veel vergelijkbare gegevensreeksen de neiging om beter te comprimeren met gz dan met lz.
Voorbeelden van dergelijke datasets zijn:
- Databasebestanden.
- Logboekbestanden.
Gevolgen van het gebruik van GZ-compressie:
Aangezien de sterkere compressiealgoritmen meer CPU gebruiken, kunnen ze aanzienlijke gevolgen hebben voor de prestaties:
- Back-ups met een lage deduplicatie worden trager omdat er meer nieuwe data moeten worden gecomprimeerd en naar schijf moeten worden geschreven. Met name de eerste volledige back-up zal waarschijnlijk 50% van de nominale piekdoorvoer bereiken.
- Aangezien het opschonen de data decomprimeert en opnieuw comprimeert terwijl het actief is, kan het langer duren om het opschonen uit te voeren en kunnen andere activiteiten op het systeem, zoals back-ups en replicatie, worden vertraagd.
- De bron-DDR in een directoryreplicatiepaar comprimeert de data met behulp van het compressiealgoritme dat door de bestemming wordt gebruikt voordat de data worden verzonden. Als de bestemming het gz-compressiealgoritme gebruikt, kan de replicatie langzamer worden uitgevoerd en kunnen andere activiteiten op het systeem, zoals back-ups en opschonen, langzamer verlopen.
Daarom is het converteren naar GZ-compressie een beslissing die moet worden genomen op basis van de werklast die het systeem zal ervaren. Anders wordt een capaciteitsprobleem in feite omgezet in een prestatieprobleem.
In de volgende sectie beschrijven we de kenmerken van de workload waarbij GZ nuttig zou kunnen zijn.
Wie moet GZ-compressie gebruiken?
Applicaties met hoge vereisten voor deduplicatie, lage churn en lage back-upprestaties zijn ideale kandidaten om gz te gebruiken. Een goed voorbeeld zijn nearline applicaties. De meeste DDR's in het veld die worden gebruikt voor nearline-toepassingen maken al gebruik van gz.
Hoe wijzig ik het compressietype?
Gebruik de volgende opdrachten om het compressietype te wijzigen:
# filesys disable
# filesys option set local-compression-type {none | lz | gzfast | gz}
# filesys enable
Zodra het compressietype is gewijzigd, gebruiken alle nieuwe schrijfbewerkingen het nieuwe compressietype en worden alle reeds geschreven gegevens lui geconverteerd naar het nieuwe compressietype tijdens het opschonen. De luie ombouw betekent dat niet alle containers tijdens de eerste reinigingsronde opnieuw worden gecomprimeerd. Er zijn verschillende opschoonrondes nodig om alle data op de DDR's volledig opnieuw te comprimeren voordat het compressiebeleid wordt gewijzigd.
Het reinigingsbeleid bepaalt welke containers worden geselecteerd in een bepaalde reinigingsronde en alleen die containers worden opnieuw gecomprimeerd. Het opschoonbeleid is gebaseerd op de hoeveelheid afvalgegevens die een bepaalde container bevat. Garbage data betekent verwijderde data waarnaar niet langer wordt verwezen door de namespace. Hoe meer afval een container heeft, hoe groter de kans dat deze wordt geselecteerd voor reiniging.
Als de klant een eenmalige treffer wil betalen, kan hij de volgende procedure volgen:
-
Schakel DDFS uit met de opdracht:
filesys disable
-
Gebruik de volgende opdracht om de luie conversie uit te schakelen (vereist SE-modus):
reg set system.GC_APPLY_LAZY_CONVERSION=false
-
Schakel DDFS in met de opdracht:
filesys enable
Als gevolg hiervan kan de eerste opschoning na het wijzigen van het compressietype en het uitschakelen van de luie conversie langer duren. Wanneer u het compressietype wijzigt, moet u het systeem een week of twee zorgvuldig in de gaten houden om er zeker van te zijn dat het zich goed gedraagt.