Auswirkungen der Konvertierung in die GZ-Komprimierung auf die Performance von Data Domain-Systemen und deren Bereinigung
Summary: Dieser Artikel enthält Informationen über verschiedene Komprimierungsalgorithmen, die auf dem DDR unterstützt werden, sowie über die Auswirkungen der Konvertierung des Systems zur Verwendung des GZ-Algorithmus. ...
Instructions
LÖSUNG
DDOS unterstützt derzeit vier verschiedene Komprimierungstypen mit unterschiedlicher CPU-Komprimierungslast. In der folgenden Tabelle sind die Merkmale der einzelnen Optionen zusammengefasst:
type expected-comp CPU-load ---------- -------------------- -------------- none 1.0x 0x lz(default) 2.0x 1x gzfast 2.5x 2x gz 3.0x 5x
Der gz-Komprimierungsalgorithmus bietet beispielsweise etwa eine 3-fache lokale Komprimierung, verwendet jedoch etwa 5-mal mehr CPU für die Ausführung des Komprimierungsteils des Codes als lz. Die erwarteten Komprimierungszahlen können je nach Datentyp stark variieren. Bei einigen Datentypen ist gz möglicherweise nur 10 % besser als lz, während sie bei anderen Datentypen 2x oder besser als lz ist.
Im Allgemeinen werden Dateien mit vielen ähnlichen Datenzeichenfolgen tendenziell besser mit gz als mit lz komprimiert.
Beispiele für solche Datensätze sind:
- Datenbankdateien.
- Protokolldateien.
Folgen der Verwendung der GZ-Komprimierung:
Da die stärkeren Komprimierungsalgorithmen mehr CPU verwenden, können sie erhebliche Auswirkungen auf die Leistung haben:
- Backups mit geringer Deduplizierung laufen langsamer, da mehr neue Daten komprimiert und auf die Festplatte geschrieben werden müssen. Insbesondere wird das erste vollständige Backup wahrscheinlich 50 % des Nennspitzendurchsatzes erreichen.
- Da bei der Bereinigung die Daten während der Ausführung dekomprimiert und erneut komprimiert werden, kann die Bereinigung länger dauern und andere Aktivitäten auf dem System wie Backups und Replikationen verlangsamen.
- Der Quell-DDR in einem Verzeichnisreplikationspaar komprimiert die Daten mithilfe des Komprimierungsalgorithmus, der vom Ziel verwendet wird, bevor die Daten gesendet werden. Wenn das Ziel daher den Komprimierungsalgorithmus "gz" verwendet, kann die Replikation langsamer ausgeführt werden und dazu führen, dass andere Aktivitäten auf dem System wie Backups und Bereinigungen langsamer ausgeführt werden.
Daher ist die Konvertierung zur GZ-Komprimierung eine Entscheidung, die basierend auf der Workload getroffen werden sollte, die das System durchlaufen wird. Andernfalls wird ein Kapazitätsproblem im Wesentlichen in ein Performanceproblem umgewandelt.
Im folgenden Abschnitt beschreiben wir die Merkmale der Workload, bei denen GZ hilfreich wäre.
Für wen eignet sich die GZ-Komprimierung?
Anwendungen mit hoher Deduplizierung, geringer Abwanderung und geringen Anforderungen an die Backupperformance sind ideale Kandidaten für die Verwendung von gz. Ein gutes Beispiel sind Nearline-Anwendungen. Die meisten DDRs im Feld, die für Nearline-Anwendungen verwendet werden, verwenden bereits gz.
Wie ändere ich den Komprimierungstyp?
Verwenden Sie die folgenden Befehle, um den Komprimierungstyp zu ändern:
# filesys disable
# filesys option set local-compression-type {none | lz | gzfast | gz}
# filesys enable
Sobald der Komprimierungstyp geändert wurde, verwenden alle neuen Schreibvorgänge den neuen Komprimierungstyp und alle bereits geschriebenen Daten werden während der Bereinigung verzögert in den neuen Komprimierungstyp konvertiert. Die träge Umwandlung bedeutet, dass nicht alle Behälter während der ersten Reinigungsrunde wieder verdichtet werden. Es dauert mehrere Bereinigungsrunden, um alle auf den DDRs vorhandenen Daten vor der Änderung der Komprimierungs-Policy vollständig neu zu komprimieren.
Die Reinigungsrichtlinie legt fest, welche Container in einer bestimmten Reinigungsrunde ausgewählt werden, und nur diese Container werden erneut komprimiert. Die Bereinigungs-Policy basiert auf der Menge an veralteten Daten, die ein bestimmter Container enthält. Garbage Data sind gelöschte Daten, die nicht mehr vom Namespace referenziert werden. Je mehr Müll sich in einem Container befindet, desto wahrscheinlicher ist es, dass er zur Reinigung ausgewählt wird.
Wenn der Kunde einen einmaligen Treffer bezahlen möchte, kann er wie folgt vorgehen:
-
Deaktivieren Sie DDFS mithilfe des Befehls:
filesys disable
-
Verwenden Sie den folgenden Befehl, um die verzögerte Konvertierung zu deaktivieren ( erfordert SE-Modus):
reg set system.GC_APPLY_LAZY_CONVERSION=false
-
Aktivieren Sie DDFS mithilfe des Befehls:
filesys enable
Daher kann die erste Bereinigung nach dem Ändern des Komprimierungstyps und dem Deaktivieren der verzögerten Konvertierung länger dauern. Wenn Sie den Komprimierungstyp ändern, sollten Sie das System ein oder zwei Wochen lang sorgfältig überwachen, um sicherzustellen, dass es sich gut verhält.
Additional Information
Referenz
Auswirkungen der Konvertierung in LZ-Komprimierungs-180977 auf die System- und Bereinigungsleistung