Impact de la conversion en compression GZ sur le système Data Domain et les performances de nettoyage
Summary: Cet article fournit des informations sur les différents algorithmes de compression pris en charge sur la DDR, ainsi que sur l’impact de la conversion du système pour utiliser l’algorithme GZ. ...
Instructions
SOLUTION
DDOS prend actuellement en charge quatre types de compression différents avec différents niveaux de compression de charge du processeur. Le tableau suivant récapitule les caractéristiques de chaque option :
type expected-comp CPU-load ---------- -------------------- -------------- none 1.0x 0x lz(default) 2.0x 1x gzfast 2.5x 2x gz 3.0x 5x
Par exemple, l’algorithme de compression gz offre environ 3 fois la compression locale, mais utilise environ 5 fois plus de CPU pour exécuter la partie compression du code que lz. Les chiffres de compression attendus peuvent varier considérablement en fonction du type de données. Pour certains types de données, gz peut n’être que 10 % plus bon que lz, tandis que pour d’autres types de données, il est 2 fois plus ou plus que lz.
En général, les fichiers contenant de nombreuses chaînes de données similaires ont tendance à mieux se compresser avec gz qu’avec lz.
Voici quelques exemples de ce type de jeux de données :
- Fichiers de base de données.
- Fichiers journaux.
Conséquences de l’utilisation de la compression GZ :
Étant donné que les algorithmes de compression les plus puissants utilisent plus de processeur, ils peuvent avoir des conséquences importantes sur les performances :
- Les sauvegardes avec une déduplication faible fonctionnent plus lentement, car davantage de nouvelles données doivent être compressées et écrites sur le disque. En particulier, la première sauvegarde complète atteindra probablement 50 % du débit optimal nominal.
- Étant donné que le nettoyage décompresse et recompresse les données pendant son exécution, le nettoyage peut prendre plus de temps et ralentir d’autres activités sur le système, telles que les sauvegardes et la réplication.
- Le DDR source dans une paire de réplication de répertoire compresse les données à l’aide de l’algorithme de compression utilisé par la destination avant d’envoyer les données. Par conséquent, si la destination utilise l’algorithme de compression gz, la réplication peut s’exécuter plus lentement et entraîner le ralentissement d’autres activités sur le système, telles que les sauvegardes et le nettoyage.
Par conséquent, la conversion en compression GZ est une décision qui doit être prise en fonction de la charge applicative que le système va rencontrer. Dans le cas contraire, un problème de capacité sera essentiellement converti en problème de performances.
Dans la section suivante, nous décrivons les caractéristiques de la charge applicative pour lesquelles GZ serait utile.
À qui s’adresse la compression GZ ?
Les applications exigeantes en matière de déduplication élevée, de faible attrition et de performances de sauvegarde sont idéales pour gz. Les applications nearline en sont un bon exemple. La plupart des DDR utilisés sur le terrain pour les applications nearline utilisent déjà gz.
Comment modifier le type de compression ?
Utilisez les commandes suivantes pour modifier le type de compression :
# filesys disable
# filesys option set local-compression-type {none | lz | gzfast | gz}
# filesys enable
Une fois le type de compression modifié, toutes les nouvelles écritures utilisent le nouveau type de compression et toutes les données déjà écrites seront converties paresseusement vers le nouveau type de compression lors du nettoyage. La conversion paresseuse signifie que tous les conteneurs ne seront pas recompressés lors de la première série de nettoyage. Il faut plusieurs cycles de nettoyage pour recompresser entièrement toutes les données existantes sur les DDR avant le changement de politique de compression.
La politique de nettoyage détermine quels conteneurs sont sélectionnés pour un cycle de nettoyage particulier et seuls ces conteneurs sont recompressés. La stratégie de nettoyage est basée sur la quantité de données inutiles contenues dans un conteneur donné. Les données de nettoyage font référence aux données supprimées qui ne sont plus référencées par l’espace de nommage. Plus un conteneur contient de déchets, plus il a de chances d’être sélectionné pour le nettoyage.
Si le client souhaite payer un paiement unique, il peut suivre la procédure suivante :
-
Désactivez DDFS à l’aide de la commande :
filesys disable
-
Utilisez la commande suivante pour désactiver la conversion différée (nécessite le mode SE) :
reg set system.GC_APPLY_LAZY_CONVERSION=false
-
Activez le DDFS à l’aide de la commande :
filesys enable
Par conséquent, le premier nettoyage après avoir modifié le type de compression et désactivé la conversion différée peut prendre plus de temps. Chaque fois que vous modifiez le type de compression, vous devez surveiller attentivement le système pendant une semaine ou deux pour vous assurer qu’il se comporte bien.
Additional Information
DOCUMENTATION
Impact de la conversion en 180977 de compression LZ sur les performances du système et du nettoyage