Data Domain-Avamar : Taux d’utilisation élevé de DD sur la cible : Analyse et pratiques d’excellence

Summary: Les Data Domains source et cible ne sont pas censés être exactement égaux dans l’utilisation du disque. Ce document décrit les raisons possibles pour lesquelles le Data Domain cible peut afficher une utilisation plus élevée que le Data Domain source. Il est important de noter que la différence d’utilisation peut être le résultat d’une combinaison des raisons ci-dessous. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Le Data Domain cible affiche une utilisation plus élevée que le Data Domain source.

Cause

Du point de vue d’Avamar :

Restauration
En cas de restauration sur le Data Domain source, le Data Domain de destination peut contenir des jours supplémentaires de données en fonction du temps de restauration. Cette incohérence existera jusqu’à l’expiration des sauvegardes supplémentaires sur la destination.

Exemple : DD1 est répliqué vers DD2. Comme la restauration date d’il y a 2 jours, nous constatons qu’il y a 3 sauvegardes sur la source, mais cinq sauvegardes répliquées vers la destination.

Réplications partielles
Si une réplication ne se termine pas correctement, les données qui ont déjà été répliquées sont stockées pendant un minimum de sept jours et nettoyées par le nettoyage de Data Domain.  Les réplications partielles contiennent des données et des empreintes digitales qui permettent à la nouvelle tentative de réplication des données de s’exécuter plus rapidement.
La surcharge de réplication partielle peut être aussi élevée que la quantité de données répliquées si les réplications échouent juste avant qu’elles ne se terminent.

Différence dans la rétention
Dans la configuration du serveur Avamar, il est possible de définir de conserver les répliques sur le serveur de destination plus longtemps qu’une source. Cela entraîne des différences dans l’utilisation de la capacité.

Différences de configuration d’Avamar
Une sauvegarde de point de contrôle sur le serveur Avamar peut être particulièrement volumineuse. Si elle n’est configurée que sur la destination Avamar, elle augmente l’utilisation de Data Domain sur la destination.

Du point de vue de Data Domain :

Empreinte digitale.

Lorsque des données sont envoyées à Data Domain pendant la réplication, elles sont dédupliquées. Une empreinte des données est d’abord envoyée au Data Domain de destination pour vérifier si la destination contient les données.

  • Si le Data Domain renvoie que l’empreinte digitale est présente, il n’est pas nécessaire de renvoyer les données

  • Si le Data Domain ne renvoie pas que l’empreinte digitale est introuvable, cela signifie que :

    • l’empreinte digitale est absente

    • le Data Domain de destination possède une empreinte digitale, mais souhaite que les données soient tout de même envoyées pour améliorer la localité spéciale sur Data Domain.

    • Data Domain est occupé et ne souhaite pas effectuer toute la recherche.

Si des données en double sont envoyées à Data Domain, les données seront dédupliquées lors du nettoyage en supprimant des copies supplémentaires des données.
Le Data Domain de destination sera davantage utilisé, mais la variation ne doit pas être importante.

Surcharge de métadonnées.
Chaque fichier sauvegardé est fourni avec ses métadonnées d’informations de fichier et il contient également des empreintes digitales pour chaque fichier.

Exemple : Pour un fichier de 1 To, le coût d’utilisation est de 0,3 % de la taille du fichier.

Pour un fragment de données moyen de 8 Ko, il y a 82 milliards de métadonnées.  Cela représente environ 0,01 % de surcharge pour la capacité post-comp.
Cette surcharge augmente également avec l’intégration d’Avamar, car Avamar combine les sauvegardes pour obtenir une sauvegarde complète synthétique à partir d’une sauvegarde incrémentielle à chaque fois que la sauvegarde est terminée.
Nous observons également que la surcharge des métadonnées augmente lorsque des sauvegardes sont ignorées ou que les données sont répliquées dans le désordre.
Les seules sauvegardes qui ne créent pas cette surcharge sont les sauvegardes de machines virtuelles. Le coût des métadonnées est réduit.

Exemple : Lorsque la sauvegarde est répliquée dans le désordre, elle crée une sauvegarde L0 sur la cible qui présente une surcharge de métadonnées beaucoup plus importante que Inc. Imaginons que nous ayons 5 jours de sauvegardes.

Réplication de la plus ancienne à la plus récente :

La première réplication sera L0, puis toutes les versions ultérieures seront Inc.
1xL0 + 4xInc

Réplication de la plus récente à la plus ancienne :

Toutes les réplications seront L0, car jour n-1 n’est pas disponible pour baser Inc dessus.
5xL0

La réplication ignore une sauvegarde :

Imaginons que la sauvegarde du jour 3 ait été qualifiée.  Le jour 1 est L0, le jour 2 correspond à Inc, puis le jour4 est à nouveau L0.
L0+Inc+L0+Inc


Suivi des fichiers
Data Domain doit savoir comment créer chaque fichier à partir des fragments dédupliqués. Si Data Domain ne dispose pas de ces informations, il doit les reconstruire et recréer la chaîne d’empreintes digitales. Cela peut entraîner une augmentation significative de la capacité.
Il existe deux scénarios qui peuvent entraîner une augmentation significative de la capacité sur le Data Domain de destination :


1. Le suivi des fichiers est perdu :

Exemple : Si le Data Domain de destination est défini dans DNS avec plusieurs adresses IP et que les adresses IP sont distribuées en permutation circulaire, le Data Domain source se connecte à différentes adresses IP à chaque fois. La copie des données envoyées hier n’est pas reconnue et davantage de données sont envoyées, ce qui augmente également le coût des métadonnées.

2. Le suivi des fichiers n’est pas activé :
Exemple : Le SFS_BFT_ENABLED doit être défini sur true pour que Base File Tracking puisse synthétiser les sauvegardes sur le système de destination. Cela permet d’optimiser les réplications entrantes pour le stockage. Si le SFS_BFT_ENABLED est défini sur false, les données sont enregistrées à l’emplacement de sauvegarde final sur DD en tant que données entrantes pre-comp.

Ce problème peut se produire lorsque le SFS_BFT_ENABLED est laissé sur false une fois la restauration d’Avamar Server terminée.

Cela peut entraîner un écart très important.  L’espace est récupéré une fois les sauvegardes expirées.

Déduplication à la volée
Data Domain demande des données dupliquées jusqu’à 6 % de la taille logique des données afin d’optimiser leur déduplication à la volée.

Différence dans la déduplication et la compression.
Les Data Domains effectuent leurs propres déduplications et compressions des données sur leur stockage local de manière indépendante. Selon la façon dont les données de destination sont stockées, elles pourraient ne pas être égales, ce qui entraînera une différence d’utilisation.

Nettoyage de Data Domain
Si les Data Domains source et cible exécutent le nettoyage sur différents jours, ou si l’un des Data Domains l’exécute plus souvent ou plus longtemps, il y aura une différence dans la capacité utilisée.

Resolution

Meilleure pratiques :

Étant donné qu’il y aura des différences d’utilisation entre les deux systèmes Data Domain (source et destination), certaines pratiques d’excellence peuvent vous aider à réduire la différence :

  1. Réduisez la possibilité d’une restauration en prenant en charge les échecs hfscheck et les défaillances matérielles dès qu’ils se produisent.

  2. Assurez-vous que les réplications se terminent correctement. En cas de problème continu lié à l’exécution des réplications, veuillez contacter le support Dell Technologies pour vérifier la configuration.

  3. Si vous avez besoin de conserver les deux Data Domains à une utilisation similaire, maintenez la même conservation des copies source et cible des sauvegardes et assurez-vous que la sauvegarde des points de contrôle est définie de la même manière sur les deux serveurs Avamar.

  4. Assurez-vous que les réplications sont toujours effectuées de la plus ancienne à la plus récente et qu’aucune sauvegarde n’est ignorée.

  5. Si Data Domain est configuré avec plusieurs adresses IP, assurez-vous qu’elles ne sont pas distribuées en permutation circulaire.

  6.  Demandez aux systèmes Data Domain, source et cible, d’exécuter le nettoyage le même jour, au même moment.

  7. Définissez SFS_BFT_ENABLED sur true.  Cela doit être activé par le support technique (créer une demande de service et référencer cet article de la base de connaissances # - 182755)

Affected Products

Avamar Server
Article Properties
Article Number: 000182755
Article Type: Solution
Last Modified: 20 Sept 2024
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.