Avamar-Data Domain: Elevato utilizzo di DD sulla destinazione: Analisi e best practice

Summary: I Data Domain di origine e di destinazione non devono essere esattamente uguali nell'utilizzo del disco. Questo documento descrive i possibili motivi per cui il Data Domain di destinazione potrebbe mostrare un utilizzo maggiore rispetto al Data Domain di origine. È importante notare che la discrepanza nell'utilizzo può essere il risultato di una combinazione dei motivi riportati di seguito. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Il Data Domain di destinazione mostra un utilizzo maggiore rispetto al Data Domain di origine.

Cause

Dal punto di vista di Avamar:

Replica
In caso di rollback sul Data Domain di origine, il Data Domain di destinazione può contenere giorni aggiuntivi di dati a seconda dell'ora del rollback. Questa discrepanza persisterà fino alla scadenza dei backup aggiuntivi sulla destinazione.

Esempio: DD1 esegue la replica su DD2. Poiché il rollback risale a 2 giorni fa, vediamo che ci sono 3 backup sull'origine, ma cinque backup sono replicati nella destinazione.

Repliche
parzialiNel caso in cui una replica non venga completata correttamente, i dati già replicati vengono archiviati per un minimo di sette giorni e puliti dalla pulizia di Data Domain.  Le repliche parziali contengono dati e impronte che consentono un esecuzione più rapida del successivo nuovo tentativo di replica dei dati.
L'overhead di replica parziale potrebbe essere pari alla quantità di dati replicati se le repliche hanno esito negativo poco prima del completamento.

Differenza nella ritenzione
Nella configurazione di Avamar Server è possibile impostare per mantenere le repliche sul server di destinazione per un periodo più lungo rispetto a un'origine. Ciò causerà differenze nell'utilizzo della capacità.

Differenze
nella configurazione di AvamarUn backup di checkpoint su Avamar Server potrebbe essere di dimensioni significative. Se è configurato solo sull'Avamar di destinazione, aumenterà l'utilizzo di Data Domain sulla destinazione.

Dal punto di vista di Data Domain:

Impronta digitale.

Quando i dati vengono inviati a Data Domain durante la replica, vengono deduplicati. Un'impronta digitale dei dati viene inviata prima al Data Domain di destinazione per verificare se la destinazione contiene i dati.

  • Se Data Domain restituisce la presenza dell'impronta digitale, non è necessario inviare nuovamente i dati

  • Se Data Domain non restituisce che l'impronta digitale non è stata trovata, significa che:

    • l'impronta digitale non c'è

    • Destination Data Domain dispone dell'impronta digitale ma desidera che i dati vengano inviati comunque per migliorare la località specifica su Data Domain.

    • Data Domain è occupato e non desidera completare l'intera ricerca.

Se a Data Domain vengono inviati dati duplicati, verranno deduplicati durante la pulizia rimuovendo copie aggiuntive dei dati.
Il Destination Data Domain avrà un utilizzo maggiore, ma la variazione non dovrebbe essere grande.

Overhead dei metadati.
Ogni file di cui è stato eseguito il backup viene fornito con i relativi metadati informativi e contiene anche le impronte digitali per ciascuno di essi.

Esempio: Per un file da 1 TB, il costo di utilizzo è pari allo 0,3% delle dimensioni del file.

Per un blocco medio di 8 kB di dati, sono presenti 82 B di metadati.  Si tratta di circa lo 0,01% di overhead per la capacità post-compressione.
Questo sovraccarico aumenta ulteriormente con l'integrazione di Avamar, poiché Avamar combina i backup per ottenere un backup completo sintetico da incrementale ogni volta che il backup viene completato.
Si osserva inoltre che l'overhead dei metadati aumenta quando vengono ignorati backup o se i dati vengono replicati in modo non ordinato.
Gli unici backup che non creano questo sovraccarico sono i backup delle VM. Il costo dei metadati viene ridotto al minimo.

Esempio: Quando il backup viene replicato in modo non ordinato, viene creato un backup L0 sulla destinazione, con un overhead dei metadati molto maggiore rispetto a Inc.  Supponiamo di avere 5 giorni di backup.

Replica dal meno recente al più recente:

La prima replica sarà L0, quindi tutte le successive saranno Inc.
1 x L0 + 4 x Inc

Replica dalla più recente alla meno recente:

Tutte le repliche saranno L0 perché il giorno n-1 non è disponibile per l'inclusione di base.
5xL0

La replica ignora un backup:

Supponiamo che il backup del giorno 3 sia stato qualificato.  Il giorno 1 è L0, il giorno 2 è Inc, quindi il giorno 4 sarà di nuovo L0.
L0+Inc+L0+Inc


Monitoraggio
dei fileData Domain deve sapere come creare ogni file dai blocchi deduplicati. Nel caso in cui Data Domain non disponga di queste informazioni, deve ricostruirle e ricreare la catena di impronte digitali. Ciò potrebbe causare un aumento significativo della capacità.
Esistono due scenari che possono causare un aumento significativo della capacità nel Data Domain di destinazione:


1. Il tracciamento dei file viene perso:

Esempio: Se il Data Domain di destinazione è impostato in DNS con più IP e gli IP vengono distribuiti in Round Robin, il Data Domain di origine si connetterà ogni volta a IP diversi. La copia dei dati inviata ieri non viene riconosciuta e vengono inviati altri dati, con conseguente aumento del costo dei metadati.

2. Il tracciamento dei file non è abilitato:
Esempio: Il SFS_BFT_ENABLED deve essere impostato su true per garantire che il tracciamento dei file di base possa sintetizzare i backup sul sistema di destinazione. Ciò consente di ottimizzare le repliche in ingresso per lo storage. Se il SFS_BFT_ENABLED è impostato su false, i dati salvati nel percorso di backup finale su DD sono uguali ai dati in ingresso pre-compressione.

Questo problema può verificarsi quando il SFS_BFT_ENABLED viene lasciato come false dopo il completamento del rollback di Avamar Server.

Ciò potrebbe comportare una discrepanza molto grande.  Lo spazio viene recuperato alla scadenza dei backup.

Deduplica
in lineaData Domain richiederà dati duplicati fino al 6% di una dimensione logica dei dati per ottimizzarne la deduplica in linea.

Differenza tra deduplica e compressione.
I Data Domain eseguono la propria deduplica e compressione dei dati sul proprio storage locale in modo indipendente e, a seconda di come vengono archiviati i dati di destinazione, questo non sarà uguale causando differenze di utilizzo.

Pulizia
di Data DomainSe i Data Domain di origine e di destinazione eseguono la pulizia in giorni diversi o se uno dei Data Domain la esegue più spesso o più a lungo, si verificherà una discrepanza nella capacità utilizzata.

Resolution

Best practice:

Poiché ci saranno discrepanze nell'utilizzo tra i due sistemi Data Domain, origine e destinazione, esistono alcune best practice che possono aiutare a ridurre al minimo la differenza:

  1. Ridurre al minimo la possibilità di rollback occupandosi degli errori hfscheck e degli hardware non appena si verificano.

  2. Assicurarsi che le repliche vengano completate correttamente. Se si verifica un problema continuo con il completamento delle repliche, contattare il supporto Dell Technologies per rivedere la configurazione.

  3. Se è necessario mantenere lo stesso utilizzo dei due Data Domain, mantenere la stessa retention sulle copie di origine e destinazione dei backup e assicurarsi che il backup dei checkpoint sia impostato allo stesso modo su entrambi gli Avamar Server.

  4. Assicurarsi che le repliche siano sempre dalla meno recente alla più recente e che nessun backup venga saltato.

  5. Se Data Domain è configurato con più IP, assicurarsi che gli IP non vengano distribuiti in modalità Round Robin.

  6.  Fare in modo che entrambi i sistemi Data Domain, origine e destinazione, eseguano la pulizia nello stesso giorno e alla stessa ora.

  7. Impostare SFS_BFT_ENABLED su true.  Questa operazione deve essere abilitata dal supporto tecnico (Sollevare una SR e fare riferimento a questo articolo KB# - 182755)

Affected Products

Avamar Server
Article Properties
Article Number: 000182755
Article Type: Solution
Last Modified: 20 Sep 2024
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.