Avamar-Data Domain: Elevato utilizzo di DD sulla destinazione: Analisi e best practice
Summary: I Data Domain di origine e di destinazione non devono essere esattamente uguali nell'utilizzo del disco. Questo documento descrive i possibili motivi per cui il Data Domain di destinazione potrebbe mostrare un utilizzo maggiore rispetto al Data Domain di origine. È importante notare che la discrepanza nell'utilizzo può essere il risultato di una combinazione dei motivi riportati di seguito. ...
Symptoms
Il Data Domain di destinazione mostra un utilizzo maggiore rispetto al Data Domain di origine.
Cause
Dal punto di vista di Avamar:
Replica
In caso di rollback sul Data Domain di origine, il Data Domain di destinazione può contenere giorni aggiuntivi di dati a seconda dell'ora del rollback. Questa discrepanza persisterà fino alla scadenza dei backup aggiuntivi sulla destinazione.
Esempio: DD1 esegue la replica su DD2. Poiché il rollback risale a 2 giorni fa, vediamo che ci sono 3 backup sull'origine, ma cinque backup sono replicati nella destinazione.
Repliche
parzialiNel caso in cui una replica non venga completata correttamente, i dati già replicati vengono archiviati per un minimo di sette giorni e puliti dalla pulizia di Data Domain. Le repliche parziali contengono dati e impronte che consentono un esecuzione più rapida del successivo nuovo tentativo di replica dei dati.
L'overhead di replica parziale potrebbe essere pari alla quantità di dati replicati se le repliche hanno esito negativo poco prima del completamento.
Differenza nella ritenzione
Nella configurazione di Avamar Server è possibile impostare per mantenere le repliche sul server di destinazione per un periodo più lungo rispetto a un'origine. Ciò causerà differenze nell'utilizzo della capacità.
Differenze
nella configurazione di AvamarUn backup di checkpoint su Avamar Server potrebbe essere di dimensioni significative. Se è configurato solo sull'Avamar di destinazione, aumenterà l'utilizzo di Data Domain sulla destinazione.
Dal punto di vista di Data Domain:
Impronta digitale.
Quando i dati vengono inviati a Data Domain durante la replica, vengono deduplicati. Un'impronta digitale dei dati viene inviata prima al Data Domain di destinazione per verificare se la destinazione contiene i dati.
-
Se Data Domain restituisce la presenza dell'impronta digitale, non è necessario inviare nuovamente i dati
-
Se Data Domain non restituisce che l'impronta digitale non è stata trovata, significa che:
-
l'impronta digitale non c'è
-
Destination Data Domain dispone dell'impronta digitale ma desidera che i dati vengano inviati comunque per migliorare la località specifica su Data Domain.
-
Data Domain è occupato e non desidera completare l'intera ricerca.
-
Se a Data Domain vengono inviati dati duplicati, verranno deduplicati durante la pulizia rimuovendo copie aggiuntive dei dati.
Il Destination Data Domain avrà un utilizzo maggiore, ma la variazione non dovrebbe essere grande.
Overhead dei metadati.
Ogni file di cui è stato eseguito il backup viene fornito con i relativi metadati informativi e contiene anche le impronte digitali per ciascuno di essi.
Esempio: Per un file da 1 TB, il costo di utilizzo è pari allo 0,3% delle dimensioni del file.
Per un blocco medio di 8 kB di dati, sono presenti 82 B di metadati. Si tratta di circa lo 0,01% di overhead per la capacità post-compressione.
Questo sovraccarico aumenta ulteriormente con l'integrazione di Avamar, poiché Avamar combina i backup per ottenere un backup completo sintetico da incrementale ogni volta che il backup viene completato.
Si osserva inoltre che l'overhead dei metadati aumenta quando vengono ignorati backup o se i dati vengono replicati in modo non ordinato.
Gli unici backup che non creano questo sovraccarico sono i backup delle VM. Il costo dei metadati viene ridotto al minimo.
Esempio: Quando il backup viene replicato in modo non ordinato, viene creato un backup L0 sulla destinazione, con un overhead dei metadati molto maggiore rispetto a Inc. Supponiamo di avere 5 giorni di backup.
Replica dal meno recente al più recente:
La prima replica sarà L0, quindi tutte le successive saranno Inc.
1 x L0 + 4 x Inc
Replica dalla più recente alla meno recente:
La replica ignora un backup:
Monitoraggio
dei fileData Domain deve sapere come creare ogni file dai blocchi deduplicati. Nel caso in cui Data Domain non disponga di queste informazioni, deve ricostruirle e ricreare la catena di impronte digitali. Ciò potrebbe causare un aumento significativo della capacità.
Esistono due scenari che possono causare un aumento significativo della capacità nel Data Domain di destinazione:
1. Il tracciamento dei file viene perso:
Esempio: Se il Data Domain di destinazione è impostato in DNS con più IP e gli IP vengono distribuiti in Round Robin, il Data Domain di origine si connetterà ogni volta a IP diversi. La copia dei dati inviata ieri non viene riconosciuta e vengono inviati altri dati, con conseguente aumento del costo dei metadati.
Questo problema può verificarsi quando il SFS_BFT_ENABLED viene lasciato come false dopo il completamento del rollback di Avamar Server.
Ciò potrebbe comportare una discrepanza molto grande. Lo spazio viene recuperato alla scadenza dei backup.
Deduplica
in lineaData Domain richiederà dati duplicati fino al 6% di una dimensione logica dei dati per ottimizzarne la deduplica in linea.
Differenza tra deduplica e compressione.
I Data Domain eseguono la propria deduplica e compressione dei dati sul proprio storage locale in modo indipendente e, a seconda di come vengono archiviati i dati di destinazione, questo non sarà uguale causando differenze di utilizzo.
Pulizia
di Data DomainSe i Data Domain di origine e di destinazione eseguono la pulizia in giorni diversi o se uno dei Data Domain la esegue più spesso o più a lungo, si verificherà una discrepanza nella capacità utilizzata.
Resolution
Best practice:
Poiché ci saranno discrepanze nell'utilizzo tra i due sistemi Data Domain, origine e destinazione, esistono alcune best practice che possono aiutare a ridurre al minimo la differenza:
-
Ridurre al minimo la possibilità di rollback occupandosi degli errori hfscheck e degli hardware non appena si verificano.
-
Assicurarsi che le repliche vengano completate correttamente. Se si verifica un problema continuo con il completamento delle repliche, contattare il supporto Dell Technologies per rivedere la configurazione.
-
Se è necessario mantenere lo stesso utilizzo dei due Data Domain, mantenere la stessa retention sulle copie di origine e destinazione dei backup e assicurarsi che il backup dei checkpoint sia impostato allo stesso modo su entrambi gli Avamar Server.
-
Assicurarsi che le repliche siano sempre dalla meno recente alla più recente e che nessun backup venga saltato.
-
Se Data Domain è configurato con più IP, assicurarsi che gli IP non vengano distribuiti in modalità Round Robin.
-
Fare in modo che entrambi i sistemi Data Domain, origine e destinazione, eseguano la pulizia nello stesso giorno e alla stessa ora.
-
Impostare SFS_BFT_ENABLED su true. Questa operazione deve essere abilitata dal supporto tecnico (Sollevare una SR e fare riferimento a questo articolo KB# - 182755)