Avamar-Data Domain: Hoog DD-gebruik op doel: Analyse en best practices

Summary: Er wordt niet verwacht dat de domeinen Bron- en Doeldata exact gelijk zijn in schijfgebruik. In dit document worden de mogelijke redenen beschreven waarom het doeldatadomein een hoger gebruik vertoont dan het brondatadomein. Het is belangrijk op te merken dat het verschil in gebruik het gevolg kan zijn van een combinatie van de onderstaande redenen. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Target Data Domain vertoont een hoger gebruik dan Source Data Domain.

Cause

Vanuit het perspectief van Avamar:

Terugdraaien
In het geval van een rollback op het brondatadomein kan het doeldatadomein extra dagen aan data bevatten, afhankelijk van de rollbacktijd. Dit verschil blijft bestaan totdat de extra back-ups op het doel verlopen.

Voorbeeld: DD1 repliceert naar DD2. Aangezien de rollback 2 dagen terug is, zien we dat er 3 back-ups op de bron staan, maar dat er vijf back-ups naar de bestemming zijn gerepliceerd.

Gedeeltelijke replicaties
Als een replicatie niet wordt voltooid, worden de data die al zijn gerepliceerd minimaal zeven dagen opgeslagen en opgeschoond door de Data Domain-opschoning.  Gedeeltelijke replicaties bevatten data en vingerafdrukken waarmee de daaropvolgende nieuwe poging van de replicatie van data sneller kan worden uitgevoerd.
De overhead voor gedeeltelijke replicatie kan net zo hoog zijn als de hoeveelheid gerepliceerde data als replicaties mislukken vlak voordat ze zijn voltooid.

Verschil in retentie
In de Avamar serverconfiguratie is het mogelijk om in te stellen dat de replica's langer dan een bron op de doelserver worden bewaard. Dit zal leiden tot verschillen in capaciteitsbenutting.

Verschillen in
Avamar-configuratieEen back-up van een controlestation op de Avamar-server kan aanzienlijk groot zijn. Als het alleen is geconfigureerd op de doel-Avamar, wordt het gebruik van Data Domain op de bestemming verhoogd.

Vanuit Data Domain-perspectief:

Vingerafdruk.

Wanneer data tijdens de replicatie naar Data Domain worden verzonden, worden ze gededupliceerd. Er wordt eerst een vingerafdruk van de gegevens naar het Data Domain van de bestemming gestuurd om te controleren of de bestemming over de gegevens beschikt.

  • Als het Data Domain aangeeft dat de vingerafdruk aanwezig is, hoeven de gegevens niet opnieuw te worden verzonden

  • Als het Data Domain niet retourneert dat de vingerafdruk niet is gevonden, betekent dit dat:

    • De vingerafdruk is er niet

    • Destination Data Domain heeft vingerafdruk, maar wil dat de gegevens toch worden verzonden om de speciale locatie op Data Domain te verbeteren.

    • Data Domain is druk en wil niet de hele zoekopdracht voltooien.

Als er dubbele data naar Data Domain worden verzonden, worden de data tijdens het opschonen gededupliceerd door extra kopieën van de data te verwijderen.
Het doeldatadomein zal een hoger gebruik hebben, maar de variatie mag niet groot zijn.

Overhead voor metadata.
Elk back-upbestand wordt geleverd met de metadata van de bestandsinformatie en bevat ook een vingerafdruk voor elk bestand.

Voorbeeld: Voor een bestand van 1 TB zijn de gebruikskosten 0,3% van de bestandsgrootte.

Voor een gemiddeld stuk data van 8 kB is er 82 B aan metadata.  Dit is ongeveer 0,01% overhead voor post-comp-capaciteit.
Deze overhead neemt bovendien toe met Avamar-integratie, omdat Avamar de back-ups combineert om een synthetische volledige back-up te verkrijgen van incrementeel elke keer dat de back-up is voltooid.
We zien ook dat de overhead voor metadata toeneemt wanneer er back-ups worden overgeslagen of wanneer de data in verkeerde volgorde worden gerepliceerd.
De enige back-ups die deze overhead niet veroorzaken, zijn VM-back-ups. De metadatakosten worden geminimaliseerd.

Voorbeeld: Wanneer de back-up in verkeerde volgorde wordt gerepliceerd, wordt een L0-back-up op het doel gemaakt, wat een veel grotere metadata-overhead heeft dan Inc.  Laten we zeggen dat we 5 dagen aan back-ups hebben.

Replicatie van oud naar nieuw:

De eerste replicatie is L0, daarna zijn alle volgende replicaties Inc.
1xL0 + 4xInc

Replicatie van nieuw naar oud:

Alle replicaties zijn L0 omdat n-1 dag niet beschikbaar is voor basis Inc.
5xL0

Replicatie slaat een back-up over:

Laten we zeggen dat de back-up op dag 3 vakkundig was.  Dag 1 is L0, dag 2 is meer, daarna is dag 4 weer L0.
L0+Inc+L0+Inc


Bestanden volgen
Data Domain moet weten hoe elk bestand moet worden opgebouwd uit de gededupliceerde blokken. Als Data Domain niet over deze informatie beschikt, moet het deze opnieuw opbouwen en de vingerafdrukketen opnieuw maken. Dit kan leiden tot een aanzienlijke toename van de capaciteit.
Er zijn twee scenario's die een aanzienlijke capaciteitstoename op het doeldatadomein kunnen veroorzaken:


1. Bestandstracering gaat verloren:

Voorbeeld: Als het doeldatadomein is ingesteld in DNS met meerdere IP-adressen en de IP's in round robin worden verdeeld, maakt het brondatadomein elke keer verbinding met verschillende IP's. De kopie van gegevens die gisteren zijn verzonden, zou niet worden herkend en er worden meer gegevens verzonden, wat ook de metadatakosten verhoogt.

2. Bestandstracering is niet ingeschakeld:
Voorbeeld: De SFS_BFT_ENABLED moet worden ingesteld op true om ervoor te zorgen dat de Base File Tracking back-ups op het doelsysteem kan synthetiseren. Hierdoor kunnen inkomende replicaties worden geoptimaliseerd voor storage. Als de SFS_BFT_ENABLED is ingesteld op false, zijn de data die worden opgeslagen op de uiteindelijke back-uplocatie op DD gelijk aan de inkomende data van vóór comp.

Dit probleem kan zich voordoen wanneer de SFS_BFT_ENABLED als 'false' wordt achtergelaten nadat het terugdraaien van de Avamar-server is voltooid.

Dit kan resulteren in een zeer grote discrepantie.  De ruimte wordt vrijgemaakt zodra de back-ups verlopen zijn.

In-line deduplicatie
Data Domain vraagt om dubbele data tot 6% van een logische grootte van de data om de in-line deduplicatie te optimaliseren.

Verschil in de deduplicatie en compressie.
Data Domains voeren hun eigen deduplicatie en compressie van data op hun lokale storage onafhankelijk uit en afhankelijk van hoe de doeldata worden opgeslagen, zal dit niet gelijk zijn, waardoor er verschil in gebruik ontstaat.

Data Domain opschonen
Als de bron- en doeldatadomeinen op verschillende dagen worden opgeschoond, of als een van de datadomeinen deze vaker of langer uitvoert, is er een discrepantie in de gebruikte capaciteit.

Resolution

Aanbevolen werkwijzen:

Aangezien er verschillen zijn in gebruik tussen de twee Data Domain systemen, bron en bestemming, zijn er enkele best practices die kunnen helpen het verschil te minimaliseren:

  1. Minimaliseer de kans op rollback door hfscheck-fouten en hardwarestoringen op te lossen zodra ze zich voordoen.

  2. Zorg ervoor dat de replicaties worden voltooid. Als er een lopend probleem is met het voltooien van replicaties, neem dan contact op met Dell Technologies support om de configuratie te controleren.

  3. Als u de twee datadomeinen op hetzelfde gebruik wilt houden, moet u dezelfde retentie behouden voor bron- en doelkopieën van de back-ups en ervoor zorgen dat de checkpoint-back-up op beide Avamar-servers hetzelfde is ingesteld.

  4. Zorg ervoor dat replicaties altijd van oud naar nieuw zijn en dat er geen back-ups worden overgeslagen.

  5. Als Data Domain is geconfigureerd met meerdere IP-adressen, moet u ervoor zorgen dat de IP-adressen niet op een round-robin-manier worden verdeeld.

  6.  Zorg dat beide Data Domain-systemen, bron en bestemming, op dezelfde dag en tijd worden opgeschoond.

  7. Hebben SFS_BFT_ENABLED ingesteld op true.  Dit moet worden ingeschakeld door de technische ondersteuning (Maak een SR aan en verwijs naar deze KB# - 182755)

Affected Products

Avamar Server
Article Properties
Article Number: 000182755
Article Type: Solution
Last Modified: 20 Sept 2024
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.