Avamar-Data Domain: Hohe DD-Auslastung auf Ziel: Analyse und Best Practices

Summary: Es wird nicht erwartet, dass die Quell- und Ziel-Data Domains die exakt gleiche Festplattenauslastung aufweisen. In diesem Dokument werden die möglichen Gründe beschrieben, warum die Ziel-Data Domain möglicherweise eine höhere Auslastung als die Quell-Data Domain aufweist. Es ist wichtig zu beachten, dass die Diskrepanz bei der Auslastung auf eine Kombination der unten aufgeführten Gründe zurückzuführen sein kann. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Ziel-Data Domain hat eine höhere Auslastung als Quell-Data Domain.

Cause

Aus Avamar-Perspektive:

Rollback
Im Falle eines Rollback auf der Quell-Data Domain kann die Ziel-Data Domain je nach Rollback-Zeit zusätzliche Tage an Daten enthalten. Diese Diskrepanz bleibt bestehen, bis die zusätzlichen Backups auf dem Ziel ablaufen.

Beispiel: DD1 repliziert auf DD2. Da das Rollback 2 Tage zurückliegt, ist zu sehen, dass es 3 Backups auf der Quelle gibt, aber fünf Backups auf das Ziel repliziert wurden.

Teilreplikationen
Falls eine Replikation nicht erfolgreich abgeschlossen wird, werden die bereits replizierten Daten für mindestens sieben Tage gespeichert und durch die Data Domain-Bereinigung bereinigt.  Teilreplikationen enthalten Daten und Fingerabdrücke, die es ermöglichen, den nachfolgenden erneuten Datenreplikationsversuch später schneller auszuführen.
Der Overhead der Teilreplikation kann so hoch sein wie die Menge der replizierten Daten, wenn Replikationen direkt vor dem Abschluss fehlschlagen.

Unterschied bei der Aufbewahrung
In der Avamar-Serverkonfiguration ist es möglich, festzulegen, dass die Replikate auf dem Zielserver länger als auf einer Quelle beibehalten werden. Dies führt zu Unterschieden bei der Kapazitätsauslastung.

Avamar-Konfigurationsunterschiede
Ein Prüfpunkt-Backup auf dem Avamar-Server kann eine erhebliche Größe aufweisen. Wenn es nur auf dem Avamar-Ziel konfiguriert ist, erhöht dies die Auslastung von Data Domain auf dem Ziel.

Aus Data Domain-Perspektive:

Fingerabdruck.

Wenn Daten während der Replikation an Data Domain gesendet werden, werden sie dedupliziert. Zunächst wird ein Fingerabdruck der Daten an die Ziel-Data Domain gesendet, um zu überprüfen, ob das Ziel über die Daten verfügt.

  • Wenn die Data Domain zurückgibt, dass der Fingerabdruck vorhanden ist, müssen die Daten nicht erneut gesendet werden.

  • Wenn die Data Domain nicht zurückgibt, dass der Fingerabdruck nicht gefunden wurde, kann dies Folgendes bedeuten:

    • Der Fingerabdruck ist nicht vorhanden.

    • Die Ziel-Data Domain verfügt über den Fingerabdruck, möchte jedoch, dass die Daten trotzdem gesendet werden, um die spezielle Lokalität auf Data Domain zu verbessern.

    • Die Data Domain ist ausgelastet und möchte nicht die gesamte Suche durchführen.

Wenn doppelte Daten an Data Domain gesendet werden, werden die Daten während der Bereinigung dedupliziert, indem zusätzliche Kopien der Daten entfernt werden.
Die Ziel-Data Domain hat eine höhere Auslastung, die Abweichung sollte jedoch nicht zu groß sein.

Metadaten-Overhead
Jede gesicherte Datei enthält ihre Dateiinformations-Metadaten sowie auch Fingerabdrücke für beide.

Beispiel: Bei einer 1-TB-Datei betragen die Auslastungskosten 0,3 % der Dateigröße.

Für einen durchschnittlichen Datenblock von 8 KB gibt es 82 B an Metadaten.  Dies entspricht etwa 0,01 % Overhead für die Kapazität nach der Komprimierung.
Dieser Overhead erhöht sich durch die Avamar-Integration zusätzlich, da Avamar die Backups kombiniert, um jedes Mal, wenn das Backup abgeschlossen wird, ein synthetisches komplettes Backup aus inkrementellen Backups zu erhalten.
Es kann zudem beobachtet werden, dass der Metadaten-Overhead steigt, wenn Backups übersprungen werden oder die Daten außer der Reihe repliziert werden.
Die einzigen Backups, die diesen Overhead nicht erzeugen, sind VM-Backups. Die Metadatenkosten werden minimiert.

Beispiel: Wenn das Backup außer der Reihe repliziert wird, erstellt es ein L0-Backup auf dem Ziel, das einen viel größeren Metadaten-Overhead als inkrementelle Backups aufweist. Angenommen, es liegen 5 Tage an Backups vor.

Replikation vom ältesten zum neuesten:

Die erste Replikation ist L0, alle nachfolgenden sind dann inkrementell.
1xL0 + 4xInc

Replikation vom neuesten zum ältesten:

Alle Replikationen sind L0, da n-1 Tag nicht für inkrementelle Backups verfügbar ist.
5xL0

Bei der Replikation wird ein Backup übersprungen:

Angenommen, das Backup an Tag 3 wurde übersprungen.  Tag 1 ist L0, Tag 2 ist inkrementell und Tag 4 ist dann wieder L0.
L0+Inc+L0+Inc


Dateinachverfolgung
Data Domain muss wissen, wie jede Datei aus den deduplizierten Blöcken erstellt wird. Falls Data Domain nicht über diese Informationen verfügt, muss es sie neu erstellen und auch die Fingerabdruckkette neu erzeugen. Dies kann zu einer erheblichen Kapazitätssteigerung führen.
Es gibt zwei Szenarien, die zu einer erheblichen Kapazitätssteigerung auf der Ziel-Data Domain führen können:


1. Die Dateinachverfolgung ist verloren gegangen:

Beispiel: Wenn die Ziel-Data Domain in DNS mit mehreren IP-Adressen festgelegt ist und die IP-Adressen im Rundlaufverfahren verteilt werden, stellt die Quell-Data Domain jedes Mal eine Verbindung zu einer anderen IP-Adresse her. Die Kopie der gestern gesendeten Daten wird nicht erkannt und es werden mehr Daten gesendet, was auch die Metadatenkosten erhöht.

2. Die Dateinachverfolgung ist nicht aktiviert:
Beispiel: Die SFS_BFT_ENABLED muss auf "true" gesetzt werden, um sicherzustellen, dass die Basisdateiverfolgung Backups auf dem Zielsystem synthetisieren kann. Auf diese Weise können eingehende Replikationen für Storage optimiert werden. Wenn SFS_BFT_ENABLED auf „false“ festgelegt ist, werden die Daten am endgültigen Backup-Speicherort auf DD gespeichert und entsprechen den eingehenden Daten vor der Komprimierung.

Dieses Problem kann auftreten, wenn der SFS_BFT_ENABLED nach Abschluss des Avamar Server-Rollbacks auf "false" belassen wird.

Dies kann zu einer sehr großen Diskrepanz führen.  Der Speicherplatz wird zurückgewonnen, sobald die Backups ablaufen.

Inline-Deduplizierung
Data Domain fordert doppelte Daten von bis zu 6 % der logischen Größe der Daten an, um die Inline-Deduplizierung zu optimieren.

Unterschied bei Deduplizierung und Komprimierung
Data Domains führen ihre eigene Deduplizierung und Komprimierung von Daten unabhängig auf ihrem lokalen Storage durch. Je nachdem, wie die Zieldaten gespeichert werden, geschieht dies nicht gleichmäßig, was zu einem Unterschied bei der Auslastung führt.

Data Domain-Bereinigung
Wenn die Quell- und Ziel-Data-Domains an verschiedenen Tagen Bereinigungen ausführen oder wenn eine der Data Domains diese häufiger oder länger ausführt, kommt es zu Diskrepanzen bei der genutzten Kapazität.

Resolution

Best Practices:

Da es Diskrepanzen bei der Auslastung zwischen den beiden Data Domain-Systemen, Quelle und Ziel, geben wird, können folgende Best Practices dazu beitragen, den Unterschied zu minimieren:

  1. Reduzieren Sie die Möglichkeit eines Rollback, indem Sie hfscheck-Fehler und Hardwareausfälle beheben, sobald diese auftreten.

  2. Stellen Sie sicher, dass Replikationen erfolgreich abgeschlossen werden. Wenn ein fortlaufendes Problem mit dem Abschließen von Replikationen vorliegt, wenden Sie sich an den Dell Technologies Support, um die Konfiguration zu überprüfen.

  3. Wenn beide Data Domains eine ähnliche Auslastung aufweisen sollen, behalten Sie den gleichen Aufbewahrungszeitraum für die Quell- und Zielkopien der Backups bei und stellen Sie sicher, dass das Prüfpunkt-Backup auf beiden Avamar-Servern identisch ist.

  4. Stellen Sie sicher, dass Replikationen immer vom ältesten zum neuesten durchgeführt werden und keine Backups übersprungen werden.

  5. Wenn Data Domain mit mehreren IP-Adressen konfiguriert ist, stellen Sie sicher, dass die IP-Adressen nicht im Rundlaufverfahren verteilt werden.

  6.  Führen Sie auf beiden Data Domain-Systemen, Quelle und Ziel, die Bereinigung am selben Tag und zur selben Uhrzeit durch.

  7. Legen Sie SFS_BFT_ENABLED auf "true" fest.  Dies muss vom technischen Support aktiviert werden (Erstellen Sie eine SR und verweisen Sie auf diesen KB# - 182755).

Affected Products

Avamar Server
Article Properties
Article Number: 000182755
Article Type: Solution
Last Modified: 20 Sept 2024
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.