Avamar-Data Domain: Wysokie wykorzystanie DD na serwerze docelowym: Analiza i najlepsze praktyki
Summary: Wykorzystanie przestrzeni dyskowej przez źródłowe i docelowe serwery Data Domain nie musi być dokładnie takie samo. W tym dokumencie opisano możliwe przyczyny sytuacji, w której serwer docelowy Data Domain wykazuje większe wykorzystanie przestrzeni względem serwera źródłowego Data Domain. Należy pamiętać, że rozbieżność w ilości wykorzystanej przestrzeni może być wynikiem kombinacji wymienionych powodów. ...
Symptoms
Serwer docelowy Data Domain wykazuje większe wykorzystanie przestrzeni względem serwera źródłowego Data Domain.
Cause
Z perspektywy serwera Avamar:
Cofnięcie
W przypadku cofnięcia danych na serwerze źródłowym Data Domain serwer docelowy Data Domain może zawierać dane z dodatkowych kilku dni w zależności od daty cofnięcia. Ta rozbieżność będzie istnieć do czasu wygaśnięcia dodatkowych kopii zapasowych w lokalizacji docelowej.
Przykład: DD1 replikuje się do DD2. Ponieważ cofnięcie nastąpiło 2 dni temu, można dostrzec, że w lokalizacji źródłowej znajdują się 3 kopie zapasowe, ale pięć zostało zreplikowanych do lokalizacji docelowej.
Częściowe replikacje
W przypadku, gdy replikacja nie zakończy się powodzeniem, dane, które zostały już zreplikowane, są przechowywane przez co najmniej siedem dni, a następnie usuwane za pomocą operacji czyszczenia Data Domain. Częściowe replikacje zawierają dane oraz ich skrót, dzięki którym ponowne próby przeprowadzenia replikacji przebiegają szybciej.
Jeżeli tuż przed planowanym zakończeniem procesu replikacji wystąpi błąd, narzut danych może być analogiczny do ilości danych poddanych replikacji.
Różnica w przechowywaniu plików
W opcjach konfiguracji serwera Avamar dostępne jest ustawienie umożliwiające przechowywanie replik na serwerze docelowym dłużej niż na źródłowym. Spowoduje to wystąpienie różnic w wykorzystaniu pojemności.
Różnice w konfiguracji serwera Avamar
Kopia zapasowa punktu kontrolnego na serwerze Avamar może być bardzo duża. Jeśli zostanie ona skonfigurowana wyłącznie na serwerze docelowym Avamar, zwiększy to wykorzystanie przez Data Domain przestrzeni w lokalizacji docelowej.
Z perspektywy serwera Data Domain:
Odcisk palca.
Gdy dane są wysyłane do Data Domain podczas replikacji, są deduplikowane. Skrót danych jest najpierw wysyłany do docelowego serwera Data Domain w celu sprawdzenia, czy w lokalizacji docelowej znajdują się dane.
-
Jeżeli serwer Data Domain wykaże obecność skrótów danych, ponowne przesłanie danych nie będzie konieczne
-
Jeżeli serwer Data Domain nie zwróci informacji dotyczących obecności skrótów danych oznacza to, że:
-
nie ma skrótów danych
-
Serwer docelowy Data Domain zawiera skróty danych, lecz mimo to oczekuje na przesłanie danych w celu usprawnienia specjalnej lokalizacji na serwerze Data Domain.
-
Serwer Data Domain jest zajęty i nie może ukończyć wyszukiwania.
-
Jeśli na serwer Data Domain zostaną wysłane zduplikowane dane, podczas czyszczenia zostaną one poddane deduplikacji poprzez usunięcie zbędnych kopii.
Serwer docelowy Data Domain zostanie wykorzystany w większym stopniu, lecz różnica nie powinna być znacząca.
Narzut metadanych.
Każdy plik kopii zapasowej zawiera własne metadane z informacjami oraz skróty danych.
Przykład: W przypadku pliku o rozmiarze 1 TB wykorzystuje się 0,3% rozmiaru pliku.
Przeciętny fragment danych o rozmiarze 8 kB zawiera 82 B metadanych. Wówczas narzut wynosi około 0,01% pojemności po kompresji.
Narzut zwiększa się dodatkowo w przypadku integracji z serwerem Avamar, który po każdym zakończeniu tworzenia kopii zapasowej łączy je w celu uzyskania z kopii przyrostowej pełnej kopii syntetycznej.
Można również zauważyć, że narzut metadanych zwiększa się, gdy kopie zapasowe są pomijane lub dane replikowane są w nieprawidłowej kolejności.
Jedynymi kopiami, którego nie tworzą tego narzutu, są kopie zapasowe maszyn wirtualnych. Ilość miejsca wykorzystanego przez metadane jest minimalizowana.
Przykład: Gdy kopia zapasowa jest replikowana poza kolejnością, tworzy ona kopię L0 w lokalizacji docelowej, która zawiera znacznie więcej metadanych niż kopia przyrostowa. Załóżmy, że kopia zapasowa zawiera dane z 5 dni.
Replikacje od najstarszej do najnowszej:
Pierwsza replikacja będzie L0, a wszystkie następne będą przyrostowe.
1xL0 + 4xInc
Replikacje od najnowszej do najstarszej:
Replikacja pomija kopię zapasową:
Śledzenie plików
Serwer Data Domain musi posiadać informacje na temat tworzenia każdego pliku pochodzącego z de duplikowanych fragmentów. Jeżeli serwer Data Domain nie posiada tej informacji, będzie musiał ją odtworzyć oraz ponownie utworzyć łańcuch skrótów danych. Może to spowodować znaczny wzrost pojemności.
Istnieją dwa scenariusze, które mogą spowodować znaczny wzrost pojemności na serwerze docelowym Data Domain:
1. Przerwano śledzenie plików:
Przykład: Jeżeli serwer docelowy Data Domain posiada skonfigurowany DNS z wieloma adresami IP i są one rozdzielone zgodnie z algorytmem karuzelowym, serwer źródłowy Data Domain za każdym razem będzie łączyć się z innym adresem IP. Przesłana poprzedniego dnia kopia danych nie zostałaby rozpoznana, wskutek czego przesłano by większą ilość danych, co dodatkowo zwiększyłoby wykorzystanie pamięci przez metadane.
Ten problem może wystąpić, gdy SFS_BFT_ENABLED zostanie pozostawiony jako fałszywy po zakończeniu przywracania systemu serwera Avamar.
Może to spowodować bardzo dużą rozbieżność. Po wygaśnięciu kopii zapasowych przestrzeń w pamięci zostaje odzyskana.
Reduplikacja in-line
Serwer Data Domain poprosi o duplikaty danych liczące do 6% rozmiaru logicznego wszystkich danych w celu zoptymalizowania procesu deduplikacji in-line.
Różnica w deduplikacji i kompresji.
Serwery Data Domain wykonują reduplikację danych oraz kompresują je na lokalnej pamięci masowej niezależnie od siebie i w zależności od sposobu przechowywania danych docelowych ilość wykorzystanego miejsca będzie się różnić.
Czyszczenie Data Domain
Jeżeli serwer źródłowy oraz docelowy Data Domain przeprowadzają czyszczenie w różne dni, lub gdy jeden z nich wykonuję tę czynność częściej lub dłużej niż drugi, wystąpi rozbieżność w ilości wykorzystanego miejsca.
Resolution
Najlepsze praktyki:
Poniżej przedstawiono kilka najlepszych praktyk, które pozwolą zminimalizować rozbieżność w wykorzystaniu dysku między dwoma serwerami Data Domain:
-
Należy rozwiązywać niepowodzenia HFScheck oraz awarie sprzętu, gdy tylko się pojawią, aby zminimalizować ryzyko cofania.
-
Należy upewnić się, że replikacje przebiegają pomyślnie. W przypadku trwającego problemu z ukończeniem replikacji należy skontaktować się z działem pomocy technicznej firmy Dell Technologies w celu sprawdzenia konfiguracji.
-
W razie konieczności utrzymania wykorzystania przestrzeni dyskowej przez oba serwery Data Domain na podobnym poziomie należy zachować taką samą retencję w źródłowej i docelowej kopii zapasowej oraz upewnić się, że ustawienia kopii zapasowej punktu kontrolnego są identyczne na obu serwerach Avamar.
-
Należy upewnić się, że replikacje są zawsze wyświetlane w kolejności od najstarszej do najnowszej oraz że kopie zapasowe nie są pomijane.
-
Jeżeli do serwera Data Domain przypisanych jest kilka adresów IP, należy upewnić się, że nie są one rozdzielone zgodnie z algorytmem karuzelowym.
-
W obu systemach Data Domain, źródłowym i docelowym, należy przeprowadzić czyszczenie w tym samym dniu i o tej samej godzinie.
-
Ustaw SFS_BFT_ENABLED na true. Musi to być włączone przez dział pomocy technicznej (zgłoś zgłoszenie i odnieś się do tego artykułu bazy wiedzy# — 182755)