Avamar: Jak ustawić Avamar Server w znany kontrolowany stan

Summary: W tym artykule wyjaśniono, jak ustawić serwer Avamar w znany stan kontrolowany.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Na serwerze Avamar występuje wiele zautomatyzowanych zadań, które mogą mieć wpływ na rozwiązywanie problemów.

W tej procedurze opisano sposób wprowadzenia Avamar w tak zwany "znany stan kontrolowany" w celu zapobieżenia wystąpieniu nieoczekiwanego lub niepożądanego działania.

Podczas ręcznej i zaawansowanej konserwacji należy postępować zgodnie z poniższą listą kontrolną. Oto przykład:
  • Odbudowa pasów
  • Odbudowywanie węzłów
  • Ponowne uruchamianie węzłów trybu offline
Jest to lista kontrolna i nie jest przewodnikiem dotyczącym sposobu wykonywania operacji lub interpretowania wyników.

To NIE jest rozwiązanie do kontroli poprawności działania. Zakłada się, że serwer Avamar jest w złej kondycji.

Cause

Ręczne lub zaawansowane zadania konserwacji muszą być uruchamiane na serwerze Avamar.

Resolution

Przestroga: Nieprawidłowe użycie niektórych poleceń wymienionych poniżej może spowodować problemy z integralnością danych lub ich utratę. Jeśli nie rozumiesz polecenia lub nie rozumiesz konsekwencji jego uruchomienia, zwróć się o pomoc do działu pomocy technicznej firmy Dell lub lokalnego przedstawiciela partnera firmy Dell.

Wymagania wstępne:
  • Wszystkie polecenia należy uruchamiać jako administrator z załadowanymi kluczami SSH dla każdego artykułu Avamar: Logowanie się na serwerze Avamar i ładowanie różnych kluczy.
  • Niektóre polecenia mogą nie dawać informacji zwrotnych lub nie działać natychmiast; Nie powinno być konieczne uruchamianie polecenia więcej niż raz.
  • Dla każdego avmaint config --ava zawsze potwierdzaj, że zmiana została wprowadzona. Uruchom polecenie:
avmaint config --ava | grep <setting>
  • Należy unikać ręcznej konserwacji. Pozwól planiście konserwacji zarządzać zadaniami konserwacji, gdy tylko jest to możliwe.
Procedura:
  1. Za pomocą tych poleceń należy odpowiedzieć na następujące pytania, aby zrozumieć ogólny stan serwera Avamar przed rozpoczęciem pracy z jakimkolwiek systemem:
  • Ile lat ma ostatni zatwierdzony punkt kontrolny?
cplist
  • Czy wszystkie paski są online? Czy wszystkie węzły są w trybie online?
status.dpn
  • Czy wszystkie usługi działają?
dpnctl status
  1. Sprawdź, czy prace konserwacyjne działają, i anuluj je w razie potrzeby:
    1. Wstrzymaj czynności konserwacyjne za pomocą harmonogramu konserwacji, aby upewnić się, że nie rozpoczną się ponownie po ich zatrzymaniu.
avmaint sched suspend cp --ava
avmaint sched suspend hfscheck --ava
Nie wstrzymuj wyrzucania elementów bezużytecznych (GC), ponieważ może to spowodować niepotrzebne wycofanie.
  1. Uruchom poniższe polecenie i sprawdź, czy są uruchomione czynności konserwacyjne.
status.dpn
  • Jeśli punkt kontrolny jest uruchomiony, pozwól mu się zakończyć.
  • Jeśli narzędzie HFScheck jest uruchomione, można je zatrzymać, jeśli serwer nie jest w trybie administratora (faza waitcgsan) lub jeśli test HFScheck jest prawie ukończony:
avmaint hfscheckstop --ava
  • Jeśli GC jest uruchomiony, można go zabić:
avmaint gckill --ava
Może to zająć trochę czasu, ponieważ bieżąca przepustka musi się zakończyć.
  1. Gdy nie jest już uruchomiona konserwacja, harmonogram konserwacji powinien zostać zatrzymany:
dpnctl stop maint
  1. Zatrzymaj harmonogram tworzenia kopii zapasowych, zatrzymaj wykonywanie kopii zapasowych lub przywracania i wstrzymaj nowe połączenia:
    1. Uniemożliwij MCS uruchamianie nowych kopii zapasowych:
dpnctl stop sched
  1. Wyświetl listę wszystkich uruchomionych kopii zapasowych:
avmaint sessions --ava | grep sessionid
Jeśli uruchomione jest przywracanie inne niż replikacja, należy skonsultować się z użytkownikiem w celu ustalenia, czy przywracanie powinno zostać ukończone.
  1. Po otrzymaniu zgody od użytkownika, że kopie zapasowe mogą zostać usunięte w czysty sposób (tworzone są częściowe kopie zapasowe) przy użyciu interfejsu użytkownika lub w nieprawidłowy sposób:
avmaint kill -waittime=0 <sessionid>
  1. Wyświetl listę wszystkich dodatkowych kopii zapasowych, które nie zostały wymienione przez poprzednie polecenie:
avmaint sessions --full
  1. W zależności od operacji, która ma zostać wykonana, uruchomienie operacji typu kopia zapasowa może być niedopuszczalne (np. avmaint getrefby). W związku z tym wstrzymaj przekaźniki, aby nie zezwalać na ręczne tworzenie kopii zapasowych:
avmaint suspend
  1. Zatrzymaj replikację (źródłową lub docelową replikacji).
    1. W przypadku źródła replikacji (przywracania) użyj interfejsu użytkownika lub EM albo zabij proces, aby zatrzymać replikację.
    2. W przypadku obiektu docelowego replikacji (kopii zapasowej) sprawdź, czy replikacja jest uruchomiona: 
avmaint sessions | grep path
  1. W ścieżce poszukaj domeny /REPLICATE . Zatrzymaj replikację w siatce źródłowej przy użyciu metod z kroku 4a.
  1. Wyłącz chrupanie za pomocą polecenia:
avmaint config --ava asynccrunching=false
Zatrzymanie crunchingu może potrwać do 15 minut. Sprawdź dzienniki GSAN z węzłów danych pod kątem komunikatów "crunch".
  1. Wyłączanie balansowania
    1. Sprawdź, czy bilansowanie jest uruchomione:
avmaint config --ava | grep balancemin
Zazwyczaj bilansowanie nie powinno być włączone (każda wartość inna niż 0), ale nadal ważne jest, aby to sprawdzić.
  1. Aby wyłączyć równoważenie:
avmaint config --ava balancemin=0
Zatrzymanie równoważenia może potrwać do 15 minut. Sprawdź status.dpn, aby zobaczyć, czy są migrowane jakieś paski, aby potwierdzić zakończenie równoważenia.
  1. Sprawdź pojemność:
    1. Sprawdź pojemność systemu operacyjnego: 
avmaint nodelist --ava | grep fs-perc
  1. Sprawdź rozmiar punktów kontrolnych:
mapall copy ~/cps                # only if cps does not exist on the data nodes
mapall --noerror './cps'
  1. Sprawdź listę punktów kontrolnych, aby określić, które punkty kontrolne MUSZĄ być zachowane (ostatni zweryfikowany punkt kontrolny na wszystkich węzłach):
cplist
W zależności od powyższych wyników określ, ile punktów kontrolnych można zachować, które z nich są krytyczne i ile nowych punktów kontrolnych można utworzyć.
Aby uzyskać informacje na temat pojemności, zapoznaj się z artykułem Avamar: Pojęcia dotyczące zarządzania pojemnością i szkolenia
  1. Zwróć uwagę na kolejność węzłów i różnice między numerami węzłów logicznych a numerami węzłów fizycznych:
nodenumbers
status.dpn
mapall --noerror 'tail -2 /data01/cur/gsan.log'
  1. Przegląd sprzętu
  • Wszystkie zautomatyzowane zadania powinny zostać zatrzymane. 
  • Serwer powinien wykazywać niewielką aktywność i powinno być bezpieczne wykonywanie wszelkich ręcznych zadań lub poleceń. 
Sprawdź serwer, sprawdzając dzienniki GSAN w węzłach danych. Sprawdź, czy rejestrowana jest niewielka lub nie jest rejestrowana żadna aktywność.
Polecenie uptime można również uruchomić przy użyciu mapall, aby sprawdzić, czy "średnia obciążenia" między węzłami danych jest niska (między 0,01 a 0,05)

Na przykład:
mapall --noerror 'uptime' 

(0.0) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.01, 0.02, 0.01 
(0.1) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.02, 0.01, 0.01 
(0.2) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.02, 0.01, 0.01
Powyższe kroki ustawiają serwer w stan nieprodukcyjny. Zawsze przywracaj zmiany po wykonaniu wszystkich zadań ręcznych.

Additional Information

 

Affected Products

Avamar, Avamar Server
Article Properties
Article Number: 000170876
Article Type: Solution
Last Modified: 06 Aug 2025
Version:  15
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.