Avamar: Jak nastavit server Avamar do známého řízeného stavu

Summary: Tento článek vysvětluje, jak nastavit server Avamar do známého řízeného stavu.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Na serveru Avamar existuje mnoho automatizovaných úloh, které mohou ovlivnit odstraňování problémů a úsilí o jejich řešení.

Tento postup popisuje, jak uvést software Avamar do takzvaného "známého řízeného stavu", aby nedošlo k neočekávané nebo nežádoucí aktivitě.

Při provádění ruční a pokročilé údržby je třeba dodržovat níže uvedený kontrolní seznam. Například:
  • Obnova pruhů
  • Opětovná stavba uzlů
  • Restartování offline uzlů
Jedná se o kontrolní seznam, nikoli o návod, jak provádět operace nebo interpretovat výsledky.

NEJEDNÁ se o řešení kontroly stavu. Předpokládá, že server Avamar není v pořádku.

Cause

Na serveru Avamar musí být spuštěny úlohy ruční nebo pokročilé údržby.

Resolution

Upozornění: Při nesprávném použití mohou některé z níže uvedených příkazů způsobit problémy s integritou nebo ztrátu dat. Pokud příkazu nerozumíte nebo nerozumíte důsledkům jeho spuštění, požádejte o pomoc podporu společnosti Dell nebo místního zástupce partnera společnosti Dell.

Požadavky:
  • Všechny příkazy je třeba spustit jako správce s klíči SSH načtenými podle článku Avamar: Jak se přihlásit k serveru Avamar a načíst různé klíče
  • Některé příkazy nemusí poskytovat zpětnou vazbu nebo mít okamžitý účinek; Nemělo by být nutné spouštět příkaz více než jednou.
  • Pro všechny avmaint config --ava vždy potvrďte, že se změna projevila. Spusťte příkaz:
avmaint config --ava | grep <setting>
  • Je třeba se vyhnout ruční údržbě. Kdykoli je to možné, umožněte plánovači údržby spravovat úlohy údržby.
Postup:
  1. Pomocí těchto příkazů je třeba odpovědět na následující otázky, abyste pochopili obecný stav serveru Avamar před manipulací s jakýmkoli systémem:
  • Jak starý je poslední ověřený kontrolní bod?
cplist
  • Jsou všechny pruhy online? Jsou všechny uzly online?
status.dpn
  • Jsou všechny služby v provozu?
dpnctl status
  1. Zkontrolujte probíhající údržbu a v případě potřeby ji zrušte:
    1. Pozastavte aktivity údržby pomocí plánovače údržby, abyste zajistili, že se po zastavení znovu nespustí.
avmaint sched suspend cp --ava
avmaint sched suspend hfscheck --ava
Nepozastavujte uvolňování paměti (GC), protože by mohlo dojít ke zbytečnému vrácení zpět.
  1. Spusťte níže uvedený příkaz a zkontrolujte, zda jsou spuštěny aktivity údržby.
status.dpn
  • Pokud je kontrolní bod spuštěný, nechte ho dokončit.
  • Pokud je HFScheck spuštěn, lze jej zastavit, pokud server není v režimu správce (fáze waitcgsan) nebo je HFScheck téměř dokončen:
avmaint hfscheckstop --ava
  • Pokud je GC spuštěný, může být ukončen:
avmaint gckill --ava
Dokončení procesu může nějakou dobu trvat, protože aktuální průchod se musí dokončit.
  1. Jakmile již není spuštěna žádná další údržba, měl by se plánovač údržby zastavit:
dpnctl stop maint
  1. Zastavte plánovač zálohování, zastavte spouštění zálohování nebo obnovení a pozastavte nová připojení:
    1. Zabraňte MCS ve spouštění nových záloh:
dpnctl stop sched
  1. Seznam všech spuštěných záloh:
avmaint sessions --ava | grep sessionid
Pokud je spuštěné jiné obnovení než replikace, obraťte se na uživatele a zjistěte, zda má být povoleno dokončení obnovení.
  1. Po přijetí souhlasu od uživatele lze zálohy čistě ukončit (vytvoří se částečné zálohy) pomocí uživatelského rozhraní nebo nečistě pomocí:
avmaint kill -waittime=0 <sessionid>
  1. Vypíše všechny další zálohy, které nejsou uvedeny předchozím příkazem:
avmaint sessions --full
  1. V závislosti na operaci, která má být provedena, nemusí být přijatelné, aby se spustily žádné operace typu zálohování (tj. avmaint getrefby). Proto pozastavte dispečery, aby nepovolovali žádné ruční zálohy:
avmaint suspend
  1. Zastavte replikaci (zdroj nebo cíl replikace).
    1. V případě zdroje replikace (obnovení) použijte uživatelské rozhraní nebo EM nebo ukončete proces a zastavte replikaci.
    2. U cíle replikace (zálohování) ověřte, zda je spuštěna replikace: 
avmaint sessions | grep path
  1. V cestě vyhledejte doménu /REPLICATE . Zastavte replikaci ve zdrojové mřížce pomocí metod v kroku 4a.
  1. Vypněte drcení pomocí příkazu:
avmaint config --ava asynccrunching=false
Může trvat až 15 minut, než se crunching zastaví. Zkontrolujte, zda protokoly GSAN z datových uzlů neobsahují nějaké "crunch" zprávy.
  1. Vypnout vyvážení
    1. Zkontrolujte, zda je spuštěno vyvažování:
avmaint config --ava | grep balancemin
Obvykle by nemělo být vyvažování povoleno (jakákoli jiná hodnota než 0), ale přesto je důležité to zkontrolovat.
  1. Zakázání vyvažování:
avmaint config --ava balancemin=0
Zastavení vyrovnávání může trvat až 15 minut. Zkontrolujte soubor status.dpn a zjistěte, zda nedochází k migraci prokládání, abyste potvrdili, že se vyrovnávání dokončilo.
  1. Zkontrolujte kapacitu:
    1. Zkontrolujte kapacitu operačního systému: 
avmaint nodelist --ava | grep fs-perc
  1. Zkontrolujte velikost kontrolních bodů:
mapall copy ~/cps                # only if cps does not exist on the data nodes
mapall --noerror './cps'
  1. Zkontrolujte seznam kontrolních bodů a zjistěte, které kontrolní body MUSÍ být zachovány (poslední ověřený kontrolní bod na všech uzlech):
cplist
V závislosti na výše uvedených výsledcích určete, kolik kontrolních bodů lze zachovat, které z nich jsou kritické a kolik nových kontrolních bodů lze vytvořit.
Informace o kapacitě naleznete v článku Avamar: Koncepty a školení v oblasti řízení kapacit
  1. Uvědomte si pořadí uzlů a rozdíly mezi čísly logických uzlů a čísly fyzických uzlů:
nodenumbers
status.dpn
mapall --noerror 'tail -2 /data01/cur/gsan.log'
  1. Kontrola hardwaru
  • Všechny automatizované úlohy by nyní měly být zastaveny. 
  • Server by měl vykazovat minimální aktivitu a mělo by být bezpečné pokračovat v jakýchkoli ručních úlohách nebo příkazech. 
Zkontrolujte server kontrolou protokolů GSAN napříč datovými uzly. Ověřte, zda neprobíhá žádná aktivita.
Příkaz uptime lze také spustit pomocí mapall, abyste zkontrolovali, zda je "průměr zatížení" napříč datovými uzly nízký (mezi 0,01 a 0,05),

například:
mapall --noerror 'uptime' 

(0.0) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.01, 0.02, 0.01 
(0.1) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.02, 0.01, 0.01 
(0.2) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.02, 0.01, 0.01
Výše uvedené kroky nastaví server do neprodukčního stavu. Po dokončení všech ručních úloh vždy vraťte změny.

Additional Information

 

Affected Products

Avamar, Avamar Server
Article Properties
Article Number: 000170876
Article Type: Solution
Last Modified: 06 Aug 2025
Version:  15
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.