NetWorker: Optimalizace operací obnovení místa pro systém Data Domain
Summary: Tento článek obsahuje několik užitečných možností ladění a kroky pro snížení zatížení a uvolnění místa na zařízeních Data Domain v datové zóně NetWorker.
Symptoms
- Uložené sady NetWorker označené jako Expired, ale not removed
- Zprávy o obnovení místa se zobrazují v protokolech více než jednou denně
- Vliv na rychlost a zatížení systému Data Domain
- Obecné dopady na výkon serveru
Cause
- Svazky, které mají nárok na obnovení místa, se načítají během akce vypršení platnosti (fázování, klonování nebo obnovení)
- Obnovení místa se ve výchozím nastavení spouští po každé pracovní operaci na libovolném svazku
- Obnovení místa kontroluje každý soubor v adresářové struktuře svazku při spuštění funkce Uvolnění místa
- Během fáze obnovení místa se může zpomalit provoz a rychlost odezvy serveru
Resolution
Fáze obnovení místa v nástroji NetWorker se spouští jednou denně jako jedna ze závěrečných fází akce Vypršení platnosti v pracovním postupu zálohování serveru. Je určen k odstranění objektů souborů sady uložení ve svazku poté, co server vyhodnotí, vyprší její platnost a odstraní je poté, co byly vypočteny ty položky, které lze bezpečně odebrat podle jejich konfigurace.
Existuje několik faktorů, které mohou mít nepříznivý vliv na rychlost odezvy serveru Data Domain nebo NetWorker. Povolte kteroukoli z níže uvedených možností, které se zdají vyhovovat požadavkům dané datové zóny. Než začnete uvažovat o testování pomocí níže uvedených souborů klíčů ladění: Zakázáním akce vypršení platnosti denní ochrany serveru > zakážete > všechny výpočty obnovy místa a databáze médií po dobu jednoho nebo více dnů, abyste potvrdili, že zjištěné problémy s výkonem souvisejí s obnovením místa nebo vypršením platnosti.
Pokud zakázání vypršení platnosti potvrdí problém související s každodenní údržbou, lze za účelem odstranění problémů zakázat následující funkce vytvořením prázdného souboru se stejným názvem (bez přípony) na serveru nebo v uzlu NetWorker v podadresáři debug hlavního adresáře nsr. Žádný z těchto souborů s příznakem nevyžaduje restartování a projeví se při spuštění úloh obnovení místa, když jsou přítomny.
Umístění Linuxu: /nsr/debug
Umístění systému Windows: C:\Program Files\EMC NetWorker\nsr\debug (nebo odpovídající instalační cesta NSR)
Názvy souborů a jejich funkce jsou podrobně popsány níže:
skip_recover_space_for_stage
- Uzly úložiště. Tento příznak způsobí, že nástroj NetWorker přeskočí fázi obnovení místa pracovní operace (klonování následované odstraněním zdroje). Pokud vaše prostředí používá přípravu, zejména přípravu ze stejných zdrojových svazků opakovaně, doporučuje se to, protože to neguje možnost vytváření více operací s místem pro obnovení pro stejné svazky. Pokud je tento příznak splněn, operace obnovení místa je zcela odložena, což systému umožňuje odstranit soubory při spuštění akce Denní vypršení platnosti nebo při ručním spuštění příkazu nsrim.
recover_space_anytime
- Pouze server. To umožňuje vypršení platnosti místa pro obnovení a odebrání sad uložení na svazcích, které aktivně čtou, což je ve výchozím nastavení odloženo. To znamená, že u svazků, které mají dlouhotrvající úlohy klonování, lze vypršení platnosti a obnovení místa opakovaně odložit, když se spustí akce vypršení platnosti, nsrim nebo pracovní úloha (viz předchozí). To může vést k velkým nevyřízeným žádostem o uvolnění místa, postupnému vyčerpání volného místa a větší úloze obnovení místa, když je povolena ke spuštění.
skip_disk_usage
- Uzly úložiště. V rámci obnovy místa a kontroly systému souborů diskového svazku jsou ve výchozím nastavení jednotlivé soubory rekurzivně kontrolovány a počítány, aby se vytvořil přesný souhrn dat pro svazek. I když někteří mohou považovat tuto přesnost za nezbytnou, odložení tohoto kroku závisí na záznamech mediální databáze NetWorker pro celkové součty souborů a bajtů, u kterých lze obvykle očekávat, že budou dostatečně přesné pro většinu použití. V silně zatíženém systému Data Domain, zejména v takových, kde se u svazků opakovaně spouští mnoho operací obnovení místa, lze tuto činnost považovat za zbytečný výdaj a bezpečně ji zakázat.
skip_consistency_check_in_recover_space
- Uzly úložiště. Během obnovy místa svazku je souborový systém svazku kontrolován soubor po souboru, aby byla zajištěna konzistence mezi databází médií. To může také způsobit latenci. Přidáním tohoto souborového klíče do každého uzlu zabráníte tomuto uzlu ve smazání souborů savesetu, kde odpovídající záznam v databázi médií neexistuje, nebo označení záznamů databáze médií, kde nebyl nalezen žádný soubor, jako "podezřelých". Upozorňujeme, že to zabrání běžným operacím čištění, mělo by se to použít ke stanovení latence související s operacemi obnovy místa a nemělo by se to zakazovat dlouhodobě.
Ve výchozím nastavení bylo zavedeno podrobnější protokolování, což způsobuje, že se do protokolů data_audit na serveru NetWorker zapisují celé cesty sady uložení. Tam, kde je již velké zatížení, mnoho/velké úlohy obnovy místa, se jedná o faktor, který může vést k nereagování, zejména z uzlů úložiště, které vzdáleně vracejí informace do NetWorker. Chcete-li tuto možnost zakázat, zvyšte prahovou hodnotu pro protokolování pro tyto protokoly na serveru NetWorker:
# nsradmin
# nsradmin> show name; auditlog severity
# print type: nsr auditlog
Omezte tuto změnu tak, aby ovlivnila pouze audit dat, pokud chcete, a to upřesněním dotazu na konkrétní instanci uvedením jejího názvu. Pokud chcete nastavení znovu použít pro každou z nich, přeskočte tento krok:
# print type: nsr auditlog; name: servername_data_audit.raw
Chcete-li zastavit protokolování jednotlivých odstranění, změňte prahovou hodnotu na jednu nebo obě na "Error" – smazání se stále zaznamenávají do daemon.raw serveru.
# update auditlog severity: Error