NetWorker: Údržba databáze médií a odstraňování problémů

Summary: Tento článek popisuje metody pro identifikaci a řešení problémů souvisejících s databází médií, jakož i osvědčené postupy pro údržbu a ochranu.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  • Nepodařilo se spustit služby.
  • Selhání denního pracovního postupu zálohování serveruOchrana> serveru.
  • Neúplné nebo zavádějící informace týkající se uložených sad nebo klientů vrácených příkazem mminfo nebo při dotazování či procházení uložených sad ve správě konzole NetWorker Management Console (NMC) nebo webového uživatelského rozhraní NetWorker (NWUI).
  • Problémy se zálohováním, obnovením nebo klonováním související s nemožností vyhledat sady, klienty nebo svazky.
  • Chyby v protokolu démona serveru nebo konzolích souvisejících s databází médií:
nsrmmdbd WiSS code assertion error (st_nextrec: rec loop detected)
nsrmmdbd error, ss_clone_ensure_clone_eligibility: assertion, invalid parameters or code segment
nsrmmdbd XCHK ssid:saveset_short_ssid host:saveset_hostname name:saveset_name has a fragment with an invalid volid:saveset_volid
nsrmmdbd NSR warning WiSS code assertion error (ST_readvdir: directory read failed)
nsrmmdbd NSR critical Unexpected error reading long record directory: an invalid slot number
nsrmmdbd NSR warning partial record error, ssid: saveset_short_ssid saveset_long_ssid flags:0x00010101 size:0 files:0 tm:datetime cloneid
nsrmmdbd NSR notice media db must be scavenged
nsrmmdbd NSR critical media db scavenge failed
nsrmmdbd NSR warning Cannot scavenge path_to_mmvolume6 (Permission denied) - recover from backup media
nsrmmdbd NSR warning Cannot scavenge path_to_mmvolume6 (unknown error code) - recover from backup media
nsrmmdbd MDB warning can't fetch save set <saveset ID>
nsrmmdbd MDB warning Unable to fetch child save set <saveset ID> for cover set <saveset ID>
  • Náhlá ztráta mnoha sad pro ukládání z databáze médií nebo náhlý skok v dostupném volném místě na disku.
  • U softwaru nevyprší platnost nebo se odstraní sady save, což vede k rychlé spotřebě úložiště.

Cause

Jako každá databáze může být i databáze médií poškozena v různé míře, pokud dojde k jakémukoli závěru o jejím normálním provozu, jako například. 
  • Neočekávané vypnutí procesu nsrmmdbd (výpis jádra, selhání systému, restart nebo ztráta napájení).
  • Přerušená transakce (externí zásah bezpečnostního softwaru nebo vyčerpání místa na disku).
  • Logický interní problém (chyba v kódu nebo neošetřené podmínky).
  • Přímé zasahování do souborů databáze médií nebo ukládání sad souborů v úložišti spravovaném NetWorkerem.
Mediální databáze je nejlépe chráněna před poškozením pomocí následujících obecných postupů:
  • Pokud je to možné, použijte pro složku nsr/mm samostatný oddíl místního disku, který pomáhá chránit před stavy, jako je vyčerpání místa na disku jinými procesy. Tento oddíl by měl mít alespoň 3násobek velikosti databáze médií; velká mediální databáze by v současné době měla 10 GB; proto by 100 GB mělo stačit pro jakoukoli instalaci. 
  • Zajistěte, aby byl pracovní postup zálohování serveru prováděn denně, aby byly v případě havárie k dispozici zálohy databáze médií a důležitých zdrojů zotavení po havárii ( zaváděcí systém).
  • Pravidelně ověřujte umístění zaváděcích popruhů pomocí příkazu mminfo -B .
  • Nikdy nedovolte, aby ke svazkům úložiště serveru NetWorker přistupoval současně jiný server NetWorker, protože by to mohlo vést ke ztrátě dat.
  • Pokud je na serveru NetWorker nainstalován antivirový software, vytvořte výjimky pro adresář /nsr, aby antivirový software nemohl skenovat, upravovat nebo odebírat soubory NetWorker. 
  • Vyhněte se ručnímu odstraňování souborů v úložišti NetWorker, abyste se pokusili uvolnit místo. NetWorker má rutiny pro získání místa, které se spouštějí denně. Pokud jsou považovány za selhávající, je třeba kontaktovat podporu.
  • Obecně platí, že pro plánování datových zón uchovávejte data stejného typu ve stejných fondech pro snadnou údržbu v případě potřeby, jako jsou sady uložení vProxy, sady uložení systému souborů a sady uložení databáze Oracle v samostatných fondech.
  • Neignorujte zprávy související s chybami databáze médií – pokud máte obavy, obraťte se na podporu.
Mějte na paměti vztah mezi databází médií a úložištěm NetWorker a chraňte svazky příznakem Scan Required
  • NetWorker spouští proces vypršení platnosti denně jako součást pracovního postupu zálohování serveru. Tato úloha vypočítá uchovávání a závislosti a vyprší platnost sad uložení, které jsou po jejich uchovávání a nemají žádné závislé položky s vypršenou platností. Po dokončení se nástroj NetWorker pokusí odstranit všechny sady pro ukládání diskových svazků, jejichž platnost vypršela. Poté se pro každý svazek spustí operace opětovného získání místa, která odstraní soubory sady uložení z diskového média, které nemají odpovídající položky databáze médií. To znamená, že pokud dojde k poškození databáze médií nebo obnovíte databázi do předchozího časového bodu, mohou být platná data odstraněna.
  • Pokud se domníváte, že se jedná o problém s kterýmkoli diskovým svazkem a chcete zajistit, aby nebyla odstraněna platná data, ujistěte se, že svazek je odpojený a označený jako Je vyžadována kontrola. To platí i pro svazky po obnovení k předchozímu bodu v čase (kde na disku vytvořeném po bodu obnovení mohou existovat platné sady uložení, a proto nemají žádné položky v obnovené databázi). 
  • Možnost Scan Required umožňuje normální zálohování, obnovení nebo klonování, ale zabraňuje normálnímu vypršení platnosti nebo odstranění – proto se ujistěte, že se používá pouze k ochraně svazků, které jsou vnímány jako ohrožené, a při návratu k běžným operacím je odstraní. Svazky musí být odpojeny, aby bylo možné tento příznak nastavit nebo odebrat. Je běžné, že svazky jsou po zotavení po havárii serveru NetWorker (nsrdr) označeny jako "je nutná kontrola", aby se zabránilo nežádoucí ztrátě dat v případě zotavení po havárii.

Resolution

Existuje několik způsobů, jak se pokusit ověřit a opravit problémy s databází médií. Než se pokusíte o některou z těchto možností, vytvořte sestavy před a po, abyste zjistili, zda byly odebrány uložené sady, svazky, klienti nebo cokoli jiného.
Na příkazovém řádku v adresáři pro hostování výstupů spusťte následující příkazy pro porovnání vlastností databáze médií před a po postupu:
  • mminfo -C mminfo-C_pre.mmi
  • mminfo -X mminfo-X_pre.mmi
  • mminfo -ar "volid,type,umístění,fond,svazek,stav,volflags,written,savesets" -q family=disk -xc, > mminfo-vol_pre.mmi
Po dokončení údržby spusťte každý z nich znovu do samostatného souboru (například *_post.mmi) a porovnejte hodnoty.

nsrim - Denní ochrana serveru

Každý den se spouští pracovní postup Zálohování serveru a > s ním i akce Vypršení platnosti. Akce Vypršení platnosti spustí nástroj nsrim, což je nativní nástroj pro údržbu NetWorker. To lze také spustit přímo, ale může to trvat několik minut až několik hodin v závislosti na zatížení serveru a velikosti databáze médií:
nsrim -X > nsrim.out 2>&1

Pokud tento proces neběží denně, není nepravděpodobné, že by se tím něco změnilo. Zkontrolujte denní dokončení nsrim v protokolu daemona.

Restartování služby

Restartování služeb NetWorker vynutí různé kontroly při spuštění, které mohou odhalit problémy s chybovými zprávami protokolu démona, a případně je opravit. Pokud se problémy s databází zdají být před zastavením služeb závažné, ujistěte se, že je k dispozici dostatek volného místa a že jsou známa umístění bootstrapu (výstup mminfo -B). V ideálním případě spusťte nejprve příkaz nsrmmdbasm -s nsr/mm/mmvolrel_path > mm.xdr a pokuste se extrahovat kopii aktuální databáze médií. Před restartováním služeb vytvořte kopii složky mmvolrel, protože může být později vyžadována pro forenzní účely nebo účely obnovení.

Export a opětovný import databáze médií

Tento proces zabraňuje úplnému zotavení po havárii tím, že extrahuje pouze životaschopné záznamy databáze médií a znovu je importuje na server bez zastavení služeb. To by se ale mělo provádět jenom v případě, že je server nečinný, a nikdy byste se o to neměli pokoušet se spuštěnými úlohami. Místo mmvolrel použijte úplnou cestu (která se může lišit v závislosti na instalaci nebo operačním systému).
  1. Nejprve označte po odpojení všechny diskové svazky jako "Scan Required". Pokud je pro zařízení, která jsou hostiteli diskových svazků, nastavena automatická správa médií , je nutné ji nejprve zakázat. Svazky pásek tento krok nepotřebují. 
  2. Spuštěním příkazů mminfo popsaných v preambuli připravíte předběžné zprávy.
  3. Zkontrolujte velikost složky mmvolrel databáze médií a zaznamenejte
  4. Ujistěte se, že není spuštěn žádný z procesů nsrck, nsrim, nsrmmdbasm; Pokud jsou v nadřazené složce MM nějaké velké, staré nebo nedávno neupravené soubory, jako je MM[alfanumerická složka], přesuňte je nebo odstraňte, pokud nejsou uzamčeny žádným procesem.
  5. Spuštěním příkazu extrahujte databázi médií: nsrmmdbasm -s mmvolrel > mm.xdr
  6. Porovnejte velikost nového souboru s velikostí složky mmvolrel – pokud by měla mít podobnou velikost. Pokud je malý (4 B nebo hrst kB), příkaz se nezdařil. Pokud je výrazně menší, je možné, že v rámci procesu došlo k odstranění poškozených záznamů.
  7. Připravte server na obnovení databáze médií nastavením pole Stav serveru na zotavení po havárii v NMC/NWUI nebo pomocí příkazu nwadmin.
  8. Proveďte obnovení přímo ze souboru pro extrahování databáze médií opět pomocí příkazu nsrmmdbasm : nsrmmdbasm -r -2 < mm.xdr
  9. Po dokončení spusťte stejný mminfo, jak je popsáno v preambuli, a porovnejte uloženou sadu a zapsané hodnoty na svazek a ujistěte se, že jsou přítomny všechny svazky. podobně mminfo -C hodnoty by měly být identické.
  10. Pokud se vyskytnou nějaké rozdíly, poznamenejte si to a pečlivě zvažte, jak postupovat, a pokud si nejste jisti výsledky, které vidíte, obraťte se na podporu:
    • U svazků, které se zdají být v dobrém stavu, můžete odebrat příznak Zkontrolovat potřebné a připojit svazky, protože by nemělo hrozit žádné nebezpečí odstranění sady uložení, pokud se zdá, že ze svazku nebyly odebrány žádné sady uložení, pokud jsou sady uložení a zapsané hodnoty konzistentní. 
    • Svazky, které vykazují méně sad uložení nebo nižší celkový počet zápisů , by měly ponechat příznak Scan Needed na místě a spustit příkaz scanner: scanner -i devicename pro opětovné zavedení souborů nalezených na svazku, které již nemají záznamy. Po dokončení skenování pro každý svazek znovu zkontrolujte počet sad uložení a odeberte příznak Vyžadováno skenování. Jakmile si budete jisti, že skener nahradil sady uložení, vraťte svazek zpět.

nsrdr

Úplné zotavení po havárii prováděné nsrdr obnoví nejen databázi médií, ale také další prvky serveru, jako je databáze zdrojů a databáze úloh. Než se pokusíte pokračovat, přečtěte si průvodce nejlepšími postupy pro zotavení po havárii serveru a dostupnosti pro vaši verzi.
Tento příkaz očekává, že uzly úložiště budou online a bude možné je kontaktovat, aby bylo možné jej dokončit.
 
POZNÁMKA: V případě jakýchkoli dotazů nebo obav se vždy obraťte na podporu, protože obnovení databáze médií může vést ke ztrátě dat diskových svazků, pokud není použit příznak Scan Needed k ochraně souborových systémů s použitelnými sadami pro ukládání, které nemusí mít záznamy databáze médií z důvodu poškození nebo obnovení do předchozího bodu v čase, obnovení databáze médií může vést ke ztrátě dat diskových svazků.

Affected Products

NetWorker

Products

Data Backup & Protection Software, NetWorker Family
Article Properties
Article Number: 000223518
Article Type: Solution
Last Modified: 08 Apr 2024
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.