NetWorker: Underhåll och felsökning av mediedatabaser

Summary: I den här artikeln beskrivs metoder för att identifiera och behandla problem relaterade till mediedatabasen, samt metodtips för underhåll och skydd.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  • Det gick inte att starta tjänsterna.
  • Fel i det dagliga arbetsflödet för säkerhetskopiering av Server Protection-server.>
  • Ofullständig eller missvisande information om sparuppsättningar eller klienter som returneras av mminfo-kommandot eller när du frågar eller bläddrar bland sparuppsättningar i administrationen av NetWorker Management Console (NMC) eller NetWorker Web User Interface (NWUI).
  • Säkerhetskopierings-, återställnings- eller kloningsproblem relaterade till oförmåga att hitta sparade uppsättningar, klienter eller volymer.
  • Fel i serverns daemonlogg eller konsoler relaterade till mediedatabasen:
nsrmmdbd WiSS code assertion error (st_nextrec: rec loop detected)
nsrmmdbd error, ss_clone_ensure_clone_eligibility: assertion, invalid parameters or code segment
nsrmmdbd XCHK ssid:saveset_short_ssid host:saveset_hostname name:saveset_name has a fragment with an invalid volid:saveset_volid
nsrmmdbd NSR warning WiSS code assertion error (ST_readvdir: directory read failed)
nsrmmdbd NSR critical Unexpected error reading long record directory: an invalid slot number
nsrmmdbd NSR warning partial record error, ssid: saveset_short_ssid saveset_long_ssid flags:0x00010101 size:0 files:0 tm:datetime cloneid
nsrmmdbd NSR notice media db must be scavenged
nsrmmdbd NSR critical media db scavenge failed
nsrmmdbd NSR warning Cannot scavenge path_to_mmvolume6 (Permission denied) - recover from backup media
nsrmmdbd NSR warning Cannot scavenge path_to_mmvolume6 (unknown error code) - recover from backup media
nsrmmdbd MDB warning can't fetch save set <saveset ID>
nsrmmdbd MDB warning Unable to fetch child save set <saveset ID> for cover set <saveset ID>
  • Plötslig förlust av många sparade uppsättningar från mediedatabasen eller en plötslig ökning av ledigt diskutrymme.
  • Programvara som inte gör att sparade uppsättningar upphör att gälla eller tas bort, vilket leder till snabb lagringsförbrukning.

Cause

Precis som alla databaser kan mediedatabasen skadas i varierande grad om det finns någon slutsats om dess normala drift, till exempel. 
  • Oväntad avstängning av nsrmmdbd-processen (kärndump, systemkrasch, omstart eller strömavbrott).
  • Avbruten transaktion (störningar i extern säkerhetsprogramvara eller minskat diskutrymme)
  • Logiskt internt problem (kodbugg eller ohanterade villkor).
  • Direkt störning av mediedatabasfiler eller spara uppsättningsfiler på NetWorker-hanterad lagring.
Mediedatabasen skyddas bäst mot skador med följande allmänna metoder:
  • Använd om möjligt en separat, lokal diskpartition för nsr/mm-mappen, vilket hjälper till att skydda mot förhållanden som utarmning av diskutrymme av andra processer. Den här partitionen bör vara minst 3 gånger större än mediedatabasen. en stor mediedatabas skulle för närvarande vara 10 GB; därför bör 100 GB räcka för alla installationer. 
  • Se till att arbetsflödet för serversäkerhetskopiering slutförs dagligen så att säkerhetskopior av mediedatabasen och kritiska haveriberedskapsresurser (Bootstrap) är tillgängliga i händelse av en katastrof.
  • Kontrollera platsen för Bootstraps med kommandot mminfo -B med jämna mellanrum.
  • Tillåt aldrig att NetWorker-serverns lagringsvolymer används av en annan NetWorker-server samtidigt, eftersom det kan leda till dataförlust.
  • Om ett antivirusprogram är installerat på NetWorker-servern skapar du undantag för katalogen /nsr för att förhindra att antivirusprogrammet genomsöker, ändrar eller tar bort NetWorker-filer. 
  • Undvik att ta bort filer i NetWorker-lagringsenheten manuellt för att försöka frigöra utrymme. NetWorker har utrymmesåtertagningsrutiner som körs dagligen, och support bör kontaktas om dessa anses vara bristfälliga.
  • För datazonsplanering bör du i allmänhet behålla data av samma typ i samma pooler för att underlätta underhållet vid behov, till exempel vProxy-sparuppsättningar, filsystemlagringsuppsättningar och Oracle-databasuppsättningar i separata pooler.
  • Ignorera inte meddelanden relaterade till mediedatabasfel – kontakta supporten om du har frågor.
Var medveten om NetWorkers mediedatabas och lagringsrelation och skydda volymer med flaggan Genomsökning krävs
  • NetWorker kör förfalloprocessen dagligen som en del av arbetsflödet för serversäkerhetskopiering. Det här jobbet beräknar kvarhållningar och beroenden och upphör att gälla för sparade uppsättningar som har passerat kvarhållningen och inte har några beroenden som inte har upphört att gälla. När detta är klart försöker NetWorker att ta bort alla sparade uppsättningar för diskvolymer som har upphört att gälla. Därefter körs åtgärden för att frigöra utrymme för varje volym, vilket tar bort sparuppsättningsfiler från diskmedia som inte har motsvarande mediedatabasposter. Det innebär att om mediedatabasen skadas, eller om du återställer databasen till en tidigare tidpunkt, kan giltiga data tas bort.
  • Om du anser att det är problem med diskvolymer bör du se till att giltiga data inte tas bort genom att se till att volymen är demonterad och markerad som Genomsökning krävs. Detta gäller även för volymer efter återställning till en tidigare tidpunkt (där giltiga sparuppsättningar kan finnas på disken som skapats efter återställningspunkten och därför inte har några poster i den återställda databasen). 
  • Genomsökning krävs möjliggör normal säkerhetskopiering, återställning och/eller kloning, men förhindrar normal utgångstid eller borttagning – så se till att den endast används för att skydda volymer som uppfattas vara i fara och tas bort när du återgår till normal drift. Volymer måste demonteras för att den här flaggan ska kunna anges eller tas bort. Det är vanligt att volymer markeras som "genomsökning krävs" efter haveriberedskap för NetWorker-server (nsrdr) för att förhindra förlust av oönskade data i ett katastrofåterställningsscenario.

Resolution

Det finns flera sätt att försöka verifiera och korrigera problem med mediedatabasen. Innan du försöker dig på något av dessa bör du skapa rapporter före och efter för att se om sparuppsättningar, volymer, klienter eller något annat har tagits bort.
På kommandoraden, i en katalog som värd för utdata, kör du följande kommandon för att jämföra mediedatabasegenskaper före och efter proceduren:
  • mminfo -C mminfo-C_pre.mmi
  • mminfo -X mminfo-X_pre.mmi
  • mminfo -ar "volid,type,location,pool,volume,state,volflags,written,savesets" -q family=disk -xc, > mminfo-vol_pre.mmi
När du har slutfört underhållet kör du var och en av dem till en separat fil (till exempel *_post.mmi) och jämför värdena.

nsrim – dagligt serverskydd

Varje dag körs arbetsflödet för Server Protection > Server Backup och därmed åtgärden Förfallodatum. Åtgärden Expiration kör nsrim, som är NetWorkers inbyggda underhållsverktyg. Detta kan också köras direkt, men kan ta allt från några minuter till flera timmar, beroende på serverbelastning och mediedatabasstorlek:
nsrim -X > nsrim.out 2>&1

Om inte den här processen inte körs dagligen är det inte osannolikt att det kommer att förändra något. Kontrollera daemonloggen för att se om nsrim är klar dagligen.

Omstart av tjänsten

Om du startar om NetWorker-tjänsterna tvingas olika startkontroller fram, vilket kan leda till problem i demonloggfelmeddelanden, och eventuellt korrigera felmeddelanden. Innan du stoppar tjänster, om databasproblem verkar vara allvarliga, se till att det finns tillräckligt med ledigt utrymme tillgängligt och att bootstrap-platser är kända (mminfo -B-utdata). Vi rekommenderar att du kör nsrmmdbasm -s nsr/mm/mmvolrel_path > mm.xdr först för att försöka extrahera en aktuell mediedatabaskopia. Innan du startar om tjänsterna skapar du en kopia av mappen mmvolrel eftersom den kan behövas i kriminaltekniskt syfte eller i återställningssyfte senare.

Export och återimport av mediedatabasen

Den här processen undviker en fullständig haveriberedskap genom att endast extrahera genomförbara mediedatabasposter och importera dem till servern igen utan att stoppa tjänsterna. Detta bör dock endast göras när servern är inaktiv och bör aldrig göras med jobb som körs. Använd den fullständiga sökvägen i stället för mmvolrel (som kan variera beroende på installation och operativsystem)
  1. Innan du börjar markerar du alla diskvolymer som Genomsökning krävs efter avmontering. Om automatisk mediehantering är inställt för enheter som är värdar för diskvolymer måste du inaktivera detta först. Bandvolymer behöver inte det här steget. 
  2. Kör de mminfo-kommandon som beskrivs i ingressen för att förbereda dina preliminära rapporter.
  3. Kontrollera storleken på mediedatabasens mmvolrel-mapp och post
  4. Se till att ingen av processerna nsrck, nsrim eller nsrmmdbasmkörs. Om det finns några stora, gamla eller inte nyligen ändrade filer i den överordnade MM-mappen, som MM[alfanumeriska], flyttar eller tar du bort dem om de inte är låsta av någon process.
  5. Kör kommandot för att packa upp mediedatabasen: nsrmmdbasm -s mmvolrel > mm.xdr
  6. Jämför storleken på den nya filen med storleken på mappen mmvolrel - om den skulle vara ungefär lika stor. Om den är liten (4 B eller en handfull kB) misslyckades kommandot. Om den är betydligt mindre kan skadade poster ha tagits bort som en del av processen.
  7. Förbered servern för att återställa mediedatabasen genom att ställa in serverns tillståndsfält haveriberedskap i NMC/NWUI eller med hjälp av nwadmin.
  8. Återställ direkt från mediedatabasens extrahera fil med kommandot nsrmmdbasm igen: nsrmmdbasm -r -2 < mm.xdr
  9. När du är klar kör du samma mminfo som beskrivs i ingressen och jämför sparade och skrivna värden per volym och ser till att alla volymer finns. på samma sätt bör mminfo -C-värden vara identiska.
  10. Om det finns några skillnader, notera och noga överväga hur du ska fortsätta, och kontakta supporten om du inte är säker på de resultat du ser:
    • För volymer som verkar vara problemfria kan du ta bort flaggan Genomsökning krävs och montera volymerna, eftersom det inte bör finnas någon risk för borttagning av sparade uppsättningar om inga sparade uppsättningar verkar ha tagits bort från volymen om de sparade uppsättningarna och de skrivna värdena är konsekventa. 
    • Volymer som visar färre sparade uppsättningar eller en lägre skriftlig summa bör lämna flaggan Genomsökning krävs på plats och köra scanner: scanner -i devicename för att återinföra filer som finns på volymen och som inte längre har poster. När genomsökningen har slutförts för varje volym kontrollerar du antalet sparade uppsättningar igen och tar bort flaggan Genomsökning krävs. Återmontera volymen när du är säker på att skannern har ersatt de sparuppsättningar som förväntas saknas.

NSRDR

Den fullständiga haveriberedskapen som utförs av nsrdr återställer inte bara mediedatabasen, utan även andra serverelement som resursdatabasen och jobbdatabasen. Läs manualen för bästa praxis för katastrofåterställning och tillgänglighet för servrar för din version innan du försöker gå vidare med den.
Det här kommandot förväntar sig att lagringsnoderna är online och kan kontaktas för att slutföras.
 
Obs! Kontakta alltid supporten om du har frågor eller funderingar, eftersom återställning av mediedatabasen kan leda till dataförlust för diskvolymer om flaggan Genomsökning krävs inte används för att skydda filsystem med livskraftiga sparuppsättningar som kanske inte har mediedatabasposter på grund av skada eller återställning till en tidigare tidpunkt.

Affected Products

NetWorker

Products

Data Backup & Protection Software, NetWorker Family
Article Properties
Article Number: 000223518
Article Type: Solution
Last Modified: 08 Apr 2024
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.