NetWorker: Vedlikehold og feilsøking av mediedatabasen

Summary: Denne artikkelen beskriver metoder for å identifisere og behandle problemer knyttet til mediedatabasen, samt beste praksis for vedlikehold og beskyttelse.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  • Kunne ikke starte tjenestene.
  • Feil i den daglige arbeidsflyten for sikkerhetskopiering av serverbeskyttelsesserver>.
  • Ufullstendig eller villedende informasjon relatert til lagringssett eller klienter som returneres av mminfo-kommandoen , eller når du spør eller blar gjennom lagringssett i administrasjon av NetWorker Management Console (NMC) eller NWUI-grensesnitt (NetWorker Web User Interface).
  • Problemer med sikkerhetskopiering, gjenoppretting eller kloning relatert til manglende evne til å finne lagringssett, klienter eller volumer.
  • Feil i serverens daemonlogg eller konsoller relatert til mediedatabasen:
nsrmmdbd WiSS code assertion error (st_nextrec: rec loop detected)
nsrmmdbd error, ss_clone_ensure_clone_eligibility: assertion, invalid parameters or code segment
nsrmmdbd XCHK ssid:saveset_short_ssid host:saveset_hostname name:saveset_name has a fragment with an invalid volid:saveset_volid
nsrmmdbd NSR warning WiSS code assertion error (ST_readvdir: directory read failed)
nsrmmdbd NSR critical Unexpected error reading long record directory: an invalid slot number
nsrmmdbd NSR warning partial record error, ssid: saveset_short_ssid saveset_long_ssid flags:0x00010101 size:0 files:0 tm:datetime cloneid
nsrmmdbd NSR notice media db must be scavenged
nsrmmdbd NSR critical media db scavenge failed
nsrmmdbd NSR warning Cannot scavenge path_to_mmvolume6 (Permission denied) - recover from backup media
nsrmmdbd NSR warning Cannot scavenge path_to_mmvolume6 (unknown error code) - recover from backup media
nsrmmdbd MDB warning can't fetch save set <saveset ID>
nsrmmdbd MDB warning Unable to fetch child save set <saveset ID> for cover set <saveset ID>
  • Plutselig tap av mange lagringssett fra mediedatabasen, eller et plutselig hopp i ledig ledig disklagringsplass.
  • Programvare som ikke utløper eller sletter lagringssett, fører til raskt lagringsforbruk.

Cause

Som enhver database kan mediedatabasen bli skadet i varierende grad der det er noen slutning med normal drift, for eksempel. 
  • Uventet avslutning av nsrmmdbd-prosessen (kjernedump, systemkrasj, omstart eller strømbrudd).
  • Avbrutt transaksjon (forstyrrelser i eksternt sikkerhetsprogram eller uttømming av diskplass).
  • Logisk internt problem (kodefeil eller ubehandlede forhold).
  • Direkte forstyrrelser i mediedatabasefiler eller lagre settfiler på NetWorker-administrert lagring.
Mediedatabasen er best beskyttet mot skade med følgende generelle praksiser:
  • Hvis det er mulig, bør du bruke en separat, lokal diskpartisjon for nsr/mm-mappen, som bidrar til å beskytte mot forhold som for eksempel tømming av diskplass i andre prosesser. Denne partisjonen skal være minst 3x størrelsen på mediedatabasen; en stor mediedatabase for tiden ville være 10 GB; Derfor bør 100 GB være nok for enhver installasjon. 
  • Kontroller at arbeidsflyten for sikkerhetskopiering av server fullføres daglig, slik at sikkerhetskopiering av mediedatabasen og kritiske nødgjenopprettingsressurser (Bootstrap) er tilgjengelige i tilfelle en katastrofe.
  • Bekreft plasseringen av oppstartsstropper med mminfo -B-kommandoen med jevne mellomrom.
  • Du må aldri tillate at NetWorker-serverens lagringsvolumer åpnes av en annen NetWorker-server samtidig, siden dette kan føre til tap av data.
  • Hvis antivirusprogramvare er installert på NetWorker-serveren, må du opprette utelatelser for /nsr-katalogen for å hindre at antivirusprogramvaren skanner, endrer eller fjerner NetWorker-filer. 
  • Unngå å slette filer i NetWorker-lagring manuelt for å forsøke å frigjøre plass. NetWorker har rutiner for gjenvinning av plass som kjører daglig, og support bør kontaktes hvis disse anses å være mislykket.
  • For Datazone-planlegging bør du generelt holde data av samme type i de samme utvalgene for enkelt vedlikehold når det er nødvendig, for eksempel vProxy-lagringssett, filsystemlagringssett og Oracle-databaselagringssett i separate grupper.
  • Ikke ignorere meldinger relatert til mediedatabasefeil - kontakt kundestøtte hvis du har bekymringer.
Vær oppmerksom på NetWorkers relasjon for mediedatabase og lagring, og beskytt volumer med Skann nødvendig-flagget
  • NetWorker kjører utløpsprosessen daglig som en del av arbeidsflyten for sikkerhetskopiering av server. Denne jobben beregner oppbevaringer og avhengigheter og utløper lagringssett som er forbi oppbevaringen, og som ikke har noen avhengige som ikke er utløpt. Når dette er fullført, prøver NetWorker å slette alle utløpte lagringssett for diskvolum. Etter dette kjører plassgjenvinningsoperasjonen for hvert volum, og sletter lagrede settfiler fra diskmedier som ikke har tilsvarende oppføringer i mediedatabasen. Dette betyr at hvis mediedatabasen blir skadet, eller du gjenoppretter databasen til et tidligere tidspunkt, kan gyldige data bli slettet.
  • Hvis du mener at det er et problem med noen diskvolumer, må du sørge for at volumet ikke blir slettet for å sikre at gyldige data ikke blir slettet og merket som Skanning nødvendig. Dette gjelder også volumer etter gjenoppretting til et tidligere tidspunkt (der det kan finnes gyldige lagringssett på disk som ble opprettet etter gjenopprettingspunktet, og derfor ikke har noen oppføringer i den gjenopprettede databasen). 
  • Skanning nødvendig tillater normal sikkerhetskopiering, gjenoppretting og/eller kloning, men forhindrer normal utløp eller sletting – så sørg for at den bare brukes til å beskytte volumer som anses å være i fare, og fjernes når du går tilbake til vanlig drift. Volumene må demonteres for å angi eller fjerne dette flagget. Det er vanlig at volumer merkes som "skanning nødvendig" etter NetWorker Server Disaster Recovery (nsrdr) for å forhindre uønsket tap av data i et scenario med katastrofegjenoppretting.

Resolution

Det er flere måter å forsøke å verifisere og rette opp problemer med mediedatabasen på. Før du prøver noen av disse, for å vurdere virkningene, må du opprette rapporter før og etter for å se om lagringssett, volumer, klienter eller noe annet er fjernet.
Kjør følgende kommandoer i en katalog for å være vert for utdata på kommandolinjen for å sammenligne egenskapene for mediedatabasen før og etter prosedyren:
  • mminfo -C mminfo-C_pre.mmi
  • mminfo -X mminfo-X_pre.mmi
  • mminfo -ar "volid, type, location, pool, volume, state, volflags, skrevet, savesets"-q family = disk-xc, > mminfo-vol_pre.mmi
Når du har fullført vedlikeholdet, kjører du hver fil på nytt til en egen fil (for eksempel *_post.mmi) og sammenligner verdier.

nsrim - daglig serverbeskyttelse

Hver dag kjører Server Protection > Server Backup-arbeidsflyten, og med den utløpshandlingen. Utløpshandlingen kjører nsrim, som er NetWorkers opprinnelige vedlikeholdsverktøy. Dette kan også kjøres direkte, men kan ta alt fra flere minutter til flere timer, avhengig av serverbelastning og størrelsen på mediedatabasen:
nsrim-X > nsrim.out 2> &1

Med mindre denne prosessen ikke kjører daglig, er dette ikke usannsynlig å endre noe. Sjekk demonloggen for daglig fullføring av nsrim .

Omstart av tjenesten

Omstart av NetWorker-tjenestene tvinger ulike oppstartskontroller som kan avsløre problemer i bakgrunnsprosessloggfeilmeldinger og potensielt korrigere noen. Hvis databaseproblemene ser ut til å være alvorlige før tjenestene stoppes, må du kontrollere at det er nok ledig plass og at plasseringen av oppstartsstroppene er kjent (mminfo -B-utdata). Ideelt sett bør du først kjøre nsrmmdbasm -s nsr/mm/mmvolrel_path > mm.xdr for å prøve å pakke ut en kopi av gjeldende mediedatabase. Før du starter tjenestene på nytt, må du opprette en kopi av mmvolrel-mappen, da det kan være nødvendig for rettsmedisinske formål eller gjenopprettingsformål senere.

Eksport og reimport av mediedatabasen

Denne prosessen unngår en fullstendig katastrofegjenoppretting ved bare å trekke ut levedyktige mediedatabaseposter, og importere dem på nytt til serveren uten å stoppe tjenestene. Dette bør imidlertid bare gjøres når serveren er inaktiv, og bør aldri forsøkes med jobber som kjører. Bruk hele banen i stedet for mmvolrel (som kan variere basert på installasjon eller operativsystem)
  1. Før du begynner, merker du alle diskvolumer som Skanning nødvendig etter demontering. Hvis Auto Media Management er angitt for enheter som er vert for diskvolumer, må du deaktivere dette først. Båndvolumer trenger ikke dette trinnet. 
  2. Kjør mminfo-kommandoene som er beskrevet i innledningen for å forberede de foreløpige rapportene.
  3. Kontroller størrelsen på mediedatabasen mmvolrel mappen og ta opp
  4. Kontroller at ingen av nsrck-, nsrim- og nsrmmdbasm-prosessenekjører; Hvis det er noen store, gamle eller ikke nylig endrede filer i MM-overordnet mappe som mm [alfanumerikk], flytt eller slett hvis de ikke er låst av noen prosess.
  5. Kjør kommandoen for å pakke ut mediedatabasen: nsrmmdbasm -s mmvolrel > mm.xdr
  6. Sammenlign størrelsen på den nye filen med størrelsen på mmvolrel-mappen - hvis den skal være like stor. Hvis den er liten (4 B eller en håndfull KB), mislyktes kommandoen. Hvis det er betydelig mindre - kan det ha blitt korrupte poster fjernet som en del av prosessen.
  7. Klargjør serveren for å gjenopprette mediedatabasen ved å sette serverens tilstandsfelt til katastrofeoppretting i NMC/NWUI eller ved hjelp av nwadmin.
  8. Gjenopprett direkte fra utpakkingsfilen for mediedatabasen ved å bruke kommandoen nsrmmdbasmigjen: nsrmmdbasm -r -2 < mm.xdr
  9. Når du er ferdig, kjør samme mminfo som beskrevet i innledningen og sammenlign lagre sett og skrevne verdier, per volum, og sørg for at alle volumene er til stede; På samme måte bør mminfo -C-verdier være identiske.
  10. Hvis det er noen ulikheter, ta notat og nøye vurdere hvordan du skal fortsette, og kontakt kundeservice hvis du ikke er trygg på resultatene du ser:
    • For volumer som ser ut til å være i god stand, kan du fjerne Skann nødvendig-flagget og montere volumene, da det ikke skal være fare for sletting av lagringssett hvis ingen lagringssett ser ut til å ha blitt fjernet fra volumet hvis lagringssettene og de skrevne verdiene er konsistente. 
    • Volumer som viser færre lagringssett eller en lavere skriftlig total, bør la Skann nødvendig-flagget være på plass og kjøre skanner: scanner -i devicename for å gjeninnføre filer som finnes på volumet som ikke lenger har poster. Når skanneren er fullført for hvert volum, kontrollerer du antall lagringssett på nytt og fjerner flagget for skanning nødvendig. Monter volumet på nytt når du er sikker på at skanneren har erstattet lagringssett som forventes å mangle.

nsrdr

Den fullstendige katastrofegjenopprettingen utført av nsrdr gjenoppretter ikke bare mediedatabasen, men også andre serverelementer som ressursdatabasen og jobbdatabasen. Se veiledningen for gjenoppretting og tilgjengelighet etter katastrofer for serveren for din versjon før du prøver å fortsette med dette.
Denne kommandoen forventer at lagringsnodene er tilkoblet og tilgjengelige for å fullføre.
 
MERK: Kontakt alltid kundestøtte hvis det oppstår spørsmål eller bekymringer, siden gjenoppretting av mediedatabasen kan føre til tap av data for diskvolumer hvis flagget Skann nødvendig ikke brukes til å beskytte filsystemer med levedyktige lagringssett som kanskje ikke har mediedatabaseoppføringer på grunn av skade eller gjenoppretting til et tidligere tidspunkt.

Affected Products

NetWorker

Products

Data Backup & Protection Software, NetWorker Family
Article Properties
Article Number: 000223518
Article Type: Solution
Last Modified: 08 Apr 2024
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.