NetWorker: Felsöka problem med bandbibliotek i NetWorker
Sammanfattning: Den här artikeln är avsedd att hjälpa både NetWorker-support och NetWorker-säkerhetskopieringsadministratörer att hantera och felsöka problem med bandbibliotek.
Instruktioner
Innan du undersöker problem med bandbibliotek är det viktigt att tänka på följande:
- Bandenheter läser och skriver data och etiketter till media och tillhandahåller alla mediafunktioner. De kan inte flytta bandkassetterna själva
- Bandbibliotek flyttar mediebandkassetter från element till element: Enheter, kortplatser och import- och exportportar, och läser eller skriver inga data
Om NetWorker-åtgärder misslyckas på grund av att det inte går att flytta bandkassetter finns det flera möjliga allmänna orsaker:
- Problem med maskinvara eller fast programvara med biblioteksrobot eller interna delar
- Anslutningsproblem från NetWorker-värd till biblioteksrobotik under transport
- OS-, drivrutins- eller kompatibilitetsproblem mellan NetWorker-värd och bibliotek
- NetWorker-konfigurationsproblem som rör bandbibliotekstyp, tillstånd och adressering
Följ dessa steg kronologiskt för att fastställa problemets natur och eventuellt lösa det. Om det här dokumentet inte löser problemet innehåller det tester som begränsar problemet och hjälper en specialist att fortsätta arbetet.
1. Miljöinformation
Från NetWorker-servern och berörda lagringsnoder:
- Värdnamn, OS-typ och version.
- NetWorker-version och build-nummer.
- Utdata från '
inquire' som visar band och bibliotek. - Zippad kopia av aktuell
nsrdb(för att bevara aktuell jukeboxinformation vid behov, för återställning)
Linux:/nsr/res/nsrdb
Windows (Standard):C:\Program Files\EMC NetWorker\nsr\res\nsrdb - Lagringsnod, NetWorker-namn för bibliotek och lista över berörda noder, enheter och volymer
- Problemets gemensamma egenskaper (specifika volymer, specifika enheter, specifika noder osv.)
nsrget -o:d på berörda servrar och noder.
-o:d på vilken värd som helst med band där banden är upptagna med att skriva. Du kan kontrollera detta från NetWorker Management Console (NMC) under Övervakning –>Enheter.
Följande artikel innehåller information om hur du hämtar och använder NSRGET: NetWorker: Så här använder du datainsamlingsverktyget NSRGet i NetWorker (På engelska)
2. Testa bibliotekets beredskap
- Kontrollera om ägaren till lagringsnoden för det berörda biblioteket är aktiverad och klar:
- I NMC går du till Enheter –>Lagringsnoder.
- Kontrollera att Visa –>Diagnostikläge är aktiverat.
- Kontrollera kolumnerna Aktiverad och Klar i fönstret till höger.
- Om en lagringsnod som förväntas vara aktiverad inte är aktiverad högerklickar du på lagringsnoden och klickar på Aktivera/inaktivera för att aktivera den.
- Om lagringsnoden inte blir klar inom en minut eller två måste du följa upp separat. Biblioteket svarar inte eftersom dess lagringsnod inte är tillgänglig.
- Kontrollera om det berörda biblioteket är aktiverat och klart:
- I NMC går du till Enheter –>Bibliotek.
- Kontrollera att Visa –>Diagnostikläge är aktiverat.
- Kontrollera kolumnerna Aktiverad och Klar i fönstret till höger. Om Biblioteket visar statusen Klar går du vidare till avsnitt [
4]. - Om den inte är aktiverad kan du högerklicka på biblioteksinstansen till vänster och välja "Aktivera/inaktivera" för att återaktivera den.
- När den är aktiverad, vänta en minut eller två, klicka igen på biblioteksbehållaren och se om en grön bock visas i kolumnen "Klar".
- Om biblioteket inte blir klart högerklickar du på biblioteksinstansen till vänster, väljer Egenskaper och på fliken Allmänt kontrollerar du att värdet Kontrollport matchar
scsidev@#.#.#adressen du ser fråninquireKommandot. - Om kontrollporten inte matchar, ställ in Aktiverad på Nej och klicka på OK; Ange sedan egenskaperna igen och ändra kontrollporten så att den matchar
inquireIdentifierad adress. När du har uppdaterat Control Port ändrar du tillbaka Enabled till Yes och klickar på OK igen för att aktivera igen. Vänta en minut eller två för att se om biblioteket blir klart. - Slutligen, om biblioteket inte kan bli Klar efter korrigering av kontrollportsvärdet, anger du egenskaperna för biblioteket en sista gång. Under fliken Avancerat anger du Felsökningsspårningsnivå till 5. och Inaktivera och återaktivera igen för att registrera startsekvensen i daemonloggen i två minuter.
När du återaktiverar biblioteket i avsnitt [2.2] bekräftar du att nsrlcpd Startar på den avsedda lagringsnoden. Kontrollera också att den inte stannar eller startar om av sig själv. Om process-ID:t (PID) fortsätter att ändras tyder det på att processen stoppas eller dödas av programvaran eller dumpningskärnan. Var också uppmärksam på namnmatchningsproblem mellan server och lagringsnod, vilket kan förhindra start. Namnet som servern matchar för noden ska matcha nodernas eget nsrladb-namn och serverns namn för noden.
- Se Felsöka problem med bandbibliotek i NetWorker för avancerad felsökningsinformation om problem med biblioteksberedskap.
- Se felsökningsguide för NetWorker: Bearbeta krascher och kärndumpar om du ser eller misstänker att nodens
nsrexecd,nsrsnmdEllernsrlcpdär kärndumpning.
En detaljerad översikt över NetWorker-processer per värd finns i: NetWorker-processer och portar
Meddelanden om dessa tjänster loggas i värdens daemon.raw:
- Linux:
/nsr/logs/daemon.raw - Windows (Standard):
C:\Program Files\EMC NetWorker\nsr\logs\daemon.raw - NetWorker: Så här använder du nsr_render_log för att återge .raw loggfiler
3. Ta reda på hur snabbt biblioteket fungerar:
Om biblioteket inte blir klart, och du inte kan fastställa en orsak, se till att biblioteket självt kan kontaktas:
- Kontrollera
inquireutdata från noden från [1.3] och se till att biblioteket visas i utdata som 'Autochanger', och notera SCSI#.#.#Adress. - Om biblioteket inte visas i
inquireutdata, kontrollera att operativsystemet kan identifiera det. Solaris-värdar rapporterar inte biblioteket om det är konfigurerat och aktiverat i NetWorker. Om du vill ha hjälp kan du läsa Felsöka problem med identifiering av bandbibliotek i NetWorker. - Se till att biblioteket svarar på grundläggande bibliotekskommandon. Om du använder SCSI-adressen i [
3.1], kör: 'sjisn #.#.#'. Mer information om testkommandon för bibliotek finns i Felsöka problem med åtkomst till bandbibliotek i NetWorker. - Om SJI-kommandona misslyckas bör du överväga möjligheten till transport- eller maskinvaruproblem: Se Felsöka maskinvaruproblem med bandbibliotek i NetWorker om du vill ha hjälp.
- Om problemet är att operativsystemet inte upptäcker biblioteket och svarar korrekt på SJI-kommandon och NetWorker inte kan identifiera det, kan du prova att använda
jbconfigoch välja alternativ 2; Om detta inte fungerar kan du prova med alternativ 4, ange biblioteksadressen manuellt och konfigurera som ett standardbibliotek (alternativ 56). Se Felsöka problem med bandbibliotek i NetWorker för mer information.
4. Testa bandets rörelse och volymhälsa
Om biblioteket är klart och verkar svara, men har problem med att läsa in volymer, finns det många olika möjliga orsaker.
- Töm hela biblioteket om det är möjligt; Om du kan stoppa andra åtgärder högerklickar du och återställer biblioteket från fliken Enheter ->Bibliotek .
- Försök att ladda en enda bandkassett i en enda enhet, där båda tros påverkas av laddningsproblem; lasta av efter varje försök efter behov.
- Jämför med samma volym i olika enheter och olika volymer i enheten som tros vara påverkad; Anteckna felen och mönstren, om sådana finns.
- Om volyminläsningen misslyckas på ett tillförlitligt sätt, oavsett enhet, kan du prova följande etikettkontroll:
- Ladda volymen utan montering om tejpkassetten rör sig utan fel, du har verifierat att armen är mekaniskt funktionell.
- Kör
nsrmm -pv -f networker_deviceOm den svarar med en verifierad etikett har du verifierat att mediet också är giltigt och felfritt. - I egenskaperna för biblioteket, med diagnostiskt läge aktiverat, går du till fliken Timers och ställer in Load Sleep till 60 innan du klickar på OK.
- Ta bort volymen och försök sedan att läsa in volymen igen Om det nu lyckas var problemet troligen ett tidsproblem (du kan experimentera med lägre strömsparlägesvärden tills det börjar fungera igen).
- Om den
nsrmmKommandot misslyckades, ytterligare testning krävs. Inaktivera den aktuella enheten i NMC genom att högerklicka och välja Aktivera/Inaktivera.- Kör
scannerKommandot på enheten:- För NetWorker-serverns lokala lagringsnod kör du:
scanner -nizv local_device - För på en "fjärransluten" NetWorker-lagringsnod kör du:
scanner -s server -nizv local_device
- För NetWorker-serverns lokala lagringsnod kör du:
- Bryt efter ~20 rader och kontrollera etiketten läsmeddelanden; Framgång indikeras av
8936:scanner: scanning media_type tape volume_name on device_name. - Om
scannerreturnerar meddelandet oväntat filnummer, ville ha 2, fick higher_number dataförlust har inträffat, troligen på grund av SCSI-återställning; check Felsöka överskrivna etiketter och SCSI-återställningar i NetWorker.
- Kör
- Om den
scannerreturnerar enmessage 8945:scanner: Read: -1 bytesFastställ om volymen kan avläsas på andra noder eller enheter och fastställ problemets trend. Om du upptäcker att vissa volymer kan läsas på vissa noder, men inte andra, och enheten är LTO-4 eller högre, bör du överväga enhetsdekrypteringsfel: LTO-maskinvarukryptering och NetWorker.
Mer avancerad information om medieverifiering finns i: Felsöka problem med mediemontering i NetWorker.
5. Test av enhetsbeställningsproblem
Om laddnings- och monteringskommandon lyckas men etikettläsningar eller enkla monteringar misslyckas kan problemet involvera felaktig enhetsordning.
- Töm hela biblioteket om det är möjligt; Om du kan stoppa andra åtgärder högerklickar du och återställer biblioteket från Enheter ->Bibliotek.
- Försök att ladda en enda bandkassett i en enda enhet, där båda tros påverkas av laddningsproblem; lasta av efter varje försök efter behov.
- Jämför med samma volym i olika enheter och olika volymer i enheten som tros vara påverkad; Anteckna felen och mönstren, om sådana finns.
- Om en last misslyckas på ett tillförlitligt sätt kan du prova följande etikettkontroll:
Mer avancerad hjälp med problem med biblioteksinläsning finns i: Felsöka problem med inläsning av bandbibliotek i NetWorker.
Om alla dessa tester har misslyckats och du inte har kommit längre, se till att du dokumenterar dina resultat per steg i den här artikeln och kontakta NetWorker-supporten. Tydliga detaljer är avgörande för att påskynda lösningar och se till att "upprepade steg" begränsas.