NetWorker: Fejlfinding af problemer med indlæsning af båndbibliotek i NetWorker
Summary: Denne artikel har til formål at hjælpe supportere og administratorer med fejlfinding af problemer med indlæsning af biblioteker på biblioteks- eller programniveau. For at afgøre, om problemet er logisk eller fysisk, og om det er et problem med robotten, drevet eller mediebåndkassetten. ...
Symptoms
- Sporadiske eller konsekvente fejl ved ilægning af båndkassetter i biblioteket
- Kan ikke udføre sikkerhedskopieringer eller gendannelser fra biblioteksmedier
- Biblioteket er detekterbart, bekræftet funktionelt og klar
- Kunne ikke udføre belastnings- eller etikethandlinger
- Tape, der mærkes »umærket«
- Mulige ASC/ASCQ/SCSI SENSE-fejl eller -meddelelser i system- eller programlogfiler
- Sporadiske eller konsistente fejl, der udfører specifikke eller tilfældige bibliotekshandlinger
Cause
Hvis bibliotekskonfigurationen fungerede tidligere og pludselig støder på et problem, skal du overveje mulige ændringer, der kan være i vejen for registrering og konfiguration:
- Ændring af robot-, switch- eller adapterfirmware, driver eller konfiguration
- Tilføjelse, udskiftning eller fjernelse af drev, båndkassetter eller andre bibliotekskomponenter
- Ændring af NetWorker-softwareversion, operativsystempatches
- Enhver hardwarehændelse som f.eks. strømtab eller genstart af en komponent i datastien
- Uoverensstemmelser mellem NetWorker-konfiguration og -bibliotek (f.eks. båndkassetter, der er flyttet uden for NetWorkers kontrol)
Hvis biblioteket aldrig har fungeret, skal du bekræfte, at hardwaren understøttes i NetWorker-vejledningen til hardwarekompatibilitet (kræver login til Dell-supportkontoen). Husk, at det er muligt for et bibliotek at være delvist funktionelt; Discovery alene garanterer ikke brugervenlighed eller supportabilitet.
Resolution
For at fejlfinde biblioteksindlæsningsproblemer, efter at have overvejet de sidst kendte ændringer, fejlfindes ved at uddelegere processen til dens primitive bestanddele og teste dem individuelt.
De nødvendige data indsamles NSRGet Når du kører med -o:d Skifte. NetWorker: Sådan bruges NSRGet-værktøjet til dataindsamling i NetWorker
De genstande, der ikke er det, er begrænset til de operationer, der kan betragtes som farlige, hvis de forsøges manuelt.
Indlæsning af bibliotek: Kommunikation
- Sørg igen for, at biblioteket er lydhørt og klar, før du fortsætter. Hvis det ikke gør:
Indlæsning af bibliotek: Fysisk drift
- Kontroller, at biblioteksdrift er fysisk mulig på et grundlæggende niveau. Sørg for, at testen udføres, når biblioteket ellers ikke er aktivt, og at båndkassetterne udskiftes på deres oprindelige placering.
sjirdtag <changer address>
Flyt derefter båndkassetterne mellem elementerne og tilbage igen:
sjimm <changer address> <drive|slot|inlt|mt> <element_number> <drive|slot|inlt|mt> <element_number>
- Der er nogle situationer, hvor fejl kan forventes; Biblioteker, for hvem Skub automatisk ud ikke er aktiveret på biblioteksniveau, får f.eks. en fejl, når de forsøger at flytte fra drev til et andet element (båndkassetten skal skubbes ud separat over en
mt -f <device_handle> offlinekommando, før du flytter ud af elementet). - Hvis fejl returneres sporadisk eller konsekvent under forsøg på robotoperationer, SCSI ASC/ASCQ-kodefejl, skal du overveje eskalering til biblioteksleverandøren til gennemgang.
Indlæsning af bibliotek: Logisk betjening
Når vi har konstateret, at fysiske operationer er fejlfri (i det mindste overfladisk), kan vi forsøge at spore problemet inden for NetWorker.
- Bestem bibliotekets layout, og sørg for, at det er parat, ved at sammenligne NSR Jukebox-tilstandsoplysningerne med robottens båndpatronoplysninger:
nsrjb [<-j library_name>] -C sjirdtag <changer address>
- Forsøg at indlæse et berørt bånd i et berørt drev med høj nøjagtighed:
nsrjb [<-j library_name>] -lvvvvv -f <device_handle> -S <slot_number>
Hvis biblioteket indlæses gentagne gange uden problemer, kan belastningsproblemet skyldes specifikke situationsfaktorer snarere end en vedvarende fejl. Alle bestræbelser skal gøres for at isolere den tilstand, der fører til belastningsfejl, og fejlfinding af tilstanden skal følge (se nedenfor).
- Hvis regelmæssige belastningshandlinger mislykkes, især hvis diskenhederne er markeret som "umærkede", er den læste etiket mislykkedes under indlæsningsforsøget (hvilket får monteringen til at mislykkes). Forsøg at genindlæse den samme tape i det samme drev i høj rækkefølge uden at montere:
nsrjb [<-j library_name>] -lnvvvvv -f <device_handle> -S <slot_number>
- Udføre en enkeltstående etiketverificering for at teste for at se, om etikettens læsefejl var forbigående eller er konsekvent:
nsrmm -pvvvvv -f <device_handle>
- Hvis etiketten læses korrekt, kan problemet løse sig ved, at etiketlæsningsforsøgene finder sted, før båndenheden er klar, efter fysisk ilægning af den. I dette tilfælde kan du prøve at indstille variablen i systemmiljøet eller opstartsscriptet:
MAX_LOAD_RETRIES=10
Hvis belastningshandlingen stadig ser ud til at mislykkes under en sammensat belastning/montering (etiketlæsning) efter indstilling af variablen, skal du gå til afsnittet Fejlfinding.
Indlæsning af bibliotek: Fejlfinding
Hvis alt andet fejler, skal du indsamle de relevante data for at hjælpe med at fejlfinde problemet, før du konsulterer fageksperter (SMV'er):
- Før du genopretter problemet i NetWorker, skal du ændre fejlfindingssporingsniveauet til 5 i NSR Jukebox-ressourcen
- Brug også
dbgcommandfor at øge fejlretningsniveauet for kørslennsrdognsrmmgdprocesser til 5dbgcommand -n PROCESS_NAME Debug=5- Sådan deaktiverer du:
dbgcommand -n PROCESS_NAME Debug=0 - NetWorker: Niveauer med oplysninger om fejlfinding
- Overveje
truss/tusc/strace,pstack,gcore/gencorepå det relevantensrlcpdFør og under hændelsen med problemet - Indstil fejlfindingsvariablerne i systemmiljøet (Windows) eller startscriptet (UNIX) for at få rigere fejlfindingsdata:
SJI_DEBUG=9 LUS_DEBUG=9 CDI_DEBUG=9 SCSI_DEBUG=9 JBDEBUG=9
Hvis ingen af ovenstående forslag hjælper, skal du kontakte support efter behov fra din biblioteksleverandør, hvis den dokumentation, der er indsamlet fra fejlfindingen, tyder på interne uregelmæssigheder, jf. Fejlfinding af problemer med registrering af båndbibliotek i NetWorkerog Fejlfinding af adgangsproblemer til båndbibliotek i NetWorker; Ellers, skal du sikre, at fejlfindingsoutputtet eskaleres i NetWorker-support for at forfølge muligheden for en kodefejl.
Additional Information
Denne artikel hører til i en serie i Fejlfinding i båndbiblioteker med NetWorker.