Odstraňování problémů s uvolněním páskové knihovny v nástroji NetWorker
Summary: Tento článek pomáhá podporovatelům a správcům zálohování řešit problémy s uvolněním knihovny na úrovni knihovny nebo aplikace. Identifikuje, zda se jedná o logický nebo fyzický problém a zda se týká robota, jednotky nebo kazety s médiem. ...
Symptoms
- Sporadické nebo konzistentní chyby při uvolňování páskových kazet z jednotek
- Narušená zálohovací okna kvůli selhání odlehčení
- Páskové kazety uvízlé v jednotkách
- Knihovna je zjistitelná, potvrzena jako funkční a připravená
- Možnost provádět operace načtení a označení, ale nelze ji uvolnit
- Možná
ASC / ASCQ / SCSIChyby nebo zprávy SENSE v systémových protokolech či protokolech aplikací.
Cause
Pokud konfigurace knihovny dříve fungovala a najednou došlo k problému, zvažte možné změny, které mohou bránit detekci a konfiguraci:
- Změna firmwaru robota, přepínače nebo adaptéru, ovladače nebo konfigurace
- Přidání, výměna nebo odebrání jednotek, páskových kazet nebo jiných součástí knihovny
- Změna verze softwaru NetWorker, opravy operačního systému
- Jakákoli hardwarová událost, jako je ztráta napájení nebo restartování jakékoli komponenty v datové cestě.
- Nesrovnalosti mezi konfigurací a knihovnou NetWorker (například páskové kazety přesunuté mimo kontrolu NetWorker)
Pokud knihovna nikdy nefungovala, ověřte, zda je hardware podporován v NetWorker Hardware Compatibility Guide. Pamatujte, že je možné, aby knihovna byla částečně funkční; Zjišťování samo o sobě nezaručuje použitelnost nebo podporu.
Známé příčiny problémů s uvolněním knihovny:
- Principy a odstraňování problémů s uvolněním médií z páskové knihovny
- Páskové svazky se občas nedaří vysunout
Resolution
Po kontrole posledních změn vyřešte problémy s uvolněním knihovny tak, že proces rozdělíte na základní komponenty a otestujete každou zvlášť.
Požadovaná data shromažďuje nástroj NSRGet při spuštění pomocí příkazu -o:d . Skript vyloučí operace, které by mohly být nebezpečné, pokud by byly spuštěny automaticky, například ty, které není bezpečné provádět prostřednictvím kolektoru.
VÝSTRAHA: Některé příkazy mohou vyvolat resetování SCSI a způsobit převíjení páskových zařízení zpět. Nepoužívejte je, pokud jsou některé pásky aktivní a přístupné hostiteli.
Uvolnění knihovny: Komunikace
- Než budete pokračovat, ujistěte se, že knihovna reaguje a je schopna načíst pásky. Pokud není:
Odstraňování problémů s připraveností páskové knihovny v nástroji NetWorker
Odstraňování potíží s přístupem k páskové knihovně v nástroji NetWorker
Odstraňování problémů s detekcí páskové knihovny v nástroji NetWorker
Odstraňování problémů s hardwarem páskové knihovny v nástroji NetWorker
Uvolnění knihovny: Příprava nakládky
- Pokud se chcete připravit na některý z následujících testů, připravte se na načtení testovacího svazku. Nejprve uvolněte všechna zařízení, abyste předešli záměně:
nsrjb -HHvvvvv
- Ujistěte se, že jsou zařízení prázdná, a to přímým dotazem na NetWorker i robota. Najděte také slot s volným svazkem:
nsrjb -C
sjirdtag <robot SCSI address>
- Chcete-li zakázat neočekávané operace uvolnění, nastavte vlastnost NSR Jukebox Idle Device Timeout páskové knihovny, kterou používáte, na hodnotu 0.
- Načtěte svazek do zařízení pomocí běžných příkazů NetWorker, kde v ideálním případě došlo k problémům s uvolněním v obou případech:
nsrjb -lnvvvvv -f <NetWorker device name> -S <slot number>
- Spuštěním příkazu na příslušném hostiteli ověřte, že se svazek zobrazuje v zařízení, které jste právě načetli:
mt -f <local device name> status
nsrmm -pvvvvv -f <full NetWorker device name>
- Pokud dojde k nesrovnalostem se svazky, ověřte, že načtení a připojení proběhlo úspěšně. Pokud se připojení nezdaří a svazek je okamžitě vysunut, můžete pokračovat v odstraňování problémů s připojením pomocí článku Odstraňování problémů s připojením k chybě připojení v programu NetWorker. Pokud si přejete pokračovat bez ohledu na řešení problémů s uvolněním selhání, můžete to zkusit znovu načtením bez připojení (
nsrjb -lnvvvvvnamístonsrjb -lvvvvvvýše)
Uvolnění knihovny: Fyzický provoz (vyhození)
- Chcete-li otestovat funkci vysunutí páskové kazety, kterou jste vložili v předchozím kroku, použijte nativní (nebo portovanou v systému Windows)
mt(můžete také vyzkoušet ekvivalent příkazu CDI, který používá dodatečný kód NetWorker, ale umožňuje použítCDI_DEBUGproměnná)
mt -f <local device name> offline
cdi_load_unload -u -f /dev/nst0 -vvvvvv
- Zkontrolujte výstup a potvrďte, že vysunutí bylo skutečně dokončeno pomocí nativního/portovaného
mtnebo ekvivalentní CDI:
mt -f <local device name> status
cdi_get_status -f /dev/nst0 -vvvvvv
- Před úplným uvolněním znovu načtěte svazek do páskového zařízení:
cdi_load_unload -l -f /dev/nst0 -vvvvvv
- Pokud operace vysunutí nepoužije nativní operace nebo operace příkazu CDI, zvažte možnost problémů s jednotkou nebo páskovou kazetou a proveďte test pomocí mechanismů nižší úrovně, než je úroveň ovladače:
- Pokuste se přesunout hlasitost ze samotného ovládacího rozhraní robota
- Pokus o přesunutí svazku z LCD panelu fyzické knihovny
- Pokus o přesunutí svazku z rozhraní příkazového řádku virtuální knihovny
- Opakujte stejnou operaci s jinou jednotkou a jinou páskovou kazetou, abyste otestovali rozsah problému
- Naplánujte hovor dodavateli, pokud dojde k problémům s výše uvedenými pokusy o vysunutí/přesun
- Pokud se vysunutí nezdaří, ale nízkoúrovňová rozhraní mohou pohybovat páskovými kazetami, problém pravděpodobně souvisí s ovladačem
- Zkontrolujte protokoly a výstupy operačního systému (
dmesg, messages, errpt -a, syslog,Protokol systémových událostí) - Zvažte problémy s objednáváním disků.
- Zkontrolujte protokoly a výstupy operačního systému (
Uvolnění knihovny: Fyzický provoz (pohyb kazety s páskou)
- Zkontrolujte, zda jsou operace knihovny fyzicky možné na základní úrovni. Ujistěte se, že se testování provádí, když knihovna není jinak aktivní, a ověřte, že kazeta s testovací páskou je tam, kde jste ji nechali, a to jak v robotu, tak v konfiguraci NetWorker:
sjirdtag <changer address> nsrjb -C
- Poté přesuňte páskové kazety z hnacího prvku do slotu a zpět:
sjimm <changer address> drive <element_number> slot <element_number>
sjimm <changer address> slot <element_number> drive <element_number>
- Pokud se nezdaří přesun z jednotky do slotu, automatické vysunutí (automatické přepnutí do režimu offline v knihovně Data Domain VTL) pravděpodobně není v knihovně povoleno. Můžete to potvrdit tak, že nejprve vysunete svazek (předchozí část) a zopakujete operaci přesunutí. Po dokončení přesuňte svazek zpět.
Uvolnění knihovny: Logická operace (uvolnění z NetWorker)
Jakmile zjistíme, že fyzické operace jsou bezchybné (alespoň povrchně), můžeme se pokusit vysledovat problém v NetWorker.
- Ještě jednou – ověřte, že se knihovní robot a NetWorker shodují na umístění páskových kazet:
nsrjb [<-j library_name>] -C
sjirdtag <changer address>
- Pokus o uvolnění testovací pásky s vysokou upovídaností:
nsrjb [<-j library_name>] -uvvvvv -f <device_handle>
Pokud se knihovna úspěšně uvolní ze všech zařízení a kazet, může se jednat o situační problém. Izolujte podmínku způsobující selhání a spusťte ladění.
- Pokud operace uvolnění selže a svazky jsou označeny jako 'unlabeled', pak je nejpravděpodobnější, že NSR Jukebox: Ověřte, zda nastavení Label on Unload nedochází k rušení z důvodu selhání čtení předcházejícího operaci uvolnění. Zakažte nastavení a akci opakujte.
- Nastavte vlastnosti NSR Jukebox Eject Sleep a Unload Sleep na 60 a zkuste to znovu; Pokud to umožňuje bezchybné odlehčení, snižujte spánek postupně, dokud se poruchy neobnoví.
Uvolnění knihovny: Ladění
Pokud vše ostatní selže, shromážděte příslušná data, která vám pomohou s laděním problému, než se poradíte s malými a středními podniky:
- Před opětovným výskytem problému v nástroji NetWorker změňte v prostředku NSR Jukebox úroveň trasování laděnína hodnotu 5
- Použijte také
dbgcommandaby se zvýšila úroveň ladění spuštěnéhonsrdansrmmgdprocesů do 5 - Uvažovat
truss/tusc/strace,pstack,gcore/gencorena příslušnémnsrlcpdPřed nebo během problémové události - Nastavte proměnné ladění v systémovém prostředí (Windows) nebo spouštěcím skriptu (UNIX), abyste získali bohatší data ladění:
SJI_DEBUG=9LUS_DEBUG=9CDI_DEBUG=9SCSI_DEBUG=9JBDEBUG=9
Pokud jsou operace uvolnění knihovny otestovány a shledány funkčními, ale jiné problémy přetrvávají, obraťte se zpět na NetWorker: Chcete-li pokračovat v odstraňování problémů, pokračujte v odstraňování problémů na domovské stránce páskových knihoven.
Pokud návrhy nepomohou, obraťte se na podporu dodavatele knihovny, pokud data ladění ukazují interní anomálie. V opačném případě eskalujte výstup ladění podpoře NetWorker, aby prozkoumala možnou vadu kódu.
Additional Information
Tento článek je součástí řady řešení Odstraňování problémů s páskovými knihovnami pomocí nástroje NetWorker. Seznam je zde:
NetWorker: Domovská stránka pro odstraňování problémů s páskovými knihovnami