NetWorker: Problemen met het bestellen van tapewisselaarstations oplossen
Samenvatting: In dit artikel wordt een bekend probleem met tapebibliotheken in een SAN-omgeving beschreven dat ertoe leidt dat apparaatnamen door het besturingssysteem worden gewijzigd, wat leidt tot applicatiefouten. ...
Symptomen
In een Plug 'N Play-besturingssysteem krijgen apparaten SCSI-doeladressen toegewezen in de volgorde van detectie.
Omdat de SAN-detectievolgorde varieert en verbindingsverlies Plug-and-Play-toewijzing activeert, veranderen doelnummers en kunnen ze niet vast blijven.
Plug-and-Play hernoemt apparaten op basis van de opsommingsvolgorde, dus elke opzettelijke of onopzettelijke onderbreking van de verbinding kan ertoe leiden dat apparaten nieuwe namen krijgen.
Een probleem met het ordenen van schijven beschrijft een situatie waarbij de door NetWorker geconfigureerde drivernaam voor een apparaat niet overeenkomt met de werkelijke naam. Dit is meestal het gevolg van het veranderen van de naam van de driver in het besturingssysteem na de initiële configuratie van de NetWorker-bibliotheek. Dit is meestal een probleem met het Plug 'N Play-besturingssysteem, dat van invloed is op Windows en Linux.
Er zijn veel fouten en omstandigheden verbonden aan dit probleem, waaronder, maar niet beperkt tot:
- Fout: '
nsrd: media info: failed unloading drive `{driver handle}' to slot {slot number}, error '69'' - Fout: '
{hostname} the destination component full' - Fout: '
{driver handle} read open error, no such device or address' - Fout: '
opening: I/O error' - Fout: '
nsrd: Jukebox '{jukebox}' failed: expected volume '{volid}' got {volid}' - Fout: '
nsrd: Jukebox '{jukebox}' failed: expected volume '(volume_name)' got 'NULL'' - Fout: '
read open error, device not ready' - Fout: '
nsrjb: Jukebox error, All allocated drives are not usable, unrecoverable operation errors' - Fout: '
nsrd: Jukebox '{jukebox}' failed: expected volume '{volid}' got {volid}' - Fout: '
nsrd: Jukebox '{jukebox}' failed: expected volume '{volume}' got 'NULL'' - Fout: '
read open error, device not ready' - Fout: '
nsrjb: Jukebox error, All allocated drives are not usable, unrecoverable operation errors' - Fout: '
nsrd: media warning: {driver handle} reading: read open error: No media in drive.' - Fout: '
inventory: Bar code label `{barcode}' does not match media db bar code label, updating media db' - Fout: '
Illegal request, medium not present' - Fout: '
nsrd: media info: failed unloading drive `{driver handle}' to slot {slot number}'
Oorzaak
NetWorker maakt het bibliotheekobject tijdens de eerste installatie, waarbij tapestations worden gekoppeld aan de door het besturingssysteem gegenereerde apparaathandvatten die ze op dat moment hebben. Het is een statische associatie die de relatie weergeeft op het moment van configuratie. Een bibliotheek kan bijvoorbeeld twee apparaten hebben:
fysieke schijf 1 = \\.\Tape0 (of misschien /dev/nst0 in Linux)
Fysieke schijf 2 = \\.\Tape1 (of /dev/nst1)
In plug-and-play-systemen zoals Windows of Linux kan elk apparaat dat verdwijnt, inclusief opnieuw opstarten of wijzigingen in de connectiviteit, ervoor zorgen dat het besturingssysteem de naam van de apparaten wijzigt. Met name op een SAN, waar apparaatdetectie verstoord kan zijn, kunnen de apparaten bij de volgende herstart een andere naam krijgen, bijvoorbeeld in tegenstelling tot het bovenstaande:
Fysieke schijf 1 = \\.\Tape1 or /dev/nst1
Fysieke schijf 2 = \\.\Tape0 or /dev/nst0
Opdrachten aan deze apparaten kunnen nog steeds werken, ervan uitgaande dat er een apparaat is dat de gewenste naam gebruikt. NetWorker verliest apparaatnamen uit het oog omdat de associaties van de driver-handle van de bibliotheek niet meer overeenkomen met de fysieke elementen nadat het besturingssysteem de naam van de apparaten heeft gewijzigd. NetWorker kan bijvoorbeeld een tapecartridge in één schijf laden, maar een verouderde, onjuiste apparaatnaam gebruiken, waardoor opdrachten naar de verkeerde schijf worden gestuurd na het hernoemen van het besturingssysteem. Dit kan resulteren in een breed scala aan fouten, ervan uitgaande dat er een onverwacht volume (of helemaal geen) wordt gevonden. Er zijn veel mogelijke oorzaken van de bestelvoorwaarden van schijven:
- Handmatige verkeerde configuratie van bibliotheek met behulp van
jbconfigofjbeditOpdrachten - Opnieuw opstarten van host, storageadapter, storageconnectiviteitshardware of tapeapparaten
- Tijdelijk verlies van verbinding met een apparaat
- Het apparaat in het besturingssysteem uitschakelen en opnieuw inschakelen
- Updates van het besturingssysteem
- Updates van apparaatdrivers of storageadapter
Oplossing
Persistente naamgeving:
Dit wordt beschouwd als best practice en kan worden aanbevolen door support, zelfs als u geen problemen ondervindt om u proactief te beschermen. Gebruik de informatie uit de volgende artikelen:
- Implementing Tape Device Name application resilience for Windows
- Implementing Tape Device Name application resilience for Linux
Extra informatie
Handmatige herconfiguratie
Als u de tolerantie van applicaties niet onmiddellijk kunt inschakelen en uw bibliotheek niet opnieuw kunt configureren, zijn er verschillende handmatige alternatieven die u kunt overwegen:
- NMC herconfiguratie: U kunt de configuratie van NetWorker bijwerken met behulp van de optie Opnieuw configureren van de Bibliotheek-instantie om de apparaatdefinities voor alle betrokken apparaten te verwijderen en vervolgens de overgebleven tape-apparaatinstanties uit de apparatencontainer te verwijderen, voordat u opnieuw scant en opnieuw configureert met de gecorrigeerde, nieuwe namen.
jbconfigOpdracht: Deze opdrachten maken nog steeds deel uit van de NetWorker-suite, maar worden niet meer gebruikt en vereisen meer geavanceerde kennis van zowel NetWorker als tapebibliotheek- en storagetransporttechnologieën.- Gebruik om helemaal opnieuw te beginnen
jbconfigVoor handmatig beheer van het aanmaken van bibliotheken: Een NetWorker-tapewisselaar handmatig configureren met de opdracht jbconfig
- Gebruik om helemaal opnieuw te beginnen
- Geforceerde hernoeming: Het is mogelijk om apparaten uit te schakelen of te verwijderen en ze te lezen/opnieuw in te schakelen in de volgorde die overeenkomt met hun huidige configuratie in NetWorker. In een eenvoudig Windows-scenario voor het bovenstaande zou men bijvoorbeeld beide apparaten kunnen uitschakelen, waarbij de instantie die eerst als Tape0 in NetWorker is geconfigureerd, opnieuw wordt ingeschakeld om het besturingssysteem te dwingen dat apparaat opnieuw Tape0 te noemen. De Linux-methodologie zou vergelijkbaar zijn, maar met behulp van het /proc/scsi/scsi-bestand om apparaten direct te verwijderen en opnieuw te scannen.