NetWorker: Troubleshooting Tape Library Problems in NetWorker
Riepilogo: Questo articolo ha lo scopo di assistere il supporto NetWorker e i Backup Administrator NetWorker nell'approccio e nella risoluzione dei problemi relativi alle librerie a nastro.
Istruzioni
Prima di esaminare i problemi relativi alla libreria a nastro, è importante considerare quanto segue:
- Le unità nastro leggono e scrivono dati ed etichette sui supporti e forniscono tutte le funzioni dei supporti, inoltre non possono spostare le cartucce a nastro
- Le LIBRERIE a nastro spostano le cartucce a nastro dei supporti da un elemento all'altro: Unità, slot e porte di importazione ed esportazione e non leggono o scrivono dati
Se le operazioni di NetWorker non riescono a causa dell'impossibilità di spostare le cartucce a nastro, esistono diverse possibili cause generali:
- Problema hardware o firmware con il robot della libreria o i componenti interni
- Problemi di connettività dall host NetWorker alla robotica della biblioteca durante il trasporto
- Problema di sistema operativo, driver o compatibilità tra l'host e la libreria NetWorker
- Problema di configurazione di NetWorker relativo al tipo, allo stato e all'indirizzamento della libreria a nastro
Seguire questi passaggi in ordine cronologico per determinare la natura del problema ed eventualmente risolverlo. Se il problema persiste, vengono forniti test che limitano il problema e consentono a uno specialista di continuare il lavoro.
1. Informazioni ambientali
Dal server NetWorker e dagli storage node interessati:
- Nome host, tipo e versione del sistema operativo.
- Versione e numero di build di NetWorker.
- L'output del '
inquire' che mostra nastri e librerie. - Copia compressa dell'attuale
nsrdb(per conservare le informazioni correnti del jukebox, se necessario, per il rollback)
Linux:/nsr/res/nsrdb
Windows (impostazione predefinita):C:\Program Files\EMC NetWorker\nsr\res\nsrdb - Storage node, nome NetWorker della libreria ed elenco dei nodi, dispositivi e volumi interessati
- Punti in comune del problema (volumi specifici, unità specifiche, nodi specifici e così via)
nsrget -o:d sul server e sui nodi interessati.
-o:d Su qualsiasi host con nastri in cui i nastri sono impegnati a scrivere. È possibile verificarlo da NetWorker Management Console (NMC) in Monitoring ->Devices.
L'articolo seguente fornisce informazioni su come ottenere e usare NSRGET: NetWorker: Come utilizzare lo strumento di data collection di NetWorker NSRGet (in inglese)
2. Test della predisposizione della libreria
- Verificare se lo storage node proprietario della libreria interessata è abilitato e pronto:
- In NMC passare a Devices ->Storage Nodes.
- Verificare che View :>la modalità diagnostica sia abilitata.
- Selezionare le colonne Enabled e Ready nel riquadro a destra.
- Se uno storage node che dovrebbe essere abilitato non è abilitato, cliccare con il pulsante destro del mouse sullo storage node e scegliere Enable/Disable per abilitarlo .
- Se lo storage node non diventa pronto in un minuto o due, è necessario eseguire il follow-up separatamente; la libreria non risponde perché il relativo storage node è inaccessibile.
- Verificare se la libreria interessata è abilitata e pronta:
- In NMC passare a Devices ->Libraries.
- Verificare che View :>la modalità diagnostica sia abilitata.
- Selezionare le colonne Enabled e Ready nel riquadro a destra. Se la libreria mostra uno stato Ready , passare alla sezione [
4]. - Se non è abilitata, è possibile cliccare con il pulsante destro del mouse sull'istanza della libreria sulla sinistra e selezionare "Enable/Disable" per riabilitarla.
- Una volta abilitato, attendi un minuto o due, fai di nuovo clic sul contenitore Libraries e verifica se viene visualizzato un segno di spunta verde nella colonna "Ready".
- Se la libreria non è pronta, cliccare con il pulsante destro del mouse sull'istanza della libreria a sinistra, selezionare Properties e, nella scheda General , assicurarsi che il valore Control Port corrisponda al valore
scsidev@#.#.#indirizzo visualizzato dalinquire. - Se Control Port non corrisponde, impostare Enabled su No e fare clic su OK; quindi immettere nuovamente le proprietà e modificare Control Port in modo che corrisponda a
inquireIndirizzo rilevato. Dopo aver aggiornato Control Port, impostare nuovamente Enabled su Yes, quindi cliccare nuovamente su OK per riabilitarla. Attendere un minuto o due per verificare se la libreria è pronta. - Infine, se dopo aver corretto il valore Control Port non si consente alla libreria di diventare Ready, immettere le proprietà della libreria un'ultima volta; nella scheda Avanzate , impostare Debug Trace Level su 5; e Disabilitare e riabilitare per acquisire la sequenza di avvio nel log del daemon per due minuti.
Quando si riabilita la libreria nella sezione [2.2], confermano che nsrlcpd Viene avviato sullo storage node previsto. Verificare inoltre che non si arresti o non si riavvii in modo indipendente. Se l'ID processo (PID) continua a cambiare, suggerisce che il processo è stato interrotto o terminato dal software o dal core di dump. Prestare attenzione anche ai problemi di risoluzione dei nomi tra server e storage node, che possono impedire l'avvio. Il nome che il server risolve per il nodo deve corrispondere al nome nsrladb dei nodi e al nome del server per il nodo.
- Vedere Risoluzione dei problemi di predisposizione delle librerie a nastro in NetWorker per informazioni avanzate sui problemi di predisposizione delle librerie.
- Consultare la Guida alla risoluzione dei problemi di NetWorker: Arresti anomali del processo e core dump se si nota o si sospetta che il nodo
nsrexecd,nsrsnmdonsrlcpdsono discariche di noccioli.
Per una panoramica dettagliata dei processi per host di NetWorker, consultare: Processi e porte NetWorker
I messaggi relativi a questi servizi vengono registrati nella directory daemon.raw:
- Linux:
/nsr/logs/daemon.raw - Windows (impostazione predefinita):
C:\Program Files\EMC NetWorker\nsr\logs\daemon.raw - NetWorker: Come utilizzare nsr_render_log per eseguire il rendering .raw file di log
3. Determinare la velocità di risposta della libreria:
Se la libreria non è pronta e non è possibile determinare una causa, assicurarsi di poter contattare la libreria stessa:
- Controllare la colonna
inquireoutput del nodo da [1.3] e assicurarsi che la libreria appaia nell'output come 'Autochanger', e prendere nota delle informazioni SCSI#.#.#Indirizzo. - Se la libreria non viene visualizzata in
inquireoutput, verificare che il sistema operativo sia in grado di rilevarlo. Gli host Solaris non segnalano la libreria se è configurata e abilitata in NetWorker. Per assistenza, vedere Risoluzione dei problemi di rilevamento delle librerie a nastro in NetWorker. - Accertarsi che la libreria risponda ai comandi di base della libreria. Utilizzo dell'indirizzo SCSI in [
3.1], eseguire: 'sjisn #.#.#'. Per ulteriori informazioni sui comandi di test della libreria, consultare Risoluzione dei problemi di accesso alle librerie a nastro in NetWorker. - Se i comandi SJI hanno esito negativo, considerare la possibilità di problemi di trasporto o hardware: Per assistenza, vedere Risoluzione dei problemi hardware delle librerie a nastro in NetWorker .
- Se il problema è che il sistema operativo non rileva la libreria e risponde correttamente ai comandi SJI, NetWorker non riesce a rilevarla, provare a usare il metodo
jbconfigcomando e selezionando l'opzione 2; Se il problema persiste, provare l'opzione 4, fornire manualmente l'indirizzo della libreria ed eseguire la configurazione come libreria standard (opzione 56). Vedere Risoluzione dei problemi di configurazione delle librerie a nastro in NetWorker per ulteriori dettagli.
4. Test dello stato del volume e del movimento del nastro
Se la libreria è pronta e sembra rispondere, ma presenta problemi di caricamento dei volumi, le possibili cause sono diverse.
- Svuotare l'intera libreria, se possibile; se è possibile arrestare altre operazioni, cliccare con il pulsante destro del mouse e reimpostare la libreria dalla scheda Devices ->Libraries .
- Tentare di caricare una singola cartuccia a nastro in un singolo dispositivo, se si ritiene che entrambe siano interessate da problemi di caricamento; Scaricare dopo ogni tentativo, se necessario.
- Eseguire il confronto con lo stesso volume in unità diverse e volumi diversi nell'unità che si ritiene sia interessata; Annotare gli errori e gli schemi, se presenti.
- Se il caricamento del volume non riesce in modo affidabile, indipendentemente dal dispositivo, provare il seguente controllo delle etichette:
- Caricamento del volume senza mounting Se la cartuccia del nastro si muove senza errori, è stato verificato il funzionamento meccanico del braccio.
- Eseguire
nsrmm -pv -f networker_deviceSe risponde con etichetta verificata, significa che anche il supporto è valido e integro. - Nelle proprietà della libreria, con la modalità diagnostica abilitata, passare alla scheda Timer e impostare Load Sleep su 60 prima di cliccare su OK.
- Scaricare il volume, quindi tentare di ricaricarlo se l'operazione ha esito positivo. Il problema era probabilmente un problema di tempistica (è possibile provare valori di sospensione inferiori fino a quando non inizia di nuovo a non funzionare).
- Se
nsrmmComando non riuscito, sono necessari ulteriori test. Disabilitare l'unità in questione in NMC cliccando con il pulsante destro del mouse e selezionando Enable/Disable.- Eseguire nuovamente il comando
scannerComando sul dispositivo:- Per lo storage node locale del server NetWorker, eseguire:
scanner -nizv local_device - Per su uno storage node NetWorker "remoto", eseguire:
scanner -s server -nizv local_device
- Per lo storage node locale del server NetWorker, eseguire:
- Interrompi dopo ~20 righe e controlla l'etichetta read messaging; il successo è indicato da
8936:scanner: scanning media_type tape volume_name on device_name. - se
scannerrestituisce il messaggio numero file imprevisto, desiderato 2, ottenuto higher_number si è verificata una perdita di dati, molto probabilmente dovuta al ripristino di SCSI; vedere Risoluzione dei problemi relativi alle etichette sovrascritte e alle reimpostazioni SCSI in NetWorker.
- Eseguire nuovamente il comando
- Se
scannerrestituisce unmessage 8945:scanner: Read: -1 bytesDeterminare se il volume può essere letto su altri nodi o unità e determinare la tendenza del problema. Se si rileva che alcuni volumi possono essere letti su alcuni nodi, ma non su altri, e il dispositivo è LTO-4 o superiore, considerare gli errori di decrittografia dell'unità: Crittografia hardware LTO e NetWorker.
Per informazioni più avanzate sulla verifica dei supporti, consultare: Risoluzione dei problemi di mounting dei supporti in NetWorker.
5. Test per verificare la presenza di problemi di ordinamento delle unità
Se i comandi di caricamento e mounting hanno esito positivo, ma la lettura dell'etichetta o il mount semplice hanno esito negativo, il problema potrebbe riguardare un ordine errato delle unità.
- Svuotare l'intera libreria, se possibile; se è possibile arrestare altre operazioni, fare clic con il pulsante destro del mouse e reimpostare la libreria da Dispositivi ->Librerie.
- Tentare di caricare una singola cartuccia a nastro in un singolo dispositivo, se si ritiene che entrambe siano interessate da problemi di caricamento; Scaricare dopo ogni tentativo, se necessario.
- Eseguire il confronto con lo stesso volume in unità diverse e volumi diversi nell'unità che si ritiene sia interessata; Annotare gli errori e gli schemi, se presenti.
- Se un caricamento ha esito negativo in modo affidabile, provare il seguente controllo dell'etichetta:
Per assistenza più avanzata sui problemi di caricamento delle librerie, consultare: Risoluzione dei problemi di caricamento delle librerie a nastro in NetWorker.
Se tutti questi test hanno esito negativo e non si è proseguiti, documentare i risultati per ogni passaggio di questo articolo e contattare il supporto NetWorker. Dettagli chiari sono essenziali per accelerare le soluzioni e garantire che i "passaggi ripetuti" siano limitati.