NetWorker: Errori RPC sui backup device NetWorker DDBoost
Resumen: Data Domain con sessione attiva osserva problemi di comunicazione che fanno entrare i dispositivi Data Domain in uno stato obsoleto. Anche se non è presente alcuna scrittura, contiene la sessione non funzionante e non rilascerà le informazioni sulla sessione utilizzate dal database di gestione dei supporti. Tutti i dispositivi associati allo stesso pool e storage node non sono in grado di accettare altre sessioni; nessun processo di backup o clonazione viene accettato dai dispositivi interessati con conseguenti errori RPC. ...
Síntomas
- Tutte le operazioni di backup/clonazione sul server NetWorker rimanevano solo in stato di blocco/coda in quanto i dispositivi DDBOOST erano in stato Unmounted e il seguente errore veniva visualizzato nei log delle azioni:
- Il backup del set di salvataggio non riuscito a causa di errori irrecuperabili è uno dei messaggi di errore significativi.
- I dispositivi Data Domain vengono disinstallati durante la finestra di backup, anche se non vi sono problemi di connettività tra NetWorker e Data Domain.
- Danneggiamento nel database dei job di NetWorker che determina un'incoerenza tra l'applicazione di backup NetWorker e il database dei job
Causa
Resolución
I valori di timeout sugli storage node NetWorker devono essere ottimizzati in base alle considerazioni sull'ambiente di NetWorker Backup e alla guida all'ottimizzazione dei dispositivi NetWorker.
Su uno storage node NetWorker di Linux, seguire le istruzioni riportate di seguito per impostare i valori appropriati di Timeout keep-alive TCP come mostrato.2. Eseguire i seguenti comandi per modificare le impostazioni tcp_keepalive:
# echo 700 > /proc/sys/net/ipv4/tcp_keepalive_time
# echo 10 > /proc/sys/net/ipv4/tcp_keepalive_intvl
# echo 20 > /proc/sys/net/ipv4/tcp_keepalive_probes
2. Passare a " HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters".
3. Creare una nuova voce REG-DWORD denominata " KeepAliveTime".
4. Assegnare un valore decimale 900000 (15 minuti).
5. Per attivare il nuovo valore, è necessario riavviare il sistema.
NOTA: L'ottimizzazione del TCP aggiuntiva è descritta in dettaglio nella NetWorker Performance Optimization Planning Guide, disponibile tramite https://www.dell.com/support/home/product-support/product/networker/docs.
I servizi Storage Node NetWorker devono essere riavviati una volta definiti i parametri di cui sopra. Assicurarsi che questi valori rimangano coerenti nei riavvii dello storage node NetWorker.
Inoltre, qualsiasi incoerenza sull'applicazione di backup NetWorker in relazione al processo nsrmmd sullo storage node NetWorker deve essere eliminata eseguendo i passaggi indicati di seguito.
1. Arrestare i servizi NetWorker sul backup server.
Linux: nsr_shutdown
Windows: net stop nsrexecd /y
2. Rinominare le cartelle /nsr/res/jobsdb, /nsr/logs/daemon.raw e /nsr/tmp sul server NetWorker.
3. Riavviare nuovamente i servizi NetWorker sul backup server. In questo modo verranno reinizializzate le operazioni di salvataggio di NetWorker e non verrà notato alcun ulteriore reset della connessione RPC e i valori di timeout di inattività.
Linux: systemctl start networker
Windows: net start nsrd
se NMC è installato sul server NetWorker: net start gstd