NetWorker: Manutenzione e risoluzione dei problemi del database dei supporti
Summary: Questo articolo descrive i metodi per identificare e trattare i problemi relativi al database dei supporti, nonché le best practice per la manutenzione e la protezione.
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
- Impossibile avviare i servizi.
- Errore del flusso di lavoro giornaliero di Server Protection>Server Backup .
- Informazioni incomplete o fuorvianti relative ai saveset o ai client restituiti dal comando mminfo o durante l'esecuzione di query o l'esplorazione dei saveset nell'amministrazione di NetWorker Management Console (NMC) o NetWorker Web User Interface (NWUI).
- Problemi di backup, ripristino o clonazione dovuti all'impossibilità di individuare saveset, client o volumi.
- Errori nel log del daemon del server o nelle console correlati al database dei supporti:
nsrmmdbd WiSS code assertion error (st_nextrec: rec loop detected)
nsrmmdbd error, ss_clone_ensure_clone_eligibility: assertion, invalid parameters or code segment
nsrmmdbd XCHK ssid:saveset_short_ssid host:saveset_hostname name:saveset_name has a fragment with an invalid volid:saveset_volid
nsrmmdbd NSR warning WiSS code assertion error (ST_readvdir: directory read failed)
nsrmmdbd NSR critical Unexpected error reading long record directory: an invalid slot number
nsrmmdbd NSR warning partial record error, ssid: saveset_short_ssid saveset_long_ssid flags:0x00010101 size:0 files:0 tm:datetime cloneid
nsrmmdbd NSR notice media db must be scavenged
nsrmmdbd NSR critical media db scavenge failed
nsrmmdbd NSR warning Cannot scavenge path_to_mmvolume6 (Permission denied) - recover from backup media
nsrmmdbd NSR warning Cannot scavenge path_to_mmvolume6 (unknown error code) - recover from backup media
nsrmmdbd MDB warning can't fetch save set <saveset ID>
nsrmmdbd MDB warning Unable to fetch child save set <saveset ID> for cover set <saveset ID>
- Perdita improvvisa di molti saveset dal database dei supporti o aumento improvviso dello spazio libero disponibile per lo storage su disco.
- Il software non riesce a far scadere o eliminare i saveset, con conseguente rapido consumo dello storage.
Cause
Come qualsiasi database, il database dei supporti può essere danneggiato a vari livelli in caso di inferenza con le sue normali operazioni, ad esempio
- Arresto imprevisto del processo nsrmmdbd (core dump, arresto anomalo del sistema, riavvio o interruzione dell'alimentazione).
- Transazione interrotta (interferenza del software di sicurezza esterno o esaurimento dello spazio su disco).
- Problema logico interno (bug del codice o condizioni non gestite).
- Interferenza diretta con i file del database dei supporti o con i file dei saveset sullo storage gestito da NetWorker.
- Se possibile, usare una partizione del disco locale separata per la cartella nsr/mm, che aiuta a proteggersi da condizioni come l'esaurimento dello spazio su disco da parte di altri processi. Questa partizione deve essere almeno 3 volte la dimensione del database dei supporti. un database multimediale di grandi dimensioni attualmente sarebbe di 10 GB; pertanto, 100 GB dovrebbero essere sufficienti per qualsiasi installazione.
- Assicurarsi che il flusso di lavoro Server Backup venga completato quotidianamente in modo che i backup del database dei supporti e delle risorse critiche per il ripristino di emergenza ( bootstrap) siano disponibili in caso di emergenza.
- Verificare periodicamente la posizione dei bootstrap con il comando mminfo -B .
- Non consentire mai l'accesso simultaneo ai volumi di storage del server NetWorker, in quanto ciò potrebbe causare la perdita di dati.
- Se il software antivirus è installato sul server NetWorker, creare esclusioni per la directory /nsr per impedire al software antivirus di eseguire la scansione, la modifica o la rimozione dei file NetWorker.
- Evitare di eliminare manualmente i file nello storage NetWorker per tentare di liberare spazio. NetWorker dispone di routine di recupero dello spazio che vengono eseguite quotidianamente ed è necessario contattare il supporto se si ritiene che queste non funzionino.
- In generale, per la pianificazione di datazone, mantenere i dati dello stesso tipo negli stessi pool per facilitare la manutenzione quando necessario, ad esempio i saveset vProxy, i saveset del file system e i saveset del database Oracle in pool separati.
- Non ignorare i messaggi relativi agli errori del database dei supporti: in caso di dubbi, contattare il supporto.
- NetWorker esegue quotidianamente il processo di scadenza come parte del flusso di lavoro Server Backup. Questo job calcola le retention e le dipendenze e fa scadere i saveset che hanno superato la retention e non hanno dipendenti non scaduti. Al termine, NetWorker tenta di eliminare tutti i saveset di volumi disco scaduti. Successivamente, viene eseguita l'operazione di recupero dello spazio per ogni volume, eliminando i file dei saveset dai supporti del disco che non dispongono di voci del database dei supporti corrispondenti. Ciò significa che se il database dei supporti viene danneggiato o si ripristina il database a un punto precedente nel tempo, i dati validi potrebbero essere eliminati.
- Se si ritiene che si sia verificato un problema con i volumi del disco, per assicurarsi che i dati validi non vengano eliminati, assicurarsi che il volume sia disinstallato e contrassegnato come Scan Needed. Ciò vale anche per i volumi dopo il ripristino in un point-in-time precedente (in cui potrebbero esistere saveset validi su disco creato dopo il recovery point e pertanto non avere voci nel database ripristinato).
- Scan Needed consente il backup, il ripristino e/o la clonazione normali, ma impedisce la normale scadenza o eliminazione, quindi assicurarsi che venga utilizzato solo per proteggere i volumi percepiti come in pericolo e rimosso quando si torna alle normali operazioni. I volumi devono essere smontati per impostare o rimuovere questo flag. È comune che i volumi vengano contrassegnati come "Scan Needed" dopo il ripristino di emergenza del server NetWorker (nsrdr), per evitare perdite di dati indesiderate in uno scenario di ripristino di emergenza.
Resolution
Esistono diversi modi per tentare di verificare e correggere i problemi del database dei supporti. Prima di eseguire una di queste operazioni, creare report prima e dopo per verificare se sono stati rimossi saveset, volumi, client o altro.
Nella riga di comando, in una directory per ospitare gli output, eseguire i seguenti comandi per confrontare le proprietà del database dei supporti prima e dopo la procedura:
A meno che questo processo non venga eseguito quotidianamente, non è improbabile che questo cambi nulla. Controllare il log del daemon per il completamento giornaliero di nsrim .
Questo comando prevede che gli storage node siano online e contattabili per il completamento.
Nella riga di comando, in una directory per ospitare gli output, eseguire i seguenti comandi per confrontare le proprietà del database dei supporti prima e dopo la procedura:
- mminfo -C mminfo-C_pre.mmi
- mminfo -X mminfo-X_pre.mmi
- mminfo -ar "volid,tipo,posizione,pool,volume,stato,volflags,scritto,savesets" -q family=disk -xc, > mminfo-vol_pre.mmi
nsrim - Protezione giornaliera del server
Ogni giorno viene eseguito il flusso di lavoro Server Protection > Server Backup e con esso l'azione Expiration. L'azione Scadenza esegue nsrim, che è l'utilità di manutenzione nativa di NetWorker. Questa operazione può anche essere eseguita direttamente, ma può richiedere da alcuni minuti a diverse ore, a seconda del carico del server e delle dimensioni del database dei supporti:
nsrim -X > nsrim.out 2>&1
A meno che questo processo non venga eseguito quotidianamente, non è improbabile che questo cambi nulla. Controllare il log del daemon per il completamento giornaliero di nsrim .
Riavvio del servizio
Il riavvio dei servizi NetWorker forza vari controlli di avvio che potrebbero esporre problemi nei messaggi di errore del registro daemon e potenzialmente correggerne qualsiasi. Prima di interrompere i servizi, se i problemi del database sembrano essere gravi, assicurarsi che vi sia spazio libero sufficiente e che i percorsi di bootstrap siano noti (output mminfo -B). Idealmente, eseguire nsrmmdbasm -s nsr/mm/mmvolrel_path > mm.xdr prima per tentare di estrarre una copia del database dei supporti corrente. Prima di riavviare i servizi, creare una copia della cartella mmvolrel in quanto potrebbe essere necessaria in seguito per scopi forensi o di ripristino.Esportazione e reimportazione del database dei supporti
Questo processo evita un ripristino di emergenza completo estraendo solo i record validi del database dei supporti e reimportandoli nel server senza arrestare i servizi. Tuttavia, questa operazione deve essere eseguita solo quando il server è inattivo e non deve mai essere tentata con i processi in esecuzione. Utilizzare il percorso completo al posto di mmvolrel (che può variare in base all'installazione o al sistema operativo)- Prima di iniziare, contrassegnare tutti i volumi del disco come Scan Needed dopo l'unmounting. Se Auto Media Management è impostato per i dispositivi che ospitano volumi di dischi, è necessario prima disabilitare questa funzione. I volumi nastro non necessitano di questo passaggio.
- Eseguire i comandi mminfo descritti nel preambolo per preparare i report preliminari.
- Controllare le dimensioni della cartella e del record mmvolrel del database dei supporti
- Assicurarsi che nessuno dei processi nsrck, nsrim, nsrmmdbasmsia in esecuzione; Se nella cartella principale MM sono presenti file di grandi dimensioni, obsoleti o non modificati di recente, come MM[alphanumerics], spostarli o eliminarli se non sono bloccati da alcun processo.
- Eseguire il comando nsrmmdbasm -s mmvolrel mm.xdr per estrarre il > database dei supporti:
- Confrontare le dimensioni del nuovo file con le dimensioni della cartella mmvolrel - se devono avere dimensioni simili. Se è minuscolo (4 B o una manciata di KB), il comando non è riuscito. Se è significativamente più piccolo, potrebbero essere stati rimossi record danneggiati durante il processo.
- Preparare il server per il ripristino del database dei supporti impostando il campo Server's state su Disaster Recovery in NMC/NWUI o utilizzando nwadmin.
- Eseguire il ripristino direttamente dal database dei supporti Estrarre il file usando di nuovo il comando nsrmmdbasm : nsrmmdbasm -r -2 < mm.xdr
- Al termine, eseguire le stesse mminfo descritte nel preambolo e confrontare i valori del saveset e scritti per ogni volume, assicurandosi che tutti i volumi siano presenti; allo stesso modo i valori mminfo -C dovrebbero essere identici.
- Se ci sono disparità, prenderne nota e valutare attentamente come procedere, quindi contattare il supporto se non si è sicuri dei risultati visualizzati:
- Per i volumi che sembrano integri, è possibile rimuovere il flag Scan Needed ed eseguire il mounting dei volumi, in quanto non dovrebbe esserci alcun pericolo di eliminazione dei saveset se risulta che nessun saveset è stato rimosso dal volume se i saveset e i valori scritti sono coerenti.
- I volumi che mostrano un numero inferiore di saveset o un totale scritto inferiore devono lasciare il flag Scan Needed al suo posto ed eseguire scanner: scanner -i devicename per reintrodurre i file trovati nel volume che non dispongono più di record. Una volta completato lo scanner per ciascun volume, controllare nuovamente il numero dei saveset e rimuovere il flag Scan Needed. Eseguire nuovamente il mounting del volume quando si è certi che lo scanner abbia sostituito i saveset che dovrebbero risultare mancanti.
nsrdr
Il ripristino di emergenza completo eseguito da nsrdr ripristina non solo il database dei supporti, ma anche altri elementi del server come il database delle risorse e il database dei job. Consultare la Guida alle best practice per il ripristino di emergenza e la disponibilità del server per la versione in uso prima di tentare di procedere.Questo comando prevede che gli storage node siano online e contattabili per il completamento.
NOTA: Contattare sempre il supporto in caso di domande o dubbi, in quanto il ripristino del database dei supporti può causare la perdita di dati per i volumi del disco se il flag Scan Needed non viene usato per proteggere i file system con saveset validi che potrebbero non avere record del database dei supporti a causa di un danneggiamento o del ripristino a un point-in-time precedente.
Affected Products
NetWorkerProducts
Data Backup & Protection Software, NetWorker FamilyArticle Properties
Article Number: 000223518
Article Type: Solution
Last Modified: 08 Apr 2024
Version: 1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.