Avamar: Come impostare l'Avamar Server in uno stato controllato noto
Summary: Questo articolo spiega come impostare un Avamar Server in uno stato controllato noto.
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Esistono molte attività automatizzate su un Avamar Server che possono influire sulle attività di risoluzione dei problemi.
Questa procedura documenta come impostare Avamar in quello che viene chiamato "stato controllato noto" per evitare che si verifichino attività impreviste o indesiderate.
Quando si eseguono attività di manutenzione manuali e avanzate, è necessario seguire l'elenco di controllo riportato di seguito. Ad esempio:
NON si tratta di una soluzione per il controllo integrità. Si presuppone che l'Avamar Server non sia integro.
Questa procedura documenta come impostare Avamar in quello che viene chiamato "stato controllato noto" per evitare che si verifichino attività impreviste o indesiderate.
Quando si eseguono attività di manutenzione manuali e avanzate, è necessario seguire l'elenco di controllo riportato di seguito. Ad esempio:
- Ricostruzione delle strisce
- Ricostruzione dei nodi
- Riavvio dei nodi offline
NON si tratta di una soluzione per il controllo integrità. Si presuppone che l'Avamar Server non sia integro.
Cause
Le attività di manutenzione manuali o avanzate devono essere eseguite su un Avamar Server.
Resolution
Attenzione: Se utilizzati in modo errato, alcuni dei comandi a cui si fa riferimento di seguito possono causare problemi di integrità o perdita di dati. Se non si comprende un comando o le conseguenze della sua esecuzione, richiedere assistenza al Supporto Dell o al rappresentante del partner Dell locale.
Prerequisiti:
Prerequisiti:
- Tutti i comandi devono essere eseguiti come amministratore con le chiavi SSH caricate in base all'articolo Avamar: Come accedere a un Avamar Server e caricare varie chiavi. (In inglese)
- Alcuni comandi potrebbero non fornire un feedback o avere effetto immediato; Non dovrebbe essere necessario eseguire un comando più di una volta.
- Per qualsiasi
avmaint config --avaconfermare sempre che la modifica ha avuto effetto. Eseguire il comando:
avmaint config --ava | grep <setting>
- La manutenzione manuale dovrebbe essere evitata. Consentire al programma di pianificazione della manutenzione di gestire le attività di manutenzione quando possibile.
- È necessario rispondere alle seguenti domande utilizzando questi comandi per comprendere lo stato generale di Avamar Server prima di intervenire su qualsiasi sistema:
- A quando risale l'ultimo checkpoint convalidato?
cplist
- Tutte le strisce sono online? Tutti i nodi sono online?
status.dpn
- Tutti i servizi sono attivi?
dpnctl status
- Verificare la manutenzione in esecuzione e annullarla se necessario:
- Sospendere le attività di manutenzione utilizzando l'utilità di pianificazione della manutenzione per assicurarsi che non vengano riavviate dopo averle interrotte.
avmaint sched suspend cp --ava avmaint sched suspend hfscheck --ava
Non sospendere la garbage collection (GC) in quanto potrebbe causare un rollback non necessario.
- Eseguire il comando riportato di seguito e verificare la presenza di attività di manutenzione in esecuzione.
status.dpn
- Se un checkpoint è in esecuzione, attendere che venga completato.
- Se HFScheck è in esecuzione, può essere arrestato se il server non è in modalità amministratore (fase waitcgsan) o se HFScheck è quasi completato:
avmaint hfscheckstop --ava
- Se un GC è in esecuzione, può essere terminato:
avmaint gckill --ava
Il completamento di questa operazione potrebbe richiedere del tempo, poiché il passaggio corrente deve terminare.
- Una volta che non vi è più manutenzione in esecuzione, il programma di pianificazione della manutenzione deve essere arrestato:
dpnctl stop maint
- Arrestare l'utilità di pianificazione dei backup, interrompere l'esecuzione di backup o ripristini e sospendere le nuove connessioni:
- Impedire a MCS di avviare nuovi backup:
dpnctl stop sched
- Elencare tutti i backup in esecuzione:
avmaint sessions --ava | grep sessionid
Se è in esecuzione un ripristino diverso dalla replica, consultare l'utente per determinare se è necessario consentire il completamento del ripristino.
- Una volta ricevuta l'approvazione da parte dell'utente, è possibile terminare i backup in modo pulito (vengono creati backup parziali) utilizzando l'interfaccia utente o in modo non corretto utilizzando:
avmaint kill -waittime=0 <sessionid>
- Elencare tutti i backup aggiuntivi non elencati dal comando precedente:
avmaint sessions --full
- A seconda dell'operazione da eseguire, potrebbe non essere accettabile l'esecuzione di operazioni di tipo backup (avmaint getrefby). Pertanto, sospendere i dispatcher per non consentire backup manuali:
avmaint suspend
- Arrestare la replica (origine o destinazione della replica).
- Per l'origine della replica (ripristino), utilizzare l'interfaccia utente o EM o terminare il processo per arrestare la replica.
- Per la destinazione di replica (backup), verificare se la replica è in esecuzione:
avmaint sessions | grep path
- Cercare il dominio /REPLICATE nel percorso. Arrestare la replica sulla griglia di origine utilizzando i metodi del passaggio 4a.
- Disattiva lo scricchiolio con il comando:
avmaint config --ava asynccrunching=false
Potrebbero essere necessari fino a 15 minuti prima che il crunching si arresti; controllare i registri GSAN dei nodi di dati per verificare la presenza di eventuali messaggi di "crunch".
- Disattiva il bilanciamento
- Verificare se il bilanciamento è in esecuzione:
avmaint config --ava | grep balancemin
In genere, il bilanciamento non deve essere abilitato (qualsiasi valore diverso da 0), ma è comunque importante controllare.
- Per disabilitare il bilanciamento:
avmaint config --ava balancemin=0
L'arresto del bilanciamento potrebbe richiedere fino a 15 minuti. Controllare status.dpn per verificare se è in corso la migrazione di stripe per confermare che il bilanciamento è terminato.
- Controllare la capacità:
- Controllare la capacità del sistema operativo:
avmaint nodelist --ava | grep fs-perc
- Controllare le dimensioni dei checkpoint:
mapall copy ~/cps # only if cps does not exist on the data nodes mapall --noerror './cps'
- Controllare l'elenco dei checkpoint per determinare quali checkpoint DEVONO essere mantenuti (l'ultimo checkpoint convalidato su tutti i nodi):
cplist
A seconda dei risultati di cui sopra, determinare quanti checkpoint possono essere mantenuti, quali sono critici e quanti nuovi checkpoint possono essere creati.
Per informazioni sulla capacità, consultare l'articolo Avamar: Concetti e formazione sul capacity management
- Conoscere l'ordine dei nodi e le differenze tra i numeri dei nodi logici e i numeri dei nodi fisici:
nodenumbers status.dpn mapall --noerror 'tail -2 /data01/cur/gsan.log'
- Revisione dell hardware
- Tutte le attività automatizzate dovrebbero ora essere interrotte.
- Il server dovrebbe avere poca attività e dovrebbe essere sicuro procedere con eventuali attività o comandi manuali.
Controllare il server controllando i registri GSAN tra i nodi di dati. Verificare che l'attività registrata sia minima o nulla.
Il comando uptime può essere eseguito anche utilizzando mapall per verificare che la "media di carico" tra i nodi di dati sia bassa (tra 0,01 e 0,05)
Ad esempio:
Ad esempio:
mapall --noerror 'uptime' (0.0) ssh -x admin@10.xx.xx.xxx 'uptime' 16:39:29 up 100 days, 6:39, 0 users, load average: 0.01, 0.02, 0.01 (0.1) ssh -x admin@10.xx.xx.xxx 'uptime' 16:39:29 up 100 days, 6:39, 0 users, load average: 0.02, 0.01, 0.01 (0.2) ssh -x admin@10.xx.xx.xxx 'uptime' 16:39:29 up 100 days, 6:39, 0 users, load average: 0.02, 0.01, 0.01La procedura precedente imposta il server su uno stato non di produzione. Annulla sempre le modifiche una volta completate tutte le attività manuali.
Additional Information
Affected Products
Avamar, Avamar ServerArticle Properties
Article Number: 000170876
Article Type: Solution
Last Modified: 06 Aug 2025
Version: 15
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.