Avamar: Procedura per convalidare gli errori di garbage collection su Avamar
Summary: Di seguito sono riportati i passaggi per convalidare gli errori di Garbage Collection (GC) su Avamar.
Symptoms
Che cos'è la garbage collection?
La garbage collection (GC) è il processo di eliminazione dei blocchi inutilizzati dai backup scaduti. In questo modo si libera capacità sull'Avamar Server.
Per impostazione predefinita, la garbage collection viene eseguita una volta al giorno a partire dall'inizio della finestra di manutenzione.
Sintomi comuni di errore:
MSG_ERR_DDR_ERRORMSG_ERR_DISKFULLMSG_ERR_MISCMSG_ERR_TRYAGAINLATERMSG_ERR_BADTIMESYNC
Cause
Cause comuni degli errori dei GC:
MSG_ERR_DDR_ERROR
- Esistono molti problemi sottostanti che possono causare l'esito negativo di GC con
MSG_ERR_DDR_ERROR. Ecco alcuni di questi motivi:- Errori di rete o di connettività
- Problemi con il file system di Data Domain
- L'appliance Data Domain si riempie
- Una password utente DD Boost scaduta o errata
- Sono presenti troppi checkpoint (Avamar) o snapshot (Data Domain). Questo di solito è abbinato a
hfscheckErrori che non consentono il "roll-off" di checkpoint e istantanee precedenti.
MSG_ERR_MISC oppure MSG_ERR_TRYAGAINLATER
- A partire da Avamar v.7, i backup possono essere eseguiti contemporaneamente alla garbage collection.
- Occasionalmente, si verifica un processo denominato "suddivisione dello stripe di indice" quando vengono aggiunti nuovi dati dai backup.
- Poiché questo processo "Index Stripe Splitting" non può essere eseguito mentre è in esecuzione la garbage collection, viene segnalato uno degli errori riportati sopra.
- Gli stripe di indice in una griglia tendono a dividersi nello stesso periodo di tempo l'uno dell'altro nei vari nodi.
- A volte il completamento di questa operazione può richiedere alcuni giorni.
- Avamar funziona come previsto. La soluzione alternativa consiste nel non eseguire i backup durante GC.
MSG_ERR_BADTIMESYNC
- Si tratta di un problema raro e riscontrato solo sulle griglie a più nodi. L'errore si verifica quando l'ora non è sincronizzata tra uno o più nodi di dati Avamar e l'utility node.
- È probabile che tutte le attività di manutenzione (GC, checkpoint e
hfscheck)segnalano lo stesso errore.
Resolution
Determinazione dello stato di Garbage Collection più recente:
Le informazioni sulla garbage collection più recente possono essere visualizzate utilizzando l'interfaccia utente di CLI, AUI o Management Console Server (MCS).
Dalla CLI:

- Aprire una sessione SSH (ad esempio putty) su Avamar Server e accedere come "admin". Eseguire i comandi seguenti:
status.dpn avmaint gcstatus
- Gli esempi seguenti mostrano una Garbage Collection riuscita:
Last GC: finished Tue Jul 9 00:00:23 2024 after 00m 03s >> recovered 199.88 KB (OK) Last GC: finished Wed Jun 5 09:20:46 2024 after 00m 12s >> recovered 0.00 KB (OK)
- Se lo stato è diverso da (OK), è presente un potenziale problema con la garbage collection:
Last GC: finished Mon Jun 17 09:02:41 2024 after 01m 51s >> recovered 14.98 MB (MSG_ERR_DDR_ERROR) Last GC: finished Thu Jun 13 07:06:54 2024 after 03m 41s >> recovered 0.00 KB (MSG_ERR_DISKFULL) Last GC: finished Mon Jun 10 19:04:58 2024 after 01m 01s >> recovered 0 KB (MSG_ERR_MISC) Last GC: finished Thu Jun 16:21:12 2024 after 00m 25s >> recovered 0 KB (MSG_ERR_BADTIMESYNC)
Dall'AUI:
- Esaminare lo "Stato dell'ultima garbage collection". Se lo stato è diverso da (OK), è presente un potenziale problema con la garbage collection.
Dall'interfaccia utente di MCS:
- Se "Last Garbage collection" presenta una "x" rossa come mostrato sopra, è presente un potenziale problema con la garbage collection e sono necessarie ulteriori analisi.
Se la garbage collection continua a non riuscire a causa di un problema reale (come convalidato utilizzando la procedura precedente), selezionare le opzioni appropriate nel modulo di risposta agli avvisi per trasferire la richiesta di assistenza a un agente del supporto.
Additional Information
Riconoscimento degli errori una volta risolto il problema:
Dalla CLI:
- Trovare gli eventi Unacknowledged eseguendo:
mccli event show --unack
- Confermare il codice singolo inserendo l'ID univoco o tutti i codici errore:
mccli event show --id-

Dall'AUI:
- Accedere all'AUI e visualizzare il dashboard:
- Fare clic sul punto esclamativo per visualizzare una schermata simile a quella riportata di seguito:
- Cliccare su Unacknowledged events e la schermata mostra qualcosa di simile a quanto segue:
- Selezionare l'evento (come mostrato sopra) e cliccare su Acknowledge.
Determinazione della durata dell'errore del GC:
Il modo più semplice per determinare da quanto tempo GC ha avuto esito negativo consiste nell'utilizzare la CLI (anche se queste informazioni sono disponibili anche nell'interfaccia utente AUI e MCS).
Il comando seguente mostra tutti gli errori di garbage collection degli ultimi 30 giorni:
dumpmaintlogs --types=gc --days=30 |grep "failed garbage collection"
2024/05/27-16:32:18.55893 {0.0} <4202> failed garbage collection with error MSG_ERR_DDR_ERROR
2024/05/28-16:32:37.92920 {0.0} <4202> failed garbage collection with error MSG_ERR_DDR_ERROR
2024/05/29-16:31:51.62962 {0.0} <4202> failed garbage collection with error MSG_ERR_DDR_ERROR
2024/05/30-16:31:55.18969 {0.0} <4202> failed garbage collection with error MSG_ERR_DDR_ERROR
2024/06/20-01:19:09.97961 {0.0} <4202> failed garbage collection with error MSG_ERR_DDR_ERROR
