Avamar: Søppelhenting mislykkes med MSG_ERR_TRYAGAINLATER
Summary: Fra og med v7.x, der sikkerhetskopiering er tillatt under vedlikeholdsjobben for søppelhenting, kan du av og til se meldingen "MSG_ERR_TRYAGAINLATER".
Symptoms
Vedlikeholdsjobben for Avamar-søppelhenting avsluttes med feilen MSG_ERR_TRYAGAINLATER.
Slik bekrefter du problemet:
-
status.dpnViser:
admin@avamarhost:~/>: status.dpn ... Last GC: finished Mon Dec 23 06:08:00 2013 after 03m 05s >> recovered 0.00 KB (MSG_ERR_TRYAGAINLATER)
-
Bekreft ved hjelp av
dumpmaintlogsKommandoen:
admin@avamarhost:~/>: dumpmaintlogs --types=gc --days=1
...
2013/12/23-12:08:00.9673 {0.0} <4202> failed garbage collection with error MSG_ERR_TRYAGAINLATER
-
Dette kan også kontrolleres i Avamar-serverloggene av Avamar Support.
Cause
Dette er forventet atferd og oppstår når nye data legges til Avamar fra sikkerhetskopier.
Når oppbevaringsbeholdere, eller "striper" på Avamar, deles i to, kalles det "Index Stripe Splitting".
Dette skjer i sjeldne tilfeller sjelden og bare etter at visse kapasitetsintervaller er nådd, avhengig av nodestørrelse, antall, versjon, så videre. Denne vedlikeholdsoppgaven kan ikke utføres under GC.
Hvis en indeksstripe deles når bestemte GC-operasjoner forsøkes, avsluttes GC med MSG_ERR_TRYAGAINLATER.
Hvis en indeksstripe kjører GC og den må deles, venter den til GC-operasjoner er fullført.
Indeksstriper på et rutenett har en tendens til å dele seg rundt samme tidsperiode som hverandre på de forskjellige nodene. Noen ganger kan dette ta noen dager å fullføre.
Resolution
Avamar fungerer som den skal.
Når indeksstripesplittingen fullføres, gjenopptas søppelinnsamlingen.
Løsningen er å ikke kjøre sikkerhetskopier under GC.
Additional Information
- Denne oppførselen forekommer ikke på et rutenett som er i "steady state" (har jevn eller synkende kapasitetsutnyttelse), siden alle stripene som må eksistere allerede eksisterer.
- Denne oppførselen oppstår ikke på et rutenett som har blitt fullt og siden har redusert i kapasitet (uten å ha blitt utvidet med nye noder). Dette er fordi alle stripene som kan opprettes på et rutenett allerede eksisterer.
- Atferden kan oppstå etter at en node er lagt til, og det finnes ytterligere kapasitet for å dele striper ytterligere.
- Problemet kan oppstå fra tid til annen, og det er mer sannsynlig å se på Avamar-rutenett som opplever vedvarende datavekst, eller som nylig har blitt utvidet med flere noder.
- Atferden kan vedvare over en rekke dager.