Avamar: Affaldsindsamling mislykkes med MSG_ERR_TRYAGAINLATER
Summary: Fra v7.x, hvor sikkerhedskopiering er tilladt under vedligeholdelsesjobbet Garbage Collection, kan meddelelsen "MSG_ERR_TRYAGAINLATER" lejlighedsvis vises.
Symptoms
Vedligeholdelsesjobbet Avamar Garbage Collection afsluttes med fejlen MSG_ERR_TRYAGAINLATER.
Sådan bekræfter du problemet:
-
status.dpnViser:
admin@avamarhost:~/>: status.dpn ... Last GC: finished Mon Dec 23 06:08:00 2013 after 03m 05s >> recovered 0.00 KB (MSG_ERR_TRYAGAINLATER)
-
Bekræft ved hjælp af
dumpmaintlogsKommando:
admin@avamarhost:~/>: dumpmaintlogs --types=gc --days=1
...
2013/12/23-12:08:00.9673 {0.0} <4202> failed garbage collection with error MSG_ERR_TRYAGAINLATER
-
Du kan også tjekke dette ind i Avamar-serverlogfilerne af Avamar Support.
Cause
Dette er forventeligt og opstår, når nye data føjes til Avamar fra sikkerhedskopier.
Når storagebeholdere eller "stripes" på Avamar opdeles i to, kaldes det "indeksstribe opdeling".
Dette sker i sjældne tilfælde sjældent og kun efter visse kapacitetsintervaller er nået afhængigt af nodestørrelse, antal, version osv. Denne vedligeholdelsesopgave kan ikke udføres under GC.
Hvis en indeksstribe opdeles, når visse GC-handlinger forsøges, afsluttes GC med MSG_ERR_TRYAGAINLATER.
Hvis en indeksstribe kører GC, og den skal opdeles, venter den, indtil GC-handlingerne er fuldført.
Indeksstriber på et gitter har tendens til at opdele sig omkring den samme tidsperiode som hinanden på de forskellige noder. Nogle gange kan det tage et par dage at gennemføre.
Resolution
Avamar virker efter hensigten.
Når opdelingen af indeksstriben er fuldført, genoptages affaldsindsamlingen.
Løsningen er ikke at køre sikkerhedskopier under GC.
Additional Information
- Denne adfærd forekommer ikke på et gitter, der er i "steady state" (har stabil eller faldende kapacitetsudnyttelse), da alle de striber, der skal eksistere, allerede eksisterer.
- Denne funktionsmåde forekommer ikke på et net, der er blevet fuldt og siden er reduceret i kapacitet (uden at være blevet udvidet med nye noder). Dette skyldes, at alle de striber, der kan oprettes på et gitter, allerede eksisterer.
- Funktionsmåden kan opstå, når en node er blevet tilføjet, og der findes yderligere kapacitet til at opdele striber yderligere.
- Problemet kan opstå igen fra tid til anden og ses med større sandsynlighed på Avamar-netværk, der oplever vedvarende datavækst, eller som for nylig er blevet udvidet med yderligere noder.
- Adfærden kan vare over en række dage.