Avamar: La recolección de elementos no utilizados falla con MSG_ERR_TRYAGAINLATER
Summary: A partir de v7.x, donde se permiten respaldos durante el trabajo de mantenimiento de la recolección de elementos no utilizados, ocasionalmente se puede ver el mensaje "MSG_ERR_TRYAGAINLATER". ...
Symptoms
El trabajo de mantenimiento de la recolección de elementos no utilizados de Avamar finaliza con el error MSG_ERR_TRYAGAINLATER.
Para verificar el problema:
-
status.dpnMuestra:
admin@avamarhost:~/>: status.dpn ... Last GC: finished Mon Dec 23 06:08:00 2013 after 03m 05s >> recovered 0.00 KB (MSG_ERR_TRYAGAINLATER)
-
Verifique mediante
dumpmaintlogscomando:
admin@avamarhost:~/>: dumpmaintlogs --types=gc --days=1
...
2013/12/23-12:08:00.9673 {0.0} <4202> failed garbage collection with error MSG_ERR_TRYAGAINLATER
-
De manera opcional, el soporte de Avamar puede verificar esto en los registros del servidor Avamar.
Cause
Este es el comportamiento esperado y se produce a medida que se agregan nuevos datos a Avamar desde los respaldos.
Cuando los contenedores de almacenamiento, o "fracciones" en Avamar, se dividen en dos, se denomina "división de secciones de índice".
En raras ocasiones, esto ocurre en raras ocasiones y solo después de que se alcanzan ciertos intervalos de capacidad según el tamaño, el conteo, la versión del nodo, etc. Esta tarea de mantenimiento no se puede realizar durante la GC.
Si una sección de índice se divide cuando se intentan realizar ciertas operaciones de GC, el GC se cierra con MSG_ERR_TRYAGAINLATER.
Si una banda de índice está ejecutando GC y debe dividirse, espera hasta que las operaciones de GC se hayan completado.
Las franjas de índice en una cuadrícula tienden a dividirse aproximadamente en el mismo período entre sí en los distintos nodos. A veces, esto puede tardar unos días en completarse.
Resolution
Avamar está funcionando según lo previsto.
Cuando se completa la división de la sección del índice, se reanuda la recolección de elementos no utilizados.
La solución alternativa es no ejecutar respaldos durante GC.
Additional Information
- Este comportamiento no se produce en una cuadrícula que está en "estado estacionario" (tiene una utilización de capacidad estable o decreciente), ya que todas las secciones que deben existir ya existen.
- Este comportamiento no se produce en una cuadrícula que se ha llenado y que desde entonces ha reducido su capacidad (sin haberse ampliado con nuevos nodos). Esto se debe a que ya existen todas las franjas que se pueden crear en una cuadrícula.
- El comportamiento puede ocurrir después de que se agrega un nodo y existe capacidad adicional para dividir aún más las fracciones.
- El problema puede repetirse de vez en cuando y es más probable que se observe en las cuadrículas de Avamar que experimentan un crecimiento sostenido de los datos o que se expandieron recientemente con nodos adicionales.
- El comportamiento puede persistir durante una serie de días.