Procesos de recuperación de espacio de Avamar: parte 1: Recolección
Summary: En este artículo de la base de conocimientos, se describe la primera parte del proceso de recuperación de espacio de Avamar. Esto se conoce como recolección de elementos no utilizados.
Instructions
Este artículo es el primero de una serie que documenta cómo Avamar recicla el espacio, tanto dentro de GSAN como en los discos duros.
- Procesos de recuperación de espacio de Avamar: parte 1: Recolección
- Procesos de recuperación de espacio de Avamar: parte 2: Crujido
- Procesos de recuperación de espacio de Avamar: parte 3: Proceso de eliminación de punto de control (RMCP)
La implementación actual de la recolección de elementos no utilizados se introdujo junto con Avamar v7.0, y su diseño se ha mantenido en gran medida sin cambios.
¿Qué hace la recolección de elementos no utilizados?
La recolección de elementos no utilizados es la primera etapa del proceso en la que Avamar recupera espacio que se utilizó para almacenar datos de respaldo.
Funciona en el directorio cur y libera espacio dentro de GSAN mediante la eliminación de fragmentos de datos a los que ya no hace referencia ningún respaldo:
- Se dice que los datos se "definen" si se pueden buscar en el índice.
- Se hace referencia a los datos si existen como parte de un respaldo (es decir, el hash está presente en el sistema de contabilidad de usuarios, las fracciones compuestas o los elementos de directorio).
El espacio recuperado por la recolección de elementos no utilizados no se puede reutilizar hasta que se haya ejecutado el procesamiento . El procesamiento se ejecuta inmediatamente después de que finaliza la recolección de elementos no utilizados programada diariamente. Consulte Procesos de recuperación de espacio de Avamar: parte 2: Procesamiento.
¿Cuándo se ejecuta la recolección de elementos no utilizados?
¿Por cuánto tiempo se ejecuta la recolección de elementos no utilizados?
De manera predeterminada, la recolección de elementos no utilizados se ejecuta durante 4 horas. Si no se completan dos pasadas dentro de este tiempo, el tiempo de ejecución de la siguiente recolección de elementos no utilizados aumentará 15 minutos. Esto continúa hasta que dos pases se completan correctamente o se alcanza el límite predeterminado de 7 horas (420 minutos).
Los problemas comunes se enumeran a continuación. Es posible que algunos artículos requieran que se visualice la autenticación en el sitio de soporte de Dell.
- El programador de mantenimiento o, más específicamente, la recolección de elementos no utilizados está deshabilitada. La salida de status.dpn para puede confirmar esto.
- La capacidad del sistema operativo está por encima del valor disknogc (que puede ser del 86 % al 89 %).
- Problemas de sincronización de hora entre los nodos de Avamar.
- Las fracciones de índice se dividen.
- Los mapas de bits a los que se hace referencia a hash no se pueden restablecer.
Cómo funciona la recolección de elementos no utilizados
Paso 1: Creación de la tabla de conteos de referencia (TORC):
La recolección de elementos no utilizados lee entradas en el sistema de contabilidad de usuarios, las fracciones compuestas y los elementos de directorio para crear una tabla de conteos de referencia (TORC).
En TORC, la recolección de elementos no utilizados registra todos los hashes en el sistema y cuántas veces se hace referencia a cada hash.
Paso 2: Lectura de los índices:
Una vez que se completa el TORC, cada nodo carga un subconjunto de sus fracciones de índice individuales en la memoria. El parámetro gccount define la cantidad de fracciones de lectura. Para cada hash definido en el índice, la recolección de elementos no utilizados busca el hash en el TORC para comprobar si se hace referencia a él.
- Si el hash existe tanto en el índice como en el TORC, no hay nada que hacer. Cada hash en el TORC tiene un conteo de referencias de al menos 1, por lo que se define y se hace referencia al hash.
- Si el hash existe en el índice, pero no en el TORC, el hash se define, pero no se hace referencia a él, por lo que se puede quitar.
Nota: Si el hash existiera en el TORC, pero no en el índice, se trataría de un error de integridad de datos (hash al que se hace referencia, pero que no está definido). Esto da como resultado una falla de hfscheck.
Paso 3: Eliminar hashes no referenciados:
Como mencionamos anteriormente, los hashes a los que no se hace referencia no forman parte de ningún respaldo, por lo que se pueden eliminar de manera segura de Avamar. Para ello, realice lo siguiente:
- Elimina la entrada en el índice.
- Elimina a cero la entrada para el hash en el descriptor de encabezado del fragmento (CHD). El CHD define dónde se encuentran los fragmentos individuales dentro del contenedor de fracciones.
Avamar marcó el área que ocupaba el hash como vacía. Por motivos de rendimiento o capacidad, los datos no se eliminan en esta etapa.
Paso 4: Actualice TORC:
Si el fragmento que eliminó la recolección de elementos no utilizados era una organización compuesta, se debe actualizar toRC.
Si observamos el paso 1, los conteos de referencia en torc incluyen referencias hechas por fracciones compuestas, que contienen fragmentos compuestos.
Dado que se quitó un fragmento compuesto, podemos disminuir el conteo de referencias en el TORC por uno para los hashes a los que hace referencia ese fragmento compuesto.
La recolección de elementos no utilizados realiza esto mediante la lectura en la organización compuesta, para ver qué hashes hace referencia a y, a continuación, actualizar TORC.
Paso 5: Lea el siguiente conjunto de índices:
La recolección de elementos no utilizados descarga el conjunto anterior de fracciones de índice de la memoria y, a continuación, carga un nuevo conjunto.
Los pasos 2, 3 y 4 se repiten para estas nuevas fracciones de índice.
Una vez que se leen todas las fracciones de índice, se elimina cualquier fragmento de datos (conocido como fragmentos "atómicos") en el TORC que tenga 0 referencias (gracias al paso 4).
Paso 6: Inicie una nueva aprobación:
Una vez que se leen todos los índices, la recolección de elementos no utilizados inicia una nueva aprobación.
Todas las fracciones de índice se vuelven a leer y buscan datos a los que ya no se hace referencia gracias a nuestras pasadas anteriores.
Esto es necesario porque los hashes no se leen en un orden lógico, sino en el orden en que se almacenan en los índices.
La recolección de elementos no utilizados no está segura de encontrar los hashes en el orden óptimo. Un hash puede permanecer al que se hace referencia hasta el final de la pasada.
Dos pasadas de recolección de elementos no utilizados pueden mantener cómodamente una capacidad de "estado estable" en la mayoría de los entornos de servidores Avamar.
La recolección de elementos no utilizados realiza pasadas hasta que se agota el tiempo o se completa una pasada sin eliminar ningún dato.
Recolección manual de elementos no utilizados
No se debe realizar una micromanage de un servidor Avamar. El programador está diseñado para automatizar la ejecución de tareas de mantenimiento. Si la capacidad de Avamar es alta, consulte la Guía de mejores prácticas operacionales de Avamar y Avamar: Conceptos y capacitación de administración de capacidad.
En raras ocasiones, la ejecución de la recolección de elementos no utilizados puede ayudar a aliviar problemas graves en los que la "capacidad del usuario" de GSAN es tan alta que el sistema entra en el modo de solo lectura.
En estos casos, la recolección de elementos no utilizados se ejecuta manualmente para reducir el nivel de capacidad a solo debajo del umbral de solo lectura. Esto permite que se ejecute la ventana de respaldo.
La recolección de elementos no utilizados automatizada puede seguir funcionando de manera normal.
El soporte de Avamar debe investigar y comprender completamente la situación antes de que se considere la recolección manual de elementos no utilizados.
Nunca es apropiado solicitar que el soporte ejecute la recolección manual de elementos no utilizados en un sistema sin la autorización de un ingeniero de soporte L2 después de una investigación de este tipo.
Consulte Avamar: acerca del uso de la recolección de elementos no utilizados manual.