NetWorker: Optimización de las operaciones de recuperación de espacio para Data Domain
Summary: En este artículo, se proporcionan algunos ajustes y pasos útiles para reducir la carga y ayudar a liberar espacio en los dispositivos Data Domain en una zona de datos de NetWorker.
Symptoms
- Savesets de NetWorker marcados como Vencidos, pero no eliminados
- Los mensajes de recuperación de espacio aparecen en los registros más de una vez al día
- Impactos en la carga y la velocidad de Data Domain
- Impactos generales en el rendimiento del servidor
Cause
- Los volúmenes elegibles para la recuperación de espacio se leen durante la acción de vencimiento (almacenamiento provisional, clonación o recuperación)
- La recuperación de espacio se ejecuta de manera predeterminada después de cada operación de almacenamiento provisional en un volumen determinado
- La recuperación de espacio comprueba cada archivo en una estructura de directorios de volúmenes cuando se ejecuta la recuperación de espacio
- Las operaciones del servidor y la capacidad de respuesta pueden ralentizarse durante la fase de recuperación de espacio
Resolution
La fase de recuperación de espacio de NetWorker se ejecuta una vez al día como una de las fases finales de la acción de vencimiento en el flujo de trabajo de respaldo del servidor. Está diseñado para eliminar objetos de archivo de saveset dentro de un volumen después de la evaluación, el vencimiento y la eliminación de registros de saveset del servidor después de calcular aquellos que son seguros de eliminar de acuerdo con su configuración.
Hay varios factores que pueden tener impactos adversos en la capacidad de respuesta de Data Domain o NetWorker Server. Habilite cualquiera de las siguientes opciones que parezcan adaptarse a los requisitos de la zona de datos en cuestión. Antes de considerar las pruebas con los siguientes archivos de claves de depuración: Deshabilite la acción diaria de vencimiento del respaldo > de Server Protection > Server para deshabilitar todos los cálculos de la base de datos de medios y el espacio de recuperación durante uno o más días a fin de confirmar que los problemas de rendimiento encontrados están relacionados con las actividades de recuperación de espacio o vencimiento.
Si la deshabilitación del vencimiento confirma el problema relacionado con el mantenimiento diario, las siguientes funciones se pueden deshabilitar para la solución de problemas mediante la creación de un archivo vacío del mismo nombre (sin una extensión) en NetWorker Server o node en el subdirectorio de depuración del directorio nsr principal. Ninguno de estos archivos de marca requiere un reinicio y surtirán efecto con los trabajos de recuperación de espacio iniciados mientras estén presentes.
Ubicación de Linux: /nsr/debug
Ubicación de Windows: C:\Program Files\EMC NetWorker\nsr\debug (o la ruta de instalación de NSR correspondiente)
Los nombres de los archivos y sus funciones se detallan a continuación:
skip_recover_space_for_stage
- Nodos de almacenamiento. Esta marca hace que NetWorker omita la fase de espacio de recuperación de una operación de almacenamiento provisional (clonación seguida de eliminación del origen). Si el entorno utiliza el almacenamiento provisional, especialmente el almacenamiento provisional a partir de los mismos volúmenes de origen repetidamente, se recomienda esto, ya que niega la posibilidad de generar varias operaciones de espacio de recuperación para los mismos volúmenes. Cuando esta marca está implementada, la operación de recuperación de espacio se aplaza por completo, lo que permite que el sistema elimine los archivos cuando se ejecuta la acción diaria de vencimiento o el comando nsrimmanualmente.
recover_space_anytime
- Solo servidor. Esto permite que el espacio de recuperación venza y elimina los savesets en los volúmenes que están leyendo activamente, que de manera predeterminada se aplazan. Esto significa que, para los volúmenes que tienen trabajos de clonación de larga duración, el vencimiento y la recuperación de espacio se pueden aplazar repetidamente cuando se ejecuta la acción de vencimiento, nsrim o un trabajo de almacenamiento provisional (consulte la versión anterior). Esto, a su vez, puede provocar grandes trabajos pendientes de recuperación de espacio, un agotamiento gradual del espacio libre y un trabajo de recuperación de espacio más grande cuando se permite su ejecución.
skip_disk_usage
- Nodos de almacenamiento. Como parte de la recuperación de espacio y la comprobación del sistema de archivos del volumen de disco, de manera predeterminada, los archivos individuales se comprueban y cuentan de manera recursiva a fin de producir un agregado preciso de datos para el volumen. Si bien algunos pueden considerar que esta precisión es esencial, el aplazamiento de este paso depende de los registros de la base de datos de medios de NetWorker para los totales de archivos y bytes, que generalmente se espera que sean lo suficientemente precisos para la mayoría de los usos. En un Data Domain muy cargado, especialmente uno donde muchas operaciones de espacio de recuperación se ejecutan repetidamente para volúmenes, esto se puede considerar un gasto innecesario y se puede deshabilitar de manera segura.
skip_consistency_check_in_recover_space
- Nodos de almacenamiento. Durante la recuperación de espacio de un volumen, el sistema de archivos del volumen se comprueba archivo por archivo para garantizar la coherencia entre la base de datos de medios; Esto también puede introducir latencia. La adición de este archivo de claves a cada nodo evitará que ese nodo elimine archivos de saveset en los que no existe un registro correspondiente en la base de datos de medios o que marque los registros de la base de datos de medios en los que no se encuentra ningún archivo como "sospechosos". Tenga en cuenta que esto evitará las operaciones de limpieza normales y se debe utilizar para ayudar a calificar la latencia relacionada con las operaciones de recuperación de espacio, y no se debe deshabilitar a largo plazo.
De manera predeterminada, se introdujo un registro más detallado, lo que provoca que todas las rutas del saveset se registren en los registros de data_audit en NetWorker Server. Cuando ya hay una carga pesada, muchos/grandes trabajos de recuperación de espacio, este es un factor que puede provocar falta de respuesta, en particular de los nodos de almacenamiento que devuelven la información de manera remota a NetWorker. Para deshabilitar esto, aumente el umbral de registro para estos registros en NetWorker Server:
# nsradmin
# nsradmin> show name; auditlog severity
# print type: nsr auditlog
Restrinja este cambio para que solo afecte a la auditoría de datos, si lo desea, refinando la consulta a la instancia específica mediante la inclusión de su nombre. Omita este paso para volver a aplicar el ajuste a cada uno:
# print type: nsr auditlog; name: servername_data_audit.raw
Cambie el umbral a uno o ambos a "Error" para dejar de registrar las eliminaciones individuales: las eliminaciones se siguen registrando en el daemon.raw del servidor.
# update auditlog severity: Error