Sistema Data Domain y rendimiento de limpieza Impacto de la conversión a la compresión GZ
Summary: En este artículo, se proporciona información sobre los diferentes algoritmos de compresión compatibles con el DDR, junto con el impacto de convertir el sistema para utilizar el algoritmo GZ. ...
Instructions
SOLUCIÓN
Actualmente, DDOS admite cuatro tipos de compresión diferentes con distintos niveles de carga de compresión de la CPU. En la siguiente tabla se resumen las características de cada opción:
type expected-comp CPU-load ---------- -------------------- -------------- none 1.0x 0x lz(default) 2.0x 1x gzfast 2.5x 2x gz 3.0x 5x
Por ejemplo, el algoritmo de compresión gz proporciona aproximadamente 3 veces la compresión local, pero utiliza aproximadamente 5 veces más CPU para ejecutar la parte de compresión del código que lz. Las cifras de compresión esperadas pueden variar en gran medida según el tipo de datos. Para algunos tipos de datos, gz puede ser solo un 10 % mejor que lz, mientras que para otros tipos de datos, es 2 veces o mejor que lz.
En general, los archivos con muchas cadenas de datos similares tienden a comprimirse mejor con gz que con lz.
Algunos ejemplos de estos conjuntos de datos son:
- Archivos de base de datos.
- Archivos de registro.
Consecuencias del uso de la compresión GZ:
Dado que los algoritmos de compresión más potentes utilizan más CPU, pueden tener consecuencias significativas en el rendimiento:
- Los respaldos con baja desduplicación se ejecutan más lentamente, ya que se deben comprimir y escribir más datos nuevos en el disco. En particular, es probable que el primer respaldo completo alcance el 50 % del rendimiento máximo nominal.
- Dado que la limpieza descomprime y vuelve a comprimir los datos mientras se ejecutan, la limpieza puede tardar más en ejecutarse y puede ralentizar otras actividades en el sistema, como respaldos y replicación.
- El DDR de origen en un par de replicación de directorios comprime los datos mediante el algoritmo de compresión utilizado por el destino antes de enviar los datos. Por lo tanto, si el destino utiliza el algoritmo de compresión gz, la replicación puede ejecutarse más lentamente y puede provocar que otras actividades en el sistema, como los respaldos y la limpieza, se ejecuten más lentamente.
Por lo tanto, la conversión a la compresión GZ es una decisión que se debe tomar en función de la carga de trabajo que experimentará el sistema. De lo contrario, un problema de capacidad se convertirá esencialmente en un problema de rendimiento.
En la siguiente sección, describimos las características de la carga de trabajo en las que GZ sería útil.
¿Quién debe usar la compresión GZ?
Las aplicaciones con alta desduplicación, baja rotación y bajos requisitos de rendimiento de respaldo son candidatas ideales para usar gz. Un buen ejemplo son las aplicaciones nearline. La mayoría de los DDR en el campo utilizados para aplicaciones nearline ya utilizan gz.
¿Cómo cambio el tipo de compresión?
Utilice los siguientes comandos para cambiar el tipo de compresión:
# filesys disable
# filesys option set local-compression-type {none | lz | gzfast | gz}
# filesys enable
Una vez que se cambia el tipo de compresión, todas las escrituras nuevas utilizan el nuevo tipo de compresión y los datos ya escritos se convertirán de forma diferida al nuevo tipo de compresión durante la limpieza. La conversión perezosa significa que no todos los envases se volverán a comprimir durante la primera ronda de limpieza. Se necesitan varias rondas de limpieza para volver a comprimir completamente todos los datos existentes en las DDR antes del cambio de la política de compresión.
La política de limpieza determina qué contenedores se seleccionan en una ronda específica de limpieza y solo esos contenedores se vuelven a comprimir. La política de limpieza se basa en la cantidad de datos no utilizados que contiene un contenedor determinado. Los datos no utilizados son datos eliminados a los que el espacio de nombres ya no hace referencia. Cuanta más basura tenga un contenedor, más probable es que sea seleccionado para su limpieza.
Si el cliente desea pagar una visita única, puede seguir el siguiente procedimiento:
-
Deshabilite DDFS mediante el comando:
filesys disable
-
Utilice el siguiente comando para deshabilitar la conversión diferida (requiere el modo SE):
reg set system.GC_APPLY_LAZY_CONVERSION=false
-
Habilite DDFS mediante el comando:
filesys enable
Como resultado, la primera limpieza después de cambiar el tipo de compresión y deshabilitar la conversión diferida puede tardar más tiempo en ejecutarse. Siempre que cambie el tipo de compresión, debe monitorear cuidadosamente el sistema durante una o dos semanas para asegurarse de que se comporte bien.
Additional Information
REFERENCIA
Impacto en el rendimiento de limpieza y del sistema de la conversión a 180977 de compresión LZ