Sistema Data Domain y rendimiento de limpieza Impacto de la conversión a la compresión GZ

Summary: En este artículo, se proporciona información sobre los diferentes algoritmos de compresión compatibles con el DDR, junto con el impacto de convertir el sistema para utilizar el algoritmo GZ. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

SOLUCIÓN

Actualmente, DDOS admite cuatro tipos de compresión diferentes con distintos niveles de carga de compresión de la CPU. En la siguiente tabla se resumen las características de cada opción:
 

type         expected-comp               CPU-load 
----------   --------------------   -------------- 
none         1.0x                       0x 
lz(default)  2.0x                       1x 
gzfast       2.5x                       2x 
gz           3.0x                       5x
Por ejemplo, el algoritmo de compresión gz proporciona aproximadamente 3 veces la compresión local, pero utiliza aproximadamente 5 veces más CPU para ejecutar la parte de compresión del código que lz. Las cifras de compresión esperadas pueden variar en gran medida según el tipo de datos. Para algunos tipos de datos, gz puede ser solo un 10 % mejor que lz, mientras que para otros tipos de datos, es 2 veces o mejor que lz.
 
En general, los archivos con muchas cadenas de datos similares tienden a comprimirse mejor con gz que con lz.

Algunos ejemplos de estos conjuntos de datos son:

  • Archivos de base de datos.
  • Archivos de registro.

Consecuencias del uso de la compresión GZ:

Dado que los algoritmos de compresión más potentes utilizan más CPU, pueden tener consecuencias significativas en el rendimiento:

  • Los respaldos con baja desduplicación se ejecutan más lentamente, ya que se deben comprimir y escribir más datos nuevos en el disco. En particular, es probable que el primer respaldo completo alcance el 50 % del rendimiento máximo nominal.
  • Dado que la limpieza descomprime y vuelve a comprimir los datos mientras se ejecutan, la limpieza puede tardar más en ejecutarse y puede ralentizar otras actividades en el sistema, como respaldos y replicación.
  • El DDR de origen en un par de replicación de directorios comprime los datos mediante el algoritmo de compresión utilizado por el destino antes de enviar los datos. Por lo tanto, si el destino utiliza el algoritmo de compresión gz, la replicación puede ejecutarse más lentamente y puede provocar que otras actividades en el sistema, como los respaldos y la limpieza, se ejecuten más lentamente. 

Por lo tanto, la conversión a la compresión GZ es una decisión que se debe tomar en función de la carga de trabajo que experimentará el sistema. De lo contrario, un problema de capacidad se convertirá esencialmente en un problema de rendimiento.

En la siguiente sección, describimos las características de la carga de trabajo en las que GZ sería útil.

¿Quién debe usar la compresión GZ?

Las aplicaciones con alta desduplicación, baja rotación y bajos requisitos de rendimiento de respaldo son candidatas ideales para usar gz. Un buen ejemplo son las aplicaciones nearline. La mayoría de los DDR en el campo utilizados para aplicaciones nearline ya utilizan gz.

¿Cómo cambio el tipo de compresión?

Utilice los siguientes comandos para cambiar el tipo de compresión:

# filesys disable
# filesys option set local-compression-type {none | lz | gzfast | gz}
# filesys enable

 

PRECAUCIÓN: Antes de cambiar el tipo de compresión local, se debe apagar el sistema de archivos. Se puede reiniciar inmediatamente después de establecer la opción de compresión.

Una vez que se cambia el tipo de compresión, todas las escrituras nuevas utilizan el nuevo tipo de compresión y los datos ya escritos se convertirán de forma diferida al nuevo tipo de compresión durante la limpieza. La conversión perezosa significa que no todos los envases se volverán a comprimir durante la primera ronda de limpieza. Se necesitan varias rondas de limpieza para volver a comprimir completamente todos los datos existentes en las DDR antes del cambio de la política de compresión.

La política de limpieza determina qué contenedores se seleccionan en una ronda específica de limpieza y solo esos contenedores se vuelven a comprimir. La política de limpieza se basa en la cantidad de datos no utilizados que contiene un contenedor determinado.  Los datos no utilizados son datos eliminados a los que el espacio de nombres ya no hace referencia. Cuanta más basura tenga un contenedor, más probable es que sea seleccionado para su limpieza.

Si el cliente desea pagar una visita única, puede seguir el siguiente procedimiento:

  1. Deshabilite DDFS mediante el comando:

    filesys disable
  2. Utilice el siguiente comando para deshabilitar la conversión diferida (requiere el modo SE):

    reg set system.GC_APPLY_LAZY_CONVERSION=false
  3. Habilite DDFS mediante el comando:

    filesys enable

Como resultado, la primera limpieza después de cambiar el tipo de compresión y deshabilitar la conversión diferida puede tardar más tiempo en ejecutarse. Siempre que cambie el tipo de compresión, debe monitorear cuidadosamente el sistema durante una o dos semanas para asegurarse de que se comporte bien.


Additional Information

    REFERENCIA

    Impacto en el rendimiento de limpieza y del sistema de la conversión a 180977 de compresión LZ

    Affected Products

    Data Domain

    Products

    Data Domain
    Article Properties
    Article Number: 000004020
    Article Type: How To
    Last Modified: 23 Sep 2024
    Version:  6
    Find answers to your questions from other Dell users
    Support Services
    Check if your device is covered by Support Services.