Sistema Data Domain e impatto sulle prestazioni di pulizia della conversione alla compressione GZ
Summary: Questo articolo fornisce informazioni sui diversi algoritmi di compressione supportati sul DDR e sull'impatto della conversione del sistema per l'utilizzo dell'algoritmo GZ.
Instructions
SOLUZIONE
DDOS supporta attualmente quattro diversi tipi di compressione con diversi livelli di carico della CPU di compressione. La tabella seguente riepiloga le caratteristiche di ciascuna opzione:
type expected-comp CPU-load ---------- -------------------- -------------- none 1.0x 0x lz(default) 2.0x 1x gzfast 2.5x 2x gz 3.0x 5x
Ad esempio, l'algoritmo di compressione gz fornisce circa 3 volte la compressione locale, ma utilizza circa 5 volte più CPU per eseguire la parte di compressione del codice rispetto a lz. Le cifre di compressione previste possono variare notevolmente in base al tipo di dati. Per alcuni tipi di dati, gz può essere solo il 10% migliore di lz, mentre per altri tipi di dati è 2 volte o migliore di lz.
In generale, i file con molte stringhe di dati simili tendono a essere compressi meglio con gz che con lz.
Esempi di tali set di dati includono:
- File di database.
- File di registro.
Conseguenze dell'utilizzo della compressione GZ:
Poiché gli algoritmi di compressione più potenti utilizzano più CPU, possono avere conseguenze significative sulle prestazioni:
- L'esecuzione dei backup con deduplica bassa è più lenta poiché è necessario comprimere e scrivere su disco un numero maggiore di nuovi dati. In particolare, il primo backup completo raggiungerà probabilmente il 50% del throughput di picco nominale.
- Poiché la pulizia decomprime e ricomprime i dati mentre sono in esecuzione, la pulizia potrebbe richiedere più tempo e potrebbe rallentare altre attività sul sistema, ad esempio backup e replica.
- Il DDR di origine in una coppia di replica di directory comprime i dati utilizzando l'algoritmo di compressione utilizzato dalla destinazione prima di inviare i dati. Pertanto, se la destinazione utilizza l'algoritmo di compressione gz, l'esecuzione della replica potrebbe essere più lenta e altre attività sul sistema, ad esempio i backup e la pulizia, potrebbero essere più lente.
Pertanto, la conversione alla compressione GZ è una decisione da prendere in base al carico di lavoro del sistema. In caso contrario, un problema di capacità verrà essenzialmente convertito in un problema di prestazioni.
Nella sezione seguente vengono descritte le caratteristiche del carico di lavoro in cui GZ potrebbe essere utile.
A chi è rivolto la compressione GZ?
Le applicazioni con elevati requisiti di deduplica, varianza ridotta e prestazioni di backup ridotte sono i candidati ideali per l'utilizzo di gz. Un buon esempio sono le applicazioni nearline. La maggior parte dei DDR sul campo utilizzati per le applicazioni nearline utilizza già gz.
Come si modifica il tipo di compressione?
Utilizzare i seguenti comandi per modificare il tipo di compressione:
# filesys disable
# filesys option set local-compression-type {none | lz | gzfast | gz}
# filesys enable
Una volta modificato il tipo di compressione, tutte le nuove scritture utilizzano il nuovo tipo di compressione e tutti i dati già scritti verranno convertiti in modo differito nel nuovo tipo di compressione durante la pulizia. La conversione lazy significa che non tutti i contenitori verranno ricompressi durante il primo ciclo di pulizia. Sono necessari diversi cicli di pulizia per comprimere completamente tutti i dati esistenti sui DDR prima della modifica della policy di compressione.
I criteri di pulizia determinano quali contenitori vengono selezionati in un determinato ciclo di pulizia e solo questi contenitori vengono ricompressi. La policy di pulizia si basa sulla quantità di dati garbage contenuti in un determinato container. Per dati garbage si intendono i dati eliminati a cui non fa più riferimento il namespace. Più spazzatura ha un contenitore, più è probabile che venga selezionato per la pulizia.
Se il cliente desidera pagare una vincita una tantum, può seguire la seguente procedura:
-
Disabilitare DDFS utilizzando il comando:
filesys disable
-
Utilizzare il seguente comando per disabilitare la conversione lazy (richiede la modalità SE):
reg set system.GC_APPLY_LAZY_CONVERSION=false
-
Abilitare DDFS utilizzando il comando:
filesys enable
Di conseguenza, l'esecuzione della prima pulizia dopo la modifica del tipo di compressione e la disabilitazione della conversione lazy potrebbe richiedere più tempo. Ogni volta che si modifica il tipo di compressione, è necessario monitorare attentamente il sistema per una o due settimane per assicurarsi che si comporti correttamente.
Additional Information
RIFERIMENTO
Impatto sulle prestazioni di sistema e pulizia della conversione a LZ Compression 180977