Impacto sobre o desempenho da limpeza e do sistema Data Domain da conversão para a compactação GZ
Summary: Este artigo fornece informações sobre os diferentes algoritmos de compactação compatíveis com o DDR, juntamente com o impacto da conversão do sistema para usar o algoritmo GZ.
Instructions
SOLUÇÃO
Atualmente, o DDOS é compatível com quatro tipos diferentes de compactação com diferentes níveis de carga da CPU de compactação. A tabela a seguir resume as características de cada opção:
type expected-comp CPU-load ---------- -------------------- -------------- none 1.0x 0x lz(default) 2.0x 1x gzfast 2.5x 2x gz 3.0x 5x
Por exemplo, o algoritmo de compactação gz fornece cerca de 3x compactação local, mas usa cerca de 5x mais CPU para executar a parte de compactação do código do que lz. Os números de compactação esperados podem variar muito com base no tipo de dados. Para alguns tipos de dados, gz pode ser apenas 10% melhor que lz, enquanto para outros tipos de dados, é 2x ou melhor que lz.
Em geral, arquivos com muitas cadeias semelhantes de dados tendem a compactar melhor com gz do que lz.
Exemplos desses conjuntos de dados incluem:
- Arquivos de banco de dados.
- Arquivos de log.
Consequências do uso da compactação GZ:
Como os algoritmos de compactação mais fortes usam mais CPU, eles podem ter consequências significativas no desempenho:
- Os backups com baixa desduplicação são executados mais lentamente, pois mais novos dados precisam ser compactados e gravados no disco. Em particular, o primeiro backup completo provavelmente alcançará 50% do throughput de pico nominal.
- Como a limpeza descompacta e recompacta os dados enquanto ela está em execução, a limpeza pode levar mais tempo para ser executada e pode retardar outras atividades no sistema, como backups e replicação.
- O DDR de origem em um par de replicação de diretório compacta os dados usando o algoritmo de compactação usado pelo destino antes de enviar os dados. Portanto, se o destino usa o algoritmo de compactação gz, a replicação pode ser executada mais lentamente e pode fazer com que outras atividades no sistema, como backups e limpeza, sejam executadas mais lentamente.
Portanto, a conversão para a compactação GZ é uma decisão que deve ser tomada com base na carga de trabalho que o sistema vai experimentar. Caso contrário, um problema de capacidade será essencialmente convertido em um problema de desempenho.
Na seção a seguir, descrevemos as características da carga de trabalho em que GZ seria útil.
Quem deve usar a compactação GZ?
Aplicativos com requisitos de alto desempenho de backup e desduplicação, baixa rotatividade são candidatos ideais para usar o gz. Um bom exemplo são os aplicativos nearline. A maioria dos DDRs em campo usados para aplicativos nearline já usam gz.
Como faço para alterar o tipo de compactação?
Use os seguintes comandos para alterar o tipo de compactação:
# filesys disable
# filesys option set local-compression-type {none | lz | gzfast | gz}
# filesys enable
Depois que o tipo de compactação é alterado, todas as novas gravações usam o novo tipo de compactação e todos os dados já gravados serão convertidos preguiçosamente para o novo tipo de compactação durante a limpeza. A conversão preguiçosa significa que nem todos os recipientes serão recomprimidos durante a primeira rodada de limpeza. São necessárias várias rodadas de limpeza para recompactar totalmente todos os dados existentes nos DDRs antes da alteração da política de compactação.
A política de limpeza determina quais contêineres são selecionados em uma rodada específica de limpeza, e somente esses contêineres são recompactados. A política de limpeza é baseada na quantidade de dados de lixo que um determinado contêiner retém. Dados de lixo significam dados excluídos que não são mais referenciados pelo namespace. Quanto mais lixo um recipiente tiver, maior a probabilidade de ele ser selecionado para limpeza.
Se o cliente quiser pagar um ganho único, ele poderá seguir o seguinte procedimento:
-
Desative o DDFS usando o comando:
filesys disable
-
Use o seguinte comando para desativar a conversão lenta (requer o modo SE):
reg set system.GC_APPLY_LAZY_CONVERSION=false
-
Habilite o DDFS usando o comando:
filesys enable
Como resultado, a primeira limpeza depois de alterar o tipo de compactação e desabilitar a conversão lenta pode levar mais tempo para ser executada. Sempre que alterar o tipo de compactação, você deve monitorar cuidadosamente o sistema por uma ou duas semanas para se certificar de que ele está se comportando bem.
Additional Information
REFERÊNCIA
Impacto no desempenho do sistema e da limpeza da conversão para o LZ 180977 de compactação