Avamar-Data Domain: Alta utilização do DD de destino: Análise e práticas recomendadas
Summary: A utilização do disco nos Data Domains de origem e destino não são exatamente iguais. Este documento descreve os possíveis motivos pelos quais o Data Domain de destino pode apresentar uma utilização superior à do Data Domain de origem. É importante observar que a discrepância de utilização pode ocorrer devido a uma combinação dos motivos abaixo. ...
Symptoms
O Data Domain de destino apresenta uma utilização maior do que a do Data Domain de origem.
Cause
Da perspetiva do Avamar:
Reversão
No caso de uma reversão no Data Domain de origem, o Data Domain de destino pode manter os dados por mais dias, dependendo do tempo de reversão. Essa discrepância existirá até que os backups adicionais no destino expirem.
Exemplo: O DD1 é replicado para o DD2. Como a reversão é de dois dias atrás, observamos que há três backups na origem, porém cinco backups são replicados para o destino.
Replicações parciais
No caso de uma replicação não concluída com êxito, os dados que já foram replicados estão sendo armazenados por, no mínimo, sete dias e removidos pela limpeza do Data Domain. As replicações parciais contêm dados e impressões digitais que permitem que a repetição subsequente da replicação de dados seja executada com mais rapidez.
A sobrecarga da replicação parcial pode ser tão alta quanto a quantidade de dados replicados se as replicações falharem antes de serem concluídas.
Diferença na retenção
Na configuração do Avamar Server, é possível definir uma configuração para manter as réplicas no servidor de destino por mais tempo do que no de origem. Isso causará diferenças na utilização da capacidade.
Diferenças de configuração do Avamar
Um backup de checkpoint no Avamar Server pode ser significativamente grande. Se o backup for configurado apenas no Avamar de destino, ele aumentará a utilização do Data Domain no destino.
Da perspetiva do Data Domain:
Impressão digital.
Quando os dados são enviados ao Data Domain durante a replicação, eles estão sendo desduplicados. Uma impressão digital dos dados está sendo enviada ao Data Domain de destino primeiro para verificar se o destino tem os dados.
-
Se o Data Domain retornar que a impressão digital está lá, os dados não precisarão ser reenviados
-
Se o Data Domain não retornar que a impressão digital não foi encontrada, isso significará que:
-
a impressão digital não está lá
-
O Data Domain de destino tem a impressão digital, mas deseja que os dados sejam enviados de qualquer maneira para melhorar a localidade especial no Data Domain.
-
O Data Domain está ocupado e não deseja concluir toda a pesquisa.
-
Se dados duplicados forem enviados ao Data Domain, eles serão desduplicados durante a limpeza por meio da remoção das cópias adicionais dos dados.
O Data Domain de destino terá uma utilização maior, mas a variação não deve ser grande.
Sobrecarga de metadados.
Cada arquivo de backup vem com seus metadados de informações de arquivo e também contém impressões digitais para cada um.
Exemplo: Para um arquivo de 1 TB, o custo de utilização é de 0,3% do tamanho do arquivo.
Para um fragmento médio de 8 KB de dados, há 82 B de metadados. Isso representa cerca de 0,01% de sobrecarga para a capacidade pós-comp.
Essa sobrecarga aumenta ainda mais com a integração do Avamar, pois o Avamar combina os backups para obter um backup completo sintético a partir de um backup incremental sempre que o backup é concluído.
Também observamos que a sobrecarga de metadados aumenta quando há backups ignorados ou quando os dados são replicados fora de ordem.
Os únicos backups que não criam essa sobrecarga são os de VM. O custo dos metadados é minimizado.
Exemplo: Quando o backup é replicado fora de ordem, ele cria o backup L0 no destino, que tem uma sobrecarga de metadados muito maior do que a Inc. Digamos que tenhamos cinco dias de backups.
Da replicação mais antiga para a mais recente:
A primeira replicação será L0, então todas as subsequentes serão Inc.
1xL0 + 4xInc
Da replicação mais recente para a mais antiga:
A replicação ignora um backup:
Rastreamento de arquivos
O Data Domain precisa saber como compilar cada arquivo a partir dos fragmentos desduplicados. Caso o Data Domain não tenha essas informações, ele precisará recriá-las e recriar também a cadeia de impressões digital. Isso pode causar um aumento de capacidade.
Há dois cenários que podem causar um aumento significativo de capacidade no Data Domain de destino:
1. O rastreamento de arquivos foi perdido:
Exemplo: Se o Data Domain de destino for definido no DNS com vários IPs e os IPs forem distribuídos em rodízio, o Data Domain de origem se conectará todas as vezes a IPs diferentes. A cópia dos dados enviados ontem não será reconhecida e mais dados serão enviados, o que também aumentará o custo de metadados.
Esse problema pode ocorrer quando o SFS_BFT_ENABLED é deixado como falso após a conclusão da reversão do servidor Avamar.
Isso pode resultar em uma discrepância muito grande. O espaço é recuperado quando os backups expiram.
Desduplicação em linha
O Data Domain solicitará dados duplicados de até 6% de um tamanho lógico dos dados para otimizar sua desduplicação em linha.
Diferença na desduplicação e na compactação.
Os Data Domains fazem a desduplicação e compactação de dados no próprio armazenamento local, de forma independente. Dependendo de como os dados de destino estão sendo armazenados, esse processo não será igual, ocasionando diferença na utilização.
Limpeza do Data Domain
Se os Data Domains de origem e destino estiverem executando a limpeza em dias diferentes ou se um dos Data Domains estiver sendo executado com mais frequência ou por mais tempo, haverá discrepância na capacidade utilizada.
Resolution
Práticas recomendadas:
Como haverá diferenças de utilização entre os dois sistemas Data Domain (origem e destino), algumas práticas recomendadas poderão ajudar a minimizar essas discrepâncias:
-
Diminua a possibilidade de reversão resolvendo as falhas de hfscheck e as falhas de hardware assim que elas ocorrerem.
-
Certifique-se de que as replicações estejam sendo concluídas com êxito. Se ocorrer continuamente um problema para concluir as replicações, entre em contato com o suporte da Dell Technologies para analisar a configuração.
-
Se você precisar manter os dois Data Domains em uma utilização semelhante, mantenha a mesma retenção nas cópias de origem e destino dos backups e certifique-se de que o backup de checkpoint esteja definido da mesma forma nos dois Avamar Servers.
-
Certifique-se de que as replicações sejam sempre feitas da mais antiga para a mais nova e de que nenhum backup seja ignorado.
-
Se o Data Domain estiver configurado com vários IPs, certifique-se de que os IPs não sejam distribuídos em forma de rodízio.
-
Configure os sistemas Data Domain (origem e destino) para que eles executem a limpeza no mesmo dia e na mesma hora.
-
Defina SFS_BFT_ENABLED como true. Isso deve ser ativado pelo suporte técnico (crie um chamado & consulte este KB# - 182755)