Data Domain: Práticas recomendadas para migração de dados em sistemas PowerProtect Data Domain usando replicação de MTree
Summary: Este artigo discute como se preparar para migrar dados usando a replicação de Mtree (MRepl) de sistemas PowerProtect Data Domain (PPDD) legados sem suporte para placa QAT interna. Por exemplo, DD9500 e DD9800. É crucial considerar a carga de trabalho de operação do sistema atual para evitar efeitos colaterais inesperados que poderiam afetar negativamente os resultados da migração de dados. Este artigo ajuda a planejar operações de migração que exigem uma nova configuração de contexto de replicação de Mtree (MRepl) usando sistemas PPDD preexistentes como origem. ...
Instructions
Com a introdução das plataformas 16G, a migração de MTrees específicos do PPDD legado para um sistema mais recente é um requisito comum.
O processo de migração cria novos contextos de replicação de Mtree. Considere o seguinte para garantir o mínimo de disrupção.
- Carga de trabalho do sistema atual das operações de backup
- Diferenças de recursos de compactação (por exemplo, suporte a cartão QAT)
- Incorporação repentina de novas configurações de contexto do Mrepl
- Erros de hardware que afetam o processo de coleta de lixo (GC)
Para manter a integridade dos dados e atender aos Acordos de Nível de Serviço, o sistema pode entrar em pane em determinados limites operacionais.
O mecanismo de pânico aciona ações autocorretivas para garantir que o sistema sempre opere com confiança.
Isso discute essas considerações e orienta como evitar o tempo de inatividade inesperado que pode interferir nos planos de migração.
Carga de trabalho do sistema atual das operações de backup:
Concentre-se inicialmente nas operações atuais do sistema. Antes da migração, monitore as principais métricas. Isso inclui cargas de trabalho contínuas, utilização da CPU, uso de memória, status da rede e alertas de hardware.
O objetivo é preservar a operação do sistema dentro dos parâmetros normais.
Diferenças de recursos de compactação:
Ao preparar-se para a migração usando a replicação de Mtree (Mrepl), considere a disparidade nos recursos de compactação entre os sistemas.
Alguns sistemas legados não possuem uma placa de compactação integrada para auxiliar nas operações relacionadas à compactação.
Os sistemas DD9900, DD9400 ou DD6900 permitem a conexão de uma placa QAT externa para acelerar as operações de compactação.
Quando uma placa QAT não está presente (por exemplo, DD9800, DD9500), ela depende de recursos de CPU e memória para tarefas de compactação e descompactação.
Ao configurar novos contextos de replicação sem suporte a QAT, os dados devem primeiro ser descompactados.
Isso pode resultar em um pico de uso da CPU durante a fase de inicialização da replicação.
A origem verifica o destino para identificar o tipo de placa de compactação disponível.
Quando um sistema 16G (DD9910, DD9410 ou DD6410) for o destino, a origem deverá descompactar os dados do formato preexistente do gzfast. Em seguida, ele deve compactá-lo para o formato LZ.
Incorpore gradualmente a nova configuração de contexto do mrepl:
Durante a recuperação de desastres (DR), ao replicar dados de um Data Domain para outro, os trabalhos de replicação geralmente são iniciados após a conclusão da ingestão de dados.
Isso garante que o local de destino receba todos os dados replicados.
Quando novos contextos de replicação são definidos para migração, a origem deve lidar com dados significativos durante a inicialização da replicação.
Isso ocorre porque o destino não tem dados desduplicados e a otimização ainda não é possível. Isso resulta em um aumento da carga no sistema de origem.
Para atenuar isso, quando o sistema continuar a processar cargas de trabalho de backup (E/S), incorpore gradualmente os contextos de replicação associados à migração.
Defina um throughput de replicação baixo para limitar os recursos alocados a esses contextos de replicação relacionados à migração.
Depois que a replicação começar a criar otimizações no destino e os parâmetros operacionais forem validados, adicione mais contextos de replicação (migração). Ou modifique o throughput de replicação dos existentes.
O objetivo é evitar o acionamento dos mecanismos de proteção do sistema. Isso leva a panes no sistema, o que pode afetar as migrações.
Lembre-se de que as referências de desempenho do sistema são calculadas com base nas cargas de trabalho em operação, não para novas cargas de trabalho.
Configure o controle de fluxo gradualmente durante os cenários de migração.
O comando "replication throttle add" pode ser usado para agendar um point-in-time específico e alocar uma largura de banda definida (em Mbps) para limitação.
Inicie novos trabalhos de replicação com uma largura de banda disponível limitada (aceleração menor). Em seguida, avalie o impacto na operação do sistema.
Depois que o trabalho de replicação estiver em andamento, a aceleração poderá ser aumentada para fornecer largura de banda adicional.
Também é recomendável monitorar a lógica analítica do sistema, incluindo CPU, memória e consumo de rede, disponível no DDSM.
Erros de hardware que afetam o processo de coleta de lixo (GC):
Outro fator que pode causar degradação no desempenho de backup ou replicação está relacionado a falhas de hardware, especialmente durante as operações padrão de coleta de lixo. Em condições operacionais normais, o mecanismo de coleta de lixo nos sistemas PPDD conclui as atividades de reciclagem de espaço sem afetar as operações de ingestão, restauração ou replicação. Em determinadas situações, o sistema oferece opções para definir a aceleração da coleta de lixo, fornecendo aos administradores de sistema controle adicional sobre quando os processos de limpeza do sistema ocorrem.
A configuração padrão de aceleração para coleta de lixo não afeta backups e restaurações. A maioria dos casos em que um impacto é observado está vinculada a falhas de hardware. Por exemplo, quando determinadas unidades exigem substituição, as demandas contínuas de E/S do sistema podem retardar o armazenamento de backups e restaurações, consequentemente afetando as operações gerais de GC.
O Data Domain Operating System fornece mecanismos de alerta abrangentes para esses problemas de hardware, gerando alertas proativamente quando essas condições são detectadas. Isso facilita que os operadores de backup resolvam prontamente os problemas relacionados ao hardware.
Outro fator importante a considerar é que as atividades de replicação são tão importantes quanto o backup e a restauração. Por padrão, cada plataforma fornece um número fixo de fluxos para cada trabalho e pode processar operações simultâneas sob os limites definidos para atender aos Acordos de Nível de Serviço (SLAs).
Conclusão:
A migração bem-sucedida de dados usando a replicação de MTree requer uma consideração cuidadosa do seguinte:
- Monitorando a carga de trabalho do sistema atual a partir das operações de backup
- Entender plataformas legadas, como DD9800 ou DD9500
- Use um algoritmo de compactação diferente (gzfast).
- Quando novos contextos de replicação de MTree (MRepl) são criados em um sistema em operação, incorpore gradualmente as novas configurações de contexto do Mrepl
- Monitore de perto o impacto das novas cargas de trabalho no sistema.
- Monitorar possíveis erros de hardware (que afetam as operações do processo de coleta de lixo).
Seguir essas práticas recomendadas minimiza as interrupções e mantém a estabilidade do sistema.
A implementação dessas recomendações ajuda a evitar o tempo de inatividade inesperado e facilita a migração de dados.