Sistemas Data Domain com versões 7.7.1.0, 7.7.2.0, 7.8.0.0 e 7.8.0.10. Possível problema de perda de dados quando os backups são gravados enquanto o ciclo de limpeza está em execução
Summary: Os sistemas Data Domain (DDRs, DDVE, DDVE na nuvem) que executam o DDOS versão 7.7.1.0, 7.7.2.0, 7.8.0.0 e 7.8.0.10 podem apresentar um possível problema de perda de dados quando os backups são gravados enquanto a limpeza está em execução devido a uma rara condição de corrida. ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Os dados podem ser excluídos incorretamente do sistema durante o ciclo de limpeza. O backup não pode mais ser totalmente relido. Quando esse problema ocorre, o Data Domain Restorer (DDR) pode exibir uma ou mais das seguintes opções:
- Alerta publicado indicando que a corrupção foi encontrada no disco:
Id Post Time Severity Class Object Message
----- ------------------------ -------- ---------- ----------- ------------------------------------------------------------------
m0-32 Wed Jun 29 05:19:16 2022 CRITICAL Filesystem Tier=Active EVT-FILESYS-00020: Corruption has been detected in the filesystem.
- Inicie as reinicializações não planejadas do Data Domain File System (DDFS) se o arquivo afetado for lido por restauração, replicação, movimentação de dados para a nuvem ou ciclo de limpeza.
ESCOPO DO IMPACTO
- Sistemas potencialmente afetados: Sistemas DDR, DDVE, DDVE na nuvem executando as versões 7.7.1.0, 7.7.2.0, 7.8.0.0, 7.8.0.10 do DDOS. Os sistemas que executam qualquer outra versão do DDOS não são afetados.
- Os backups existentes que são gravados em qualquer versão anterior do DDOS não são afetados.
- Os backups em camadas na nuvem por movimentação de dados não são afetados.
- Se a verificação de arquivos detectar backups depois da conclusão da última limpeza e nenhum alerta "Corruption Detected" for publicado, então, nenhum backup será afetado.
- Se todos os backups forem replicados com êxito, o Data Domain de origem de replicação não foi afetado.
Cause
O problema ocorre devido a uma rara condição de corrida.
Resolution
Esse problema foi corrigido nas versões 7.7.1.10, 7.7.2.10, 7.8.0.20 e posteriores do DDOS.
Escolha entre as versões atuais disponíveis no portal de download para incorporar correções adicionais e vulnerabilidades de segurança mais recentes.
Siga as duas seções abaixo:
(I) Como evitar a possibilidade de novos backups serem afetados
(II) Verificação e correção da integridade dos dados.
(I) Como evitar a possibilidade de novos backups serem afetados
A ação recomendada é instalar uma versão do DDOS que contenha a correção para esse problema. Se a versão do DDOS com correção estiver instalada, nenhuma outra ação nesta seção (I) será necessária.
OU
Se a versão do DDOS com correção não puder ser instalada imediatamente, prossiga com (I):
Exemplo:
(II) Verificação da integridade dos dados e correção
A arquitetura do Data Domain garante que todos os backups gravados sejam verificados para garantir a integridade. Se algum backup falhar na verificação, um alerta será publicado. O registro de data e hora do último arquivo verificado indica a data/hora em que todos os arquivos foram verificados. Se o "Último registro de data e hora verificado" for posterior ao último ciclo de limpeza E não houver um alerta "Corruption Detected", isso validará que nenhum backup será afetado.
Escolha entre as versões atuais disponíveis no portal de download para incorporar correções adicionais e vulnerabilidades de segurança mais recentes.
Siga as duas seções abaixo:
(I) Como evitar a possibilidade de novos backups serem afetados
(II) Verificação e correção da integridade dos dados.
(I) Como evitar a possibilidade de novos backups serem afetados
A ação recomendada é instalar uma versão do DDOS que contenha a correção para esse problema. Se a versão do DDOS com correção estiver instalada, nenhuma outra ação nesta seção (I) será necessária.
OU
Se a versão do DDOS com correção não puder ser instalada imediatamente, prossiga com (I):
1. Desabilite o agendamento de limpeza.
2. Se a limpeza precisar ser executada para aliviar o problema de capacidade, desative toda a ingestão antes de iniciar a limpeza.
# filesys clean set schedule never Filesystem cleaning is scheduled to run "never". Stop current Clean cycle if running # filesys clean status Cleaning started at 2022/06/27 12:32:03: phase 4 of 6 (pre-select) 8.7% complete, 438 GiB free; time: phase 0:00:01, total 0:10:35 # filesys clean stop The 'filesys clean stop' command stops the filesystem cleaning. Are you sure? (yes|no) [no]: yes ok, proceeding.
2. Se a limpeza precisar ser executada para aliviar o problema de capacidade, desative toda a ingestão antes de iniciar a limpeza.
2a. Desabilite backups/clonagem do aplicativo de backup.
2b. Desative os protocolos no Data Domain.
2b. Desative os protocolos no Data Domain.
# replication disable all # nfs disable # cifs disable # ddboost disable # vtl disable
2c. Execute a limpeza e monitore da seguinte forma:
2d. Depois que a limpeza iniciar a fase 2 (pré-análise), reative a programação de backup e os protocolos.
# filesys clean start Active tier cleaning started. Use 'filesys clean watch' to monitor progress. # filesys clean watch Beginning 'filesys clean' monitoring. Use Control-C to stop monitoring. Cleaning: phase 1 of 6 (pre-merge) 100.0% complete, 438 GiB free; time: phase 0:00:42, total 0:00:42- Cleaning: phase 2 of 6 (pre-analysis) 3.3% complete, 438 GiB free; time: phase 0:00:16, total 0:00:59
2d. Depois que a limpeza iniciar a fase 2 (pré-análise), reative a programação de backup e os protocolos.
# replication enable all # nfs enable # cifs enable # ddboost enable # vtl enable
NOTA: Depois que a versão do DDOS com correção estiver instalada, certifique-se de redefinir o agendamento de limpeza.
Exemplo:
# filesys clean set schedule Tue,0600
(II) Verificação da integridade dos dados e correção
A arquitetura do Data Domain garante que todos os backups gravados sejam verificados para garantir a integridade. Se algum backup falhar na verificação, um alerta será publicado. O registro de data e hora do último arquivo verificado indica a data/hora em que todos os arquivos foram verificados. Se o "Último registro de data e hora verificado" for posterior ao último ciclo de limpeza E não houver um alerta "Corruption Detected", isso validará que nenhum backup será afetado.
1. Verifique se há um alerta de integridade dos dados publicado:
O alerta é semelhante ao seguinte:
Se um alerta de integridade dos dados for visto, entre em contato imediatamente com o atendimento ao cliente da Dell Technologies.
CRITICAL Filesystem Tier=Active EVT-FILESYS-00020: Corruption has been detected in the filesystem. Check for current alerts with the command below: # alerts show current
Se um alerta de integridade dos dados for visto, entre em contato imediatamente com o atendimento ao cliente da Dell Technologies.
2. Se nenhum alerta de integridade dos dados for publicado, verifique o horário de conclusão da última limpeza e o registro de data e hora da verificação do arquivo.
2a. Verifique o tempo de execução da última limpeza:
# filesys clean status Cleaning finished at 2022/06/24 16:36:01.
2b. Verifique o registro de data e hora da verificação de arquivo (FV):
Entre no modo SE:
# priv set se Enter system password: <Enter Serial Num> # se grep "Last Verified file timestamp:" /ddr/var/support/autosupport Last Verified file timestamp: Sat Jun 25 23:00:22 2022 Verify threads running: 1
- Se o registro de data e hora da Verificação de arquivos (FV) for posterior à data e hora do último ciclo de limpeza, isso validará que nenhum backup será afetado.
- Se o registro de data/hora da FV estiver atrasado em relação à data e hora do último ciclo de limpeza por uma semana ou menos, aguarde até que ele seja atualizado e verifique novamente.
NOTA: O registro de data e hora da FV atrasado não indica um problema de integridade dos dados. Isso significa apenas que os arquivos gravados posteriormente à data do registro de data e hora do FV ainda precisam ser verificados).
- Para qualquer sistema que esteja executando a versão afetada do DDOS (também qualquer sistema que recebeu upgrade recentemente para a versão fixa), se o registro de data e hora da FV estiver atrasado por mais de uma semana (ou não puder ser determinado), entre em contato com o suporte ao cliente da Dell Technologies para auxiliar na validação dos dados.
Article Properties
Article Number: 000200905
Article Type: Solution
Last Modified: 11 Dec 2023
Version: 10
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.