Avamar: Falha no HFSCHECK com MSG_ERR_ROLLING_CHECK devido a uma mudança de horário do Avamar Server
Summary: Uma fonte de hora incorreta causa falha na validação do checkpoint do Avamar (hfscheck).
Symptoms
Sintomas primários:
Atividades de manutenção (checkpoint e hfscheck) não são concluídas com êxito.
Validação de checkpoint (hfscheck) está falhando com MSG_ERR_ROLLING_CHECK.
Como o checkpoint mais recente já está validado, ele não poderá ser validado novamente.
A coluna cplist O comando mostra um checkpoint com uma data e hora futuras:
cplist
cp.20201103213238 Wed Nov 3 16:32:38 2020 valid --- del nodes 1/1 stripes 4779
cp.20201104153925 Thu Nov 4 10:39:25 2020 valid --- --- nodes 1/1 stripes 4796
cp.20320218180432 Wed Feb 18 12:04:32 2032 valid rol --- nodes 1/1 stripes 4521
A tentativa de validar manualmente o checkpoint apresenta falha:
avmaint hfscheck --checkpoint=cp.20201104153925 --rolling
ERROR: avmaint: hfscheck: server_exception(MSG_ERR_ROLLING_CHECK)
Além dos erros de manutenção, pode surgir um problema secundário em que os backups são listados no futuro e, como resultado:
- As previsões e os relatórios estão incorretos.
- As informações da interface do usuário do MCS (Management Console Server) podem estar incorretas.
- Determinados relatórios (por exemplo, "Atividades concluídas com falha" e "Relatório de atividades") não estão corretos.
Exemplos de resultados para um backup que foi executado em 2019, mas relata 2032:
mccli backup show --name=/clients/client_name
0,23000,CLI command completed successfully.
Created LabelNum Size Retention
----------------------------- -------- ----------- ---------
2032-02-17 19:01:41 GMT-06:00 15 23875106816 DMY
-- Ou um flush do MCS: --
avtar --backups --id=MCUser --ap=<password> --path=/MC_BACKUPS --hfsaddr=<server>--count=26
Date Time Seq Label Size Plugin Working directory Targets
---------- -------- ------ ------- ------- -------- -------------------- -------------------------
2032-02-15 09:01:05 8373 116436K Linux /usr/local/avamar var/mc/server_data/Cause
Um problema no servidor de horário fez com que o relógio da grade do Avamar fosse redefinido para 2032.
Uma validação de checkpoint ocorreu durante esse período e agora há um cp validado a partir de 2032.
A equipe de engenharia confirmou que esse é o comportamento esperado quando uma fonte de horário incorreta é usada.
Resolution
Advertências:
Se forem encontradas discrepâncias nos tempos de backup (de acordo com os sintomas secundários acima), elas devem ser corrigidas primeiro. Não execute as etapas deste artigo. Em vez disso, entre em contato com o suporte técnico da Dell Technologies para obter mais assistência.
Para resolver o hfscheck Questão:
1. Redefina o agendador:
avmaint sched reset --ava
2. Interrompa e inicie o agendador:
avmaint sched stop --ava
avmaint sched start --ava
3. Faça um checkpoint.
4. Executar hfscheck.
5. Monitore a grade durante a próxima janela de manutenção agendada para verificar se o problema foi resolvido.