Avamar: Como definir o Avamar Server em um estado controlado conhecido

Summary: Este artigo explica como definir um Avamar Server em um estado controlado conhecido.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Há muitas tarefas automatizadas em um servidor Avamar que podem afetar os esforços de solução de problemas.

Este procedimento documenta como colocar o Avamar no que é chamado de "estado controlado conhecido" para impedir a ocorrência de atividades inesperadas ou indesejáveis.

A checklist abaixo deve ser seguida ao executar tarefas de manutenção manuais e avançadas. Por exemplo:
  • Recriação de listras
  • Recriação de nós
  • Reiniciando nós off-line
Esta é uma lista de verificação e não é um guia sobre como executar as operações ou interpretar os resultados.

Esta NÃO é uma solução de verificação de integridade. Presume-se que o Avamar Server não esteja íntegro.

Cause

Tarefas de manutenção manuais ou avançadas devem ser executadas em um servidor Avamar.

Resolution

Aviso: Se usados incorretamente, alguns dos comandos mencionados abaixo podem causar problemas de integridade dos dados ou perda de dados. Se você não entende um comando nem as consequências de executá-lo, procure a assistência do Suporte Dell ou de seu representante local do parceiro da Dell.

Pré-requisitos:
  • Todos os comandos devem ser executados como admin com as chaves SSH carregadas por artigo Avamar: Como fazer log-in em um Avamar Server e carregar várias chaves.
  • Alguns comandos podem não dar feedback ou ter efeito imediato; Não deve ser necessário executar um comando mais de uma vez.
  • Para qualquer avmaint config --ava , sempre confirme se a alteração teve efeito. Comando de execução:
avmaint config --ava | grep <setting>
  • A manutenção manual deve ser evitada. Permita que o agendador de manutenção gerencie as tarefas de manutenção sempre que possível.
Procedimento:
  1. As seguintes perguntas devem ser respondidas usando esses comandos para entender o status geral do servidor Avamar antes de trabalhar em qualquer sistema:
  • Qual a idade do último checkpoint validado?
cplist
  • Todas as listras estão online? Todos os nós estão on-line?
status.dpn
  • Todos os serviços estão funcionando?
dpnctl status
  1. Verifique se há manutenção em execução e cancele-as, se necessário:
    1. Suspenda as atividades de manutenção usando o agendador de manutenção para garantir que elas não sejam reiniciadas após interrompê-las.
avmaint sched suspend cp --ava
avmaint sched suspend hfscheck --ava
Não suspenda a coleta de lixo (GC), pois isso pode resultar em uma reversão desnecessária.
  1. Execute o comando abaixo e verifique se há atividades de manutenção em execução.
status.dpn
  • Se um checkpoint estiver em execução, deixe-o concluir.
  • Se o HFScheck estiver em execução, ele poderá ser interrompido se o servidor não estiver no modo de administração (fase waitcgsan) ou se o HFScheck estiver quase concluído:
avmaint hfscheckstop --ava
  • Se um GC estiver em execução, ele poderá ser eliminado:
avmaint gckill --ava
Isso pode levar algum tempo para ser concluído, pois a passagem atual deve terminar.
  1. Quando não houver mais manutenção em execução, o agendador de manutenção deverá ser interrompido:
dpnctl stop maint
  1. Interrompa o agendador de backup, interrompa a execução de backups ou restaurações e suspenda novas conexões:
    1. Impeça que o MCS inicie novos backups:
dpnctl stop sched
  1. Listar todos os backups em execução:
avmaint sessions --ava | grep sessionid
Se uma restauração diferente da replicação estiver em execução, consulte o usuário para determinar se a restauração deve ter permissão para ser concluída.
  1. Depois que o usuário recebe a aprovação de que os backups podem ser eliminados de forma limpa (backups parciais são criados) usando a interface do usuário ou usando:
avmaint kill -waittime=0 <sessionid>
  1. Liste todos os backups adicionais não listados pelo comando anterior:
avmaint sessions --full
  1. Dependendo da operação a ser executada, pode não ser aceitável que nenhuma operação do tipo backup seja executada (ou seja, avmaint getrefby). Portanto, suspenda os despachantes para não permitir backups manuais:
avmaint suspend
  1. Interromper a replicação (origem ou destino da replicação).
    1. Para a origem da replicação (restauração), use a interface do usuário ou o EM ou interrompa o processo para interromper a replicação.
    2. Para o destino de replicação (backup), verifique se a replicação está em execução: 
avmaint sessions | grep path
  1. Procure o domínio /REPLICATE no caminho. Interrompa a replicação na grade de origem usando os métodos da etapa 4a.
  1. Desative o crunching com o comando:
avmaint config --ava asynccrunching=false
Pode levar até 15 minutos para que a análise seja interrompida. Verifique se há mensagens de "crunch" nos logs do GSAN nos nós de dados.
  1. Desativar balanceamento
    1. Verifique se o balanceamento está em execução:
avmaint config --ava | grep balancemin
Normalmente, o balanceamento não deve ser habilitado (qualquer valor diferente de 0), mas ainda é importante verificar.
  1. Para desativar o balanceamento:
avmaint config --ava balancemin=0
Pode levar até 15 minutos para que o balanceamento pare. Verifique status.dpn para ver se alguma fração está migrando para confirmar que o balanceamento terminou.
  1. Verifique a capacidade:
    1. Verifique a capacidade do SO: 
avmaint nodelist --ava | grep fs-perc
  1. Verifique o tamanho dos checkpoints:
mapall copy ~/cps                # only if cps does not exist on the data nodes
mapall --noerror './cps'
  1. Verifique a lista de checkpoints para determinar quais checkpoints DEVEM ser mantidos (o último checkpoint validado em todos os nós):
cplist
Dependendo dos resultados acima, determine quantos checkpoints podem ser mantidos, quais são essenciais e quantos novos checkpoints podem ser criados.
Para obter informações sobre capacidade, consulte o artigo Avamar: Conceitos e treinamento de gerenciamento de capacidade
  1. Conscientize-se da ordem dos nós e das diferenças entre números lógicos de nós e números de nós físicos:
nodenumbers
status.dpn
mapall --noerror 'tail -2 /data01/cur/gsan.log'
  1. Analise o hardware
  • Todas as tarefas automatizadas devem ser interrompidas. 
  • O servidor deve ter pouca atividade e deve ser seguro prosseguir com quaisquer tarefas ou comandos manuais. 
Verifique o servidor verificando os logs do GSAN nos nós de dados. Verifique se há pouca ou nenhuma atividade sendo registrada.
O comando uptime também pode ser executado usando mapall, para verificar se a "média de carga" entre os nós de dados é baixa (entre 0,01 e 0,05)

Por exemplo:
mapall --noerror 'uptime' 

(0.0) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.01, 0.02, 0.01 
(0.1) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.02, 0.01, 0.01 
(0.2) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.02, 0.01, 0.01
As etapas acima definem o servidor para um estado de não produção. Sempre reverta as alterações depois que todas as tarefas manuais tiverem sido concluídas.

Additional Information

 

Affected Products

Avamar, Avamar Server
Article Properties
Article Number: 000170876
Article Type: Solution
Last Modified: 06 Aug 2025
Version:  15
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.