Avamar: Como definir o Avamar Server em um estado controlado conhecido
요약: Este artigo explica como definir um Avamar Server em um estado controlado conhecido.
이 문서는 다음에 적용됩니다.
이 문서는 다음에 적용되지 않습니다.
이 문서는 특정 제품과 관련이 없습니다.
모든 제품 버전이 이 문서에 나와 있는 것은 아닙니다.
증상
Há muitas tarefas automatizadas em um servidor Avamar que podem afetar os esforços de solução de problemas.
Este procedimento documenta como colocar o Avamar no que é chamado de "estado controlado conhecido" para impedir a ocorrência de atividades inesperadas ou indesejáveis.
A checklist abaixo deve ser seguida ao executar tarefas de manutenção manuais e avançadas. Por exemplo:
Esta NÃO é uma solução de verificação de integridade. Presume-se que o Avamar Server não esteja íntegro.
Este procedimento documenta como colocar o Avamar no que é chamado de "estado controlado conhecido" para impedir a ocorrência de atividades inesperadas ou indesejáveis.
A checklist abaixo deve ser seguida ao executar tarefas de manutenção manuais e avançadas. Por exemplo:
- Recriação de listras
- Recriação de nós
- Reiniciando nós off-line
Esta NÃO é uma solução de verificação de integridade. Presume-se que o Avamar Server não esteja íntegro.
원인
Tarefas de manutenção manuais ou avançadas devem ser executadas em um servidor Avamar.
해결
Aviso: Se usados incorretamente, alguns dos comandos mencionados abaixo podem causar problemas de integridade dos dados ou perda de dados. Se você não entende um comando nem as consequências de executá-lo, procure a assistência do Suporte Dell ou de seu representante local do parceiro da Dell.
Pré-requisitos:
Pré-requisitos:
- Todos os comandos devem ser executados como admin com as chaves SSH carregadas por artigo Avamar: Como fazer log-in em um Avamar Server e carregar várias chaves.
- Alguns comandos podem não dar feedback ou ter efeito imediato; Não deve ser necessário executar um comando mais de uma vez.
- Para qualquer
avmaint config --ava, sempre confirme se a alteração teve efeito. Comando de execução:
avmaint config --ava | grep <setting>
- A manutenção manual deve ser evitada. Permita que o agendador de manutenção gerencie as tarefas de manutenção sempre que possível.
- As seguintes perguntas devem ser respondidas usando esses comandos para entender o status geral do servidor Avamar antes de trabalhar em qualquer sistema:
- Qual a idade do último checkpoint validado?
cplist
- Todas as listras estão online? Todos os nós estão on-line?
status.dpn
- Todos os serviços estão funcionando?
dpnctl status
- Verifique se há manutenção em execução e cancele-as, se necessário:
- Suspenda as atividades de manutenção usando o agendador de manutenção para garantir que elas não sejam reiniciadas após interrompê-las.
avmaint sched suspend cp --ava avmaint sched suspend hfscheck --ava
Não suspenda a coleta de lixo (GC), pois isso pode resultar em uma reversão desnecessária.
- Execute o comando abaixo e verifique se há atividades de manutenção em execução.
status.dpn
- Se um checkpoint estiver em execução, deixe-o concluir.
- Se o HFScheck estiver em execução, ele poderá ser interrompido se o servidor não estiver no modo de administração (fase waitcgsan) ou se o HFScheck estiver quase concluído:
avmaint hfscheckstop --ava
- Se um GC estiver em execução, ele poderá ser eliminado:
avmaint gckill --ava
Isso pode levar algum tempo para ser concluído, pois a passagem atual deve terminar.
- Quando não houver mais manutenção em execução, o agendador de manutenção deverá ser interrompido:
dpnctl stop maint
- Interrompa o agendador de backup, interrompa a execução de backups ou restaurações e suspenda novas conexões:
- Impeça que o MCS inicie novos backups:
dpnctl stop sched
- Listar todos os backups em execução:
avmaint sessions --ava | grep sessionid
Se uma restauração diferente da replicação estiver em execução, consulte o usuário para determinar se a restauração deve ter permissão para ser concluída.
- Depois que o usuário recebe a aprovação de que os backups podem ser eliminados de forma limpa (backups parciais são criados) usando a interface do usuário ou usando:
avmaint kill -waittime=0 <sessionid>
- Liste todos os backups adicionais não listados pelo comando anterior:
avmaint sessions --full
- Dependendo da operação a ser executada, pode não ser aceitável que nenhuma operação do tipo backup seja executada (ou seja, avmaint getrefby). Portanto, suspenda os despachantes para não permitir backups manuais:
avmaint suspend
- Interromper a replicação (origem ou destino da replicação).
- Para a origem da replicação (restauração), use a interface do usuário ou o EM ou interrompa o processo para interromper a replicação.
- Para o destino de replicação (backup), verifique se a replicação está em execução:
avmaint sessions | grep path
- Procure o domínio /REPLICATE no caminho. Interrompa a replicação na grade de origem usando os métodos da etapa 4a.
- Desative o crunching com o comando:
avmaint config --ava asynccrunching=false
Pode levar até 15 minutos para que a análise seja interrompida. Verifique se há mensagens de "crunch" nos logs do GSAN nos nós de dados.
- Desativar balanceamento
- Verifique se o balanceamento está em execução:
avmaint config --ava | grep balancemin
Normalmente, o balanceamento não deve ser habilitado (qualquer valor diferente de 0), mas ainda é importante verificar.
- Para desativar o balanceamento:
avmaint config --ava balancemin=0
Pode levar até 15 minutos para que o balanceamento pare. Verifique status.dpn para ver se alguma fração está migrando para confirmar que o balanceamento terminou.
- Verifique a capacidade:
- Verifique a capacidade do SO:
avmaint nodelist --ava | grep fs-perc
- Verifique o tamanho dos checkpoints:
mapall copy ~/cps # only if cps does not exist on the data nodes mapall --noerror './cps'
- Verifique a lista de checkpoints para determinar quais checkpoints DEVEM ser mantidos (o último checkpoint validado em todos os nós):
cplist
Dependendo dos resultados acima, determine quantos checkpoints podem ser mantidos, quais são essenciais e quantos novos checkpoints podem ser criados.
Para obter informações sobre capacidade, consulte o artigo Avamar: Conceitos e treinamento de gerenciamento de capacidade
- Conscientize-se da ordem dos nós e das diferenças entre números lógicos de nós e números de nós físicos:
nodenumbers status.dpn mapall --noerror 'tail -2 /data01/cur/gsan.log'
- Analise o hardware
- Todas as tarefas automatizadas devem ser interrompidas.
- O servidor deve ter pouca atividade e deve ser seguro prosseguir com quaisquer tarefas ou comandos manuais.
Verifique o servidor verificando os logs do GSAN nos nós de dados. Verifique se há pouca ou nenhuma atividade sendo registrada.
O comando uptime também pode ser executado usando mapall, para verificar se a "média de carga" entre os nós de dados é baixa (entre 0,01 e 0,05)
Por exemplo:
Por exemplo:
mapall --noerror 'uptime' (0.0) ssh -x admin@10.xx.xx.xxx 'uptime' 16:39:29 up 100 days, 6:39, 0 users, load average: 0.01, 0.02, 0.01 (0.1) ssh -x admin@10.xx.xx.xxx 'uptime' 16:39:29 up 100 days, 6:39, 0 users, load average: 0.02, 0.01, 0.01 (0.2) ssh -x admin@10.xx.xx.xxx 'uptime' 16:39:29 up 100 days, 6:39, 0 users, load average: 0.02, 0.01, 0.01As etapas acima definem o servidor para um estado de não produção. Sempre reverta as alterações depois que todas as tarefas manuais tiverem sido concluídas.
추가 정보
해당 제품
Avamar, Avamar Server문서 속성
문서 번호: 000170876
문서 유형: Solution
마지막 수정 시간: 06 8월 2025
버전: 15
다른 Dell 사용자에게 질문에 대한 답변 찾기
지원 서비스
디바이스에 지원 서비스가 적용되는지 확인하십시오.