NetWorker: Manutenção e solução de problemas de banco de dados de mídia
Summary: Este artigo descreve métodos para identificar e tratar problemas relacionados ao banco de dados de mídia, bem como práticas recomendadas para manutenção e proteção.
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
- Falha ao iniciar serviços.
- Falha do fluxo de trabalho diário de Backup do Server Protection>.
- Informações incompletas ou enganosas relacionadas a savesets ou clients retornados pelo comando mminfo ou ao consultar ou procurar savesets na administração do NetWorker Management Console (NMC) ou do NetWorker Web User Interface (NWUI).
- Problemas de backup, recuperação ou clonagem relacionados à incapacidade de localizar savesets, clients ou volumes.
- Erros no log do daemon do servidor ou nos consoles relacionados ao banco de dados de mídia:
nsrmmdbd WiSS code assertion error (st_nextrec: rec loop detected)
nsrmmdbd error, ss_clone_ensure_clone_eligibility: assertion, invalid parameters or code segment
nsrmmdbd XCHK ssid:saveset_short_ssid host:saveset_hostname name:saveset_name has a fragment with an invalid volid:saveset_volid
nsrmmdbd NSR warning WiSS code assertion error (ST_readvdir: directory read failed)
nsrmmdbd NSR critical Unexpected error reading long record directory: an invalid slot number
nsrmmdbd NSR warning partial record error, ssid: saveset_short_ssid saveset_long_ssid flags:0x00010101 size:0 files:0 tm:datetime cloneid
nsrmmdbd NSR notice media db must be scavenged
nsrmmdbd NSR critical media db scavenge failed
nsrmmdbd NSR warning Cannot scavenge path_to_mmvolume6 (Permission denied) - recover from backup media
nsrmmdbd NSR warning Cannot scavenge path_to_mmvolume6 (unknown error code) - recover from backup media
nsrmmdbd MDB warning can't fetch save set <saveset ID>
nsrmmdbd MDB warning Unable to fetch child save set <saveset ID> for cover set <saveset ID>
- Perda súbita de muitos savesets do banco de dados de mídia ou um salto repentino no espaço livre disponível no armazenamento em disco.
- Falha do software ao expirar ou excluir savesets, levando ao consumo rápido de armazenamento.
Cause
Como qualquer banco de dados, o banco de dados de mídia pode ser danificado em vários graus onde há alguma inferência com suas operações normais, como.
- Desligamento inesperado do processo nsrmmdbd (core dump, falha do sistema, reinicialização ou perda de energia).
- Transação interrompida (interferência do software de segurança externa ou esgotamento do espaço em disco).
- Problema interno lógico (bug de código ou condições não tratadas).
- Interferência direta em arquivos de banco de dados de mídia ou arquivos de saveset no armazenamento gerenciado pelo NetWorker.
- Se possível, use uma partição de disco local separada para a pasta nsr/mm, o que ajuda a proteger contra condições como esgotamento do espaço em disco por outros processos. Essa partição deve ter pelo menos 3x o tamanho do banco de dados de mídia; um grande banco de dados de mídia atualmente seria de 10 GBs; portanto, 100 GB devem ser suficientes para qualquer instalação.
- Certifique-se de que o fluxo de trabalho do server backup seja concluído diariamente para que os backups do banco de dados de mídia e dos recursos críticos de recuperação de desastres (o bootstrap) estejam disponíveis em caso de desastre.
- Verifique a localização dos bootstraps com o comando mminfo -B periodicamente.
- Nunca permita que os volumes de armazenamento do servidor NetWorker sejam acessados por outro servidor NetWorker simultaneamente, pois isso pode levar à perda de dados.
- Se o software antivírus estiver instalado no servidor NetWorker, crie exclusões para o diretório /nsr para impedir que o software antivírus analise, modifique ou remova arquivos do NetWorker.
- Evite excluir manualmente quaisquer arquivos no armazenamento do NetWorker para tentar liberar espaço. O NetWorker tem rotinas de recuperação de espaço que são executadas diariamente, e o suporte deverá ser contatado se for considerado falha.
- Em geral, para planejamento de zona de dados, mantenha dados do mesmo tipo nos mesmos pools para facilitar a manutenção quando necessário, como savesets do vProxy, savesets do file system e savesets do banco de dados Oracle em pools separados.
- Não ignore mensagens relacionadas a erros do banco de dados de mídia. Entre em contato com o suporte se tiver problemas.
- O NetWorker executa o processo de expiração diariamente como parte do fluxo de trabalho de backup do servidor. Esse trabalho calcula as retenções e dependências e expira os savesets que já passaram de sua retenção e não têm dependentes não expirados. Depois que isso é concluído, o NetWorker tenta excluir todos os savesets expirados de volume de disco. Depois disso, a operação de recuperação de espaço é executada para cada volume, excluindo arquivos de saveset da mídia de disco que não tem entradas correspondentes do banco de dados de mídia. Isso significa que, se o banco de dados de mídia for corrompido ou se você recuperar o banco de dados para um point-in-time anterior, os dados válidos poderão ser excluídos.
- Se você achar que há um problema com qualquer volume de disco, para garantir que dados válidos não sejam excluídos, certifique-se de que o volume esteja desmontado e marcado como Verificação necessária. Isso também se aplica a volumes após a recuperação para um point-in-time anterior (onde savesets válidos podem existir no disco criados após o ponto de recuperação e, portanto, não têm entradas no banco de dados recuperado).
- Scan Needed permite backup, recuperação e/ou clonagem normais, mas impede a expiração ou exclusão normais. Portanto, certifique-se de que ela seja usada apenas para proteger os volumes percebidos como em perigo e removida ao retornar às operações normais. Os volumes devem ser desmontados para definir ou remover esse indicador. É comum que os volumes sejam marcados como "verificação necessária" após a recuperação de desastres do servidor do NetWorker (nsrdr), para evitar a perda de dados indesejados em um cenário de recuperação de desastres.
Resolution
Há várias maneiras de tentar verificar e corrigir problemas no banco de dados de mídia. Antes de tentar qualquer uma dessas opções, para avaliar os impactos, crie relatórios antes e depois para ver se savesets, volumes, clients ou qualquer outra coisa foi removido
.Na linha de comando, em um diretório para as saídas do host, execute os seguintes comandos para comparar as propriedades do banco de dados de mídia antes e depois do procedimento:
A menos que esse processo esteja falhando ao executar diariamente, é improvável que isso mude nada. Verifique o log do daemon para concluir nsrim diariamente.
Esse comando espera que os nós de armazenamento estejam on-line e contatáveis para serem concluídos.
.Na linha de comando, em um diretório para as saídas do host, execute os seguintes comandos para comparar as propriedades do banco de dados de mídia antes e depois do procedimento:
- mminfo -C mminfo-C_pre.mmi
- mminfo -X mminfo-X_pre.mmi
- mminfo -ar "volid,type,location,pool,volume,state,volflags,written,savesets" -q family=disk -xc, > mminfo-vol_pre.mmi
nsrim - Proteção diária do servidor
Todos os dias, o fluxo de trabalho de Backup do Server Protection > Server é executado e, com ele, a ação Expiração. A ação Expiration executa nsrim, que é o utilitário de manutenção nativo do NetWorker. Isso também pode ser executado diretamente, mas pode levar de vários minutos a várias horas, dependendo da carga do servidor e do tamanho do banco de dados de mídia:
nsrim -X > nsrim.out 2> e 1
A menos que esse processo esteja falhando ao executar diariamente, é improvável que isso mude nada. Verifique o log do daemon para concluir nsrim diariamente.
Reinicialização do serviço
Reiniciar os serviços do NetWorker força várias verificações de inicialização que podem expor problemas nas mensagens de erro do log do daemon e possivelmente corrigir algum. Antes de interromper os serviços, se os problemas do banco de dados parecerem graves, certifique-se de que haja espaço livre adequado disponível e que os locais de inicialização sejam conhecidos (resultado mminfo -B). Idealmente, execute nsrmmdbasm -s nsr/mm/mmvolrel_path > mm.xdr primeiro para tentar extrair uma cópia atual do banco de dados de mídia. Antes de reiniciar os serviços, crie uma cópia da pasta mmvolrel, pois ela pode ser necessária para fins forenses ou de recuperação posteriormente.Exportar e reimportar o banco de dados de mídia
Esse processo evita uma recuperação de desastres completa extraindo apenas registros de banco de dados de mídia viáveis e reimportando-os para o servidor sem interromper os serviços. No entanto, isso só deve ser feito quando o servidor estiver ocioso e nunca deve ser tentado com trabalhos em execução. Use o caminho completo no lugar de mmvolrel (que pode variar de acordo com a instalação ou o sistema operacional)- Antes de começar, marque todos os volumes de disco como Scan Needed após a desmontagem. Se o gerenciamento automático de mídia estiver definido para dispositivos que hospedam volumes de disco, você deverá desativar isso primeiro. Os volumes de fita não precisam dessa etapa.
- Execute os comandos mminfo descritos no preâmbulo para preparar seus relatórios preliminares.
- Verifique o tamanho da pasta e do registro mmvolrel do banco de dados de mídia
- Certifique-se de que nenhum dos processos nsrck, nsrim, nsrmmdbasmesteja em execução; Se houver arquivos grandes, antigos ou não modificados recentemente na pasta principal MM, como MM[AlphaNumerics], mova ou exclua se eles não estiverem bloqueados por nenhum processo.
- Execute o comando para extrair o banco de dados de mídia: nsrmmdbasm -s mmvolrel > mm.xdr
- Compare o tamanho do novo arquivo com o tamanho da pasta mmvolrel, se deve ser semelhante em tamanho. Se for pequeno (4 B ou um punhado de KB), o comando falhou. Se for significativamente menor, pode ter havido registros corrompidos removidos como parte do processo.
- Prepare o servidor para recuperar seu banco de dados de mídia definindo o campo Server's state para recuperação de desastres no NMC/NWUI ou usando nwadmin.
- Recupere-se diretamente do arquivo de extração do banco de dados de mídia usando o comando nsrmmdbasmnovamente: nsrmmdbasm -r -2 < mm.xdr
- Depois de concluído, execute o mesmo mminfo descrito no preâmbulo e compare os valores de saveset e gravação , por volume, garantindo que todos os volumes estejam presentes; da mesma forma, os valores de mminfo -C devem ser idênticos.
- Se houver disparidades, anote e considere cuidadosamente como proceder e entre em contato com o suporte se você não estiver confiante nos resultados que vê:
- Para volumes que parecem estar íntegros, você pode remover o indicador Varredura necessária e montar os volumes, pois não deve haver perigo de exclusão do saveset se nenhum saveset parecer ter sido removido do volume se os savesets e os valores gravados forem consistentes.
- Os volumes que mostram menos savesets ou um total de gravações menor devem deixar o indicador Varredura necessária no lugar e executar o scanner: scanner -i devicename para reintroduzir arquivos encontrados no volume que não têm mais registros. Depois que o scanner for concluído para cada volume, verifique a contagem de savesets novamente e remova o indicador Varredura necessária. Remonte o volume quando tiver certeza de que o scanner substituiu os savesets que estão faltando.
NSRDR
A recuperação de desastres completa realizada pelo nsrdr recupera não apenas o banco de dados de mídia, mas também outros elementos do servidor, como o banco de dados de recursos e o banco de dados de trabalhos. Consulte o Guia de Práticas Recomendadas de Recuperação de Desastres e Disponibilidade do Servidor para sua versão antes de tentar prosseguir com isso.Esse comando espera que os nós de armazenamento estejam on-line e contatáveis para serem concluídos.
Nota: Sempre entre em contato com o suporte em caso de dúvidas ou preocupações, pois a recuperação do banco de dados de mídia pode levar à perda de dados de volumes de disco se o indicador Varredura necessária não for usado para proteger file systems com savesets viáveis que podem não ter registros de banco de dados de mídia corrompidos ou recuperados para um point-in-time anterior.
Affected Products
NetWorkerProducts
Data Backup & Protection Software, NetWorker FamilyArticle Properties
Article Number: 000223518
Article Type: Solution
Last Modified: 08 Apr 2024
Version: 1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.