NetWorker: Solução de problemas da biblioteca de fitas no NetWorker
Resumo: Este artigo destina-se a auxiliar os administradores de backup e de suporte do NetWorker a abordar e solucionar problemas relacionados à biblioteca de fitas.
Instruções
Antes de investigar problemas na biblioteca de fitas, é importante considerar o seguinte:
- As UNIDADES de fita leem e gravam dados e etiquetas na mídia e fornecem todas as funções de mídia, além de não poderem mover os cartuchos de fita por conta própria
- As BIBLIOTECAS de fitas movem cartuchos de fita de mídia de elemento para elemento: Unidades, slots e portas de importação e exportação e não leia nem grave dados
Se as operações do NetWorker falharem devido à incapacidade de mover cartuchos de fita, há várias possíveis causas gerais:
- Problema de hardware ou firmware com o robô de biblioteca ou componentes internos
- Problemas de conectividade do host do NetWorker com a robótica da biblioteca no transporte
- Problema de OS, driver ou compatibilidade entre o host e a biblioteca do NetWorker
- Problema de configuração do NetWorker relacionado ao tipo, estado e endereçamento da biblioteca de fitas
Siga estas etapas cronologicamente para ajudar a determinar a natureza do problema e, possivelmente, resolvê-lo. Se esse documento não resolver o problema, ele fornecerá testes que restringem o problema e ajudam um especialista a continuar o trabalho.
1. Informações ambientais
No servidor do NetWorker e nos nós de armazenamento afetados:
- Nome do host, tipo de sistema operacional e versão.
- Número da versão e do build do NetWorker.
- Saída do '
inquire' mostrando fitas e bibliotecas. - Cópia compactada da versão atual
nsrdb(para preservar as informações da jukebox atual, se necessário, para reversão)
Linux:/nsr/res/nsrdb
Windows (padrão):C:\Program Files\EMC NetWorker\nsr\res\nsrdb - Storage Node, nome do NetWorker para a biblioteca e lista de nós, dispositivos e volumes afetados
- Pontos comuns do problema (volumes específicos, unidades específicas, nós específicos etc.)
nsrget -o:d No servidor e nos nós afetados.
-o:d Em qualquer host com fitas em que as fitas estejam ocupadas gravando. Você pode verificar isso no NetWorker Management Console (NMC), em Monitoring —>Devices.
O seguinte artigo apresenta informações sobre como obter e usar o NSRGET: NetWorker: Como usar a ferramenta de coleta de dados NSRGet do NetWorker
2. Prontidão de teste da biblioteca
- Verifique se o proprietário do nó de armazenamento da biblioteca afetada está habilitado e pronto:
- No NMC, vá para Devices ->Storage Nodes.
- Certifique-se de que View ->Diagnostic Mode esteja ativado.
- Marque as colunas Enabled e Ready no painel à direita.
- Se um nó de armazenamento que deve ser ativado não estiver ativado, clique com o botão direito do mouse no nó de armazenamento e clique em Enable/Disable para ativá-lo.
- Se o nó de armazenamento não ficar pronto em um ou dois minutos, você deverá fazer o acompanhamento separadamente; a biblioteca não responde porque seu nó de armazenamento está inacessível.
- Verifique se a biblioteca afetada está ativada e pronta:
- No NMC, vá para Dispositivos ->Bibliotecas.
- Certifique-se de que View ->Diagnostic Mode esteja ativado.
- Marque as colunas Enabled e Ready no painel à direita. Se a biblioteca mostrar um estado Ready , vá para a seção [
4]. - Se ela não estiver habilitada, você poderá clicar com o botão direito na instância da biblioteca à esquerda e selecionar "Habilitar/desabilitar" para reativá-la.
- Depois de habilitado, aguarde um ou dois minutos, clique novamente no contêiner Bibliotecas e veja se uma marca verde aparece na coluna 'Pronto'.
- Se a biblioteca não ficar pronta, clique com o botão direito do mouse na instância da biblioteca à esquerda, selecione Properties e, na guia General , certifique-se de que o valor Control Port corresponda ao
scsidev@#.#.#endereço exibido noinquire. - Se a Control Port não corresponder, defina Enabled como No e clique em OK; em seguida, digite novamente as propriedades e altere a Control Port para corresponder à
inquireEndereço descoberto. Depois de atualizar a porta de controle, altere Enabled de volta para Yes e clique em OK novamente para reativar. Aguarde um ou dois minutos para ver se a biblioteca está pronta. - Finalmente, se depois de corrigir o valor da Porta de Controle não permitir que a biblioteca fique Pronta, insira as propriedades da biblioteca uma última vez; na guia Avançado , defina Nível de Rastreamento de Depuração como 5; e Desativar e reativar novamente para capturar a sequência de inicialização no log do daemon por dois minutos.
Ao reativar a biblioteca na seção [2.2], confirme que nsrlcpd Inicia no nó de armazenamento pretendido. Verifique também se ele não é interrompido ou reiniciado independentemente. Se o PID (Process ID, ID do processo) continuar mudando, isso sugere que o processo foi interrompido ou eliminado pelo software ou pelo núcleo de dumping. Também fique alerta para problemas de resolução de nomes entre o servidor e o nó de armazenamento, o que pode impedir inicializações. O nome que o servidor resolve para o nó deve corresponder ao nome nsrladb dos nós e ao nome do servidor para o nó.
- Consulte Solucionando problemas de preparação da biblioteca de fitas no NetWorker para obter informações avançadas de solução de problemas sobre problemas de preparação da biblioteca.
- Consulte o Guia de solução de problemas do NetWorker: Processar falhas e core dumps se você vir ou suspeitar que os nós
nsrexecd,nsrsnmd, ounsrlcpdsão core dumping.
Para obter uma visão geral detalhada dos processos do NetWorker por host, consulte: Processos e portas do NetWorker
Mensagens sobre esses serviços são registradas no daemon.raw:
- Linux:
/nsr/logs/daemon.raw - Windows (padrão):
C:\Program Files\EMC NetWorker\nsr\logs\daemon.raw - NetWorker: Como usar nsr_render_log para processar arquivos de log .raw
3. Determinar a capacidade de resposta da biblioteca:
Se a biblioteca não ficar pronta e você não puder determinar uma causa, certifique-se de que a biblioteca em si possa ser contatada:
- Verifique a coluna
inquiresaída do nó de [1.3] e certifique-se de que a biblioteca apareça na saída como 'Autochanger', e observe o SCSI#.#.#nos Estados Unidos. - Se a biblioteca não aparecer no
inquireresultado, verifique se o sistema operacional consegue detectá-lo. Os hosts Solaris não relatam a biblioteca se ela estiver configurada e habilitada no NetWorker. Para obter assistência, consulte Solucionando problemas de detecção da biblioteca de fitas no NetWorker. - Certifique-se de que a biblioteca esteja respondendo aos comandos básicos da biblioteca. Usando o endereço SCSI em [
3.1], execute: 'sjisn #.#.#'. Para obter mais informações sobre comandos de teste de biblioteca, marque Solucionando problemas de acesso à biblioteca de fitas no NetWorker. - Se os comandos SJI falharem, considere a possibilidade de problemas de transporte ou hardware: Consulte Solução de problemas de hardware da biblioteca de fitas no NetWorker para obter assistência.
- Se o problema for que o sistema operacional não detecta a biblioteca e responde corretamente aos comandos SJI, o NetWorker falha ao detectar, tente usar o
jbconfige selecionando a opção 2; Se isso não funcionar, tente a opção 4, forneça manualmente o endereço da biblioteca e configure-o como uma biblioteca padrão (opção 56). Consulte Solução de problemas de configuração da biblioteca de fitas no NetWorker para obter mais detalhes.
4. Testar a movimentação da fita e a integridade do volume
Se a biblioteca estiver pronta e parecer responsiva, mas estiver tendo problemas para carregar volumes, há muitas causas diferentes possíveis.
- Esvazie toda a biblioteca, se possível; se você puder interromper outras operações, clique com o botão direito do mouse e redefina a biblioteca na guia Dispositivos ->Bibliotecas .
- Tente carregar um único cartucho de fita em um único dispositivo, onde ambos são considerados afetados por problemas de carga; descarregar após cada tentativa, conforme necessário.
- Comparar com o mesmo volume em unidades diferentes, e volumes diferentes na unidade que se acredita ter sido afetado; Observe os erros e os padrões, se houver.
- Se a carga do volume falhar de forma confiável, independentemente do dispositivo, tente a seguinte verificação de rótulo:
- Carregue o volume sem montar Se o cartucho de fita se mover sem erros, você verificou se o braço está funcionando mecanicamente.
- Execute
nsrmm -pv -f networker_deviceSe ele responder com o rótulo verificado, você verificou que a mídia também é válida e íntegra. - Nas propriedades da Biblioteca, com o Modo de Diagnóstico ativado, vá para a guia Timers e defina Load Sleep como 60 antes de clicar em OK.
- Descarregue o volume e, em seguida, tente recarregá-lo Se agora ele for bem-sucedido, o problema provavelmente era um problema de tempo (você pode experimentar valores mais baixos de suspensão até que comece a falhar novamente).
- Se a
nsrmmO comando falhou; são necessários mais testes. Desative a unidade em questão no NMC clicando com o botão direito do mouse e selecionando Enable/Disable.- Execute o
scannerComando no dispositivo:- Para o nó de armazenamento local do servidor do NetWorker, execute:
scanner -nizv local_device - Para em um nó de armazenamento "remoto" do NetWorker, execute:
scanner -s server -nizv local_device
- Para o nó de armazenamento local do servidor do NetWorker, execute:
- Quebrar após ~20 linhas e verificar a etiqueta ler mensagens; O sucesso é indicado por
8936:scanner: scanning media_type tape volume_name on device_name. - Se a solicitação do
scannerretorna a mensagem número de arquivo inesperado, wanted 2, got higher_number ocorreu perda de dados, muito provavelmente devido à redefinição de SCSI; Marque Solucionando problemas de rótulos substituídos e redefinições de SCSI no NetWorker.
- Execute o
- Se a
scannerretorna ummessage 8945:scanner: Read: -1 bytesDetermine se o volume pode ser lido em outros nós ou unidades e determine a tendência do problema. Se você achar que alguns volumes podem ser lidos em alguns nós, mas não em outros, e o dispositivo é LTO-4 ou superior, considere falhas de descriptografia de unidade: Criptografia de hardware LTO e NetWorker.
Para obter informações mais avançadas de verificação de mídia, consulte: Solução de problemas de montagem de mídia no NetWorker.
5. Teste se há problemas de ordenação de unidades
Se os comandos de carregamento e montagem forem bem-sucedidos, mas as leituras de rótulos ou montagens simples falharem, o problema pode envolver a ordenação incorreta das unidades.
- Esvazie toda a biblioteca, se possível; se você puder interromper outras operações, clique com o botão direito do mouse e redefina a biblioteca em Dispositivos ->Bibliotecas.
- Tente carregar um único cartucho de fita em um único dispositivo, onde ambos são considerados afetados por problemas de carga; descarregar após cada tentativa, conforme necessário.
- Comparar com o mesmo volume em unidades diferentes, e volumes diferentes na unidade que se acredita ter sido afetado; Observe os erros e os padrões, se houver.
- Se uma carga falhar de modo confiável, tente a seguinte verificação de rótulo:
Para obter assistência mais avançada com problemas de carregamento da biblioteca, consulte: Solução de problemas de carregamento da biblioteca de fitas no NetWorker.
Se todos esses testes falharem e você não precisar mais, certifique-se de documentar os resultados de acordo com cada etapa deste artigo e entre em contato com o suporte do NetWorker. Detalhes claros são essenciais para agilizar soluções e garantir que "etapas repetidas" sejam limitadas.