Dell Unity: Como coletar as informações necessárias para uma análise de desempenho do Unity

Summary: Este artigo mostra como coletar logs e dados para diagnosticar problemas de desempenho em arrays do Unity.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Problema

  • Baixo desempenho de leitura ou gravação (ou ambos) e altos tempos de resposta para hosts conectados.
  • Os tempos de resposta para aplicativos host aumentaram ou estão inaceitavelmente altos.
  • Problemas de desempenho em uma array Dell Unity que exigem análise de desempenho.

Os problemas de desempenho podem ter várias causas. Elas incluem: configuração de rede, congestionamento, configuração do host, falhas de hardware, conflito de discos (várias LUNs ocupadas compartilhando as mesmas unidades) ou storage array com utilização máxima.

O suporte técnico do Unity só poderá investigar e solucionar totalmente os problemas de desempenho quando receber os seguintes itens:

  • Arquivo de dados de serviço (coleta de dados)
  • Arquivos UPA (Unity Performance Archives, Arquivos de Desempenho do Unity)
  • Uma descrição detalhada dos sintomas observados no ambiente de produção

Caso as informações indicadas neste arquivo da Base de conhecimento (KB) da Dell não sejam prontamente apresentadas, os tempos de resolução poderão ser maiores.

Os detalhes dos problemas de desempenho (sintomas, registros de data e hora etc.) são cruciais para que o engenheiro saiba onde se concentrar (horários, LUNs, hosts etc.), em vez de gastar várias horas apenas para encontrar o problema (não a causa). Sem esses detalhes, horas podem ser gastas procurando um problema apenas para poder analisar as estatísticas gerais de desempenho.
 


Scope

Os serviços de suporte ao cliente investigam casos de desempenho para identificar os problemas que estão afetando os locais dos clientes. O ajuste de desempenho (para atingir o desempenho máximo de um host ou aplicativo) e a reconfiguração são tarefas para um administrador de armazenamento ou um arquiteto de soluções. Elas não serão tratadas em um chamado de reparo/correção.

Os chamados que não envolvem um problema definido, como a solicitação de um relatório do nível atual de carga de trabalho em um array, estão fora do escopo do suporte durante interrupções. Quem quiser acessar a autoajuda ou precisar de auxílio para determinar o nível de carga de trabalho em um array pode usar o serviço LiveOptics. Consulte o seguinte artigo para obter informações detalhadas sobre essa opção:

 
Requisitos de dados e informações para uma análise detalhada de desempenho

Para cada evento, o suporte técnico precisa dos seguintes logs e informações que abrangem o período do incidente:

  • Arquivos de dados de serviço (também conhecidos como coletas de dados), gerados logo após a ocorrência do problema.
    • Se a replicação estiver em uso, serão necessários os arquivos de coleta de dados e UPA de ambos os arrays.
  • Arquivos UPA (Unity Performance Archives, Arquivos de Desempenho do Unity), que compreendam todo o período em que o problema estava ocorrendo.
  • Os logs de switch e os arquivos do Grab do host também podem ser necessários se o problema parecer estar fora da array.
  • Os rastreamentos de rede do Unity também podem ser necessários.


PROBLEMAS EM BLOCOS

  • Forneça uma descrição clara e detalhada do problema:
  • Quando o problema ocorreu? (Data, hora e fuso horário)
  • Quais LUNs foram afetadas?
    • Isso é importante para restringir a pesquisa.
  • A redução de dados ou a desduplicação avançada está habilitada nas LUNs que estão com problemas? A redução de dados está habilitada nas outras LUNs? (Consulte o white paper de práticas recomendadas do Unity, seção Utilização da CPU, na página 9)
  • A replicação está em uso? Apresente informações sobre o RPO da replicação e se o problema de desempenho melhora caso haja pausa na replicação.
  • Houve algum momento em que os dados ativos ficaram indisponíveis?
  • Algo mais estava em execução no momento especificado? (Backup, trabalhos, lotes, verificações de vírus, otimização do disco do host (TRIM/UNMAP) e outros)
  • Algo que não está funcionando agora já funcionou em algum momento? Ou faz parte de uma nova implementação/configuração? Recentemente, novos aplicativos ou hosts foram adicionados?
  • Como o desempenho está sendo medido ou qual é o impacto? Atrasos ou erros no host? Os usuários finais estão relatando lentidão?
  • Alguma alteração recente no ambiente SAN (hosts, switches, array)?
  • Impacto (aplicativos afetados, nº de servidores afetados, nº de usuários afetados e outros)
  • Com que frequência o problema ocorre? (Constantemente/regularmente/uma vez/aleatoriamente)
  • Quais são os nomes dos hosts afetados?
  • Qual topologia é usada? FC, iSCSI ou Ethernet? (Se estiver usando iSCSI, todos os hosts DEVEM ter a opção TCP Delayed ACK desativada.
  • Se o problema estiver relacionado à conectividade, o suporte poderá solicitar um diagrama de topologia.
  • Ocorreu algum problema conhecido na rede simultaneamente ou algum upgrade foi feito na rede recentemente? Verifique também se o iSCSI não está sendo usado na LAN interna e se todos os switches usados são switches de classe empresarial.

 

PROBLEMAS EM ARQUIVOS

  • Forneça uma descrição clara e detalhada do problema:
  • Quais são os protocolos específicos envolvidos?
    • Exemplo: NFS (versão), CIFS (versão), NDMP, iSCSI, FTP e outros
  • O problema está relacionado a um file system/uma LUN ou a uma exportação/um compartilhamento específico?
  • Em qual momento do dia ocorreu o problema? (Data, hora e fuso horário)
  • Qual a carga de trabalho ativa no momento do problema?
    • Exemplo: log-in, log-out, backup, trabalhos em lote e outros
  • Quais hosts estão envolvidos?
    • Exemplo: Backup, VMs, workstations, servidores e outros 
    • Detalhes específicos sobre o aplicativo.
  • Como é a configuração de rede?
    • Forneça detalhes específicos da interface/NIC.
  • As interfaces de rede são isoladas em NICs separadas?
    • Exemplo: Tráfego de replicação na NIC dedicada


Coletando o arquivo de dados de serviço (coleta de dados)

Para coletar o arquivo de dados de serviço (coleta de dados), consulte o artigo 000023676 da LKB. Os arquivos de saída do arquivo de dados de serviço em execução no array são necessários para mostrar a configuração detalhada do array e os eventos ocorridos no array. Após a ocorrência do evento, o suporte recomenda que os clientes coletem o arquivo de dados de serviço (coleta de dados) o mais rápido possível.

 

 

Lembre-se de que o arquivo de dados de serviço contém o último arquivo UPA completo (uma hora) e qualquer arquivo -tmp.archive UPA disponível. Muitas vezes, essas informações não são suficientes para uma análise de desempenho adequada, e UPAs adicionais são necessários.

Para localizar o arquivo UPA no arquivo de dados de serviço (coleta de dados), acesse spx\cmd_outputs\metrics\

  • spx = Primary SP

  • Exemplo: Se a SPA for a SP ativa, o UPA estará em spa\cmd_outputs\metrics

 
Coletando arquivos UPA

  • O suporte pode solicitar arquivos UPA adicionais.
  • Diferentemente do arquivo de dados de serviço (coleta de dados), o array armazena até 48 horas de arquivos UPA. 
  • Os arquivos UPA são parecidos com os do exemplo abaixo. Cada nome de arquivo contém a data e a hora do primeiro ponto de dados no arquivo. O intervalo é de dez segundos e a cobertura é de uma hora menos dez segundos. A data e as horas nos nomes de arquivo estão em UTC/GMT.
    • O último arquivo UPA no exemplo abaixo é o arquivo mais recente (-tmp.archive). Ele contém os dados de desempenho atuais e pode ser copiado do array (usando somente SSH/CLI) para permitir a análise dos dados mais recentes. O suporte pode usar esse arquivo para ver eventos de desempenho, sem esperar até a próxima hora.

Exemplo de arquivos UPA armazenados no array do Dell Unity:
01/05/2017  10:59 AM        11,017,216 _default_20170105_150000.archive
01/05/2017  11:59 AM        11,017,216 _default_20170105_160000.archive
01/05/2017  01:00 PM        11,017,216 _default_20170105_170000.archive
01/05/2017  01:59 PM        10,983,424 _default_20170105_180000.archive
01/05/2017  02:45 PM         8,308,736 _default_20170105_190000-tmp.archive

 

 
Há dois métodos (CLI e Unisphere/GUI) que podem ser usados para coletar arquivos UPA:

 

Usando o Unisphere/a GUI
Opção 1: Lista do Unisphere


Esta opção só está disponível para o Unity OE 4.2 ou superior. Esta lista pode não incluir todos os UPAs disponíveis. Há uma limitação para a IU (Unisphere), que apenas pode listar alguns arquivos disponíveis. Se o arquivo UPA necessário não estiver listado, avance para a opção 2 ou use SSH/CLI.


Lista do Unisphere

Opção 2: Intervalo de tempo do Unisphere
  • Você pode selecionar um intervalo de tempo para que o sistema obtenha os UPAs disponíveis.
    • Antes de coletar os logs, confirme o horário do problema para que somente ocorra o download dos logs necessários.
  • Lembre-se de que o intervalo de tempo do cliente está no horário atual do navegador que, muitas vezes, é igual ao horário atual da workstation.
  • Esta opção só está disponível para o Unity OE 4.2 ou superiorIntervalo de tempo do Unisphere

Usando SSH/CLI

Também é possível usar a CLI para acessar outros UPAs que estão no array do Unity, mas que não são listados na IU (Unisphere) com a Opção 1.

  • Faça log-in com o usuário e a senha service

  • Copie os logs desejados para /cores/service/user from /EMC/backend/metricsluna1/archives

  • Faça download desses logs usando o WinSCP ou uma ferramenta semelhante

    • Se o array estiver no OE 4.5.X ou mais recente, altere o protocolo de arquivo para SCP

    • Faça log-in com o usuário e a senha service

 
ll /EMC/backend/metricsluna1/archives/
cp /EMC/backend/metricsluna1/archives/_default_20230221_180000.archive.gz /cores/service/user

Nota: Se você estiver coletando apenas UPAs atuais, talvez queira executar |tail-10, pois há dezenas de arquivos UPA disponíveis no back-end. No entanto, você pode listar todos eles.

UPAs via CLI


 
Coleta de dados do host
Os arquivos de saída do Grab do host (ou relatório da EMC) talvez sejam necessários, principalmente se o problema for exclusivo de determinados hosts.

  • Acesse https://www.dell.com/support/home/ (site do Suporte Dell) e pesquise pelo utilitário Grab relacionado ao SO do host correto (por exemplo: ESXi host grab)
  • Faça download do utilitário e do arquivo README.
  • Siga o arquivo README para executar o utilitário do sistema operacional do host escolhido.

 
Logs de switch
Se o problema de desempenho existir apenas em determinados caminhos, os logs de switch poderão ser necessários. Consulte o seguinte artigo da LKB para obter instruções (com base no modelo que está em uso):
 

Brocade/Connectrix

Cisco


Capturas de rastreamentos de rede (dump TCP)
Alguns problemas de desempenho de arquivos podem estar relacionados a problemas de rede. Para determinar perfeitamente a causa de um problema, o suporte pode solicitar rastreamentos de rede.

Dell Unity: Como capturar um rastreamento de rede TCP/IP do array. (Corrigível pelo usuário)

Additional Information

Consulte este vídeo:


Affected Products

Dell EMC Unity 300F, Dell EMC Unity 350F, Dell EMC Unity 400, Dell EMC Unity 400F, Dell EMC Unity 450F, Dell EMC Unity 500, Dell EMC Unity 500F, Dell EMC Unity 550F, Dell EMC Unity 600, Dell EMC Unity 600F

Products

Dell EMC Unity, Dell Unity 450F DC, Dell Unity 300, Dell Unity 300 DC, Dell Unity 350F DC, Dell EMC Unity XT 380, Dell EMC Unity XT 380F, Dell Unity 400 DC, Dell EMC Unity XT 480, Dell EMC Unity XT 480F, Dell EMC Unity 650F, Dell EMC Unity XT 680 , Dell EMC Unity XT 680F, Dell EMC Unity XT 880, Dell EMC Unity XT 880F, Dell EMC Unity Family |Dell EMC Unity All Flash, Dell EMC Unity Hybrid ...
Article Properties
Article Number: 000022748
Article Type: How To
Last Modified: 03 Sept 2025
Version:  7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.