Avamar: Usando o Perfmon do Microsoft Windows para monitoramento de desempenho de Avamar Clients
Summary: Este artigo explica como usar o Perfmon para monitorar as características de desempenho do Avamar Client em um ambiente Microsoft Windows.
Symptoms
Este artigo aplica-se a todas as versões do Avamar Client que executam o Windows.
O Perfmon (Monitor de desempenho) pode ser uma ferramenta avançada de solução de problemas.
Ele pode coletar métricas de desempenho do Windows ao longo do tempo, em intervalos especificados, e gerar logs que podem ser analisados graficamente para identificar problemas de desempenho do sistema.
Aqui, discutimos quais métricas coletar e como configurar corretamente essa ferramenta para coletá-las.
Para obter mais informações sobre como investigar o desempenho do Avamar Client, consulte:
Cause
Resolution
Como acessar o Perfmon:
Pressione Windows-W para abrir a janela EXECUTAR.
Digite Perfmon.
O que e quando medir
Os gargalos ocorrem quando um recurso atinge a capacidade máxima e podem causar desempenho lento.
Os gargalos são causados por recursos insuficientes ou configurados incorretamente, componentes com defeito e solicitações incorretas de recursos por um programa.
Há cinco áreas de recursos principais que podem causar gargalos e afetar o desempenho do servidor:
- Disco físico
- Memória
- Processo
- CPU
- Rede
Se algum desses recursos for utilizado em excesso, o servidor ou aplicativo poderá ficar notavelmente lento ou travar.
Discutiremos essas áreas e recomendaremos quais contadores e limites podem ajudar a medir o desempenho de um servidor.
O intervalo de amostragem tem um impacto significativo no tamanho do arquivo de log e na carga do servidor.
Defina o intervalo de amostra com base no tempo médio decorrido para que o problema ocorra a fim de estabelecer uma linha de base antes que o problema ocorra novamente. Isso ajuda a identificar qualquer tendência que leve a um problema.
Quinze minutos oferecem uma boa janela para estabelecer uma linha de base durante as operações normais.
- Se o tempo médio decorrido para que o problema ocorra for de cerca de quatro horas, defina o intervalo de amostra como 15 segundos.
- Se o tempo necessário para que o problema ocorra for de oito horas ou mais, defina o intervalo de amostragem como, no mínimo, cinco minutos.
Essas diretrizes ajudam a evitar a criação de um arquivo de log grande, dificultando a análise dos dados.
Objetos e contadores de desempenho
- Objetos — componente que gerencia os dados de desempenho
- Contadores — estatísticas de desempenho específicas de um determinado objeto que descrevem as características de desempenho de um objeto. Por exemplo, \PhysicalDisk\%Idle Time apresenta dados de desempenho sobre o tempo ocioso observado por um eixo.
- Instâncias — várias réplicas representando um recurso exclusivo. Observar \PhysicalDisk\%Idle Time pode mostrar diferentes eixos disponíveis no sistema e os valores de %Idle Time correspondentes.
Intervalo das amostras
Tenha em mente a finalidade e a duração do monitoramento.
Um intervalo de registro de 15 minutos é bom para intervalos de monitoramento de rotina.
O intervalo de amostra deve ser reduzido para um intervalo de tempo que capture o problema.
Para problemas que se desenvolvem gradualmente, ao longo de um período, intervalos de amostra mais longos podem ser usados.
Para problemas transitórios, use um intervalo curto de alguns segundos. Esse intervalo de amostragem é útil para problemas de subsistema de disco.
Lembre-se da duração do monitoramento ao configurar o intervalo de amostra.
Se o monitoramento for executado >por 8 horas, um intervalo de amostra de <300 segundos poderá resultar em um arquivo grande. A sobrecarga de executar o próprio processo de coleta pode afetar os resultados.
Como habilitar o registro no Perfmon.
Abra o prompt de comando como usuário administrador.
Copie os seguintes comandos para iniciar ou interromper a captura de logs.
O comando abaixo cria um conjunto de dados do monitor de desempenho.
Logman.exe create counter Avamar -o "c:\perflogs\Emc-avamar.blg" -f bincirc -v mmddhhmm -max 250 -c "\LogicalDisk(*)\*" "\Memory\*" "\Network Interface(*)\*" "\Paging File(*)\*" "\PhysicalDisk(*)\*" "\Processor(*)\*" "\Process(*)\*" "\Redirector\*" "\Server\*" "\System\*" -si 00:00:05 Start the logs with: Logman.exe start Avamar Stop the logs with: Logman.exe stop Avamar Above commands can be modified to collect SQL server Performance Monitor data during backups as: First create a folder for log collection as C:\SQL_Performance_Logs\ For default SQL instance run: Logman create counter Avamar_SQL_perf_log -f bin -c "\Network Interface(*)\*" "\Redirector\*" "\Paging File(*)\*" "\Memory\*" "\PhysicalDisk(*)\*" "\LogicalDisk(*)\*" "\Server\*" "\System\*" "\Process(*)\*" "\Processor(*)\*" "\SQLServer:Databases(*)\*" "\SQLServer:Buffer Manager\*" "\SQLServer:Memory Manager\*" "\SQLServer:SQL Statistics\*" -si 00:00:05 -max 800 -cnf 0 -o C:\SQL_Performance_Logs\AvamarSQL_perf_log.blg For named instance, replace server with instance name Logman create counter Avamar_SQL_perf_log -f bin -c "\Network Interface(*)\*" "\Redirector\*" "\Paging File(*)\*" "\Memory\*" "\PhysicalDisk(*)\*" "\LogicalDisk(*)\*" "\Server\*" "\System\*" "\Process(*)\*" "\Processor(*)\*" "\SQLServer:Databases(*)\*" "\SQLServer:Buffer Manager\*" "\SQLServer:Memory Manager\*" "\MSSQL$InstanceName:SQL Statistics\*" -si 00:00:05 -max 800 -cnf 0 -o C:\SQL_Performance_Logs\AvamarSQL_perf_log.blg start collecting logs: Logman start Avamar_SQL_perf_log stop log collection: Logman stop Avamar_SQL_perf_log
Contadores e seus valores de limite
Memória
%Committed bytes in use:
A memória comprometida é a memória física em uso para a qual foi reservado espaço no arquivo de paginação, caso seja necessário gravá-la no disco.
O tamanho do arquivo de paginação determina o limite de comprometimento. Se o arquivo de paginação for ampliado, o limite de comprometimento aumentará e a taxa será reduzida.
Este contador exibe apenas o valor percentual atual. Não é uma média. Se esse valor for consistentemente superior a 80%, o arquivo de página pode ser muito pequeno.
Available bytes:
Available Bytes é a quantidade de memória física, em bytes, imediatamente disponível para alocação a um processo ou para uso do sistema.
Isso raramente é uma restrição em sistemas X64. Se esse valor cair abaixo de 5% da RAM instalada de modo consistente, você deverá investigar. Se o valor cair abaixo de 1% da RAM instalada de modo consistente, há um problema evidente.
Committed Bytes:
A memória comprometida é a memória física com espaço reservado em um ou mais arquivos de paginação de disco.
Pode haver um ou mais arquivos de paginação em cada disco rígido.
O ideal é que esse contador nunca mude. As alterações indicam expansão de arquivos de página e devem ser investigadas imediatamente.
Free System Page Table entries:
isso costumava ser uma preocupação em versões x86 mais antigas. Em um servidor Windows Server 2003 SP2, inicializando sem o switch /3Gb, o valor é de aproximadamente 200.000 PTEs.
Ao inicializar com o switch /3Gb, o valor cai para aproximadamente 25.000 PTEs.
Pool Nonpaged Bytes:
Os bytes não paginados do pool representam o tamanho (em bytes) do pool não paginado. Esta é uma área da memória do sistema (memória física usada pelo sistema operacional) para objetos que não podem ser gravados em disco, mas devem permanecer na memória física enquanto forem alocados.
Se um pool não paginado estiver em execução consistentemente a mais de 80%, talvez você esteja a caminho de um problema de esgotamento do pool não paginado (ID do evento 2019).
Pool Paged Bytes:
os bytes paginados do pool são o tamanho, em bytes, do pool paginado, uma área de memória do sistema (memória física usada pelo sistema operacional) para objetos que podem ser gravados em disco quando não estão sendo usados.
O pool paginado é um recurso maior do que o pool não paginado. Se esse valor for consistentemente maior que 70% do tamanho máximo do pool configurado, você corre risco de ter esgotamento do pool paginado (ID do evento 2020).
Processador (Verifique CADA processador e o geral)
%Interrupt time:
o tempo que o processador gasta recebendo e atendendo interrupções de hardware durante intervalos de amostragem.
Esse valor é um indicador indireto da atividade dos dispositivos que geram interrupções. Por exemplo, o relógio do sistema, o mouse, drivers de disco, linhas de comunicação de dados, placas de interface de rede e outros dispositivos periféricos.
Esses dispositivos interrompem o processador quando concluem uma tarefa ou exigem atenção.
%DPC time:
indica o tempo necessário para concluir uma operação de E/S. De modo semelhante ao acima, qualquer valor de >25% deve ser investigado.
%Privileged Time:
tempo em que o kernel do sistema operacional está executando tarefas. Normalmente, o limite é inferior a 30% para servidores de aplicativos ou WEB.
%Processor Time:
devem ser investigados valores sustentados > que 90% em uma máquina com processador único ou > que 80% em uma máquina com vários processadores.
Interface de rede
Packets received discarded:
é usado para verificar problemas de hardware em potencial. Threshold value > 1. Uma possível solução é ajustar os buffers de rede.
Packets received errors:
é usado para verificar problemas de hardware em potencial. Threshold value > 2
Disco (para cada disco)
%Idle Time:
esse contador apresenta uma medição precisa do tempo em que o disco ficou ocioso, o que significa que todas as solicitações do sistema operacional para o disco foram concluídas e não há nenhuma solicitação pendente.
O cálculo ocorre quando o sistema marca um evento quando o disco fica ocioso, depois marca outro evento quando o disco recebe uma nova solicitação.
No final do intervalo de captura, ele calcula a porcentagem de tempo gasto em estado de inatividade. Esse contador varia de 100 (sempre ocioso) a 0 (sempre ocupado).
Esse contador determina com precisão a saturação do subsistema de disco.
Avg. Disk Queue Length:
média O comprimento da fila de disco é igual a (Disk Transfers/sec) * (Disk sec/Transfer).
Isso se baseia na Lei de Little da
teoria matemática das filas.
Note que, este é um valor derivado e não uma medição direta. Qualquer valor menor que o dobro do número de eixos é um bom valor.
AVG Disk Sec/Transfer:
exibe o tempo médio que as transferências de disco levaram para serem concluídas, em segundos.
Embora a escala seja de segundos, o contador tem precisão de milissegundos, o que significa que um valor de 0,004 indica que o tempo médio para as transferências de disco serem concluídas foi de 4 milissegundos.
Este é o contador no Perfmon usado para medir a latência de E/S. Estes são os valores de amostra. Eles podem variar de acordo com a qualidade dos discos que estão sendo usados:
Reads Excellent < 08 Msec (.008 seconds) Good < 12 Msec (.012 seconds) Fair < 20 Msec (.020 seconds) Poor > 20 Msec (.020 seconds) Writes Excellent < 01 Msec (.001 seconds) Good < 02 Msec (.002 seconds) Fair < 04 Msec (.004 seconds) Poor > 04 Msec (.004 seconds)
Split I/Os:
mede a taxa de divisão de E/S devido à fragmentação de arquivos. Isso acontece se a solicitação de E/S tocar dados em segmentos de arquivo não contíguos. Deve estar próximo de zero.
Isso pode ser diferente porque o tamanho da fração de RAID ou o tamanho do bloco NTFS é muito pequeno.
% Free Space:
Exibe a porcentagem do espaço útil total no disco lógico selecionado que estava livre. Sempre deve haver >15% de espaço livre, sendo o recomendado >=25%.
Processo
- Handle Count: Correlacionado com vazamentos de pool.
- Virtual bytes: Memória virtual reservada para ser usada por um aplicativo.
- Working set bytes: Bytes privados residentes na memória física de propriedade de um aplicativo.
Qual é a diferença entre os objetos de desempenho do disco físico e do disco lógico no Perfmon?
O Perfmon tem dois objetos diretamente relacionados ao desempenho do disco, disco físico e disco lógico.
Seus contadores são calculados da mesma maneira, mas seu escopo é diferente.
O objeto Physical Disk Performance monitora as unidades de disco no computador. Ele identifica as instâncias que representam o hardware físico. Os contadores são a soma do acesso a todas as partições na instância física.
O objeto Logical Disk Performance monitora partições lógicas. Um monitor de desempenho identifica discos lógicos pela letra da unidade ou ponto de montagem.
Se um disco rígido contiver várias partições, esse contador relatará os valores da partição selecionada e não do disco inteiro.
Ao usar discos dinâmicos, os volumes lógicos podem abranger mais de um disco rígido. Nesse cenário, os valores do contador incluem acesso ao disco lógico em todos os discos rígidos que ele abrange.
Quais contadores do Monitor de desempenho do Windows mostram a latência do disco rígido?
- Physical disk performance object —> média. Disk sec/Read counter — mostra a latência média de leitura.
- Physical disk performance object —> média. Disk sec/Write counter — mostra a latência média de gravação.
- Physical disk performance object —> média. Disk sec/Transfer counter — mostra as médias combinadas de leitura e gravação.
- A instância _Total é uma média das latências de todos os discos rígidos no computador.
Cada outra instância representa um disco físico individual.
Contadores a serem observados durante o monitoramento em diferentes situações:
|
Componente |
Aspecto do desempenho que está sendo monitorado |
Contadores a serem monitorados |
|
Disco |
Uso |
Disco físico\ Sec/Read Disco físico\ Disk Reads/sec Disco físico\ Avg Queue Length Read Disco físico\ Avg Queue Length Write Disco lógico\ % Free Space Interprete o contador % Disk Time com cuidado. |
|
Disco |
Gargalos |
Disco físico\ TODOS OS CONTADORES Disco lógico\ % Free Space Sistema\File Control Operations/sec Sistema\File Data Operations/sec Nota: A localização desse contador-chave é abaixo do sistema. Ele não é específico do volume, mas será útil se você tiver apenas um volume ativo. |
|
Memória |
Uso |
Memória\ Available Bytes Memória\ % Committed Bytes in Use. Memória\ Pool Non-Paged Bytes Memória\ Pool Paged Bytes. Memória\ Pages Input ou Reads/sec Memória\ Free System Pages |
|
Memória |
Gargalos ou vazamentos |
Memória\ Available Bytes Memória\ Cache Bytes Memória\ Pages/sec Memória\ Page Output ou Write /sec. Memória\ Free System Pages |
|
Processador |
Uso |
Processador\ % Processor Time (todas as instâncias) Processador\ % Privileged Time Processador\ % User Time |
|
Processador |
Gargalos |
Processador\ % Processor Time (todas as instâncias) Processador\ % DPC Time Processador\ % Interrupt Time Processador\ % Privileged Time Processador\ % User Time Processador\ DPC s Queued /sec. Sistema\System Calls/sec Sistema\ Processor Queue Length (todas as instâncias) |
Additional Information