Avamar: Uso de Perfmon en Microsoft Windows para monitorear el rendimiento de Avamar Client
Summary: En este artículo, se explica cómo usar Perfmon para monitorear las características de rendimiento del cliente Avamar en un entorno de Microsoft Windows.
Symptoms
Este artículo se aplica a todas las versiones de Avamar Client que ejecutan Windows.
Perfmon (Performance Monitor) puede ser una potente herramienta de solución de problemas.
Puede recopilar métricas de rendimiento de Windows a lo largo del tiempo, en intervalos especificados, y generar registros que se pueden analizar gráficamente a fin de identificar problemas de rendimiento del sistema.
Aquí discutimos qué métricas recopilar y cómo configurar correctamente esta herramienta para recopilarlas.
Para obtener más información sobre cómo investigar el rendimiento del cliente Avamar, consulte:
Cause
Resolution
Cómo acceder a Perfmon:
Presione Windows-W para abrir la ventana RUN.
Escriba Perfmon.
Qué aspectos medir y cuándo hacerlo
Los cuellos de botella se producen cuando un recurso alcanza su capacidad, y pueden generar un rendimiento lento.
Los cuellos de botella se deben a recursos insuficientes o mal configurados, componentes que no funcionan correctamente y solicitudes incorrectas de recursos por parte de un programa.
Hay cinco áreas de recursos principales que pueden generar cuellos de botella y afectar el rendimiento del servidor:
- Disco físico
- Memoria
- Proceso
- CPU
- Red
Si alguno de estos recursos se utiliza en exceso, el servidor o la aplicación pueden volverse notablemente lentos o bloquearse.
Analizamos estas áreas y aconsejamos qué contadores y umbrales pueden medir el rendimiento de un servidor.
El intervalo de muestreo tiene un impacto significativo en el tamaño del archivo de registro y la carga del servidor.
Configure el intervalo de muestra según el tiempo promedio transcurrido para que ocurra el problema a fin de establecer una base antes de que vuelva a presentarse. Esto permite detectar cualquier tendencia que genere un problema.
Quince minutos brindan un buen período para establecer una base durante las operaciones normales.
- Si el tiempo promedio transcurrido para que ocurra el problema es de aproximadamente cuatro horas, establezca el intervalo de muestra en 15 segundos.
- Si el tiempo en el que se produce el problema es de ocho horas o más, establezca el intervalo de muestreo en no menos de cinco minutos.
Estas reglas permiten evitar la creación de un archivo de registro extenso, lo que dificulta más el análisis de los datos.
Objetos y contadores de rendimiento
- Objetos: componentes que administran los datos de rendimiento
- Contadores: estadísticas de rendimiento específicas de un objeto puntual que describen las características de rendimiento determinadas de un objeto. Por ejemplo, \PhysicalDisk\%Idle Time proporciona datos de rendimiento sobre el tiempo de inactividad observado por un eje.
- Instancias: varias réplicas que representan un único recurso. Observar \PhysicalDisk\%Idle Time puede mostrar diferentes ejes disponibles en el sistema y sus valores correspondientes de %Idle time.
Intervalo de muestra
Tenga en cuenta el propósito y la duración del monitoreo.
Un intervalo de registro de 15 minutos está bien para intervalos de monitoreo de rutina.
El intervalo de muestra debe reducirse a un intervalo de tiempo que capture el problema.
Para problemas que se acumulan gradualmente, durante un período, se pueden usar intervalos de muestra más largos.
Para problemas transitorios, use un intervalo breve de unos pocos segundos. Este intervalo de muestreo es útil para problemas del subsistema de disco.
Tenga en cuenta la duración del monitoreo cuando configure el intervalo de muestra.
Si el monitoreo dura >8 horas, un intervalo de muestra de <300 segundos puede dar como resultado un archivo grande. La sobrecarga de ejecutar el proceso de recopilación en sí misma puede afectar los resultados.
Cómo habilitar Perfmon Logging@.
Abra el símbolo del sistema como usuario administrador.
Copie los siguientes comandos para iniciar o detener la captura de registros.
El siguiente comando crea un conjunto de datos de monitoreo de rendimiento.
Logman.exe create counter Avamar -o "c:\perflogs\Emc-avamar.blg" -f bincirc -v mmddhhmm -max 250 -c "\LogicalDisk(*)\*" "\Memory\*" "\Network Interface(*)\*" "\Paging File(*)\*" "\PhysicalDisk(*)\*" "\Processor(*)\*" "\Process(*)\*" "\Redirector\*" "\Server\*" "\System\*" -si 00:00:05 Start the logs with: Logman.exe start Avamar Stop the logs with: Logman.exe stop Avamar Above commands can be modified to collect SQL server Performance Monitor data during backups as: First create a folder for log collection as C:\SQL_Performance_Logs\ For default SQL instance run: Logman create counter Avamar_SQL_perf_log -f bin -c "\Network Interface(*)\*" "\Redirector\*" "\Paging File(*)\*" "\Memory\*" "\PhysicalDisk(*)\*" "\LogicalDisk(*)\*" "\Server\*" "\System\*" "\Process(*)\*" "\Processor(*)\*" "\SQLServer:Databases(*)\*" "\SQLServer:Buffer Manager\*" "\SQLServer:Memory Manager\*" "\SQLServer:SQL Statistics\*" -si 00:00:05 -max 800 -cnf 0 -o C:\SQL_Performance_Logs\AvamarSQL_perf_log.blg For named instance, replace server with instance name Logman create counter Avamar_SQL_perf_log -f bin -c "\Network Interface(*)\*" "\Redirector\*" "\Paging File(*)\*" "\Memory\*" "\PhysicalDisk(*)\*" "\LogicalDisk(*)\*" "\Server\*" "\System\*" "\Process(*)\*" "\Processor(*)\*" "\SQLServer:Databases(*)\*" "\SQLServer:Buffer Manager\*" "\SQLServer:Memory Manager\*" "\MSSQL$InstanceName:SQL Statistics\*" -si 00:00:05 -max 800 -cnf 0 -o C:\SQL_Performance_Logs\AvamarSQL_perf_log.blg start collecting logs: Logman start Avamar_SQL_perf_log stop log collection: Logman stop Avamar_SQL_perf_log
Contadores y sus valores de umbral
Memoria
%Committed bytes in use:
La memoria confirmada es la memoria física en uso para la cual se reservó espacio en el archivo de paginación en caso de que se deba escribir en el disco.
El tamaño del archivo de paginación determina el límite de confirmación. Si se amplía el archivo de paginación, el límite de confirmación aumenta y la tasa se reduce.
Este contador muestra solo el valor porcentual actual. No es un promedio. Si este valor es sistemáticamente superior al 80 %, es posible que el archivo de paginación sea demasiado pequeño.
Available bytes:
Los bytes disponibles es la cantidad de memoria física, en bytes, inmediatamente disponible para su asignación a un proceso o el uso del sistema.
Esto rara vez es una restricción en los sistemas X64. Si este valor cae por debajo del 5 % de la RAM instalada de forma constante, se debe investigar. Si el valor cae por debajo del 1 % de la RAM instalada de forma constante, hay un problema definitivo.
Committed Bytes:
La memoria confirmada es la memoria física que tiene espacio reservado en uno o más archivos de paginación de discos.
Puede haber uno o más archivos de paginación en cada disco duro.
Lo ideal es que este contador no cambie nunca. Los cambios indican una expansión del archivo de paginación y se deben investigar de inmediato.
Entradas libres de la tabla de páginas del sistema:
esto solía ser una preocupación en versiones anteriores de x86. En un servidor Windows Server 2003 SP2, el cual arranca sin el switch /3 Gb, el valor es de aproximadamente 200 000 PTE.
Cuando se inicia con el switch /3 Gb, esto disminuye a ~25 000 PTE.
Pool Nonpaged Bytes:
Los bytes no paginados del pool es el tamaño (en bytes) del pool no paginado. Esta es un área de la memoria del sistema (memoria física utilizada por el sistema operativo) para objetos que no se pueden escribir en el disco, pero que deben permanecer en la memoria física, siempre y cuando estén asignados.
Si un pool no paginado se ejecuta a más del 80 %, de manera constante, es posible que presente un problema de agotamiento del pool no paginado (ID de evento 2019).
Pool Paged Bytes:
Los bytes paginados del pool es el tamaño, en bytes, del pool paginado, un área de la memoria del sistema (memoria física usada por el sistema operativo) para objetos que se pueden escribir en el disco cuando no están en uso.
El pool paginado es un recurso más grande que el pool no paginado. Si este valor es consistentemente mayor que el 70 % del tamaño máximo configurado del pool, puede estar en riesgo de un agotamiento del pool paginado (ID del evento 2020).
Procesador (compruebe CADA procesador y a nivel general)
%Interrupt time:
el tiempo que el procesador dedica a recibir y reparar interrupciones de hardware durante intervalos de muestra.
Este valor es un indicador indirecto de la actividad de los dispositivos que genera interrupciones. Por ejemplo, el reloj del sistema, el mouse, los controladores de disco, las líneas de comunicación de datos, las tarjetas de interfaz de red y otros dispositivos periféricos.
Estos dispositivos interrumpen el procesador cuando han completado una tarea o requieren atención.
%DPC time:
indica el tiempo necesario para completar una operación de I/O. De manera similar a lo anterior, se debe investigar cualquier valor que sea >25 %.
%Privileged Time:
tiempo durante el cual el kernel del sistema operativo está realizando trabajos. Por lo general, el umbral es inferior al 30 % para los servidores de aplicaciones o WEB.
%Processor Time:
Se deben investigar valores sostenidos de >90 % en un equipo de un solo procesador o de >80 % en un equipo con varios procesadores.
Interfaz de red
Packets received discarded:
se utiliza para comprobar posibles problemas de hardware. Valor del umbral > 1. Una posible solución es ajustar los búferes de red.
Packets received errors:
se utiliza para comprobar posibles problemas de hardware. Valor del umbral > 2
Disco (para cada disco)
%Idle time:
este contador proporciona una medición precisa del tiempo que el disco estuvo inactivo, lo que significa que se completaron todas las solicitudes del sistema operativo al disco y que no hay solicitudes pendientes.
El cálculo se realiza cuando el sistema marca la fecha y hora de un evento cuando el disco queda inactivo y, a continuación, marca la fecha y hora de otro evento cuando el disco recibe una nueva solicitud.
Al final del intervalo de captura, calcula el porcentaje de tiempo inactivo. Este contador varía de 100 (lo que significa que siempre está inactivo) y 0 (lo que significa que siempre está ocupado).
Este contador determina con precisión la saturación del subsistema del disco.
Avg. Disk Queue Length:
Avg. Disk Queue Length es igual a (transferencias de disco por segundo) *(transferencias por segundo en discos).
Esto se basa en la Ley de Little de la
teoría matemática de las colas.
Tenga en cuenta que este es un valor derivado y no una medición directa. Cualquier valor menor que el doble de la cantidad de ejes es un buen valor.
Avg Disk Sec/Transfer:
muestra el tiempo promedio que tardaron en completarse las transferencias de disco, en segundos.
Aunque la escala es en segundos, el contador tiene una precisión de milisegundos, lo que significa que un valor de 0,004 indica que el tiempo promedio para que se completen las transferencias de disco fue de 4 milisegundos.
Este es el contador en Perfmon que se utiliza para medir la latencia de I/O. Estos son los valores de ejemplo. Estos pueden variar según la calidad de los discos que se utilizan:
Reads Excellent < 08 Msec (.008 seconds) Good < 12 Msec (.012 seconds) Fair < 20 Msec (.020 seconds) Poor > 20 Msec (.020 seconds) Writes Excellent < 01 Msec (.001 seconds) Good < 02 Msec (.002 seconds) Fair < 04 Msec (.004 seconds) Poor > 04 Msec (.004 seconds)
Split I/Os:
mide la tasa de división de I/O debido a la fragmentación de archivos. Esto sucede si la solicitud de I/O toca datos en segmentos de archivos no contiguos. Debe ser cercano a cero.
Esto puede ser diferente debido a que el tamaño de la sección RAID o el tamaño de bloque NTFS son demasiado pequeños.
% Free Space:
Muestra el porcentaje del espacio útil total en el disco lógico seleccionado que estaba libre. Siempre debe haber >15 % de espacio libre, siendo el porcentaje recomendado >=25 %.
Proceso
- Handle Count: Se correlaciona con fugas del pool.
- Virtual bytes: Memoria virtual reservada para su uso por parte de una aplicación.
- Working set bytes: Bytes privados que residen en la memoria física y que son propiedad de una aplicación.
¿Cuál es la diferencia entre los objetos de rendimiento Physical Disk y Logical Disk en Perfmon?
Perfmon tiene dos objetos directamente relacionados con el rendimiento del disco, Physical Disk y Logical Disk.
Sus contadores se calculan de la misma manera, pero su alcance es diferente.
El objeto de rendimiento Physical Disk monitorea las unidades de disco en la computadora. Identifica las instancias que representan al hardware físico. Los contadores son la suma del acceso a todas las particiones en la instancia física.
El objeto de rendimiento Logical Disk monitorea las particiones lógicas. Un monitor de rendimiento identifica los discos lógicos por su letra de unidad o punto de montaje.
Si un disco duro contiene varias particiones, este contador informa los valores de la partición seleccionada y no de todo el disco.
Cuando se usan discos dinámicos, los volúmenes lógicos pueden abarcar más de un disco duro; en esta situación, los valores del contador incluyen el acceso al disco lógico en todos los discos duros que abarca.
¿Qué contadores del Monitor de rendimiento de Windows muestran la latencia del disco duro?
- Objeto de rendimiento Physical Disk -> Contador Avg. Disk sec/Read: muestra la latencia de lectura promedio.
- Objeto de rendimiento Physical Disk -> Contador Avg. Disk sec/Write: muestra la latencia de escritura promedio.
- Objeto de rendimiento Physical Disk -> Contador Avg. Disk sec/Transfer: muestra los promedios combinados de lectura y escritura.
- La instancia _Total es un promedio de las latencias para todos los discos duros en la computadora.
Cada otra instancia representa un disco físico individual.
Contadores que debe observar mientras se monitorea en diferentes situaciones:
|
Componente |
Aspecto de rendimiento que se monitorea |
Contadores a monitorear |
|
Disco |
Uso |
Physical Disk\ Sec/Read Physical Disk\ Disk Reads/sec Physical Disk\ Avg Queue Length Read Physical Disk\ Avg Queue Length Write Logical Disk\ % Free Space Interprete el contador %Disk Time cuidadosamente. |
|
Disco |
Cuellos de botella |
Physical Disk\ ALL COUNTERS Logical Disk\ % Free Space System\File Control Operations/sec System\File Data Operations/sec Nota: La ubicación de este contador de claves se encuentra en el sistema. No está en un volumen específico, pero es útil si solo tiene un volumen activo. |
|
Memoria |
Uso |
Memory\ Available Bytes Memory\ % Committed Bytes in Use. Memory\ Pool Non-Paged Bytes Memory\ Pool Paged Bytes. Memory\ Pages Input o Reads/sec Memory\ Free System Pages |
|
Memoria |
Cuellos de botella o fugas |
Memory\ Available Bytes Memory\ Cache Bytes Memory\ Pages/sec Memory\ Page Output o Write /sec. Memory\ Free System Pages |
|
Procesador |
Uso |
Processor\ % Processor Time (todas las instancias) Processor\ % Privileged Time Processor\ % User Time |
|
Procesador |
Cuellos de botella |
Processor\ % Processor Time (todas las instancias) Processor\ % DPC Time Processor\ % Interrupt Time Processor\ % Privileged Time Processor\ % User Time Processor\ DPC s Queued /sec. System\System Calls/sec System\ Processor Queue Length (todas las instancias) |
Additional Information