Avamar : utilisation de l’outil Perfmon de Microsoft Windows pour la surveillance des performances des clients Avamar
Summary: Cet article explique comment utiliser Perfmon pour surveiller les caractéristiques de performances du client Avamar dans un environnement Microsoft Windows.
Symptoms
Cet article s’applique à toutes les versions du client Avamar exécutant Windows.
PerfMon (moniteur de performances) peut être un outil de dépannage puissant.
Il peut collecter des indicateurs de performance Windows au fil du temps, à des intervalles spécifiés, et générer des journaux pouvant être analysés graphiquement pour identifier les problèmes de performance du système.
Nous abordons ici les indicateurs à collecter et la manière de configurer correctement cet outil pour les collecter.
Pour plus d’informations sur l’analyse des performances du client Avamar, consultez :
Cause
Resolution
Accès à Perfmon :
Appuyez sur les touches Windows+W pour ouvrir la fenêtre RUN.
Saisissez Perfmon.
Que mesurer et quand
Des goulots d’étranglement se produisent lorsqu’une ressource atteint sa capacité maximale et peuvent ralentir les performances.
Les goulots d’étranglement sont dus à des ressources insuffisantes ou mal configurées, à des composants défectueux ou encore à des requêtes inappropriées effectuées par un programme.
Cinq grandes catégories de ressources peuvent provoquer ces goulets d’étranglement et impacter les performances d’un serveur :
- Disque physique
- Mémoire
- Exécuter le fichier
- Processeur
- Réseau
Si l’une de ces ressources est surutilisée, le serveur ou l’application peut ralentir considérablement ou planter.
Nous abordons ces points et indiquons les compteurs et seuils pouvant vous aider à mesurer les performances d’un serveur.
L’intervalle d’échantillonnage a un impact significatif sur la taille du fichier journal et la charge du serveur.
Définissez l’intervalle d’échantillonnage nécessaire à l’apparition du problème afin d’établir une référence avant qu’il ne se reproduise. Cela permet de repérer toute tendance susceptible d’entraîner un problème.
Un intervalle de quinze minutes constitue une bonne base pour établir une référence lors des opérations normales.
- Si le problème survient en moyenne après environ quatre heures, définissez l’intervalle d’échantillonnage sur 15 secondes.
- Si le problème survient après huit heures ou plus, définissez l’intervalle d’échantillonnage sur au minimum cinq minutes.
Ces instructions permettent d’éviter la création d’un fichier journal volumineux, ce qui rendrait l’analyse des données plus difficile.
Objets de performance et compteurs
- Objets : composants gérant les données de performance.
- Compteurs : statistiques de performance propres à un objet particulier et décrivant ses caractéristiques de fonctionnement. Par exemple, \PhysicalDisk%Idle Time fournit des données sur le temps d’inactivité observé par un axe de disque.
- Instances : réplicas multiples d’une ressource unique. L’observation de \PhysicalDisk%Idle Time peut afficher différents axes de disque présents sur le système et leurs valeurs %Idle Time respectives.
Intervalle d’échantillonnage
Gardez à l’esprit l’objectif et la durée de la surveillance.
Un intervalle d’enregistrement de 15 minutes convient pour les intervalles de surveillance de routine.
L’intervalle d’échantillonnage doit être réduit à un intervalle de temps qui permet de détecter le problème.
Pour les problèmes qui s’accumulent progressivement, sur une certaine période, des intervalles d’échantillonnage plus longs peuvent être utilisés.
Pour les problèmes transitoires, utilisez un intervalle court de quelques secondes. Cet intervalle d’échantillonnage est utile pour les problèmes liés au sous-système de disque.
Tenez compte de la durée de la surveillance lors de la configuration de l’intervalle d’échantillonnage.
Si la surveillance dure plus de >8 heures, un intervalle d’échantillonnage inférieur à <300 secondes peut générer un fichier volumineux. La surcharge liée à l’exécution du processus de collecte peut affecter les résultats.
Activation de la journalisation de débogage.
Ouvrez l’invite de commande en tant qu’utilisateur admin.
Copiez les commandes suivantes pour démarrer ou arrêter la capture des journaux.
La commande ci-dessous crée un ensemble de données du moniteur de performances.
Logman.exe create counter Avamar -o "c:\perflogs\Emc-avamar.blg" -f bincirc -v mmddhhmm -max 250 -c "\LogicalDisk(*)\*" "\Memory\*" "\Network Interface(*)\*" "\Paging File(*)\*" "\PhysicalDisk(*)\*" "\Processor(*)\*" "\Process(*)\*" "\Redirector\*" "\Server\*" "\System\*" -si 00:00:05 Start the logs with: Logman.exe start Avamar Stop the logs with: Logman.exe stop Avamar Above commands can be modified to collect SQL server Performance Monitor data during backups as: First create a folder for log collection as C:\SQL_Performance_Logs\ For default SQL instance run: Logman create counter Avamar_SQL_perf_log -f bin -c "\Network Interface(*)\*" "\Redirector\*" "\Paging File(*)\*" "\Memory\*" "\PhysicalDisk(*)\*" "\LogicalDisk(*)\*" "\Server\*" "\System\*" "\Process(*)\*" "\Processor(*)\*" "\SQLServer:Databases(*)\*" "\SQLServer:Buffer Manager\*" "\SQLServer:Memory Manager\*" "\SQLServer:SQL Statistics\*" -si 00:00:05 -max 800 -cnf 0 -o C:\SQL_Performance_Logs\AvamarSQL_perf_log.blg For named instance, replace server with instance name Logman create counter Avamar_SQL_perf_log -f bin -c "\Network Interface(*)\*" "\Redirector\*" "\Paging File(*)\*" "\Memory\*" "\PhysicalDisk(*)\*" "\LogicalDisk(*)\*" "\Server\*" "\System\*" "\Process(*)\*" "\Processor(*)\*" "\SQLServer:Databases(*)\*" "\SQLServer:Buffer Manager\*" "\SQLServer:Memory Manager\*" "\MSSQL$InstanceName:SQL Statistics\*" -si 00:00:05 -max 800 -cnf 0 -o C:\SQL_Performance_Logs\AvamarSQL_perf_log.blg start collecting logs: Logman start Avamar_SQL_perf_log stop log collection: Logman stop Avamar_SQL_perf_log
Compteurs et leurs valeurs de seuil
Mémoire
%Committed bytes in use :
la mémoire validée est la mémoire physique utilisée pour laquelle de l’espace a été réservé dans le fichier d’échange au cas où elle devrait être écrite sur le disque.
La taille du fichier d’échange détermine la limite de validation. Si le fichier d’échange est agrandi, la limite de validation augmente et le rapport est réduit.
Ce compteur affiche uniquement la valeur actuelle en pourcentage. Il ne s’agit pas d’une moyenne. Si cette valeur reste constamment au-dessus de 80 %, le fichier d’échange peut être trop petit.
Available bytes :
Available Bytes correspond à la quantité de mémoire physique, en octets, immédiatement disponible pour être allouée à un processus ou pour l’usage du système.
Cela constitue rarement une contrainte sur les systèmes X64. Si cette valeur tombe régulièrement en dessous de 5 % de la RAM installée, vous devriez analyser la situation. Si la valeur tombe régulièrement en dessous de 1 % de la RAM installée, il y a un problème certain.
Committed Bytes :
la mémoire validée est la mémoire physique qui dispose d’un espace réservé sur un ou plusieurs fichiers d’échange de disques.
Il peut y avoir un ou plusieurs fichiers d’échange sur chaque disque dur.
Idéalement, ce compteur ne doit jamais changer. Des modifications sont le signe d’une extension du fichier d’échange et doivent être examinées immédiatement.
Free System Page Table Entries (PTE) :
ceci constituait un problème sur les anciennes versions x86. Sur un serveur Windows Server 2003 SP2 démarré sans le commutateur /3Gb, la valeur est d’environ 200 000 PTE.
Avec le commutateur /3Gb, elle chute à environ 25 000 PTE.
Pool Nonpaged Bytes :
Pool Nonpaged Bytes correspond à la taille (en octets) du pool non paginé. Il s’agit d’une zone de la mémoire système (mémoire physique utilisée par le système d’exploitation) destinée aux objets ne pouvant pas être écrits sur le disque, mais devant rester dans la mémoire physique tant qu’ils sont alloués.
Si un pool non paginé fonctionne constamment à plus de 80 %, vous risquez de rencontrer un problème d’épuisement du pool non paginé (ID d’événement 2019).
Pool Paged Bytes :
Pool Paged Bytes correspond à la taille, en octets, du pool paginé, une zone de la mémoire système (mémoire physique utilisée par le système d’exploitation) destinée aux objets pouvant être écrits sur le disque lorsqu’ils ne sont pas utilisés.
Le pool paginé est une ressource plus grande que le pool non paginé. Si cette valeur reste constamment supérieure à 70 % de la taille maximale configurée du pool, vous risquez de rencontrer un problème d’épuisement du pool paginé (ID d’événement 2020).
Processeur (vérifier pour CHAQUE processeur et globalement)
%Interrupt time :
temps passé par le processeur à recevoir et à traiter les interruptions matérielles pendant les intervalles d’échantillonnage.
Cette valeur est un indicateur indirect de l’activité des périphériques qui génèrent des interruptions. Par exemple, l’horloge système, la souris, les pilotes de disque, les lignes de communication de données, les cartes d’interface réseau et autres périphériques.
Ces périphériques interrompent le processeur lorsqu’ils ont terminé une tâche ou nécessitent une attention particulière.
%DPC time :
indique le temps nécessaire pour exécuter une opération d’E/S. À l’instar de ce qui précède, toute valeur supérieure à >25 % doit être étudiée.
%Privileged Time :
temps durant lequel le noyau du système d’exploitation exécute des tâches. En général, le seuil est inférieur à 30 % pour les serveurs d’applications ou Web.
%Processor Time :
des valeurs régulièrement supérieures à > 90 % sur une machine à processeur unique, ou supérieures à > 80 % sur une machine multiprocesseur, doivent être examinées.
Interface réseau
Packets received discarded :
utilisé pour vérifier d’éventuels problèmes matériels. Valeur de seuil >supérieure à 1. Une solution possible consiste à ajuster les tampons réseau.
Packets received errors :
utilisé pour vérifier d’éventuels problèmes matériels. Valeur de seuil >supérieure à 2.
Disque (pour chaque disque)
%Idle time :
ce compteur fournit une mesure précise du temps pendant lequel le disque était inactif, c’est-à-dire lorsque toutes les requêtes du système d’exploitation vers le disque ont été exécutées et qu’aucune requête n’était en attente.
Le calcul se fait en horodatant un événement lorsque le disque devient inactif, puis en horodatant un nouvel événement lorsqu’il reçoit une nouvelle requête.
À la fin de l’intervalle de capture, le système calcule le pourcentage du temps passé en inactivité. La valeur de ce compteur varie de 100 (toujours inactif) à 0 (toujours occupé).
Ce compteur détermine avec précision la saturation du sous-système de disque.
Avg. Disk Queue Length :
Avg. Disk Queue Length est égal à (Disk Transfers/sec) x (Disk sec/Transfer).
Ce calcul est basé sur la loi de Little de la
théorie mathématique des files d’attente.
Remarque : Il s’agit d’une valeur dérivée et non d’une mesure directe. Toute valeur inférieure au double du nombre d’axes de disque (spindles) est considérée comme correcte.
Avg Disk Sec/Transfer :
affiche le temps moyen nécessaire à l’exécution des transferts disque, en secondes.
Bien que l’échelle soit en secondes, le compteur dispose d’une précision en millisecondes. Par exemple, une valeur de 0,004 indique que le temps moyen d’exécution des transferts disque était de 4 millisecondes.
Dans Perfmon, il s’agit du compteur utilisé pour mesurer la latence des E/S. Voici quelques exemples de valeurs. Elles peuvent varier en fonction de la qualité des disques utilisés :
Reads Excellent < 08 Msec (.008 seconds) Good < 12 Msec (.012 seconds) Fair < 20 Msec (.020 seconds) Poor > 20 Msec (.020 seconds) Writes Excellent < 01 Msec (.001 seconds) Good < 02 Msec (.002 seconds) Fair < 04 Msec (.004 seconds) Poor > 04 Msec (.004 seconds)
Split I/Os :
mesure le taux de fractionnement des E/S dû à la fragmentation des fichiers. Cela se produit lorsqu’une requête d’E/S accède à des données situées sur des segments de fichier non contigus. La valeur devrait être proche de zéro.
Ce taux peut varier en fonction de la taille de la bande RAID ou si la taille des blocs NTFS est trop petite.
% Free Space :
affichez le pourcentage d’espace utilisable total disponible sur le disque logique sélectionné. Il devrait toujours y avoir >15 % d’espace libre, la valeur recommandée étant de >25 %.
Exécuter le fichier
- Handle Count : en corrélation avec les fuites de pool.
- Virtual bytes : mémoire virtuelle réservée à l’usage d’une application.
- Working set bytes : octets privées résidant dans la mémoire physique appartenant à une application.
Quelle est la différence entre les objets de performances de disque physique et de disque logique dans Perfmon ?
PerfMon possède deux objets directement liés aux performances du disque : disque physique et disque logique.
Leurs compteurs sont calculés de la même manière, mais leur portée est différente.
L’objet de performances de disque physique surveille les lecteurs de disque de l’ordinateur. Il identifie les instances représentant le matériel physique. Les compteurs correspondent à la somme des accès à toutes les partitions de l’instance physique.
L’objet de performances de disque logique surveille les partitions logiques. Un moniteur de performance identifie les disques logiques par leur lettre de lecteur ou leur point de montage.
Si un disque dur contient plusieurs partitions, ce compteur indique les valeurs de la partition sélectionnée et non de l’ensemble du disque.
Lors de l’utilisation de disques dynamiques, les volumes logiques peuvent couvrir plusieurs disques durs. Dans ce scénario, les valeurs des compteurs incluent les accès au disque logique sur tous les disques physiques concernés.
Quels compteurs dans Windows Performance Monitor indiquent la latence du disque dur ?
- Performance du disque physique -> compteur Avg. Disk sec/Read : affiche la latence moyenne de lecture.
- Performance du disque physique -> compteur Avg. Disk sec/Write : affiche la latence moyenne d’écriture.
- Performance du disque physique -> compteur Avg. Disk sec/Transfer : affiche les moyennes combinées pour les lectures et les écritures.
- L’instance _Total est une moyenne des latences de tous les disques durs de l’ordinateur.
Chaque autre instance représente un disque physique individuel.
Compteurs à surveiller lors du suivi dans différentes situations :
|
Composant |
Élément de performance surveillé |
Compteurs à surveiller |
|
Disque |
Utilisation |
Physical Disk\ Sec/Read Physical Disk\ Disk Reads/sec Physical Disk\ Avg Queue Length Read Physical Disk\ Avg Queue Length Write Logical Disk\ % Free Space Interprétez le compteur % Disk Time avec prudence. |
|
Disque |
Goulots d’étranglement |
Physical Disk\ ALL COUNTERS Logical Disk\ % Free Space System\File Control Operations/sec System\File Data Operations/sec Remarque : l’emplacement de ce compteur clé se trouve sous le système. Il n’est pas spécifique à un volume, mais il est utile si vous n’avez qu’un seul volume actif. |
|
Mémoire |
Utilisation |
Memory\ Available Bytes Memory\ % Committed Bytes in Use. Memory\ Pool Non-Paged Bytes Memory\ Pool Paged Bytes. Memory\ Pages Input ou Reads/sec Memory\ Free System Pages |
|
Mémoire |
Goulots d’étranglement ou fuites |
Memory\ Available Bytes Memory\ Cache Bytes Memory\ Pages/sec Memory\ Page Output ou Write /sec. Memory\ Free System Pages |
|
Processeur |
Utilisation |
Processor\ % Processor Time (toutes les instances) Processor\ % Privileged Time Processor\ % User Time |
|
Processeur |
Goulots d’étranglement |
Processor\ % Processor Time (toutes les instances) Processor\ % DPC Time Processor\ % Interrupt Time Processor\ % Privileged Time Processor\ % User Time Processor\ DPC s Queued /sec. System\System Calls/sec System\ Processor Queue Length (toutes les instances) |
Additional Information