Avamar: Verwenden von Microsoft Windows Perfmon für das Performancemonitoring von Avamar Clients
Summary: In diesem Artikel wird erläutert, wie Sie Perfmon verwenden, um die Performancemerkmale von Avamar Clients in einer Microsoft Windows-Umgebung zu überwachen.
Symptoms
Dieser Artikel gilt für alle Avamar Client-Versionen, auf denen Windows ausgeführt wird.
Perfmon (Performance Monitor) kann ein leistungsstarkes Tool für das Troubleshooting sein.
Es kann Windows-Performancekennzahlen in festgelegten Intervallen über einen Zeitraum erfassen und Protokolle erzeugen, die grafisch analysiert werden können, um Probleme bei der Systemperformance zu identifizieren.
In diesem Artikel wird erläutert, welche Kennzahlen erfasst werden sollten und wie Sie dieses Tool korrekt konfigurieren, um sie zu erfassen.
Weitere Informationen zur Untersuchung der Avamar Client-Performance finden Sie unter:
Cause
Resolution
So greifen Sie auf Perfmon zu:
Drücken Sie Windows-W, um das Fenster AUSFÜHREN zu öffnen.
Geben Sie Perfmon ein.
Was und wann gemessen werden sollte
Engpässe treten auf, wenn eine Ressource ihre Kapazität erreicht, und können zu einer langsamen Performance führen.
Engpässe entstehen aufgrund unzureichender oder falsch konfigurierter Ressourcen, fehlerhafter Komponenten und falscher Ressourcenanforderungen durch ein Programm.
Es gibt fünf Hauptressourcenbereiche, die Engpässe verursachen und die Serverperformance beeinträchtigen können:
- Physische Festplatte
- Arbeitsspeicher
- Prozess
- CPU
- Netzwerk
Wenn eine dieser Ressourcen überlastet ist, kann der Server oder die Anwendung merklich langsamer werden oder abstürzen.
Nachfolgend werden diese Ressourcenbereiche näher vorgestellt und Empfehlungen gegeben, welche Indikatoren und Schwellenwerte dabei helfen können, die Performance eines Servers zu messen.
Das Abtastintervall hat erhebliche Auswirkungen auf die Größe der Protokolldatei und die Serverlast.
Legen Sie das Abtastintervall basierend auf der durchschnittlich verstrichenen Zeit bis zum Auftreten des Problems fest, um eine Baseline zu erstellen, bevor das Problem erneut auftritt. Dies hilft dabei, Trends zu erkennen, die zu einem Problem führen.
Fünfzehn Minuten sind ein gutes Zeitfenster für das Festlegen einer Baseline während des normalen Betriebs.
- Wenn das Problem im Durchschnitt nach etwa vier Stunden auftritt, legen Sie das Abtastintervall auf 15 Sekunden fest.
- Wenn das Problem nach mindestens acht Stunden auftritt, legen Sie das Abtastintervall auf mindestens fünf Minuten fest.
Diese Richtlinien tragen dazu bei, dass die Protokolldatei nicht zu groß wird und damit die Analyse der Daten erschwert.
Performanceobjekte und -indikatoren
- Objekte: Komponenten, die die Performancedaten managen
- Indikatoren: Performancestatistiken für ein bestimmtes Objekt, die die spezifischen Performancemerkmale des Objekts beschreiben. Beispiel: „\PhysicalDisk\%Idle Time“ liefert Performancedaten zur Leerlaufzeit einer Spindel.
- Instanzen: mehrere Replikate, die eine eindeutige Ressource darstellen. Unter „\PhysicalDisk\%Idle Time“ werden möglicherweise mehrere im System vorhandene Spindeln und die jeweiligen Werte für die Leerlaufzeit angezeigt.
Abtastintervall
Beachten Sie den Zweck und die Dauer der Überwachung.
Ein Protokollierungsintervall von 15 Minuten ist als routinemäßiges Überwachungsintervall ausreichend.
Das Abtastintervall sollte auf ein Intervall festgelegt werden, in dem das Problem erfasst werden kann.
Bei Problemen, die sich allmählich über einen bestimmten Zeitraum manifestieren, können längere Abtastintervalle verwendet werden.
Verwenden Sie für vorübergehende Probleme ein kurzes Intervall von wenigen Sekunden. Dieses Abtastintervall ist bei Problemen des Festplattensubsystems hilfreich.
Berücksichtigen Sie bei der Festlegung des Abtastintervalls die Dauer der Überwachung.
Wenn die Überwachung >8 Stunden läuft, kann ein Abtastintervall von <300 Sekunden zu einer großen Datei führen. Auch der Overhead beim Ausführen des Erfassungsvorgangs selbst kann sich auf die Ergebnisse auswirken.
Aktivieren der Perfmon-Protokollierung
Öffnen Sie die Eingabeaufforderung als Admin-NutzerIn.
Kopieren Sie die folgenden Befehle, um die Protokollerfassung zu starten oder zu beenden.
Mit dem folgenden Befehl wird ein Performancemonitor-Dataset erstellt.
Logman.exe create counter Avamar -o "c:\perflogs\Emc-avamar.blg" -f bincirc -v mmddhhmm -max 250 -c "\LogicalDisk(*)\*" "\Memory\*" "\Network Interface(*)\*" "\Paging File(*)\*" "\PhysicalDisk(*)\*" "\Processor(*)\*" "\Process(*)\*" "\Redirector\*" "\Server\*" "\System\*" -si 00:00:05 Start the logs with: Logman.exe start Avamar Stop the logs with: Logman.exe stop Avamar Above commands can be modified to collect SQL server Performance Monitor data during backups as: First create a folder for log collection as C:\SQL_Performance_Logs\ For default SQL instance run: Logman create counter Avamar_SQL_perf_log -f bin -c "\Network Interface(*)\*" "\Redirector\*" "\Paging File(*)\*" "\Memory\*" "\PhysicalDisk(*)\*" "\LogicalDisk(*)\*" "\Server\*" "\System\*" "\Process(*)\*" "\Processor(*)\*" "\SQLServer:Databases(*)\*" "\SQLServer:Buffer Manager\*" "\SQLServer:Memory Manager\*" "\SQLServer:SQL Statistics\*" -si 00:00:05 -max 800 -cnf 0 -o C:\SQL_Performance_Logs\AvamarSQL_perf_log.blg For named instance, replace server with instance name Logman create counter Avamar_SQL_perf_log -f bin -c "\Network Interface(*)\*" "\Redirector\*" "\Paging File(*)\*" "\Memory\*" "\PhysicalDisk(*)\*" "\LogicalDisk(*)\*" "\Server\*" "\System\*" "\Process(*)\*" "\Processor(*)\*" "\SQLServer:Databases(*)\*" "\SQLServer:Buffer Manager\*" "\SQLServer:Memory Manager\*" "\MSSQL$InstanceName:SQL Statistics\*" -si 00:00:05 -max 800 -cnf 0 -o C:\SQL_Performance_Logs\AvamarSQL_perf_log.blg start collecting logs: Logman start Avamar_SQL_perf_log stop log collection: Logman stop Avamar_SQL_perf_log
Indikatoren und ihre Schwellenwerte
Arbeitsspeicher
%Committed Bytes in use:
Der zugesicherte Arbeitsspeicher ist der verwendete physische Arbeitsspeicher, für den in der Auslagerungsdatei Speicherplatz reserviert wurde, falls auf die Festplatte geschrieben werden muss.
Die Größe der Auslagerungsdatei bestimmt den Grenzwert für den zugesicherten Arbeitsspeicher. Wird die Auslagerungsdatei vergrößert, erhöht sich auch der Grenzwert und das Verhältnis wird reduziert.
Dieser Indikator zeigt nur den aktuellen Prozentwert an. Es handelt sich nicht um einen Durchschnittswert. Wenn dieser Wert konstant über 80 % liegt, ist die Auslagerungsdatei möglicherweise zu klein.
Available Bytes:
Verfügbare Byte ist die Menge an physischem Arbeitsspeicher in Byte, die sofort für die Zuweisung an einen Prozess oder für die Verwendung durch das System verfügbar ist.
Bei x64-Systemen kommt es hier selten zu Einschränkungen. Wenn dieser Wert regelmäßig unter 5 % des installierten RAM fällt, sollten Sie dies untersuchen. Wenn der Wert regelmäßig unter 1 % des installierten RAM fällt, liegt ein eindeutiges Problem vor.
Committed Bytes:
Der zugesicherte Arbeitsspeicher ist der physische Arbeitsspeicher, für den auf einer oder mehreren Festplattenauslagerungsdateien Speicherplatz reserviert ist.
Auf jeder Festplatte können eine oder mehrere Auslagerungsdateien vorhanden sein.
Dieser Indikator sollte sich idealerweise nie ändern. Änderungen deuten auf eine Erweiterung der Auslagerungsdatei hin und sollten sofort untersucht werden.
Free System Page Table entries:
Dies war bei älteren x86-Versionen ein Problem. Auf einem Windows Server 2003 SP2-Server, der ohne den /3Gb-Switch gestartet wird, beträgt der Wert ca. 200.000 PTEs.
Beim Starten mit dem /3Gb-Switch sinkt dieser Wert auf ~25.000 PTEs.
Pool Nonpaged Bytes:
Nicht ausgelagerte Pool-Byte ist die Größe (Byte) des nicht ausgelagerten Pools. Hierbei handelt es sich um einen Bereich des Systemarbeitsspeichers (physischer Speicher, der vom Betriebssystem verwendet wird) für Objekte, die nicht auf Festplatte geschrieben werden können, jedoch im physischen Arbeitsspeicher verbleiben müssen, solange sie zugewiesen sind.
Wenn ein nicht ausgelagerter Pool konstant mit mehr als 80 % ausgeführt wird, kann es zu einer Erschöpfung des nicht ausgelagerten Pools kommen (Ereignis-ID 2019).
Pool Paged Bytes:
Ausgelagerte Pool-Byte ist die Größe (Byte) des ausgelagerten Pools, eines Bereichs des Systemarbeitsspeichers (physischer Speicher, der vom Betriebssystem verwendet wird) für Objekte, die auf Festplatte geschrieben werden können, wenn sie nicht verwendet werden.
Der ausgelagerte Pool ist eine größere Ressource als der nicht ausgelagerte Pool. Wenn dieser Wert konstant über 70 % der maximal konfigurierten Poolgröße liegt, besteht möglicherweise das Risiko einer Erschöpfung des ausgelagerten Pools (Ereignis-ID 2020).
Prozessor(Überprüfen Sie JEDEN Prozessor und die Gesamtwerte)
%Interrupt time:
Die Zeitspanne, die der Prozessor während der Abtastintervalle mit dem Empfang und der Verarbeitung von Hardware-Interrupts verbringt.
Dieser Wert ist ein indirekter Indikator für die Aktivität von Geräten, die Interrupts erzeugen. Zum Beispiel die Systemuhr, die Maus, Festplattentreiber, Datenkommunikationsleitungen, Netzwerkschnittstellenkarten und andere Peripheriegeräte.
Diese Geräte unterbrechen den Prozessor, wenn sie eine Aufgabe abgeschlossen haben oder Aufmerksamkeit erfordern.
%DPC time:
gibt die Zeitspanne für die Durchführung eines I/O-Vorgangs an. Ähnlich wie oben sollte jeder Wert >25 % untersucht werden.
%Privileged Time:
Zeitspanne, in der der Betriebssystemkernel arbeitet. In der Regel liegt der Schwellenwert für Anwendungs- oder Webserver unter 30 %.
%Processor Time:
Dauerhafte Werte von >90 % auf einem Computer mit einem Prozessor bzw. >80 % auf einem Computer mit mehreren Prozessoren sollten untersucht werden.
Netzwerkschnittstelle
Packets received discarded:
Dies wird verwendet, um auf potenzielle Hardwareprobleme zu prüfen. Der Schwellenwert beträgt >1. Eine mögliche Abhilfemaßnahme ist die Anpassung der Netzwerkpuffer.
Packets received errors:
Dies wird verwendet, um auf potenzielle Hardwareprobleme zu prüfen. Der Schwellenwert liegt bei >2.
Festplatte (für jede Festplatte)
%Idle time:
Dieser Indikator liefert ein präzises Messergebnis für die Zeitspanne, in der sich die Festplatte im Leerlauf befand. Das bedeutet, dass alle Anforderungen des Betriebssystems an die Festplatte abgeschlossen wurden und keine ausstehenden Anforderungen vorhanden sind.
Die Berechnung erfolgt, indem das System einen Ereigniszeitstempel erstellt, wenn die Festplatte in den Leerlauf geht, und dann einen weiteren Ereigniszeitstempel, wenn die Festplatte eine neue Anforderung erhält.
Am Ende des Erfassungsintervalls wird der Prozentsatz der Zeit berechnet, die im Leerlauf verbracht wurde. Dieser Indikator reicht von 100 (immer inaktiv) bis 0 (immer ausgelastet).
Dieser Indikator zeigt die Auslastung des Festplattensubsystems präzise an.
Avg. Disk Queue Length:
Die durchschnittliche Länge der Festplattenwarteschlange ergibt sich aus (Festplattenübertragungen/Sek.) * (Festplattensekunde/Übertragung).
Dies basiert auf Littles Gesetz aus der mathematischen
Theorie der Warteschlangen.
Beachten Sie, dass es sich hierbei um einen abgeleiteten Wert und nicht um einen direkten Messwert handelt. Jeder Wert, der unter der doppelten Anzahl der Spindeln liegt, ist ein guter Wert.
Avg Disk Sec/Transfer:
zeigt die durchschnittliche Zeitspanne für Festplattenübertragungen in Sekunden an.
Obwohl die Skala Sekunden verwendet, hat der Indikator eine Genauigkeit im Millisekundenbereich, d. h. ein Wert von 0,004 gibt an, dass die durchschnittliche Zeit für Festplattenübertragungen 4 Millisekunden betragen hat.
Dies ist der Indikator in Perfmon, der zum Messen der I/O-Latenz verwendet wird. Nachfolgend finden Sie Beispielwerte. Diese können je nach Qualität der verwendeten Festplatten variieren:
Reads Excellent < 08 Msec (.008 seconds) Good < 12 Msec (.012 seconds) Fair < 20 Msec (.020 seconds) Poor > 20 Msec (.020 seconds) Writes Excellent < 01 Msec (.001 seconds) Good < 02 Msec (.002 seconds) Fair < 04 Msec (.004 seconds) Poor > 04 Msec (.004 seconds)
Split I/Os:
misst die Rate der I/O-Aufteilung aufgrund von Dateifragmentierung. Dies tritt auf, wenn die I/O-Anforderung Daten in nicht zusammenhängenden Dateisegmenten berührt. Der Wert sollte nahe null liegen.
Dies kann aufgrund der RAID-Stripe-Größe oder der zu kleinen NTFS-Blockgröße abweichen.
% Free Space:
zeigt den Prozentsatz des gesamten nutzbaren Speicherplatzes auf dem ausgewählten logischen Laufwerk an, der frei war. Es sollten immer >15 % freier Speicherplatz vorhanden sein, empfohlen werden >=25 %.
Prozess
- Handle Count: korreliert mit Pool-Verlusten.
- Virtual Bytes: virtueller Arbeitsspeicher, der für die Verwendung durch eine Anwendung reserviert ist.
- Working Set Bytes: private Byte im physischen Arbeitsspeicher, der einer Anwendung gehört.
Was ist der Unterschied zwischen den Performanceobjekten „Physical Disk“ und „Logical Disk“ in Perfmon?
Perfmon verwendet zwei Objekte, die direkt mit der Festplattenperformance zusammenhängen: physische Festplatte und logische Festplatte.
Die Indikatoren werden jeweils auf die gleiche Weise berechnet, der Umfang ist jedoch unterschiedlich.
Das Performanceobjekt „Physical Disk“ überwacht die Festplattenlaufwerke auf dem Computer. Es identifiziert die Instanzen, die die physische Hardware repräsentieren. Die Indikatoren sind die Summe des Zugriffs auf alle Partitionen auf der physischen Instanz.
Das Performanceobjekt „Logical Disk“ überwacht die logischen Partitionen. Ein Performancemonitor identifiziert die logischen Festplatten anhand ihres Laufwerksbuchstabens oder Einhängepunkts.
Enthält eine Festplatte mehrere Partitionen meldet dieser Indikator die Werte für die ausgewählte Partition und nicht für die gesamte Festplatte.
Bei Verwendung dynamischer Festplatten können sich die logischen Volumes über mehr als eine Festplatte erstrecken. In diesem Szenario enthalten die Indikatoren den Zugriff auf die logische Festplatte in allen Festplatten, über die sie sich erstreckt.
Welche Indikatoren im Windows Performance Monitor zeigen die Festplattenlatenz an?
- Performanceobjekt „Physical disk“ -> Indikator „Avg. Disk sec/Read“: zeigt die durchschnittliche Leselatenz an.
- Performanceobjekt „Physical disk“ -> Indikator „Avg. Disk sec/Write“: zeigt die durchschnittliche Schreiblatenz an.
- Performanceobjekt „Physical disk“ -> Indikator „Avg. Disk sec/Transfer“: zeigt die kombinierten Durchschnittswerte für Lese- und Schreibvorgänge an.
- Die Instanz „_Total“ ist ein Durchschnitt der Latenzen für alle Festplatten im Computer.
Alle anderen Instanzen stellen ein einzelnes physisches Laufwerk dar.
Indikatoren, die in verschiedenen Situationen bei der Überwachung im Auge behalten werden sollten:
|
Komponente |
Zu überwachender Performanceaspekt |
Zu überwachende Indikatoren |
|
Festplatte |
Verwendung |
Physical Disk\ Sec/Read Physical Disk\ Disk Reads/sec Physical Disk\ Avg Queue Length Read Physical Disk\ Avg Queue Length Write Logical Disk\ % Free Space Interpretieren Sie den Indikator für „% Disk Time“ sorgfältig. |
|
Festplatte |
Engpässe |
Physical Disk\ ALLE INDIKATOREN Logical Disk\ % Free Space System\File Control Operations/sec System\File Data Operations/sec Hinweis: Der Speicherort dieses Hauptindikators befindet sich unter „System“. Er ist nicht Volume-spezifisch, jedoch nützlich, wenn nur ein aktives Volume vorhanden ist. |
|
Arbeitsspeicher |
Verwendung |
Memory\ Available Bytes Memory\ % Committed Bytes in Use. Memory\ Pool Non-Paged Bytes Memory\ Pool Paged Bytes. Memory\ Pages Input oder Reads/sec Memory\ Free System Pages |
|
Arbeitsspeicher |
Engpässe oder Verluste |
Memory\ Available Bytes Memory\ Cache Bytes Memory\ Pages/sec Memory\ Page Output oder Write /sec. Memory\ Free System Pages |
|
Prozessor |
Verwendung |
Processor\ % Processor Time (alle Instanzen) Processor\ % Privileged Time Processor\ % User Time |
|
Prozessor |
Engpässe |
Processor\ % Processor Time (alle Instanzen) Processor\ % DPC Time Processor\ % Interrupt Time Processor\ % Privileged Time Processor\ % User Time Processor\ DPC s Queued /sec. System\System Calls/sec System\ Processor Queue Length (alle Instanzen) |
Additional Information