Avamar: Używanie narzędzia Perfmon systemu Microsoft Windows do monitorowania wydajności klientów Avamar
Summary: W tym artykule wyjaśniono, jak używać narzędzia Perfmon do monitorowania charakterystyki wydajności klienta Avamar w środowisku Microsoft Windows.
Symptoms
Ten artykuł dotyczy wszystkich wersji klienta Avamar z systemem Windows.
Perfmon (Monitor wydajności) może być bardzo przydatnym narzędziem do rozwiązywania problemów.
Może zbierać wskaźniki wydajności systemu Windows w określonych odstępach czasu i generować dzienniki, które mogą być analizowane graficznie w celu zidentyfikowania problemów z wydajnością systemu.
W tym artykule omówimy, które wskaźniki należy zbierać i jak poprawnie skonfigurować to narzędzie do ich zbierania.
Aby uzyskać więcej informacji na temat badania wydajności klienta Avamar, zobacz:
Cause
Resolution
Jak uzyskać dostęp do Perfmon:
Naciśnij Windows-W, aby otworzyć okno Uruchom.
Wpisz Perfmon.
Co i kiedy mierzyć
Wąskie gardła występują, gdy zasób osiąga próg pojemności i mogą powodować niską wydajność.
Wąskie gardła są spowodowane niewystarczającymi lub błędnie skonfigurowanymi zasobami, nieprawidłowo działającymi składnikami i nieprawidłowymi żądaniami zasobów przez program.
Istnieje pięć głównych obszarów zasobów, które mogą powodować wąskie gardła i wpływać na wydajność serwera:
- Dysk fizyczny
- Pamięć
- Proces
- Procesor
- Sieć
Jeśli którykolwiek z tych zasobów jest nadmiernie wykorzystywany, serwer lub aplikacja może działać wyraźnie wolniej lub ulec awarii.
Omawiamy te obszary i doradzamy, jakie liczniki i progi mogą pomóc w pomiarze wydajności serwera.
Interwał próbkowania ma znaczący wpływ na rozmiar pliku dziennika i obciążenie serwera.
Ustaw interwał próbkowania na podstawie średniego czasu, po jakim występuje problem, aby ustalić punkt odniesienia dla problemu. Pomaga to dostrzec każdy trend, który prowadzi do problemu.
Piętnaście minut to dobry czas jako punkt odniesienia podczas normalnej pracy.
- Jeśli średni czas do wystąpienia problemu wynosi około czterech godzin, ustaw interwał próbkowania na 15 s.
- Jeśli czas do wystąpienia problemu wynosi osiem godzin lub więcej, ustaw interwał próbkowania na nie mniej niż pięć minut.
Te wytyczne pomagają uniknąć tworzenia dużego pliku dziennika, co utrudnia analizowanie danych.
Obiekty i liczniki wydajności
- Obiekty — komponent zarządzający danymi wydajnościowymi
- Liczniki — statystyki wydajności specyficzne dla określonego obiektu, które opisują cechy wydajności obiektu. Na przykład parametr \PhysicalDisk\%Idle Time udostępnia dane wydajności dotyczące czasu bezczynności dysku.
- Wystąpienia — wiele replik reprezentujących unikatowy zasób. Obserwowanie parametru \PhysicalDisk\%Idle Time może pokazywać różne dyski dostępne w systemie i odpowiadające im wartości % czasu bezczynności.
Interwał próbkowania
Pamiętaj o celu i czasie trwania monitorowania.
15-minutowy interwał rejestrowania jest odpowiedni dla rutynowych interwałów monitorowania.
Interwał próbkowania powinien być zredukowany do przedziału czasu, który rejestruje problem.
W przypadku problemów, które narastają stopniowo przez pewien czas, można zastosować dłuższe odstępy między próbkami.
W przypadku przejściowych problemów użyj krótkiego, kilkusekundowego interwału. Ten interwał próbkowania jest przydatny w przypadku problemów z podsystemem dysku.
Podczas konfigurowania interwału próbkowania należy pamiętać o czasie trwania monitorowania.
Jeśli monitorowanie trwa >8 godzin, interwał próbkowania wynoszący <300 sekund może spowodować utworzenie dużego pliku. Obciążenie związane z uruchomieniem samego procesu zbierania może mieć wpływ na wyniki.
Włączanie rejestrowania Perfmon Logging@.
Otwórz wiersz polecenia jako administrator.
Skopiuj następujące polecenia, aby rozpocząć lub zatrzymać przechwytywanie dziennika.
Poniższe polecenie tworzy zestaw danych monitora wydajności.
Logman.exe create counter Avamar -o "c:\perflogs\Emc-avamar.blg" -f bincirc -v mmddhhmm -max 250 -c "\LogicalDisk(*)\*" "\Memory\*" "\Network Interface(*)\*" "\Paging File(*)\*" "\PhysicalDisk(*)\*" "\Processor(*)\*" "\Process(*)\*" "\Redirector\*" "\Server\*" "\System\*" -si 00:00:05 Start the logs with: Logman.exe start Avamar Stop the logs with: Logman.exe stop Avamar Above commands can be modified to collect SQL server Performance Monitor data during backups as: First create a folder for log collection as C:\SQL_Performance_Logs\ For default SQL instance run: Logman create counter Avamar_SQL_perf_log -f bin -c "\Network Interface(*)\*" "\Redirector\*" "\Paging File(*)\*" "\Memory\*" "\PhysicalDisk(*)\*" "\LogicalDisk(*)\*" "\Server\*" "\System\*" "\Process(*)\*" "\Processor(*)\*" "\SQLServer:Databases(*)\*" "\SQLServer:Buffer Manager\*" "\SQLServer:Memory Manager\*" "\SQLServer:SQL Statistics\*" -si 00:00:05 -max 800 -cnf 0 -o C:\SQL_Performance_Logs\AvamarSQL_perf_log.blg For named instance, replace server with instance name Logman create counter Avamar_SQL_perf_log -f bin -c "\Network Interface(*)\*" "\Redirector\*" "\Paging File(*)\*" "\Memory\*" "\PhysicalDisk(*)\*" "\LogicalDisk(*)\*" "\Server\*" "\System\*" "\Process(*)\*" "\Processor(*)\*" "\SQLServer:Databases(*)\*" "\SQLServer:Buffer Manager\*" "\SQLServer:Memory Manager\*" "\MSSQL$InstanceName:SQL Statistics\*" -si 00:00:05 -max 800 -cnf 0 -o C:\SQL_Performance_Logs\AvamarSQL_perf_log.blg start collecting logs: Logman start Avamar_SQL_perf_log stop log collection: Logman stop Avamar_SQL_perf_log
Liczniki i ich wartości progowe
Pamięć
%Committed bytes in use:
Pamięć zarezerwowana to używana pamięć fizyczna, dla której zarezerwowano miejsce w pliku stronicowania na wypadek konieczności zapisania jej na dysku.
Rozmiar pliku stronicowania określa limit rezerwacji. Jeśli plik stronicowania jest większy, zwiększa się limit rezerwacji, a współczynnik jest zmniejszany.
Ten licznik pokazuje tylko bieżącą wartość procentową. To nie jest średnia. Jeśli ta wartość stale przekracza 80%, plik stronicowania może być zbyt mały.
Available bytes:
Dostępne bajty to ilość pamięci fizycznej w bajtach, która jest natychmiast dostępna do przydzielenia do procesu lub do użytku systemowego.
W przypadku systemów X64 rzadko stanowi to ograniczenie. Jeśli ta wartość stale spada poniżej 5% zainstalowanej pamięci RAM, należy zbadać sprawę. Jeśli wartość stale spada poniżej 1% zainstalowanej pamięci RAM, zdecydowanie występuje problem.
Committed Bytes:
Pamięć zarezerwowana to pamięć fizyczna, dla której miejsce jest zarezerwowane w jednym lub kilku plikach stronicowania dysku.
Na każdym dysku twardym może znajdować się jeden lub więcej plików stronicowania.
Idealnie byłoby, gdyby licznik ten nigdy się nie zmieniał. Zmiany wskazują na powiększenie pliku stronicowania i należy natychmiast zbadać sprawę.
Wolne wpisy w systemowej tabeli stronicowania:
Stanowiło to problem w starszych wersjach x86. Na serwerze z systemem Windows Server 2003 z dodatkiem SP2 uruchamianym bez przełącznika /3GB wartość wynosi około 200 000 PTE.
Podczas uruchamiania z przełącznikiem /3Gb wartość ta spada do ~25 000 PTE.
Pool Nonpaged Bytes:
Bajty niestronicowane w puli to rozmiar (w bajtach) puli niestronicowanej. Jest to obszar pamięci systemowej (pamięć fizyczna używana przez system operacyjny) dla obiektów, których nie można zapisać na dysku, ale muszą one pozostać w pamięci fizycznej tak długo, jak są przydzielone.
Jeśli pula niestronicowana stale działa na poziomie ponad 80%, może to oznaczać problem z wyczerpaniem puli niestronicowanej (identyfikator zdarzenia 2019).
Pool Paged Bytes:
Bajty stronicowane w puli to rozmiar (w bajtach) puli stronicowanej, czyli obszaru pamięci systemowej (pamięci fizycznej używanej przez system operacyjny) dla obiektów, które mogą być zapisywane na dysku, gdy nie są używane.
Pula stronicowana jest większym zasobem niż pula niestronicowana. Jeśli ta wartość jest stale większa niż 70% maksymalnego skonfigurowanego rozmiaru puli, może istnieć ryzyko wyczerpania puli stronicowanej (identyfikator zdarzenia 2020).
Processor(sprawdź dla KAŻDEGO procesora i ogólnie)
%Interrupt time:
Czas, jaki procesor poświęca na odbieranie i obsługę przerwań sprzętowych w interwałach próbkowania.
Wartość ta jest pośrednim wskaźnikiem aktywności urządzeń generujących przerwania. Na przykład zegar systemowy, mysz, sterowniki dysków, linie transmisji danych, karty sieciowe i inne urządzenia peryferyjne.
Urządzenia te przerywają pracę procesora po wykonaniu zadania lub gdy wymagają uwagi.
%DPC time:
Wskazuje czas wymagany do ukończenia operacji we/wy. Podobnie jak w przypadku powyższego, należy zbadać każdą wartość wynoszącą >25%.
%Privileged Time:
Czas pracy jądra systemu operacyjnego. Zazwyczaj próg ten jest mniejszy niż 30% dla serwerów aplikacyjnych lub internetowych.
%Processor Time:
Należy zbadać wartości wynoszące stale > 90% na komputerze z jednym procesorem lub > 80% na komputerze z wieloma procesorami.
Karta sieciowa
Packets received discarded:
Służy do sprawdzania potencjalnych problemów ze sprzętem. Wartość progowa > 1. Możliwym środkiem zaradczym jest dostosowanie buforów sieciowych.
Packets received errors:
Służy do sprawdzania potencjalnych problemów ze sprzętem. Wartość progowa > 2
Dysk (dla każdego dysku)
%Idle time:
Ten licznik zapewnia dokładny pomiar czasu, przez jaki dysk był bezczynny, czyli wszystkie żądania z systemu operacyjnego do dysku zostały zakończone i nie było żadnych oczekujących żądań.
Obliczenia są wykonywane w ten sposób, że system oznacza sygnaturą czasową zdarzenie, gdy dysk przechodzi w stan bezczynności, a następnie zdarzenie, gdy dysk otrzymuje nowe żądanie.
Na koniec interwału przechwytywania oblicza procent czasu bezczynności. Licznik ten waha się od 100 (co oznacza „zawsze bezczynny”) do 0 (co oznacza „zawsze zajęty”).
Licznik ten dokładnie określa nasycenie podsystemu dysku.
Avg. Disk Queue Length:
Średnia długość kolejki dysku jest równa wartości (transfery dysku/s) * (sekundy pracy dysku/transfer).
Opiera się to na prawie Little'a z matematycznej
teorii kolejek.
Należy pamiętać, że jest to wartość pochodna, a nie bezpośredni pomiar. Każda wartość mniejsza niż dwukrotność liczby dysków jest dobrą wartością.
Avg Disk Sec/Transfer:
Wyświetla średni czas trwania transferu do/z dysku w sekundach.
Chociaż skala jest w sekundach, licznik ma milisekundową precyzję, co oznacza, że wartość 0,004 oznacza, że średni czas zakończenia transferu do/z dysku wynosił 4 milisekundy.
Jest to licznik używany w narzędziu Perfmon do pomiaru opóźnienia we/wy. Oto przykładowe wartości. Mogą się one różnić w zależności od jakości używanych dysków:
Reads Excellent < 08 Msec (.008 seconds) Good < 12 Msec (.012 seconds) Fair < 20 Msec (.020 seconds) Poor > 20 Msec (.020 seconds) Writes Excellent < 01 Msec (.001 seconds) Good < 02 Msec (.002 seconds) Fair < 04 Msec (.004 seconds) Poor > 04 Msec (.004 seconds)
Split I/Os:
Mierzy szybkość podziału we/wy z powodu fragmentacji plików. Dzieje się tak, jeśli żądanie we/wy dotyczy danych w nieciągłych segmentach plików. Powinna być to wartość bliska zeru.
Może to być inna ze względu na zbyt mały rozmiar Stripe macierzy RAID lub rozmiar bloku NTFS.
% Free Space:
Wyświetla procent całkowitego wolnego miejsca do wykorzystania na wybranym dysku logicznym. Zawsze powinna wynosić >15% wolnego miejsca, zalecane >=25%.
Proces
- Handle Count: Korelacja z przeciekami puli.
- Virtual bytes: Pamięć wirtualna zarezerwowana do użytku przez aplikację.
- Working set bytes: Prywatne bajty rezydujące w pamięci fizycznej, której właścicielem jest aplikacja.
Jaka jest różnica między obiektami wydajności dysku fizycznego i dysku logicznego w narzędziu Perfmon?
Perfmon ma dwa obiekty bezpośrednio związane z wydajnością dysku: dysk fizyczny i dysk logiczny.
Ich liczniki są obliczane w ten sam sposób, ale ich zakres jest inny.
Obiekt wydajności dysku fizycznego monitoruje napędy dysków w komputerze. Identyfikuje instancje reprezentujące fizyczny sprzęt. Liczniki są sumą dostępu do wszystkich partycji w wystąpieniu fizycznym.
Obiekt wydajności dysku logicznego monitoruje partycje logiczne. Monitor wydajności identyfikuje dyski logiczne na podstawie litery dysku lub punktu montowania.
Jeśli dysk twardy zawiera wiele partycji, licznik raportuje wartości dla wybranej partycji, a nie dla całego dysku.
W przypadku korzystania z dysków dynamicznych woluminy logiczne mogą obejmować więcej niż jeden dysk twardy. W tym scenariuszu wartości licznika obejmują dostęp do dysku logicznego na wszystkich dyskach twardych, które są nim objęte.
Które liczniki w Monitorze wydajności systemu Windows pokazują opóźnienie dysku twardego?
- Obiekt wydajności dysku fizycznego —> licznik Avg. Disk sec/Read — pokazuje średnie opóźnienie odczytu.
- Obiekt wydajności dysku fizycznego —> licznik Avg. Disk sec/Write — pokazuje średnie opóźnienie odczytu.
- Obiekt wydajności dysku fizycznego —> licznik Avg. Disk sec/Transfer — pokazuje połączone średnie wartości odczytu i zapisu.
- Wystąpienie _Total jest średnią opóźnień wszystkich dysków twardych w komputerze.
Każde inne wystąpienie reprezentuje pojedynczy dysk fizyczny.
Liczniki, które należy obserwować podczas monitorowania w różnych sytuacjach:
|
Komponent |
Monitorowany aspekt wydajności |
Liczniki do monitorowania |
|
Dysk |
Zastosowanie |
Physical Disk\ Sec/Read Physical Disk\ Disk Reads/sec Physical Disk\ Avg Queue Length Read Physical Disk\ Avg Queue Length Write Logical Disk\ % Free Space Dokładnie zinterpretuj licznik % Disk Time. |
|
Dysk |
Wąskie gardła |
Physical Disk\ ALL COUNTERS Logical Disk\ % Free Space System\File Control Operations/sec System\File Data Operations/sec Uwaga: Lokalizacja tego kluczowego licznika znajduje się pod systemem. Nie jest to zależne od woluminu, ale jest przydatne, jeśli masz tylko jeden wolumin aktywny. |
|
Pamięć |
Zastosowanie |
Memory\ Available Bytes Memory\ % Committed Bytes in Use. Memory\ Pool Non-Paged Bytes Memory\ Pool Paged Bytes. Memory\ Pages Input or Reads/sec Memory\ Free System Pages |
|
Pamięć |
Wąskie gardła lub wycieki |
Memory\ Available Bytes Memory\ Cache Bytes Memory\ Pages/sec Memory\ Page Output or Write /sec. Memory\ Free System Pages |
|
Procesor |
Zastosowanie |
Processor\ % Processor Time (wszystkie wystąpienia) Processor\ % Privileged Time Processor\ % User Time |
|
Procesor |
Wąskie gardła |
Processor\ % Processor Time (wszystkie wystąpienia) Processor\ % DPC Time Processor\ % Interrupt Time Processor\ % Privileged Time Processor\ % User Time Processor\ DPC s Queued /sec. System\System Calls/sec System\ Processor Queue Length (wszystkie wystąpienia) |
Additional Information