Avamar: Použití nástroje Microsoft Windows Perfmon ke sledování výkonu klientů Avamar
Summary: Tento článek vysvětluje, jak používat nástroj Perfmon ke sledování výkonnostních charakteristik klienta Avamar v prostředí Microsoft Windows.
Symptoms
Tento článek platí pro všechny verze klientů Avamar se systémem Windows.
Perfmon (Performance Monitor) může být užitečný nástroj pro odstraňování problémů.
Může shromažďovat metriky výkonu systému Windows v průběhu času, v určených intervalech a generovat protokoly, které lze graficky analyzovat a identifikovat problémy s výkonem systému.
Zde diskutujeme o tom, které metriky shromažďovat a jak správně nakonfigurovat tento nástroj pro jejich shromažďování.
Další informace o zkoumání výkonu klienta Avamar najdete tady:
Cause
Resolution
Jak získat přístup k nástroji Perfmon:
Stisknutím kláves Windows+W otevřete okno Spustit.
Zadejte výraz Perfmon.
Co a kdy měřit
Kritické body nastanou, když prostředek dosáhne své kapacity a může způsobit zpomalení výkonu.
Kritické body jsou způsobeny nedostatečnými nebo nesprávně nakonfigurovanými prostředky, nefunkčními součástmi a nesprávnými požadavky programu na prostředky.
Existuje pět hlavních oblastí prostředků, které mohou způsobovat kritická místa a ovlivňovat výkon serveru:
- Fyzické disky
- Paměť
- Proces
- Procesor
- Síť
Pokud je některý z těchto prostředků nadměrně využíván, server nebo aplikace se může znatelně zpomalit nebo selhat.
Diskutujeme o těchto oblastech a radíme, které čítače a prahové hodnoty mohou pomoci měřit výkon serveru.
Interval vzorkování má významný vliv na velikost souboru protokolu a zatížení serveru.
Nastavte interval vzorkování na základě průměrné doby, za kterou se problém vyskytne, a vytvořte směrný plán, než se problém projeví znovu. To pomáhá odhalit jakýkoli trend, který vede k problému.
Patnáct minut je dobré okno pro stanovení směrného plánu během normálního provozu.
- Pokud je průměrná doba, za kterou k problému dojde, přibližně 4 hodiny, nastavte interval vzorkování na 15 s.
- Pokud k problému dojde během 8 hodin nebo déle, nastavte interval vzorkování na nejméně 5 minut.
Tyto pokyny pomáhají vyhnout se vytvoření velkého souboru protokolu, což ztěžuje analýzu dat.
Objekty a čítače výkonu
- Objekty – komponenta, která spravuje data výkonu
- Čítače – statistika výkonu specifická pro konkrétní objekt, která popisuje charakteristiky výkonu specifické pro objekt. Například \PhysicalDisk\%Idle Time poskytuje údaje o výkonu o době nečinnosti zjištěné plotnou.
- Instance – více replik představujících jedinečný prostředek. Sledování \PhysicalDisk\%Idle Time může zobrazit různé dostupné jednotky v systému a jejich odpovídající hodnoty %Idle Time.
Interval vzorkování
Mějte na paměti účel a dobu trvání sledování.
15minutový interval protokolování je vhodný pro rutinní intervaly sledování.
Interval vzorkování by měl být zkrácen na časový interval, který zachycuje problém.
U problémů, které se hromadí postupně, v průběhu času, lze použít delší intervaly vzorkování.
V případě přechodných problémů použijte krátký interval několika sekund. Tento interval vzorkování je užitečný při problémech se subsystémem disku.
Při nastavování intervalu vzorkování mějte na paměti dobu sledování.
Pokud sledování běží >8 hodin, může mít vzorkovací interval <300 sekund za následek vznik velkého souboru. Režijní náklady na spuštění samotného procesu shromažďování mohou ovlivnit výsledky.
Jak povolit protokolování Perfmon.
Otevřete příkazový řádek jako uživatel admin.
Spuštěním nebo zastavením zachytávání protokolu spusťte nebo zastavte následující příkazy.
Následující příkaz vytvoří datovou sadu nástroje Performance Monitoring.
Logman.exe create counter Avamar -o "c:\perflogs\Emc-avamar.blg" -f bincirc -v mmddhhmm -max 250 -c "\LogicalDisk(*)\*" "\Memory\*" "\Network Interface(*)\*" "\Paging File(*)\*" "\PhysicalDisk(*)\*" "\Processor(*)\*" "\Process(*)\*" "\Redirector\*" "\Server\*" "\System\*" -si 00:00:05 Start the logs with: Logman.exe start Avamar Stop the logs with: Logman.exe stop Avamar Above commands can be modified to collect SQL server Performance Monitor data during backups as: First create a folder for log collection as C:\SQL_Performance_Logs\ For default SQL instance run: Logman create counter Avamar_SQL_perf_log -f bin -c "\Network Interface(*)\*" "\Redirector\*" "\Paging File(*)\*" "\Memory\*" "\PhysicalDisk(*)\*" "\LogicalDisk(*)\*" "\Server\*" "\System\*" "\Process(*)\*" "\Processor(*)\*" "\SQLServer:Databases(*)\*" "\SQLServer:Buffer Manager\*" "\SQLServer:Memory Manager\*" "\SQLServer:SQL Statistics\*" -si 00:00:05 -max 800 -cnf 0 -o C:\SQL_Performance_Logs\AvamarSQL_perf_log.blg For named instance, replace server with instance name Logman create counter Avamar_SQL_perf_log -f bin -c "\Network Interface(*)\*" "\Redirector\*" "\Paging File(*)\*" "\Memory\*" "\PhysicalDisk(*)\*" "\LogicalDisk(*)\*" "\Server\*" "\System\*" "\Process(*)\*" "\Processor(*)\*" "\SQLServer:Databases(*)\*" "\SQLServer:Buffer Manager\*" "\SQLServer:Memory Manager\*" "\MSSQL$InstanceName:SQL Statistics\*" -si 00:00:05 -max 800 -cnf 0 -o C:\SQL_Performance_Logs\AvamarSQL_perf_log.blg start collecting logs: Logman start Avamar_SQL_perf_log stop log collection: Logman stop Avamar_SQL_perf_log
Čítače a jejich prahové hodnoty
Paměť
%Committed bytes in use:
Hodnota je používaná fyzická paměť, pro kterou je vyhrazeno místo ve stránkovacím souboru pro případ, že by bylo potřeba jej zapsat na disk.
Velikost stránkovacího souboru určuje limit pro potvrzení. Pokud se stránkovací soubor zvětší, limit potvrzení se zvýší a poměr se sníží.
Tento čítač zobrazuje pouze aktuální procentuální hodnotu. Nejedná se o průměr. Pokud je tato hodnota trvale vyšší než 80 %, může být stránkovací soubor příliš malý.
Available Bytes:
Hodnota Available Bytes je velikost fyzické paměti v bajtech, která je okamžitě k dispozici pro přidělení procesu nebo pro použití v systému.
U systémů x64 to jen zřídka znamená omezení. Pokud tato hodnota trvale klesne pod 5 % nainstalované paměti RAM, měli byste to prozkoumat. Pokud hodnota trvale klesne pod 1 % nainstalované paměti RAM, nastává jednoznačný problém.
Committed Bytes:
Hodnota je fyzická paměť, která má vyhrazené místo pro jeden nebo více stránkovacích souborů disku.
Na každém pevném disku může být jeden nebo více stránkovacích souborů.
Tento čítač by se v ideálním případě neměl nikdy měnit. Změny značí rozšíření stránkovacího souboru a měly by být okamžitě prozkoumány.
Free System Page Table Entries:
Toto býval problém u starších verzí x86. Na serveru se systémem Windows Server 2003 SP2, který se spouští bez přepínače /3Gb, je hodnota přibližně 200 000 PTE.
Při spouštění pomocí přepínače /3Gb klesne hodnota na zhruba 25 000 PTE.
Pool Nonpaged Bytes:
Pool Nonpaged Bytes je velikost (bajty) nestránkovaného fondu. Jedná se o oblast systémové paměti (fyzická paměť používaná operačním systémem) pro objekty, které nelze zapsat na disk, ale musí zůstat ve fyzické paměti po dobu přidělení.
Pokud nestránkovaný fond běží konzistentně na více než 80 %, můžete směřovat k problému s vyčerpáním nestránkovaného fondu (ID události 2019).
Pool Paged Bytes:
Hodnota Pool Paged Bytes představuje velikost stránkovaného fondu (v bajtech), což je oblast systémové paměti (fyzická paměť používaná operačním systémem) pro objekty, které lze zapsat na disk, když se nepoužívají.
Stránkovaný fond je větší prostředek než nestránkovaný fond. Pokud je tato hodnota konzistentně větší než 70 % maximální nakonfigurované velikosti fondu, může vám hrozit vyčerpání stránkovaného fondu (ID události 2020).
Procesor (zkontrolujte hodnotu u každého procesoru a celkově)
%Interrupt time:
Doba, kterou procesor stráví příjmem a servisem hardwarových přerušení během vzorkovacích intervalů.
Tato hodnota je nepřímým indikátorem aktivity zařízení, která generují přerušení. Například systémové hodiny, myš, ovladače disků, datové komunikační linky, karty síťového rozhraní a další periferní zařízení.
Tato zařízení přeruší činnost procesoru, když dokončí úlohu nebo vyžadují pozornost.
%DPC time:
Udává čas potřebný k dokončení operace I/O. Podobně jako výše byste měli prozkoumat jakoukoli hodnotu >25 %.
%Privileged Time:
Čas, kdy jádro operačního systému pracuje. Obvykle je prahová hodnota menší než 30 % pro aplikaci nebo webové servery.
%Processor Time:
Trvalé hodnoty > 90 % na počítači s jedním procesorem nebo > 80 % na počítači s více procesory by měly být prozkoumány.
Síťové rozhraní
Packets Received Discarded:
Slouží ke kontrole potenciálních problémů s hardwarem. Prahová hodnota > 1. Možným řešením je úprava síťových vyrovnávacích pamětí.
Packets received errors:
Slouží ke kontrole potenciálních problémů s hardwarem. Prahová hodnota > 2
Disk (pro každý disk)
%Idle Time:
Tento čítač poskytuje přesné měření doby, po kterou byl disk nečinný, což znamená, že všechny požadavky z operačního systému na disk byly dokončeny a neexistují žádné čekající požadavky.
Výpočet probíhá tak, že systém označí událost, když disk přestane být nečinný, a pak označí další události, když disk obdrží nový požadavek.
Na konci intervalu zachytávání vypočítá procento času stráveného nečinností. Tento čítač se pohybuje od 100 (což znamená vždy nečinný) do 0 (což znamená vždy zaneprázdněn).
Tento čítač přesně určuje saturaci diskového subsystému.
Avg. Disk Queue Length:
Avg. Disk Queue Length se rovná (Disk Transfers/sec) *(Disk sec/Transfer).
To je založeno na Littleově zákonu z matematické
teorie front.
Upozorňujeme, že se jedná o odvozenou hodnotu, nikoli o přímé měření. Jakákoli hodnota menší než dvojnásobek počtu ploten je dobrá hodnota.
Avg Disk Sec/Transfer:
Zobrazuje průměrnou dobu v sekundách, za kterou se přenosy disku dokončí.
I když je měřítko v sekundách, čítač má přesnost v milisekundách, což znamená, že hodnota 0,004 označuje, že průměrná doba dokončení přenosů disků byla 4 milisekundy.
Jedná se o čítač v nástroji Perfmon, který se používá k měření latence operací I/O. Zde jsou ukázkové hodnoty. Ty se mohou lišit v závislosti na kvalitě použitých disků:
Reads Excellent < 08 Msec (.008 seconds) Good < 12 Msec (.012 seconds) Fair < 20 Msec (.020 seconds) Poor > 20 Msec (.020 seconds) Writes Excellent < 01 Msec (.001 seconds) Good < 02 Msec (.002 seconds) Fair < 04 Msec (.004 seconds) Poor > 04 Msec (.004 seconds)
Split I/Os:
Měří rychlost rozdělení operací I/O v důsledku fragmentace souboru. K tomu dochází, pokud se požadavek na operace I/O dotkne dat v nesousedících segmentech souboru. Hodnota by se měla blížit nule.
To se může lišit z důvodu velikosti prokládání pole RAID nebo příliš malého bloku NTFS.
% Free Space:
Zobrazí procento celkového využitelného místa na vybraném logickém disku, který byl volný. Vždy by mělo být k dispozici >15 % volného místa, doporučeno je >= 25 %.
Proces
- Handle Count: Korelujte s nevrácením fondu.
- Virtual bytes: Virtuální paměť vyhrazená pro použití aplikací.
- Working set bytes: Soukromé bajty nacházející se ve fyzické paměti, která je vlastněna aplikací.
Jaký je rozdíl mezi fyzickým diskem a objekty výkonu logických disků v nástroji Perfmon?
Nástroj Perfmon má dva objekty přímo související s výkonem disku, fyzický disk a logický disk.
Jejich čítače se počítají stejným způsobem, ale jejich rozsah je odlišný.
The Physical Disk performance object sleduje diskové jednotky v počítači. Identifikuje instance reprezentující fyzický hardware. Čítače představují součet přístupu ke všem oddílům ve fyzické instanci.
The Logical Disk Performance object sleduje logické oddíly. Sledování výkonu identifikuje logické disky podle písmene jednotky nebo připojovacího bodu.
Pokud pevný disk obsahuje více oddílů, bude tento čítač hlásit hodnoty pro vybraný oddíl, nikoli pro celý disk.
Při použití dynamických disků mohou logické svazky zahrnovat více než jeden pevný disk. V tomto scénáři hodnoty čítačů zahrnují přístup k logickému disku na všech pevných discích, na kterých se nachází.
Které čítače v nástroji Windows Performance Monitor zobrazují latenci pevného disku?
- Physical disk performance object -> Avg. Disk sec/Read counter – Zobrazuje průměrnou latenci čtení.
- Physical disk performance object -> Avg. Disk sec/Write counter – Zobrazuje průměrnou latenci zápisu.
- Physical disk performance object -> Avg. Disk sec/Transfer counter – zobrazuje kombinované průměry pro čtení i zápis.
- _Total instance je průměrem latencí všech pevných disků v počítači.
Každá další instance představuje jeden fyzický disk.
Čítače, které je třeba sledovat při monitorování v různých situacích:
|
Komponentní |
Sledovaný aspekt výkonu |
Čítače, které je dobré sledovat |
|
Disk |
Použití |
Physical Disk\ Sec/Read Physical Disk\ Disk Reads/sec Physical Disk\ Avg Queue Length Read Physical Disk\ Avg Queue Length Write Logical Disk\ % Free Space Pečlivě interpretujte čítač %Disk Time. |
|
Disk |
Bottlenecks |
Physical Disk\ ALL COUNTERS Logical Disk\ % Free Space System\File Control Operations/sec System\File Data Operations/sec Poznámka: Tento čítač se nachází v části System. Není specifický pro konkrétní svazek, ale je užitečný, pokud máte pouze jeden aktivní svazek. |
|
Paměť |
Použití |
Memory\ Available Bytes Memory\ % Committed Bytes in Use. Memory\ Pool Non-Paged Bytes Memory\ Pool Paged Bytes. Memory\ Pages Input or Reads/sec Memory\ Free System Pages |
|
Paměť |
Bottlenecks or leaks |
Memory\ Available Bytes Memory\ Cache Bytes Memory\ Pages/sec Memory\ Page Output or Write /sec. Memory\ Free System Pages |
|
Procesor |
Použití |
Processor\ % Processor Time (all instances) Processor\ % Privileged Time Processor\ % User Time |
|
Procesor |
Bottlenecks |
Processor\ % Processor Time (all instances) Processor\ % DPC Time Processor\ % Interrupt Time Processor\ % Privileged Time Processor\ % User Time Processor\ DPC s Queued /sec. System\System Calls/sec System\ Processor Queue Length (all instances) |
Additional Information