Uzel Metro: Jak shromažďovat protokoly z uzlu metro
Summary: Tento článek popisuje postup shromažďování protokolů z uzlu Metro a také popisuje, jaké protokoly nebo data mohou být potřeba v případě problému s výkonem.
Instructions
Postup provedení následujících úloh:
- Jaké protokoly jsou potřeba k ladění problémů s uzly metro?
- Návody zachytit collect-diagnostics v clusteru uzlů metro?
- Jak ověřit stávající balíčky collect-diagnostics na serverech pro správu.
- Jak zrušit a vyčistit probíhající collect-diagnostics v uzlu metro?
A. Jaké protokoly jsou potřeba k ladění problémů s uzly metro?
-
Příkaz nutný ke shromáždění protokolů z uzlu metro se nazývá "collect-diagnostics" a lze jej spustit z libovolného uzlu (*1) v nastavení uzlu metro. Spuštění tohoto příkazu v jedné direktorii clusteru uzlů metro by mělo obsahovat všechna data ze všech směrovačů a ze všech uzlů clusteru. NESPOUŠTĚJTE tento příkaz na více než jednom uzlu současně.
*1 POZNÁMKA: Spusťte příkaz 'collect-diagnostics' pouze z jednoho řídicího směrovače, pouze na jednom clusteru, pokud se jedná o konfiguraci Metro, a počkejte na jeho úplné dokončení, než shromáždíte soubory CD od jiné řídicí jednotky nebo z partnerského clusteru, pokud je to nutné. -
Příkaz „collect-diagnostics“ vytvoří komprimovaný soubor protokolu tar.gz obsahující konfigurační soubory a soubory protokolu. Soubor collect-diagnostics je umístěn v adresáři /diag/collect-diagnostics-out/ na uzlu, ze kterého byl spuštěn. Po dokončení příkazu zkopírujte soubor z uzlu pomocí nástroje WINSCP nebo ekvivalentního nástroje SCP. Poté jej můžete poskytnout podpoře pro analýzu. Více informací o použití tohoto příkazu naleznete v části B níže.
Poznámky:- Pokud je příkaz „collect-diagnostics“ spuštěn bez možností, jsou vygenerovány dva soubory – základní soubor a rozšířený soubor. To může u škálovaných systémů trvat poměrně dlouho.
- Podpora uzlů Metro obvykle vyžaduje pouze soubor Base, v některých případech však mohou problémy s výkonem vyžadovat i soubor rozšíření.
- Standardní možnosti, které může být nutné použít při spuštění procesu collect-diagnostics:
- “.
--noextended": Tato možnost vynechá kolekci rozšířené diagnostiky. - “.
--last-logs": Tato možnost zachycuje protokoly zpět x počet hodin nebo dní.
- “.
- Další podrobnosti o příkazu získáte zadáním příkazu "collect-diagnostics -h"
Toto jsou ukázky toho, jak tyto dva názvy souborů vypadají. Datum a čas zobrazené jako YYYY-MM-DD-HH.MM.SS jsou z data a času jejich vytvoření:
- Základní soubor:
<Serial number>-c1-diag-YYYY-MM-DD-HH.MM.SS.tar.gz - Rozšiřovaný soubor:
<Serial number>-c1-diag-ext-YYYY-MM-DD-HH.MM.SS.tar.gz
-
Problémy s výkonem jsou složité a vyžadují shromáždění velkého množství konkrétních informací. V důsledku toho máme k dispozici dotazník o výkonu, který musí zákazníci vyplnit, aby se tento proces urychlil. Dotazník naleznete v příloze tohoto článku znalostní databáze, na konci v části Příloha.
-
Při určitých typech problémů s výkonem je užitečné zachytit další protokol s názvem "fe_perf_stats". Protokoly se generují průběžně, ale nejsou zachyceny nástrojem collect-diagnostics. Chcete-li zachytit tento protokol, změňte adresář cd (adresář) na /var/log/VPlex/cli na uzlu z každého clusteru a spusťte příkaz "tar cvzf fe-perf-stats.tar.gz fe_perf_stats*" pro komprimaci dat souborů do souboru tar. Připojte se k uzlu pomocí nástroje WINSCP nebo ekvivalentního nástroje SCP a přejděte do umístění /var/log/VPlex/cli. Zkopírujte soubor "fe-perf-stats.tar.gz" do počítače. Pokud o to požádá podpora, nahrajte soubor tar spolu s jedním nebo více soubory collect-diagnostics do servisního požadavku nebo na odkaz na ftp, který vám podpora v servisním požadavku poskytne, a e-mailem.
-
Kromě diagnostiky shromáždění může být užitečné zachytit následující informace:
- Otevřete protokolování pro relaci putty,
- Poté spusťte níže uvedené příkazy:
- Poté shromážděte protokol Putty a stáhněte jej do systému.
- Pak k servisnímu požadavku připojte protokol PuTTY, collect-diagnostics a všechna další požadovaná data.
Následující příkazy je třeba spustit z příkazového řádku VPlexcli.
cluster statusll clusters/**/storage-views/* --fullll ~portsshow-use-hierarchy /clusters/**/virtual-volumes/*ll ~system-volumesls -t /clusters/*/directors/*::serial-number(tento příkaz vypíše všechny DST pro každý uzel)ls -t /clusters/**/director-*/::hostname(zobrazené názvy hostitelů jsou IP adresy, to se očekává)
B. Návody zachytit collect-diagnostics v clusteru uzlů metro?
Chcete-li tato data zachytit, spusťte příkaz collect-diagnostics s následujícími příznaky: „--noextended“ a „--last-logs 30d“.
-
Navažte relaci SSH v příkazovém řádku řídicího uzlu Linux, například service@director-1-1-a, a poté se přihlaste do rozhraní vplexcli.
Ukázkový výstup:
login as: service Keyboard-interactive authentication prompts from server: | Password: End of keyboard-interactive prompts from server Last login: <date and timestamp data> from x.x.x.x service@director-1-1-a:~> service@director-1-1-a:~> vplexcli Trying ::1... Connected to localhost. Escape character is '^]'. VPlexcli:/>
-
Chcete-li spustit příkaz collect-diagnostics, spusťte v příkazovém řádku vplexcli příkaz „collect-diagnostics“ s řízenými možnostmi, jak je znázorněno v příkladu níže.
Příklad výstupu:
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2024-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 2024-02-09 19:55:13 UTC: No cluster-witness server found. 2024-02-09 19:55:13 UTC: Free space = 88G 2024-02-09 19:55:13 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection ..
C. Jak ověřit existující balíčky collect-diagnostics v řídicím středisku nebo uzlu.
-
Po dokončení příkazu collect-diagnostics a návratu do příkazového řádku vplexcli se pomocí nástroje WinSCP [nebo ekvivalentního nástroje SCP] připojte k direktoru, ze kterého jste příkaz spustili, a přejděte do složky /diag/collect-diagnostics-out/
-
Určete jeden nebo více souborů protokolu se správným časovým razítkem a stáhněte je do místní pracovní stanice.
D. Jak zrušit probíhající collect-diagnostics
-
Pokud jste stále v relaci PuTTY, kde jste zahájili proces collect-diagnostics, měli byste vidět výstup procesu collect-diagnostics a že je proces spuštěn.
Ukázkový výstup:
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2022-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 2022-02-09 19:55:13 UTC: No cluster-witness server found. 2022-02-09 19:55:13 UTC: Free space = 88G 2022-02-09 19:55:13 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection .. -
Otevřete duplicitní relaci PuTTY a přihlaste se k řídicímu členovi, kde jste spustili příkaz collect-diagnostics, pomocí servisního účtu.
Ukázkový výstup:
login as: service Using keyboard-interactive authentication. Password: Last login: <date and time stamp data> from x.x.x.x service@director-1-1-b:~>
-
V okně director restartujte konzoli pro správu pomocí následujícího příkazu, čímž zrušíte spuštěnou diagnostiku collect-diagnostics.
Ukázkový výstup:
service@director-1-1-b:~> sudo systemctl restart VPlexManagementConsole.service
-
Když se podíváte zpět na první relaci PuTTY, ve které je spuštěná collect-diagnostics při restartování konzoly pro správu, měla by se jako poslední zaznamenaný výstup zobrazit sestava collect-diagnostics následující:
"Connection closed by foreign host."
Ukázkový výstup (zkontrolujte poslední řádek výstupu):
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2022-02-09 20:02:03 UTC: ****Initializing collect-diagnostics... 2022-02-09 20:02:04 UTC: No cluster-witness server found. 2022-02-09 20:02:04 UTC: Free space = 88G 2022-02-09 20:02:04 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection .. ERROR Executing SMS log collection .. Connection closed by foreign host. <<< -
Jakmile se collect-diagnostics zobrazí jako zastavené, krok 3 výše, vraťte se do druhé relace PuTTY a pomocí příkazu cd přejděte do adresáře /diag, poté spusťte příkaz "ll " a měly by se zobrazit další adresáře.
collect-diagnostics-tmpcollect-diagnostics-jobscollect-diagnostics-tmp-ext*
*pokud nebyly vynechány rozšířené soubory
Ukázkový výstup:
service@director-1-1-b:/diag> ll total 32 drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:03 collect-diagnostics-tmp-ext drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:03 collect-diagnostics-jobs drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:04 collect-diagnostics-out drwxr-xr-x 3 service groupSvc 4096 Feb 9 20:02 collect-diagnostics-tmp drwx------ 2 root root 16384 Jan 27 16:54 lost+found drwx--x--x 3 service groupSvc 4096 Dec 17 03:08 share service@director-1-1-b:/diag>
-
Pokud se podíváte do každého z těchto adresářů, uvidíte soubory s datem a časem, kdy jste spustili nyní zrušenou collect-diagnostics. Tyto soubory zabírají místo v oddílu /diag a měly by být odebrány.
-
Chcete-li odebrat/odstranit soubory z adresáře /dag, zadejte příkaz "rm -r collect-diagnostics-jobs" a "rm -r collect-diagnostics-tmp" a poté znovu zadejte "ll", abyste měli jistotu, že byly adresáře odstraněny nebo odstraněny.
Ukázkový výstup:
service@director-1-1-b:/diag> rm -r collect-diagnostics-jobs service@director-1-1-b:/diag> rm -r collect-diagnostics-tmp service@director-1-1-b:/diag> ll total 24 drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:04 collect-diagnostics-out drwx------ 2 root root 16384 Jan 27 16:54 lost+found drwx--x--x 3 service groupSvc 4096 Dec 17 03:08 share service@director-1-1-b:/diag>
-
Pokud adresář „collect-diagnostics-tmp-ext“ existuje, odeberte jej příkazem „rm -r collect-diagnostics-tmp-ext“
Poznámka: Rozšířený soubor se obvykle používá k šetření selhání uzlu. Pokud probíhá šetření selhání uzlu a podpora nezachytila všechny potřebné protokoly, obraťte se před vyčištěním adresáře collect-diagnostics-tmp-ext na podporu, protože by to mohlo odstranit potřebné soubory jádra.