Uzel Metro: Jak shromažďovat protokoly z uzlu metro

Summary: Tento článek popisuje postup shromažďování protokolů z uzlu Metro a také popisuje, jaké protokoly nebo data mohou být potřeba v případě problému s výkonem.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Postup provedení následujících úloh:

  1. Jaké protokoly jsou potřeba k ladění problémů s uzly metro?
  2. Návody zachytit collect-diagnostics v clusteru uzlů metro?
  3. Jak ověřit stávající balíčky collect-diagnostics na serverech pro správu.
  4. Jak zrušit a vyčistit probíhající collect-diagnostics v uzlu metro?

A. Jaké protokoly jsou potřeba k ladění problémů s uzly metro?

  1. Příkaz nutný ke shromáždění protokolů z uzlu metro se nazývá "collect-diagnostics" a lze jej spustit z libovolného uzlu (*1) v nastavení uzlu metro. Spuštění tohoto příkazu v jedné direktorii clusteru uzlů metro by mělo obsahovat všechna data ze všech směrovačů a ze všech uzlů clusteru. NESPOUŠTĚJTE tento příkaz na více než jednom uzlu současně.

    *1 POZNÁMKA: Spusťte příkaz 'collect-diagnostics' pouze z jednoho řídicího směrovače, pouze na jednom clusteru, pokud se jedná o konfiguraci Metro, a počkejte na jeho úplné dokončení, než shromáždíte soubory CD od jiné řídicí jednotky nebo z partnerského clusteru, pokud je to nutné.
  2. Příkaz „collect-diagnostics“ vytvoří komprimovaný soubor protokolu tar.gz obsahující konfigurační soubory a soubory protokolu. Soubor collect-diagnostics je umístěn v adresáři /diag/collect-diagnostics-out/ na uzlu, ze kterého byl spuštěn. Po dokončení příkazu zkopírujte soubor z uzlu pomocí nástroje WINSCP nebo ekvivalentního nástroje SCP. Poté jej můžete poskytnout podpoře pro analýzu. Více informací o použití tohoto příkazu naleznete v části B níže.

    Poznámky:
    • Pokud je příkaz „collect-diagnostics“ spuštěn bez možností, jsou vygenerovány dva soubory – základní soubor a rozšířený soubor. To může u škálovaných systémů trvat poměrně dlouho.
    • Podpora uzlů Metro obvykle vyžaduje pouze soubor Base, v některých případech však mohou problémy s výkonem vyžadovat i soubor rozšíření.
    • Standardní možnosti, které může být nutné použít při spuštění procesu collect-diagnostics:
      • “.--noextended": Tato možnost vynechá kolekci rozšířené diagnostiky.
      • “.--last-logs": Tato možnost zachycuje protokoly zpět x počet hodin nebo dní.
    • Další podrobnosti o příkazu získáte zadáním příkazu "collect-diagnostics -h"

    Toto jsou ukázky toho, jak tyto dva názvy souborů vypadají. Datum a čas zobrazené jako YYYY-MM-DD-HH.MM.SS jsou z data a času jejich vytvoření:

    • Základní soubor: <Serial number>-c1-diag-YYYY-MM-DD-HH.MM.SS.tar.gz
    • Rozšiřovaný soubor: <Serial number>-c1-diag-ext-YYYY-MM-DD-HH.MM.SS.tar.gz
  3. Problémy s výkonem jsou složité a vyžadují shromáždění velkého množství konkrétních informací. V důsledku toho máme k dispozici dotazník o výkonu, který musí zákazníci vyplnit, aby se tento proces urychlil. Dotazník naleznete v příloze tohoto článku znalostní databáze, na konci v části Příloha.

  4. Při určitých typech problémů s výkonem je užitečné zachytit další protokol s názvem "fe_perf_stats". Protokoly se generují průběžně, ale nejsou zachyceny nástrojem collect-diagnostics. Chcete-li zachytit tento protokol, změňte adresář cd (adresář) na /var/log/VPlex/cli na uzlu z každého clusteru a spusťte příkaz "tar cvzf fe-perf-stats.tar.gz fe_perf_stats*" pro komprimaci dat souborů do souboru tar. Připojte se k uzlu pomocí nástroje WINSCP nebo ekvivalentního nástroje SCP a přejděte do umístění /var/log/VPlex/cli. Zkopírujte soubor "fe-perf-stats.tar.gz" do počítače. Pokud o to požádá podpora, nahrajte soubor tar spolu s jedním nebo více soubory collect-diagnostics do servisního požadavku nebo na odkaz na ftp, který vám podpora v servisním požadavku poskytne, a e-mailem.

  5. Kromě diagnostiky shromáždění může být užitečné zachytit následující informace:

    • Otevřete protokolování pro relaci putty,
    • Poté spusťte níže uvedené příkazy:
    • Poté shromážděte protokol Putty a stáhněte jej do systému.
    • Pak k servisnímu požadavku připojte protokol PuTTY, collect-diagnostics a všechna další požadovaná data.

    Následující příkazy je třeba spustit z příkazového řádku VPlexcli.

    1. cluster status
    2. ll clusters/**/storage-views/* --full
    3. ll ~ports
    4. show-use-hierarchy /clusters/**/virtual-volumes/*
    5. ll ~system-volumes
    6. ls -t /clusters/*/directors/*::serial-number (tento příkaz vypíše všechny DST pro každý uzel)
    7. ls -t /clusters/**/director-*/::hostname (zobrazené názvy hostitelů jsou IP adresy, to se očekává)

B. Návody zachytit collect-diagnostics v clusteru uzlů metro?

Poznámka: Základní soubor za posledních 30 dní je dostatečný k prošetření a vyřešení většiny problémů. Pokud podpora neurčí jinak, měli byste použít tyto možnosti.
Chcete-li tato data zachytit, spusťte příkaz collect-diagnostics s následujícími příznaky: „--noextended“ a „--last-logs 30d“.
  1. Navažte relaci SSH v příkazovém řádku řídicího uzlu Linux, například service@director-1-1-a, a poté se přihlaste do rozhraní vplexcli.

    Ukázkový výstup:

    login as: service
    Keyboard-interactive authentication prompts from server:
    | Password:
    End of keyboard-interactive prompts from server
    Last login: <date and timestamp data> from x.x.x.x
    service@director-1-1-a:~>
    service@director-1-1-a:~> vplexcli
    Trying ::1...
    Connected to localhost.
    Escape character is '^]'.
    
    VPlexcli:/>
  2. Chcete-li spustit příkaz collect-diagnostics, spusťte v příkazovém řádku vplexcli příkaz „collect-diagnostics“ s řízenými možnostmi, jak je znázorněno v příkladu níže.

    Příklad výstupu:

    VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 
    
    ('WARNING:The collect-diagnostics command was issued with option --noextended.
    ',) 
    
    The following file(s) will NOT be collected: 
    
            core files 
            fast trace dump files 
            slow trace dump files 
            udcom trace dump files 
            udcom legacy trace files 
            user-defined performance sink files 
            the management console's heap 
    
    ('WARNING:Only the logs that are generated in the last 30 days are collected.') 
    
    2024-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 
    2024-02-09 19:55:13 UTC: No cluster-witness server found. 
    2024-02-09 19:55:13 UTC: Free space = 88G 
    2024-02-09 19:55:13 UTC: Total space needed = 1907M 
    
    ================================================================================ 
    
    Starting collect-diagnostics, this operation might take a while... 
    
    ================================================================================ 
    
    Executing cluster collection ..

C. Jak ověřit existující balíčky collect-diagnostics v řídicím středisku nebo uzlu.

  1. Po dokončení příkazu collect-diagnostics a návratu do příkazového řádku vplexcli se pomocí nástroje WinSCP [nebo ekvivalentního nástroje SCP] připojte k direktoru, ze kterého jste příkaz spustili, a přejděte do složky /diag/collect-diagnostics-out/

  2. Určete jeden nebo více souborů protokolu se správným časovým razítkem a stáhněte je do místní pracovní stanice.

D. Jak zrušit probíhající collect-diagnostics

Poznámka: Jedná se o nerušivou činnost. Vzhledem k tomu, že neexistují žádné přímé příkazy ke zrušení procesu shromažďování, je nutné restartovat konzoli pro správu. Před přerušením spuštěné collect-diagnostics se ale obraťte na podporu a vysvětlete, proč chcete zrušit spuštění collect-diagnostics, abyste měli jistotu, že je v pořádku, protože můžou být ztracena data. Tato ztracená data nejsou k dispozici pro opětovné vyzvednutí, když se collect-diagnostics znovu spustí po akci zrušení.
  1. Pokud jste stále v relaci PuTTY, kde jste zahájili proces collect-diagnostics, měli byste vidět výstup procesu collect-diagnostics a že je proces spuštěn.

    Ukázkový výstup:

    VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 
    
    ('WARNING:The collect-diagnostics command was issued with option --noextended.
    ',) 
    
    The following file(s) will NOT be collected: 
    
            core files 
            fast trace dump files 
            slow trace dump files 
            udcom trace dump files 
            udcom legacy trace files 
            user-defined performance sink files 
            the management console's heap 
    
    ('WARNING:Only the logs that are generated in the last 30 days are collected.') 
    
    2022-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 
    2022-02-09 19:55:13 UTC: No cluster-witness server found. 
    2022-02-09 19:55:13 UTC: Free space = 88G 
    2022-02-09 19:55:13 UTC: Total space needed = 1907M 
    
    ================================================================================ 
    
    Starting collect-diagnostics, this operation might take a while... 
    
    ================================================================================ 
    
    Executing cluster collection ..
  2. Otevřete duplicitní relaci PuTTY a přihlaste se k řídicímu členovi, kde jste spustili příkaz collect-diagnostics, pomocí servisního účtu.

    Ukázkový výstup:

    login as: service 
    Using keyboard-interactive authentication. 
    Password: 
    Last login: <date and time stamp data> from x.x.x.x 
    service@director-1-1-b:~>
  3. V okně director restartujte konzoli pro správu pomocí následujícího příkazu, čímž zrušíte spuštěnou diagnostiku collect-diagnostics.

    Ukázkový výstup:

    service@director-1-1-b:~> sudo systemctl restart VPlexManagementConsole.service
  4. Když se podíváte zpět na první relaci PuTTY, ve které je spuštěná collect-diagnostics při restartování konzoly pro správu, měla by se jako poslední zaznamenaný výstup zobrazit sestava collect-diagnostics následující:

    "Connection closed by foreign host."

    Ukázkový výstup (zkontrolujte poslední řádek výstupu):

    VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 
    
    ('WARNING:The collect-diagnostics command was issued with option --noextended.
    ',) 
    
    The following file(s) will NOT be collected: 
    
            core files 
            fast trace dump files 
            slow trace dump files 
            udcom trace dump files 
            udcom legacy trace files 
            user-defined performance sink files 
            the management console's heap 
    
    ('WARNING:Only the logs that are generated in the last 30 days are collected.') 
    
    2022-02-09 20:02:03 UTC: ****Initializing collect-diagnostics... 
    2022-02-09 20:02:04 UTC: No cluster-witness server found. 
    2022-02-09 20:02:04 UTC: Free space = 88G 
    2022-02-09 20:02:04 UTC: Total space needed = 1907M 
    
    ================================================================================ 
    
    Starting collect-diagnostics, this operation might take a while... 
    
    ================================================================================ 
    
    Executing cluster collection ..                               ERROR 
    Executing SMS log collection ..                               Connection closed by foreign host. <<<
  5. Jakmile se collect-diagnostics zobrazí jako zastavené, krok 3 výše, vraťte se do druhé relace PuTTY a pomocí příkazu cd přejděte do adresáře /diag, poté spusťte příkaz "ll " a měly by se zobrazit další adresáře.

    • collect-diagnostics-tmp
    • collect-diagnostics-jobs
    • collect-diagnostics-tmp-ext*
      *pokud nebyly vynechány rozšířené soubory

    Ukázkový výstup:

    service@director-1-1-b:/diag> ll 
    total 32 
    drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:03 collect-diagnostics-tmp-ext
    drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:03 collect-diagnostics-jobs 
    drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:04 collect-diagnostics-out 
    drwxr-xr-x 3 service groupSvc  4096 Feb  9 20:02 collect-diagnostics-tmp 
    drwx------ 2 root    root     16384 Jan 27 16:54 lost+found 
    drwx--x--x 3 service groupSvc  4096 Dec 17 03:08 share 
    service@director-1-1-b:/diag>
  6. Pokud se podíváte do každého z těchto adresářů, uvidíte soubory s datem a časem, kdy jste spustili nyní zrušenou collect-diagnostics. Tyto soubory zabírají místo v oddílu /diag a měly by být odebrány.

  7. Chcete-li odebrat/odstranit soubory z adresáře /dag, zadejte příkaz "rm -r collect-diagnostics-jobs" a "rm -r collect-diagnostics-tmp" a poté znovu zadejte "ll", abyste měli jistotu, že byly adresáře odstraněny nebo odstraněny.

    Ukázkový výstup:

    service@director-1-1-b:/diag> rm -r collect-diagnostics-jobs 
    service@director-1-1-b:/diag> rm -r collect-diagnostics-tmp 
    
    service@director-1-1-b:/diag> ll 
    total 24 
    drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:04 collect-diagnostics-out 
    drwx------ 2 root    root     16384 Jan 27 16:54 lost+found 
    drwx--x--x 3 service groupSvc  4096 Dec 17 03:08 share 
    service@director-1-1-b:/diag>
  8. Pokud adresář „collect-diagnostics-tmp-ext“ existuje, odeberte jej příkazem „rm -r collect-diagnostics-tmp-ext

    Poznámka: Rozšířený soubor se obvykle používá k šetření selhání uzlu. Pokud probíhá šetření selhání uzlu a podpora nezachytila všechny potřebné protokoly, obraťte se před vyčištěním adresáře collect-diagnostics-tmp-ext na podporu, protože by to mohlo odstranit potřebné soubory jádra.

 

Affected Products

metro node mn-114, metro node mn-215
Article Properties
Article Number: 000197436
Article Type: How To
Last Modified: 01 Jul 2025
Version:  8
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.