Uzel Metro: Jak shromažďovat protokoly z uzlu metro

Resumo: Tento článek popisuje postup shromažďování protokolů z uzlu Metro a také popisuje, jaké protokoly nebo data mohou být potřeba v případě problému s výkonem.

Este artigo aplica-se a Este artigo não se aplica a Este artigo não está vinculado a nenhum produto específico. Nem todas as versões do produto estão identificadas neste artigo.

Instruções

Postup provedení následujících úloh:

  1. Jaké protokoly jsou potřeba k ladění problémů s uzly metro?
  2. Návody zachytit collect-diagnostics v clusteru uzlů metro?
  3. Jak ověřit stávající balíčky collect-diagnostics na serverech pro správu.
  4. Jak zrušit a vyčistit probíhající collect-diagnostics v uzlu metro?

A. Jaké protokoly jsou potřeba k ladění problémů s uzly metro?

  1. Příkaz nutný ke shromáždění protokolů z uzlu metro se nazývá "collect-diagnostics" a lze jej spustit z libovolného uzlu (*1) v nastavení uzlu metro. Spuštění tohoto příkazu v jedné direktorii clusteru uzlů metro by mělo obsahovat všechna data ze všech směrovačů a ze všech uzlů clusteru. NESPOUŠTĚJTE tento příkaz na více než jednom uzlu současně.

    *1 POZNÁMKA: Spusťte příkaz 'collect-diagnostics' pouze z jednoho řídicího směrovače, pouze na jednom clusteru, pokud se jedná o konfiguraci Metro, a počkejte na jeho úplné dokončení, než shromáždíte soubory CD od jiné řídicí jednotky nebo z partnerského clusteru, pokud je to nutné.
  2. Příkaz „collect-diagnostics“ vytvoří komprimovaný soubor protokolu tar.gz obsahující konfigurační soubory a soubory protokolu. Soubor collect-diagnostics je umístěn v adresáři /diag/collect-diagnostics-out/ na uzlu, ze kterého byl spuštěn. Po dokončení příkazu zkopírujte soubor z uzlu pomocí nástroje WINSCP nebo ekvivalentního nástroje SCP. Poté jej můžete poskytnout podpoře pro analýzu. Více informací o použití tohoto příkazu naleznete v části B níže.

    Poznámky:
    • Pokud je příkaz „collect-diagnostics“ spuštěn bez možností, jsou vygenerovány dva soubory – základní soubor a rozšířený soubor. To může u škálovaných systémů trvat poměrně dlouho.
    • Podpora uzlů Metro obvykle vyžaduje pouze soubor Base, v některých případech však mohou problémy s výkonem vyžadovat i soubor rozšíření.
    • Standardní možnosti, které může být nutné použít při spuštění procesu collect-diagnostics:
      • “.--noextended": Tato možnost vynechá kolekci rozšířené diagnostiky.
      • “.--last-logs": Tato možnost zachycuje protokoly zpět x počet hodin nebo dní.
    • Další podrobnosti o příkazu získáte zadáním příkazu "collect-diagnostics -h"

    Toto jsou ukázky toho, jak tyto dva názvy souborů vypadají. Datum a čas zobrazené jako YYYY-MM-DD-HH.MM.SS jsou z data a času jejich vytvoření:

    • Základní soubor: <Serial number>-c1-diag-YYYY-MM-DD-HH.MM.SS.tar.gz
    • Rozšiřovaný soubor: <Serial number>-c1-diag-ext-YYYY-MM-DD-HH.MM.SS.tar.gz
  3. Problémy s výkonem jsou složité a vyžadují shromáždění velkého množství konkrétních informací. V důsledku toho máme k dispozici dotazník o výkonu, který musí zákazníci vyplnit, aby se tento proces urychlil. Dotazník naleznete v příloze tohoto článku znalostní databáze, na konci v části Příloha.

  4. Při určitých typech problémů s výkonem je užitečné zachytit další protokol s názvem "fe_perf_stats". Protokoly se generují průběžně, ale nejsou zachyceny nástrojem collect-diagnostics. Chcete-li zachytit tento protokol, změňte adresář cd (adresář) na /var/log/VPlex/cli na uzlu z každého clusteru a spusťte příkaz "tar cvzf fe-perf-stats.tar.gz fe_perf_stats*" pro komprimaci dat souborů do souboru tar. Připojte se k uzlu pomocí nástroje WINSCP nebo ekvivalentního nástroje SCP a přejděte do umístění /var/log/VPlex/cli. Zkopírujte soubor "fe-perf-stats.tar.gz" do počítače. Pokud o to požádá podpora, nahrajte soubor tar spolu s jedním nebo více soubory collect-diagnostics do servisního požadavku nebo na odkaz na ftp, který vám podpora v servisním požadavku poskytne, a e-mailem.

  5. Kromě diagnostiky shromáždění může být užitečné zachytit následující informace:

    • Otevřete protokolování pro relaci putty,
    • Poté spusťte níže uvedené příkazy:
    • Poté shromážděte protokol Putty a stáhněte jej do systému.
    • Pak k servisnímu požadavku připojte protokol PuTTY, collect-diagnostics a všechna další požadovaná data.

    Následující příkazy je třeba spustit z příkazového řádku VPlexcli.

    1. cluster status
    2. ll clusters/**/storage-views/* --full
    3. ll ~ports
    4. show-use-hierarchy /clusters/**/virtual-volumes/*
    5. ll ~system-volumes
    6. ls -t /clusters/*/directors/*::serial-number (tento příkaz vypíše všechny DST pro každý uzel)
    7. ls -t /clusters/**/director-*/::hostname (zobrazené názvy hostitelů jsou IP adresy, to se očekává)

B. Návody zachytit collect-diagnostics v clusteru uzlů metro?

Poznámka: Základní soubor za posledních 30 dní je dostatečný k prošetření a vyřešení většiny problémů. Pokud podpora neurčí jinak, měli byste použít tyto možnosti.
Chcete-li tato data zachytit, spusťte příkaz collect-diagnostics s následujícími příznaky: „--noextended“ a „--last-logs 30d“.
  1. Navažte relaci SSH v příkazovém řádku řídicího uzlu Linux, například service@director-1-1-a, a poté se přihlaste do rozhraní vplexcli.

    Ukázkový výstup:

    login as: service
    Keyboard-interactive authentication prompts from server:
    | Password:
    End of keyboard-interactive prompts from server
    Last login: <date and timestamp data> from x.x.x.x
    service@director-1-1-a:~>
    service@director-1-1-a:~> vplexcli
    Trying ::1...
    Connected to localhost.
    Escape character is '^]'.
    
    VPlexcli:/>
  2. Chcete-li spustit příkaz collect-diagnostics, spusťte v příkazovém řádku vplexcli příkaz „collect-diagnostics“ s řízenými možnostmi, jak je znázorněno v příkladu níže.

    Příklad výstupu:

    VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 
    
    ('WARNING:The collect-diagnostics command was issued with option --noextended.
    ',) 
    
    The following file(s) will NOT be collected: 
    
            core files 
            fast trace dump files 
            slow trace dump files 
            udcom trace dump files 
            udcom legacy trace files 
            user-defined performance sink files 
            the management console's heap 
    
    ('WARNING:Only the logs that are generated in the last 30 days are collected.') 
    
    2024-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 
    2024-02-09 19:55:13 UTC: No cluster-witness server found. 
    2024-02-09 19:55:13 UTC: Free space = 88G 
    2024-02-09 19:55:13 UTC: Total space needed = 1907M 
    
    ================================================================================ 
    
    Starting collect-diagnostics, this operation might take a while... 
    
    ================================================================================ 
    
    Executing cluster collection ..

C. Jak ověřit existující balíčky collect-diagnostics v řídicím středisku nebo uzlu.

  1. Po dokončení příkazu collect-diagnostics a návratu do příkazového řádku vplexcli se pomocí nástroje WinSCP [nebo ekvivalentního nástroje SCP] připojte k direktoru, ze kterého jste příkaz spustili, a přejděte do složky /diag/collect-diagnostics-out/

  2. Určete jeden nebo více souborů protokolu se správným časovým razítkem a stáhněte je do místní pracovní stanice.

D. Jak zrušit probíhající collect-diagnostics

Poznámka: Jedná se o nerušivou činnost. Vzhledem k tomu, že neexistují žádné přímé příkazy ke zrušení procesu shromažďování, je nutné restartovat konzoli pro správu. Před přerušením spuštěné collect-diagnostics se ale obraťte na podporu a vysvětlete, proč chcete zrušit spuštění collect-diagnostics, abyste měli jistotu, že je v pořádku, protože můžou být ztracena data. Tato ztracená data nejsou k dispozici pro opětovné vyzvednutí, když se collect-diagnostics znovu spustí po akci zrušení.
  1. Pokud jste stále v relaci PuTTY, kde jste zahájili proces collect-diagnostics, měli byste vidět výstup procesu collect-diagnostics a že je proces spuštěn.

    Ukázkový výstup:

    VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 
    
    ('WARNING:The collect-diagnostics command was issued with option --noextended.
    ',) 
    
    The following file(s) will NOT be collected: 
    
            core files 
            fast trace dump files 
            slow trace dump files 
            udcom trace dump files 
            udcom legacy trace files 
            user-defined performance sink files 
            the management console's heap 
    
    ('WARNING:Only the logs that are generated in the last 30 days are collected.') 
    
    2022-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 
    2022-02-09 19:55:13 UTC: No cluster-witness server found. 
    2022-02-09 19:55:13 UTC: Free space = 88G 
    2022-02-09 19:55:13 UTC: Total space needed = 1907M 
    
    ================================================================================ 
    
    Starting collect-diagnostics, this operation might take a while... 
    
    ================================================================================ 
    
    Executing cluster collection ..
  2. Otevřete duplicitní relaci PuTTY a přihlaste se k řídicímu členovi, kde jste spustili příkaz collect-diagnostics, pomocí servisního účtu.

    Ukázkový výstup:

    login as: service 
    Using keyboard-interactive authentication. 
    Password: 
    Last login: <date and time stamp data> from x.x.x.x 
    service@director-1-1-b:~>
  3. V okně director restartujte konzoli pro správu pomocí následujícího příkazu, čímž zrušíte spuštěnou diagnostiku collect-diagnostics.

    Ukázkový výstup:

    service@director-1-1-b:~> sudo systemctl restart VPlexManagementConsole.service
  4. Když se podíváte zpět na první relaci PuTTY, ve které je spuštěná collect-diagnostics při restartování konzoly pro správu, měla by se jako poslední zaznamenaný výstup zobrazit sestava collect-diagnostics následující:

    "Connection closed by foreign host."

    Ukázkový výstup (zkontrolujte poslední řádek výstupu):

    VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 
    
    ('WARNING:The collect-diagnostics command was issued with option --noextended.
    ',) 
    
    The following file(s) will NOT be collected: 
    
            core files 
            fast trace dump files 
            slow trace dump files 
            udcom trace dump files 
            udcom legacy trace files 
            user-defined performance sink files 
            the management console's heap 
    
    ('WARNING:Only the logs that are generated in the last 30 days are collected.') 
    
    2022-02-09 20:02:03 UTC: ****Initializing collect-diagnostics... 
    2022-02-09 20:02:04 UTC: No cluster-witness server found. 
    2022-02-09 20:02:04 UTC: Free space = 88G 
    2022-02-09 20:02:04 UTC: Total space needed = 1907M 
    
    ================================================================================ 
    
    Starting collect-diagnostics, this operation might take a while... 
    
    ================================================================================ 
    
    Executing cluster collection ..                               ERROR 
    Executing SMS log collection ..                               Connection closed by foreign host. <<<
  5. Jakmile se collect-diagnostics zobrazí jako zastavené, krok 3 výše, vraťte se do druhé relace PuTTY a pomocí příkazu cd přejděte do adresáře /diag, poté spusťte příkaz "ll " a měly by se zobrazit další adresáře.

    • collect-diagnostics-tmp
    • collect-diagnostics-jobs
    • collect-diagnostics-tmp-ext*
      *pokud nebyly vynechány rozšířené soubory

    Ukázkový výstup:

    service@director-1-1-b:/diag> ll 
    total 32 
    drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:03 collect-diagnostics-tmp-ext
    drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:03 collect-diagnostics-jobs 
    drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:04 collect-diagnostics-out 
    drwxr-xr-x 3 service groupSvc  4096 Feb  9 20:02 collect-diagnostics-tmp 
    drwx------ 2 root    root     16384 Jan 27 16:54 lost+found 
    drwx--x--x 3 service groupSvc  4096 Dec 17 03:08 share 
    service@director-1-1-b:/diag>
  6. Pokud se podíváte do každého z těchto adresářů, uvidíte soubory s datem a časem, kdy jste spustili nyní zrušenou collect-diagnostics. Tyto soubory zabírají místo v oddílu /diag a měly by být odebrány.

  7. Chcete-li odebrat/odstranit soubory z adresáře /dag, zadejte příkaz "rm -r collect-diagnostics-jobs" a "rm -r collect-diagnostics-tmp" a poté znovu zadejte "ll", abyste měli jistotu, že byly adresáře odstraněny nebo odstraněny.

    Ukázkový výstup:

    service@director-1-1-b:/diag> rm -r collect-diagnostics-jobs 
    service@director-1-1-b:/diag> rm -r collect-diagnostics-tmp 
    
    service@director-1-1-b:/diag> ll 
    total 24 
    drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:04 collect-diagnostics-out 
    drwx------ 2 root    root     16384 Jan 27 16:54 lost+found 
    drwx--x--x 3 service groupSvc  4096 Dec 17 03:08 share 
    service@director-1-1-b:/diag>
  8. Pokud adresář „collect-diagnostics-tmp-ext“ existuje, odeberte jej příkazem „rm -r collect-diagnostics-tmp-ext

    Poznámka: Rozšířený soubor se obvykle používá k šetření selhání uzlu. Pokud probíhá šetření selhání uzlu a podpora nezachytila všechny potřebné protokoly, obraťte se před vyčištěním adresáře collect-diagnostics-tmp-ext na podporu, protože by to mohlo odstranit potřebné soubory jádra.

 

Produtos afetados

metro node mn-114, metro node mn-215
Propriedades do artigo
Número do artigo: 000197436
Tipo de artigo: How To
Último modificado: 01 jul. 2025
Versão:  8
Encontre as respostas de outros usuários da Dell para suas perguntas.
Serviços de suporte
Verifique se o dispositivo está coberto pelos serviços de suporte.