Вузол метрополітену: Як зібрати журнали з вузла метро

Summary: У цій статті описано кроки щодо збору журналів із вузла метрополітену, а також описано, які журнали/дані можуть знадобитися для вирішення проблеми з продуктивністю.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Кроки для виконання наступних завдань:

  1. Які журнали потрібні для налагодження проблем із вузлом метро?
  2. Як провести діагностику збору даних на кластері вузла метрополітену?
  3. Як перевірити існуючі пакети збору та діагностики на серверах управління.
  4. Як скасувати і навести лад в поточному збірнику-діагностиці в вузлі метрополітену?

A. Які журнали потрібні для налагодження проблем із вузлом метро?

  1. Команда, яка необхідна для збору журналів з вузла метрополітену, називається "collect-diagnostics" і може бути виконана з будь-якого вузла(*1) в налаштуваннях вузла метрополітену. Виконання цієї команди на одному директорі кластера вузла метрополітену повинно мати всі дані від усіх директорів, від усіх вузлів кластера. НЕ виконуйте цю команду більш ніж на одному вузлі одночасно.

    *1 ПРИМІТКА. Запустіть команду 'collect-diagnostics' тільки від одного директора, тільки від одного кластера, якщо це конфігурація Metro, і дочекайтеся її повного завершення, перш ніж збирати CD від іншого директора або від однорангового кластера, якщо це необхідно.
  2. Команда 'collect-diagnostics' створює стиснений файл журналу tar.gz, що містить конфігурацію та файли журналу. Файл collect-diagnostics розміщується в директорії /diag/collect-diagnostics-out/ на вузлі, з якого він був запущений. Як тільки команда завершиться, використовуйте WINSCP або еквівалентну утиліту SCP, щоб скопіювати файл з вузла, після чого він може бути наданий для підтримки аналізу. Докладнішу інформацію про використання цієї команди можна знайти в розділі B нижче.

    Нотатки:
    • Якщо команда «collect-diagnostics» виконується без варіантів, генеруються два файли: базовий файл і розширений файл. На масштабованих системах це може зайняти досить багато часу.
    • Підтримка вузлів Metro зазвичай вимагає лише файлу Base, однак у деяких обставинах через проблеми з продуктивністю вони можуть попросити і розширений файл.
    • Стандартними опціями, які може бути запитано для використання під час запуску збіру-діагностики, є:
      • "--noextended": Цей параметр не включає збір розширеної діагностики.
      • "--last-logs": Цей параметр фіксує журнали назад x кількість годин або днів.
    • Щоб дізнатися більше про команду, ви можете ввести "collect-diagnostics -h"

    Ось приклади того, як виглядають ці дві назви файлів, дата й час, що відображаються як YYYY-MM-DD-HH.MM.SS, походять від дати та часу їх збирання:

    • Базовий файл: <Serial number>-c1-diag-YYYY-MM-DD-HH.MM.SS.tar.gz
    • Розширений файл: <Serial number>-c1-diag-ext-YYYY-MM-DD-HH.MM.SS.tar.gz
  3. Питання продуктивності є складними і вимагають збору великої кількості конкретної інформації. В результаті ми маємо опитувальник продуктивності, який клієнти просять заповнити, щоб прискорити цей процес. Анкету можна знайти у прикріпленій до цієї статті бази знань у розділі вкладень в кінці.

  4. У деяких типах проблем із продуктивністю корисно записувати додатковий журнал під назвою «fe_perf_stats». Журнали безперервно генеруються, але не фіксуються за допомогою collect-діагностики. Щоб захопити цей журнал, cd (change directory) на /var/log/VPlex/cli на вузлі з кожного кластера та виконайте команду "tar cvzf fe-perf-stats.tar.gz fe_perf_stats*" для стиснення даних файлів у файл tar. Підключіться до вузла за допомогою WINSCP або еквівалентної утиліти SCP і перейдіть до /var/log/VPlex/cli. Скопіюйте файл "fe-perf-stats.tar.gz" у свою систему. Завантажте файл tar разом з одним або декількома файлами для збирання-діагностики, якщо цього вимагає служба підтримки, до SR або ftp-посилання, яке підтримка надає вам у SR та електронною поштою.

  5. Окрім збору діагностики, може бути корисно зібрати наступну інформацію;

    • Відкрийте каротаж для сеансу шпаклівки,
    • Потім виконайте наведені нижче команди,
    • Потім зберіть журнал Putty і завантажте його у свою систему,
    • Потім прикріпіть журнал PuTTY, збір-діагностику та будь-які інші запитувані дані до SR.

    Наступні команди слід виконувати з командного рядка VPlexcli.

    1. cluster status
    2. ll clusters/**/storage-views/* --full
    3. ll ~ports
    4. show-use-hierarchy /clusters/**/virtual-volumes/*
    5. ll ~system-volumes
    6. ls -t /clusters/*/directors/*::serial-number (ця команда перелічує всі DST для кожного вузла)
    7. ls -t /clusters/**/director-*/::hostname (відображаються імена хостів - це IP-адреси, це очікувано)

B. Як провести діагностику збору даних на кластері вузла метрополітену?

Примітка: Базового файлу, що охоплює останні 30 днів, достатньо для розслідування та вирішення більшості проблем. Ці параметри слід використовувати, якщо служба підтримки не вказала інакше.
Щоб зафіксувати ці дані, запустіть команду збирання-діагностики з такими прапорцями: "--noextended" та "--last-logs 30d".
  1. Встановіть сеанс SSH на директорському вузлі Linux, наприклад, service@director-1-1-a, а потім увійдіть у vplexcli.

    Приклад виходу:

    login as: service
    Keyboard-interactive authentication prompts from server:
    | Password:
    End of keyboard-interactive prompts from server
    Last login: <date and timestamp data> from x.x.x.x
    service@director-1-1-a:~>
    service@director-1-1-a:~> vplexcli
    Trying ::1...
    Connected to localhost.
    Escape character is '^]'.
    
    VPlexcli:/>
  2. Щоб запустити збір-діагностику, у підказці vplexcli запустіть команду "collect-diagnostics" з вказаними опціями, як показано в прикладі нижче.

    Приклад виведення:

    VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 
    
    ('WARNING:The collect-diagnostics command was issued with option --noextended.
    ',) 
    
    The following file(s) will NOT be collected: 
    
            core files 
            fast trace dump files 
            slow trace dump files 
            udcom trace dump files 
            udcom legacy trace files 
            user-defined performance sink files 
            the management console's heap 
    
    ('WARNING:Only the logs that are generated in the last 30 days are collected.') 
    
    2024-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 
    2024-02-09 19:55:13 UTC: No cluster-witness server found. 
    2024-02-09 19:55:13 UTC: Free space = 88G 
    2024-02-09 19:55:13 UTC: Total space needed = 1907M 
    
    ================================================================================ 
    
    Starting collect-diagnostics, this operation might take a while... 
    
    ================================================================================ 
    
    Executing cluster collection ..

C. Як перевірити існуючі пакети збирання-діагностики на директорі/вузлі.

  1. Коли команда collect-diagnostics завершиться і повернеться до запиту vplexcli, підключіться до директора, з якого ви виконали команду за допомогою winscp [або еквівалентної утиліти SCP] і перейдіть до папки /diag/collect-diagnostics-out/

  2. Визначте один або кілька файлів журналу з правильною позначкою часу та завантажте їх на свою локальну робочу станцію.

D. Як скасувати поточну інкасаторську діагностику

Примітка: Це неруйнівна діяльність. Оскільки прямих команд для скасування процесу збору немає, вам доведеться перезавантажити консоль керування. Проте, перш ніж перервати запущений збір-діагностику, зверніться до служби підтримки, щоб пояснити, чому ви хочете скасувати запуск збиральної діагностики, щоб переконатися, що з нею все гаразд, оскільки можуть бути втрачені дані. Ці втрачені дані не будуть доступні для збору знову, коли діагностика збору буде повторно запущена після дії скасування.
  1. Якщо ви все ще перебуваєте на сеансі PuTTY, де ви розпочали збирання-діагностику, ви повинні бачити потокове передавання результатів збірки-діагностики, показуючи, що він все ще працює.

    Приклад виходу:

    VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 
    
    ('WARNING:The collect-diagnostics command was issued with option --noextended.
    ',) 
    
    The following file(s) will NOT be collected: 
    
            core files 
            fast trace dump files 
            slow trace dump files 
            udcom trace dump files 
            udcom legacy trace files 
            user-defined performance sink files 
            the management console's heap 
    
    ('WARNING:Only the logs that are generated in the last 30 days are collected.') 
    
    2022-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 
    2022-02-09 19:55:13 UTC: No cluster-witness server found. 
    2022-02-09 19:55:13 UTC: Free space = 88G 
    2022-02-09 19:55:13 UTC: Total space needed = 1907M 
    
    ================================================================================ 
    
    Starting collect-diagnostics, this operation might take a while... 
    
    ================================================================================ 
    
    Executing cluster collection ..
  2. Відкрийте дублікат сеансу PuTTY та авторизуйтесь у директора, з якого ви починали збір-діагностику, використовуючи обліковий запис сервісу.

    Приклад виходу:

    login as: service 
    Using keyboard-interactive authentication. 
    Password: 
    Last login: <date and time stamp data> from x.x.x.x 
    service@director-1-1-b:~>
  3. Увійшовши до директора, перезавантажте консоль керування, використовуючи наступну команду, щоб скасувати запущений збір-діагностику.

    Приклад виходу:

    service@director-1-1-b:~> sudo systemctl restart VPlexManagementConsole.service
  4. Озираючись назад на перший сеанс PuTTY, в якому запущено збирання-діагностику, коли ви перезавантажили консоль керування, ви повинні побачити звіт про збір-діагностику з наступним як останній зазначений вихід:

    "Connection closed by foreign host."

    Приклад виводу (перевірте останній рядок виводу):

    VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 
    
    ('WARNING:The collect-diagnostics command was issued with option --noextended.
    ',) 
    
    The following file(s) will NOT be collected: 
    
            core files 
            fast trace dump files 
            slow trace dump files 
            udcom trace dump files 
            udcom legacy trace files 
            user-defined performance sink files 
            the management console's heap 
    
    ('WARNING:Only the logs that are generated in the last 30 days are collected.') 
    
    2022-02-09 20:02:03 UTC: ****Initializing collect-diagnostics... 
    2022-02-09 20:02:04 UTC: No cluster-witness server found. 
    2022-02-09 20:02:04 UTC: Free space = 88G 
    2022-02-09 20:02:04 UTC: Total space needed = 1907M 
    
    ================================================================================ 
    
    Starting collect-diagnostics, this operation might take a while... 
    
    ================================================================================ 
    
    Executing cluster collection ..                               ERROR 
    Executing SMS log collection ..                               Connection closed by foreign host. <<<
  5. Як тільки збирання діагностики буде видно, що він зупинений, крок 3 вище, поверніться до другого сеансу PuTTY і 'cd' до каталогу /diag, потім запустіть 'll ' і ви повинні побачити кілька додаткових каталогів,

    • collect-diagnostics-tmp
    • collect-diagnostics-jobs
    • collect-diagnostics-tmp-ext*
      *якщо розширені файли не були пропущені

    Приклад виходу:

    service@director-1-1-b:/diag> ll 
    total 32 
    drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:03 collect-diagnostics-tmp-ext
    drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:03 collect-diagnostics-jobs 
    drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:04 collect-diagnostics-out 
    drwxr-xr-x 3 service groupSvc  4096 Feb  9 20:02 collect-diagnostics-tmp 
    drwx------ 2 root    root     16384 Jan 27 16:54 lost+found 
    drwx--x--x 3 service groupSvc  4096 Dec 17 03:08 share 
    service@director-1-1-b:/diag>
  6. Якщо ви заглянете всередину кожного з цих каталогів, ви побачите файли з датою і часом, коли ви почали скасований збір-діагностику. Ці файли займають місце в розділі /diag і повинні бути видалені.

  7. Щоб видалити/видалити файли з каталогу /diag, введіть "rm -r collect-diagnostics-jobs" і "rm -r collect-diagnostics-tmp", а потім знову введіть 'll', щоб переконатися, що каталоги були видалені або видалені.

    Приклад виходу:

    service@director-1-1-b:/diag> rm -r collect-diagnostics-jobs 
    service@director-1-1-b:/diag> rm -r collect-diagnostics-tmp 
    
    service@director-1-1-b:/diag> ll 
    total 24 
    drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:04 collect-diagnostics-out 
    drwx------ 2 root    root     16384 Jan 27 16:54 lost+found 
    drwx--x--x 3 service groupSvc  4096 Dec 17 03:08 share 
    service@director-1-1-b:/diag>
  8. Якщо каталог 'collect-diagnostics-tmp-ext' існує, видаліть його, запустивши "rm -r collect-diagnostics-tmp-ext"

    Примітка: Розширений файл зазвичай використовується для розслідування збоїв вузлів. Якщо триває розслідування збою вузла, а підтримка не зібрала всі необхідні журнали, зверніться до служби підтримки, перш ніж очищати каталог collect-diagnostics-tmp-ext, оскільки це може видалити необхідні файли ядра.

 

Affected Products

metro node mn-114, metro node mn-215
Article Properties
Article Number: 000197436
Article Type: How To
Last Modified: 01 Jul 2025
Version:  8
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.