Вузол метрополітену: Як зібрати журнали з вузла метро
Summary: У цій статті описано кроки щодо збору журналів із вузла метрополітену, а також описано, які журнали/дані можуть знадобитися для вирішення проблеми з продуктивністю.
Instructions
Кроки для виконання наступних завдань:
- Які журнали потрібні для налагодження проблем із вузлом метро?
- Як провести діагностику збору даних на кластері вузла метрополітену?
- Як перевірити існуючі пакети збору та діагностики на серверах управління.
- Як скасувати і навести лад в поточному збірнику-діагностиці в вузлі метрополітену?
A. Які журнали потрібні для налагодження проблем із вузлом метро?
-
Команда, яка необхідна для збору журналів з вузла метрополітену, називається "collect-diagnostics" і може бути виконана з будь-якого вузла(*1) в налаштуваннях вузла метрополітену. Виконання цієї команди на одному директорі кластера вузла метрополітену повинно мати всі дані від усіх директорів, від усіх вузлів кластера. НЕ виконуйте цю команду більш ніж на одному вузлі одночасно.
*1 ПРИМІТКА. Запустіть команду 'collect-diagnostics' тільки від одного директора, тільки від одного кластера, якщо це конфігурація Metro, і дочекайтеся її повного завершення, перш ніж збирати CD від іншого директора або від однорангового кластера, якщо це необхідно. -
Команда 'collect-diagnostics' створює стиснений файл журналу tar.gz, що містить конфігурацію та файли журналу. Файл collect-diagnostics розміщується в директорії /diag/collect-diagnostics-out/ на вузлі, з якого він був запущений. Як тільки команда завершиться, використовуйте WINSCP або еквівалентну утиліту SCP, щоб скопіювати файл з вузла, після чого він може бути наданий для підтримки аналізу. Докладнішу інформацію про використання цієї команди можна знайти в розділі B нижче.
Нотатки:- Якщо команда «collect-diagnostics» виконується без варіантів, генеруються два файли: базовий файл і розширений файл. На масштабованих системах це може зайняти досить багато часу.
- Підтримка вузлів Metro зазвичай вимагає лише файлу Base, однак у деяких обставинах через проблеми з продуктивністю вони можуть попросити і розширений файл.
- Стандартними опціями, які може бути запитано для використання під час запуску збіру-діагностики, є:
- "
--noextended": Цей параметр не включає збір розширеної діагностики. - "
--last-logs": Цей параметр фіксує журнали назад x кількість годин або днів.
- "
- Щоб дізнатися більше про команду, ви можете ввести "collect-diagnostics -h"
Ось приклади того, як виглядають ці дві назви файлів, дата й час, що відображаються як YYYY-MM-DD-HH.MM.SS, походять від дати та часу їх збирання:
- Базовий файл:
<Serial number>-c1-diag-YYYY-MM-DD-HH.MM.SS.tar.gz - Розширений файл:
<Serial number>-c1-diag-ext-YYYY-MM-DD-HH.MM.SS.tar.gz
-
Питання продуктивності є складними і вимагають збору великої кількості конкретної інформації. В результаті ми маємо опитувальник продуктивності, який клієнти просять заповнити, щоб прискорити цей процес. Анкету можна знайти у прикріпленій до цієї статті бази знань у розділі вкладень в кінці.
-
У деяких типах проблем із продуктивністю корисно записувати додатковий журнал під назвою «fe_perf_stats». Журнали безперервно генеруються, але не фіксуються за допомогою collect-діагностики. Щоб захопити цей журнал, cd (change directory) на /var/log/VPlex/cli на вузлі з кожного кластера та виконайте команду "tar cvzf fe-perf-stats.tar.gz fe_perf_stats*" для стиснення даних файлів у файл tar. Підключіться до вузла за допомогою WINSCP або еквівалентної утиліти SCP і перейдіть до /var/log/VPlex/cli. Скопіюйте файл "fe-perf-stats.tar.gz" у свою систему. Завантажте файл tar разом з одним або декількома файлами для збирання-діагностики, якщо цього вимагає служба підтримки, до SR або ftp-посилання, яке підтримка надає вам у SR та електронною поштою.
-
Окрім збору діагностики, може бути корисно зібрати наступну інформацію;
- Відкрийте каротаж для сеансу шпаклівки,
- Потім виконайте наведені нижче команди,
- Потім зберіть журнал Putty і завантажте його у свою систему,
- Потім прикріпіть журнал PuTTY, збір-діагностику та будь-які інші запитувані дані до SR.
Наступні команди слід виконувати з командного рядка VPlexcli.
cluster statusll clusters/**/storage-views/* --fullll ~portsshow-use-hierarchy /clusters/**/virtual-volumes/*ll ~system-volumesls -t /clusters/*/directors/*::serial-number(ця команда перелічує всі DST для кожного вузла)ls -t /clusters/**/director-*/::hostname(відображаються імена хостів - це IP-адреси, це очікувано)
B. Як провести діагностику збору даних на кластері вузла метрополітену?
Щоб зафіксувати ці дані, запустіть команду збирання-діагностики з такими прапорцями: "--noextended" та "--last-logs 30d".
-
Встановіть сеанс SSH на директорському вузлі Linux, наприклад, service@director-1-1-a, а потім увійдіть у vplexcli.
Приклад виходу:
login as: service Keyboard-interactive authentication prompts from server: | Password: End of keyboard-interactive prompts from server Last login: <date and timestamp data> from x.x.x.x service@director-1-1-a:~> service@director-1-1-a:~> vplexcli Trying ::1... Connected to localhost. Escape character is '^]'. VPlexcli:/>
-
Щоб запустити збір-діагностику, у підказці vplexcli запустіть команду "collect-diagnostics" з вказаними опціями, як показано в прикладі нижче.
Приклад виведення:
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2024-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 2024-02-09 19:55:13 UTC: No cluster-witness server found. 2024-02-09 19:55:13 UTC: Free space = 88G 2024-02-09 19:55:13 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection ..
C. Як перевірити існуючі пакети збирання-діагностики на директорі/вузлі.
-
Коли команда collect-diagnostics завершиться і повернеться до запиту vplexcli, підключіться до директора, з якого ви виконали команду за допомогою winscp [або еквівалентної утиліти SCP] і перейдіть до папки /diag/collect-diagnostics-out/
-
Визначте один або кілька файлів журналу з правильною позначкою часу та завантажте їх на свою локальну робочу станцію.
D. Як скасувати поточну інкасаторську діагностику
-
Якщо ви все ще перебуваєте на сеансі PuTTY, де ви розпочали збирання-діагностику, ви повинні бачити потокове передавання результатів збірки-діагностики, показуючи, що він все ще працює.
Приклад виходу:
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2022-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 2022-02-09 19:55:13 UTC: No cluster-witness server found. 2022-02-09 19:55:13 UTC: Free space = 88G 2022-02-09 19:55:13 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection .. -
Відкрийте дублікат сеансу PuTTY та авторизуйтесь у директора, з якого ви починали збір-діагностику, використовуючи обліковий запис сервісу.
Приклад виходу:
login as: service Using keyboard-interactive authentication. Password: Last login: <date and time stamp data> from x.x.x.x service@director-1-1-b:~>
-
Увійшовши до директора, перезавантажте консоль керування, використовуючи наступну команду, щоб скасувати запущений збір-діагностику.
Приклад виходу:
service@director-1-1-b:~> sudo systemctl restart VPlexManagementConsole.service
-
Озираючись назад на перший сеанс PuTTY, в якому запущено збирання-діагностику, коли ви перезавантажили консоль керування, ви повинні побачити звіт про збір-діагностику з наступним як останній зазначений вихід:
"Connection closed by foreign host."
Приклад виводу (перевірте останній рядок виводу):
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2022-02-09 20:02:03 UTC: ****Initializing collect-diagnostics... 2022-02-09 20:02:04 UTC: No cluster-witness server found. 2022-02-09 20:02:04 UTC: Free space = 88G 2022-02-09 20:02:04 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection .. ERROR Executing SMS log collection .. Connection closed by foreign host. <<< -
Як тільки збирання діагностики буде видно, що він зупинений, крок 3 вище, поверніться до другого сеансу PuTTY і 'cd' до каталогу /diag, потім запустіть 'll ' і ви повинні побачити кілька додаткових каталогів,
collect-diagnostics-tmpcollect-diagnostics-jobscollect-diagnostics-tmp-ext*
*якщо розширені файли не були пропущені
Приклад виходу:
service@director-1-1-b:/diag> ll total 32 drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:03 collect-diagnostics-tmp-ext drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:03 collect-diagnostics-jobs drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:04 collect-diagnostics-out drwxr-xr-x 3 service groupSvc 4096 Feb 9 20:02 collect-diagnostics-tmp drwx------ 2 root root 16384 Jan 27 16:54 lost+found drwx--x--x 3 service groupSvc 4096 Dec 17 03:08 share service@director-1-1-b:/diag>
-
Якщо ви заглянете всередину кожного з цих каталогів, ви побачите файли з датою і часом, коли ви почали скасований збір-діагностику. Ці файли займають місце в розділі /diag і повинні бути видалені.
-
Щоб видалити/видалити файли з каталогу /diag, введіть "rm -r collect-diagnostics-jobs" і "rm -r collect-diagnostics-tmp", а потім знову введіть 'll', щоб переконатися, що каталоги були видалені або видалені.
Приклад виходу:
service@director-1-1-b:/diag> rm -r collect-diagnostics-jobs service@director-1-1-b:/diag> rm -r collect-diagnostics-tmp service@director-1-1-b:/diag> ll total 24 drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:04 collect-diagnostics-out drwx------ 2 root root 16384 Jan 27 16:54 lost+found drwx--x--x 3 service groupSvc 4096 Dec 17 03:08 share service@director-1-1-b:/diag>
-
Якщо каталог 'collect-diagnostics-tmp-ext' існує, видаліть його, запустивши "rm -r collect-diagnostics-tmp-ext"
Примітка: Розширений файл зазвичай використовується для розслідування збоїв вузлів. Якщо триває розслідування збою вузла, а підтримка не зібрала всі необхідні журнали, зверніться до служби підтримки, перш ніж очищати каталог collect-diagnostics-tmp-ext, оскільки це може видалити необхідні файли ядра.