VPLEX: Як діагностувати та моніторити проблеми з бекендом за допомогою покращеного управління шляхами бек-енду (BEPM) у GeoSynchrony 6.2
Summary: У цій статті розглядається функція управління шляхами Back-End (BE), яка була додана до GeoSynchrony 6.2 та пізніших версій. Також розглядається питання перевантаження бекенд-мережі через змінену функціональність BE Path Management. ...
Symptoms
До GeoSynchrony 6.2 VPLEX не зміг ізолювати деякі шляхи до Back-End томів зберігання, які мали високу затримку через перевантаження тканини або проблеми з масивом зберігання. У версії 6.2 VPLEX автоматично ізолює погано працюючі шляхи до обсягів зберігання (шляхи з високою затримкою) і автоматично відновлює їх, коли продуктивність відновлюється до прийнятного рівня.
Нові телефонні будинки, представлені в GeoSynchrony 6.2:
0x8a6b6001 - bepm/1 - Продуктивність бекенд-ІТ-вузла впала нижче прийнятних рівнів.
0x8a6b6004 - bepm/4 - На бекенд-ІТ-нексусі виявлено повторювані періоди поганої продуктивності.
0x8a6b6007 bepm/7 — Усі Initiator-Target-LUN (ITL) до логічного блоку на цьому директорі мають низьку продуктивність, тому логічний блок позначається як деградований.
Back-End шляхи складаються з Initiator (VPLEX BE-порт) та Target (порт на масиві) і називаються IT-Nexus.
Нові команди CLI для перевірки, які шляхи BE можуть перебувати у деградованому стані:back-end degraded list і back-end degraded recover
Зверніться до посібника VPLEX 6.2 CLI для отримання додаткової інформації про використання цих команд.
The back-end degraded list команда показує будь-які I-T, які VPLEX погіршив через високу затримку.
Нижче показано використання help (-h) опція з командою, щоб побачити, як можна використовувати команду:
VPlexcli:/>back-end degraded list -h
Синопсис: list [<options>]
Це відображає список деградованих I-Ts:
options (* = обов'язково):
-h | --help
Відображає використання цієї команди.
--verbose
Забезпечує більший вихід під час виконання команд. Це може не мати жодного впливу на деякі команди.
-g | --group-by= <group_by>
Група, деградована I-T на задане поле. Підтримувані поля: масив, директор
Приклад ІТ, позначених як деградовані — відображається з Degradation Reason з Degraded performance:
VPlexcli:/>back-end деградований список
Деградовані I-Ts:
Director Ініціатор порту Director Причина
деградації цільового масиву-------------- ------------- ------------------ ------------------ --------------------------- --------------------
director-1-1-A A1-FC00 0xc00144878f110800 0x50060160086429bb EMC-CLARiiON-APM00140624008 Погіршена продуктивність
A1-FC00 0xc00144878f110800 0xc00144878f3d0000 EMC-Invista-LABRATS4900007 Знижена продуктивність
A1-FC00 0xc00144878f110800 0xc00144878f3d0200 EMC-Invista-LABRATS4900007 Понижена продуктивність
A1-FC01 0xc00144878f110900 0xc00144878f3d0100 EMC-Invista-LABRATS4900007 Понижена продуктивність
A1-FC01 0xc00144878f110900 0xc00144878f3d0300 EMC-Invista-LABRATS4900007 Погіршена продуктивність
director-1-1-B B1-FC00 0xc00144878f118800 0xc00144878f3d0000 EMC-Invista-LABRATS4900007 Понижена продуктивність
B1-FC00 0xc00144878f118800 0xc00144878f3d0200 EMC-Invista-LABRATS4900007 Понижена продуктивність
B1-FC01 0xc00144878f118900 0xc00144878f3d0100 EMC-Invista-LABRATS4900007 Понижена продуктивність
B1-FC01 0xc00144878f118900 0xc00144878f3d0300 EMC-Invista-LABRATS4900007 Погіршена продуктивність
Якщо бекенд-ІТ-шлях тричі змінюється між деградованим і недеградованим (фліпування) протягом 30-хвилинного періоду, то ІТ-нексус вважається нестабільним, і VPLEX автоматично припиняє використовувати ІТ-нексус для вводу/виводу з хоста та повідомляє про подію call home 0x8a6b6004 або bepm/4 у журналах прошивки. Коли в цьому стані back-end degraded list Списки команд Degradation Reason як Isolated due to unstable performance.
У цьому випадку ІТ-Нексус залишатиметься деградованим, доки кінцевий користувач не відновить його вручну за допомогою команди CLI back-end degraded recover, або досягається чотиригодинний поріг за замовчуванням, після чого позначається ІТ-Нексус Performance degraded поки процес відновлення перевіряє його стан перед відновленням (і автоматично повторно увімкнув шлях для обслуговування вводу/виводу на хості, якщо тести продуктивності проходили).
Приклад нестабільного стану (періодичне погіршення продуктивності) Degradation Reason є Isolated due to unstable performance:
VPlexcli:/>back-end деградований список
Деградований I-TS:
Director Director Initiator Причина
деградації цільового масиву-------------- порт ------------------ ------------------ ------------------------------- -----------------------
-------------- ------------ ------------------ ------------------ ------------------------------- -----------------------
director-1-1-A A1-FC00 0xc001448798b90800 0x5000097398037804 EMC-SYMMETRIX-197600222 Ізольовано через нестабільну продуктивність
A1-FC00 0xc001448798b90800 0x5000097398037805 EMC-SYMMETRIX-197600222 Ізольовано через нестабільну продуктивність
Якщо жоден шлях не погіршується, тоді back-end degraded list команда повідомляє про це:
VPlexcli:/>backend degraded list
Жоден шлях наразі не погіршується.
Інша нова команда CLI, back-end degraded recover, — це для деградованих бекенд-траекторій. Нижче показано використання help (-h) опція з back-end degraded recover команду, щоб побачити, як можна використовувати команду:
VPlexcli:/>back-end деградований recover -h
Синопсис: recover [<options>]
Відновлює вказані деградовані I-Ts:
options (* = обов'язково):
-h | --help
Відображає використання цієї команди.
--verbose
Забезпечує більший вихід під час виконання команд. Це може не мати жодного впливу на деякі команди.
-p | --paths= <шляхи>
Деградовані I-T для відновлення. Кожне I-T має бути виражене як пара у вигляді «(<ініціатор>,< ціль>)».
--увесь
Відновіть усі наразі деградовані I-T
.Приклад одиночного I-T для відновлення, що відображається з Degradation Reason з Isolated due to unstable performance:
VPlexcli:/>бекенд деградоване відновлення -p (0xc00144878bda0900,0x5006016547e01af9)
Відновлені I-T:
Director Port Initiator Причина
деградації цільового масиву-------------- ------------- ------------------ ------------------ --------------------------- ------------------
director-1-1-A A1-FC01 0xc00144878bda0900 0x5006016547e01af9 EMC-CLARiiON-APM00164919257 Ізольовано через нестабільну продуктивність
Приклад усіх деградованих I-T, які потрібно відновити:
VPlexcli:/>backend деградоване відновлення --всі
Відновлені I-T:
Director Port Initiator Причина деградації
цільового масиву-------------- ------------- ------------------ ------------------ --------------------------- ------------------
director-1-1-A A1-FC00 0xc00144878bda0800 0x5000144260321e00 EMC-Invista-rc-surry-1 Ізольований через нестабільну продуктивність
director-1-1-B B1-FC01 0xc00144878bda8900 0x5006016547e01af9 EMC-CLARiiON-APM00164919257 Ізольований через нестабільну продуктивність
. Якщо проблема з періодичною затримкою для ураженого ІТ-з'єднання триває, і користувач не може швидко вирішити корінну причину, рекомендується звернутися до служби підтримки клієнтів VPLEX через Live Chat, щоб вручну позначити ІТ-з'єднання погіршеним і видалити шлях з використання, доки не буде вирішено основну проблему.
Cause
Проблеми поза VPLEX, такі як перевантаження тканини або масиви, можуть призводити до проблем із бекендом VPLEX. Хоча GeoSynchrony 6.2 розроблена для кращого впорання з такими перевантаженнями BE, рекомендується вирішити цю проблему якомога швидше.
Для виявлення джерела перевантаження Dell має функцію моніторингу портів FC, яка відстежує помилки у тканині будь-якого порту BE FC. Результати допомагають звузити коло проблем із мережею у тканині. Станом на GeoSynchrony 6.2 монітор порту FC увімкнений за замовчуванням.
Якщо ви все ще використовуєте будь-яку версію GeoSynchrony 6.0.x або 6.1.x і ще не готові оновити до 6.2.x, щоб скрипт FC Port Monitoring був завантажений на ваш VPLEX, зверніться до служби підтримки Dell, щоб завантажити скрипт.
Resolution
GeoSynchrony 6.2 була розроблена для кращого впорання з таким типом перевантаження мережі. Коли активується функція BEPM коду VPLEX, вона вказує на проблеми поза межами VPLEX. Причину перевантаження мережі або проблем із масивом зберігання слід негайно усунути. Дані, отримані у журналах VPLEX, можна використати для звузення місця виникнення проблем. Після усунення проблеми VPLEX автоматично відновлює I-T, які тепер будуть здорові.