Dell Unity: Як зібрати необхідну інформацію для аналізу ефективності Unity
Summary: У цій статті показано, як збирати журнали та дані для діагностики проблем із продуктивністю масивів Unity.
Instructions
Випуск
-
Низька продуктивність читання або запису (або обидва) або високий час відгуку для підключених хостів.
-
Час відгуку для хост-додатків збільшився або є неприйнятно високим.
-
Проблеми з продуктивністю на масиві Dell Unity, що вимагає аналізу продуктивності.
Проблеми з продуктивністю можуть мати кілька причин. До них належать: конфігурація мережі, перевантаження, конфігурація хоста, апаратні збої, суперечка на диску (кілька зайнятих ЛУНів спільно використовують одні й ті ж диски) або масив зберігання при максимальному використанні.
Технічна підтримка Unity не може повністю досліджувати та усувати проблеми з продуктивністю, доки не буде надано наступне:
- Файл службових даних (збір даних)
- Файли UPA (Unity Performance Archives)
- Детальний опис симптомів, що виникають у виробничому середовищі
Несвоєчасне надання інформації в цій статті бази знань Dell (KB) може призвести до збільшення часу вирішення.
Деталі проблем з продуктивністю (симптоми, позначки часу тощо) мають вирішальне значення, щоб інженер знав, на чому зосередитися (час, ЛУНи, хости тощо), а не витрачати кілька годин на пошук проблеми (а не причини). Без цієї деталі можна витратити години на пошук проблеми лише для того, щоб мати змогу проаналізувати загальну статистику ефективності.
Масштаб
Служби підтримки клієнтів досліджують випадки продуктивності, щоб виявити проблеми, які впливають на сайти клієнтів. Налаштування продуктивності (для досягнення максимальної продуктивності для хоста або програми) та реконфігурація є завданням для адміністратора сховища або архітектора рішень – це не обробляється в запиті на службу Break-Fix.
Сервісні запити, які не пов'язані з визначеною проблемою, наприклад, запит звіту про поточний рівень робочого навантаження на масив, виходять за рамки статуту Break-Fix Support. Для самодопомоги або тих, кому потрібна допомога з визначенням рівня навантаження на масив, можна скористатися сервісом LiveOptics. Детальну інформацію про цей варіант дивіться в наступній статті:
Вимоги до даних та інформації для детального аналізу продуктивності
Для кожної події Технічній підтримці потрібні наступні журнали та інформація, які охоплюють період інциденту:
- Файли службових даних (також відомі як збір даних), створені невдовзі після виникнення проблеми.
- Якщо використовується реплікація, то потрібні файли Data Collects та UPA з обохмасивів.
- Файли Unity UPA (Unity Performance Archives), які охоплюють весь період, коли виникала проблема.
- Журнали захоплення хостів і перемикачів також можуть знадобитися, якщо проблема виявляється за межами масиву.
- Також може знадобитися трасування мережі Unity.
ПРОБЛЕМИ БЛОКУВАННЯ
- Надайте чіткий і детальний опис проблеми:
- Коли виникла проблема? (дата, час і часовий пояс)
- На які ЛУНи це впливає?
- Це важливо, щоб звузити коло пошуку.
- Чи ввімкнено скорочення даних або розширену дедуплікацію на LUN, у яких виникли проблеми? Чи ввімкнено зменшення обсягу даних для інших ЛУН? (Див. Білу книгу Unity Best Practices - Розділ Використання ЦП - стор. 9)
- Чи використовується реплікація? Надайте інформацію про RPO для реплікації та про те, чи покращується проблема з продуктивністю, якщо реплікацію призупинено.
- Чи були або в будь-який час були активні дані недоступні?
- Чи працює щось інше в зазначений час? (резервне копіювання, завдання, пакети, сканування на віруси, оптимізація хост-диска (TRIM/UNMAP) тощо)
- Якщо щось працює не так, як повинно, чи працювало це коли-небудь? Або це частина нової реалізації/налаштування? Чи були нещодавно додані нові програми або хости?
- Як вимірюється ефективність або який вплив? Затримки або помилки на стороні господаря? Чи повідомляють кінцеві користувачі про повільність?
- Чи є останні зміни в середовищі SAN (хости, комутатори, масив)?
- Impact (уражені програми, # уражених серверів, # постраждалих користувачів і так далі)
- Як часто виникає проблема? (постійно/регулярно/одноразово/випадково)
- Як звуть постраждалих господарів?
- Яка топологія використовується? FC, iSCSI чи Ethernet? (Якщо використовується iSCSI, всі хости ПОВИННІ мати відключений TCP Delayed ACK.
- Якщо проблема може бути пов'язана з підключенням, служба підтримки може запросити топологічну діаграму.
- Чи існує відома проблема в мережі одночасно або мережа була модернізована нещодавно? Також переконайтеся, що iSCSI не використовується у внутрішній локальній мережі, а всі використовувані комутатори мають бути комутаторами класу Enterprise.
ПРОБЛЕМИ З ФАЙЛАМИ
- Надайте чіткий і детальний опис проблеми:
- Про які конкретні протоколи йдеться?
- Приклад: NFS (версія), CIFS (версія), NDMP, iSCSI, FTP і так далі
- Чи пов'язана проблема з конкретним експортом/спільним ресурсом, файловою системою/LUN?
- В який час доби виникає проблема? (дата, час і часовий пояс)
- Яке активне навантаження на той момент?
- Приклади: вхід, вихід, резервне копіювання, пакетні завдання тощо
- Які ведучі беруть участь?
- Приклад: Резервні копії, віртуальні машини, робочі станції, сервери тощо?
- Конкретні подробиці щодо заявки.
- Як виглядає конфігурація мережі?
- Надайте конкретні деталі інтерфейсу/NIC.
- Чи ізольовані мережеві інтерфейси на окремих мережевих адаптерах?
- Приклад: Реплікаційний трафік на виділеному NIC
Збір файлу службових даних (збір даних)
Щоб зібрати файл службових даних (збір даних), перегляньте статтю LKB 000023676. Вихідні файли з запущеного файлу даних Service на масиві необхідні для відображення детальної конфігурації масиву та будь-яких подій, які відбулися на масиві. Служба підтримки рекомендує клієнтам збирати файл даних служби (збір даних) якомога швидше після того, як сталася подія.
Майте на увазі, що файл даних Служби містить останній повний файл УПА (одна година) та всі доступні -tmp.archive Файл УПА. Часто цієї інформації недостатньо для належного оцінювання діяльності та потрібні додаткові УПА.
Щоб знайти файл UPA у файлі службових даних (збір даних), перейдіть до розділу spx\cmd_outputs\metrics\
-
spx= Первинний ІП -
Приклад: Якщо СПА є активним ІП, то ВАП знаходиться під
spa\cmd_outputs\metrics
Збір файлів УПА
- Служба підтримки може попросити додаткові файли UPA.
- На відміну від Service Data File (Data Collect), масив зберігає до 48 годин файли UPA.
- Файли УПА виглядають так, як наведено в наведеному нижче прикладі. Ім'я кожного файлу містить дату й час першої точки даних у файлі. Інтервал становить 10 секунд і охоплює одну годину мінус 10 секунд. Дата й час у назвах файлів — UTC/GMT.
- Останній файл УПА у наведеному нижче прикладі є найактуальнішим архівом (
-tmp.archive). Він містить поточні дані про продуктивність і може бути скопійований з масиву (використовуючи лише SSH/CLI) для перегляду найновіших даних. Служба підтримки може використовувати цей файл для перегляду подій продуктивності, не чекаючи наступної години.
- Останній файл УПА у наведеному нижче прикладі є найактуальнішим архівом (
Приклад файлів UPA, що зберігаються на масиві Dell Unity:01/05/2017 10:59 AM 11,017,216 _default_20170105_150000.archive
01/05/2017 11:59 AM 11,017,216 _default_20170105_160000.archive
01/05/2017 01:00 PM 11,017,216 _default_20170105_170000.archive
01/05/2017 01:59 PM 10,983,424 _default_20170105_180000.archive
01/05/2017 02:45 PM 8,308,736 _default_20170105_190000-tmp.archive
Варіант 1: Список Unisphere
Ця опція доступна лише для Unity OE 4.2 і вище. Всі наявні УПА тут можуть не вказуватися. Інтерфейс користувача (Unisphere) обмежений, і можна перелічити лише деякі доступні файли. Якщо потрібного файлу UPA немає в списку, перейдіть до варіанту 2 або використовуйте SSH/CLI.
Варіант 2: Часовий діапазон Unisphere
- Ви можете вибрати часовий діапазон, за який система може отримати доступні УПА.
- Підтвердьте час видачі перед збиранням журналів, щоб завантажувати лише необхідні журнали.
- Майте на увазі, що діапазон часу клієнта вказується за локальним часом браузера і часто збігається з поточним часом робочої станції.
- Ця опція доступна лише для Unity OE 4.2 і вище

Використання SSH/CLI
CLI також можна використовувати для доступу до більшої кількості UPA, які знаходяться в масиві Unity (але які не вказані в UI (Unisphere) за варіантом 1.
-
Авторизуйтесь за допомогою користувача сервісу та пароля послуги
-
Скопіюйте потрібні журнали в
/cores/service/userвід/EMC/backend/metricsluna1/archives -
Завантажте ці журнали за допомогою WinSCP або аналогічного інструменту
-
Якщо масив використовується на OE 4.5.X або новішої версії, змініть файловий протокол на SCP
-
Логін за допомогою користувача сервісу та пароля сервісу
-
ll /EMC/backend/metricsluna1/archives/
cp /EMC/backend/metricsluna1/archives/_default_20230221_180000.archive.gz /cores/service/user
Примітка: Якщо ви збираєте лише поточні УПА, вам може знадобитися |tail-10, оскільки на сервері доступні десятки файлів UPA; Однак ви можете перерахувати їх усі.

Збір
даних хостаМожуть знадобитися вихідні файли Host Grab (або EMC Report), особливо якщо проблема є унікальною для конкретних хостів.
-
Перейдіть на https://www.dell.com/support/home/ (сайт підтримки Dell) і знайдіть утиліту Grab Utility для потрібної ОС хоста (приклад: ESXi захоплення хоста)
-
Завантажте утиліту та файл README.
-
Дотримуйтесь файлу README, щоб запустити утиліту для обраної операційної системи хоста.
Журнали перемикань
Якщо проблема з продуктивністю існує лише на певних шляхах, можуть знадобитися журнали перемикань. Дивіться наступні інструкції LKB (залежно від моделі, що використовується):
Парча/Коннектрикс
Захоплення мережевих трас (TCP-дамп)
Деякі проблеми з продуктивністю файлів можуть бути пов'язані з проблемами мережі. Щоб повністю визначити причину проблеми, служба підтримки може запросити трасування мережі.
Dell Unity: Як захопити трасування мережі TCP/IP з масиву. (Виправляється користувачем)