Dell Unity: Велика або зростаюча черга знімків, що спричиняє проблеми з продуктивністю
Summary: Dell Unity: Велика або зростаюча черга знімків, що спричиняє проблеми з продуктивністю, і високий рівень процесора зберігання даних (SP)
Symptoms
- Значення для Recover Point Objective (RPO) було зменшено до чогось, що вважається більш агресивним (тобто 10 хвилин). "
- «Мета точки відновлення (RPO) — це прийнятий у галузі термін, який вказує на прийнятний обсяг даних, який вимірюється в одиницях часу, які можуть бути втрачені в разі збою. Коли ви налаштовуєте сеанс асинхронної реплікації, ви можете налаштувати автоматичну синхронізацію на основі RPO. Ви можете вказати RPO від мінімум 5 хвилин до максимум 1440 хвилин (24 години). За замовчуванням RPO встановлено з інтервалом 60 хвилин (1 година). Для синхронної реплікації РПО фіксується на рівні 0.
- Є багато знімків у стані «руйнівний» для ЛУН.
- Кількість знімків у стані «руйнування» з часом збільшується.
- Процесор з високим SP без відповідного робочого навантаження IOPS/пропускна здатність.
- LUN та внутрішні диски мають чергу та підвищений час відгуку.
Подивитися в Unisphere можна в розділі "Блок". Обов'язково додайте стовпець "Знімки", щоб отримати зчитування за LUN. Якщо ви бачите багато знімків у списку для LUN або кількох LUN, то це вказує на кілька речей
: перейдіть до окремого LUN і виберіть вкладку «Знімки», щоб перевірити «Стан» (буде «Знищення») та «Зроблено» (буде «Реплікація») для підтвердження:
Cause
Причин для створення черги може бути безліч. Одна з основних причин пов'язана з тим, що РРО вважається «занадто агресивним».
Власна асинхронна реплікація блоків:
Вбудована асинхронна реплікація блоків використовує дельту між двома знімками для передачі даних. Протягом життєвого циклу сеансів реплікації буде відбуватися кілька «оновлень» знімків, які відбуваються при передачі змін.
Коли знімок оновлюється, він дійсно видаляється і знову створюється у фоновому режимі.
Найбільш помітними проблемами є споживання процесора SP і додаткові внутрішні входи/виходи, які пов'язані з функціональністю знімків.
Масив Unity не може повністю видалити знімки за відносно розумний проміжок часу, в результаті чого швидкість переходів знімків у стан «підлягає видаленню» набагато перевищує швидкість повного видалення знімків за заданий проміжок часу. Коли ви зменшуєте значення RPO, це збільшує кількість створення або видалення знімків протягом заданого періоду часу.
Resolution
Для LUN, які мають найбільшу кількість знімків у стані знищення, встановіть RPO принаймні на стандартне значення (60 хвилин), доки видалення знімків не наздожене. Можливо, ви захочете залишити значення в цьому новому RPO залежно від того, скільки знімків було поставлено в чергу, і судити відповідно.
«Dell Technologies рекомендує включати рівень Flash у гібридний пул, де активні знімки.
Знімки збільшують загальне навантаження на процесор у системі та підвищують загальний IOPS диска в пулі сховищ. Знімки також використовують ємність пулу для зберігання старих даних, які відстежуються знімком, що збільшує обсяг ємності, що використовується в пулі, доки знімок не буде видалено. Враховуйте накладні витрати на знімки при плануванні вимог до продуктивності та місткості накопичувального басейну.
Перш ніж увімкнути знімки на об'єкті зберігання, рекомендується промоніторити систему та переконатися, що наявні ресурси можуть задовольнити додаткові вимоги до робочого навантаження (див. розділ Hardware Capabilities Guidelines, таблиця 2). Увімкніть знімки на кількох об'єктах зберігання одночасно, а потім спостерігайте за системою, щоб переконатися, що вона все ще перебуває в межах рекомендованих робочих діапазонів, перш ніж увімкнути більше знімків.
Рекомендується розташовувати операції зі знімками в шаховому порядку (створення, видалення і т.д.). Це може бути досягнуто за допомогою різних графіків знімків для різних наборів об'єктів зберігання. Також рекомендується планувати операції зі знімками після завершення будь-яких переїздів FAST VP.
Знімки видаляються системою асинхронно; коли знімок знаходиться в процесі видалення, він має позначку «Знищення». Якщо система накопичує «Знищуючі» знімки з часом, це може бути ознакою того, що існуючі графіки знімків занадто агресивні; Рідкісне використання знімків може забезпечити більш передбачуваний рівень продуктивності.
Dell Unity обмежить операції видалення знімків, щоб зменшити вплив на ввід/вивід хоста. Видалення миттєвих знімків відбуватиметься швидше в періоди низького використання системи». Dell Unity: Посібник із найкращих практик
Additional Information