XtremIO: DPG має два одночасні збої SSD, що призводить до впливу на продуктивність
Summary: У цій статті наведено інформацію про те, як XtremIO керує збоями двох одночасно твердотільних накопичувачів (SSD) у групі захисту даних (DPG), і пояснюється, як це може вплинути на продуктивність. Він також містить кілька рекомендацій щодо того, як зменшити вплив на продуктивність під час перебудови DPG. ...
Symptoms
Вплив на продуктивність спостерігається, коли другий SSD виходить з ладу до того, як DPG завершить перебудову після попередньої відмови SSD.
Cause
На XtremIO, якщо один SSD виходить з ладу, DPG перебудовується на решту справних SSD-накопичувачів для забезпечення захисту даних. Процес перебудови DPG відрізняється при одиночних збоях SSD, ніж при двох одночасних збоях SSD.
При виході з ладу тільки одного SSD:
- Система переходить в один деградований стан і має лише один блок парності для відновлення даних.
- Перебудова DPG починає перебудову даних з несправного SSD на решті справних SSD, щоб повернутися до статусу блоку з подвійною парністю для захисту даних.
- Коли DPG перебудовується після однієї відмови SSD, процес перебудови виконується у фоновому режимі, а вхідний ввід/вивід все ще має пріоритет.
При одночасному виході з ладу двох SSD в одному DPG:
- Система переходить у подвійний деградований стан, тобто захисту від паритету не залишається.
- Ризик втрати даних різко зростає, тому система віддає перевагу відновленню. При цьому використовується більше процесорів для швидшого перебудови DPG.
- XtremIO надає перевагу операціям перебудови, а не вводу/виводу користувача, споживаючи ресурси центрального процесора та пам'яті, щоб уникнути втрати даних.
- Цей тип перебудови вимагає масового оновлення метаданих. Він повинен обчислювати паритет для кожної ураженої смуги та виконувати перевірки цілісності даних, щоб переконатися у відсутності пошкоджень.
Оповіщення, які можуть з'явитися під час перебудови DPG:
| Назва оповіщення | Код симптому | Опис |
|---|---|---|
rebuild_0_to_20_done |
XTR0800211 |
Розпочато перебудову DPG. |
rebuild_20_to_40_done |
XTR0800221 |
Триває перебудова DPG. Понад 20 відсотків перебудови вже завершено. |
rebuild_40_to_60_done |
XTR0800231 |
Триває перебудова DPG. Понад 40 відсотків перебудови вже завершено. |
rebuild_60_to_80_done |
XTR0800241 |
Триває перебудова DPG. Понад 60 відсотків перебудови вже завершено. |
rebuild_99_done |
XTR0800251 |
Триває перебудова DPG. Понад 80 відсотків перебудови вже завершено. |
rg_state_integrate |
XTR0800904 |
DPG виконує інтеграцію з SSD. |
ssd_assigning_to_rg |
XTR0900106 |
SSD призначається на DPG. |
Команда CLI show-data-protection-groups Також можна запустити для перевірки прогресу перебудови DPG:
xmcli (tech)> show-data-protection-groups Name Index Cluster-Name Index State Num-Of-SSDs Useful-SSD-Space User-Space User-Space-In-Use Rebuild-Progress Preparation-Progress Proactive-Metadata-Loading Rebuild-Prevention Brick-Name Index X1-DPG-1 1 LAB-XIO001 1 normal 28 97.809T 85.690T 65.344T 0 0 False none X1 1 X2-DPG-1 3 LAB-XIO001 1 double_degraded 26 97.809T 83.690T 65.359T 0 54 False assigning_disk X2 2
Resolution
Коли два твердотільні накопичувачі в межах одного DPG виходять з ладу одночасно, це може вплинути на продуктивність через ресурси, що витрачаються на відновлення паритету. Зупинити перебудову DPG неможливо, як і немає команди на її прискорення. Однак, якщо клієнт зазнає значного погіршення продуктивності через подвійне погіршення режиму захисту (rg_double_degrade), наступні дії можуть допомогти зменшити вплив, якщо це можливо:
- Призупиніть будь-які резервні копії, реплікації або інтенсивні завдання вводу/виводу, доки не завершиться перебудова DPG.
- Якщо можливо, переключіть більшість активних хостів на інше сховище, доки не завершиться перебудова DPG.
- Якщо ви використовуєте віртуальні машини, вимкніть або перенесіть віртуальні машини або переведіть хости в режим обслуговування.
- Якщо можливо, використовуйте QoS або троттлінг на стороні хоста, щоб зменшити навантаження на масив під час перебудови.
Після завершення перебудови DPG усі пов'язані з цим наслідки для продуктивності мають зникнути.
Additional Information
Статті по темі:
(Увійдіть як зареєстрований користувач служби підтримки Dell, щоб переглянути ці статті.)