XtremIO. В DPG одновременно произошел сбой двух твердотельных накопителей, что привело к снижению производительности
Summary: В этой статье представлена информация о том, как XtremIO устраняет одновременные сбои двух твердотельных накопителей (SSD) в группе защиты данных (DPG), и объясняется, как это может повлиять на производительность. Кроме того, в нем содержатся рекомендации по снижению влияния на производительность во время перестройки DPG. ...
Symptoms
Сбой второго твердотельного накопителя наблюдается в случае сбоя второго твердотельного накопителя до того, как DPG завершит восстановление после сбоя предыдущего твердотельного накопителя.
Cause
В случае сбоя одного твердотельного накопителя в XtremIO DPG восстанавливает оставшиеся работоспособные твердотельные накопители для обеспечения защиты данных. Процесс восстановления DPG отличается в случае сбоя одного твердотельного накопителя и в случае одновременного отказа двух твердотельных накопителей.
Если выходит из строя только один твердотельный накопитель:
- Система переходит в одно состояние ограниченной функциональности и имеет только один блок четности для восстановления данных.
- Перестройка DPG начинается с восстановления данных с неисправного твердотельного накопителя на оставшихся работоспособных твердотельных накопителях для возврата к состоянию двойного четности для защиты данных.
- Когда DPG восстанавливается после сбоя одного твердотельного накопителя, процесс восстановления выполняется в фоновом режиме, и входящий ввод-вывод по-прежнему имеет приоритет.
При одновременном сбое двух твердотельных накопителей в одном DPG:
- Система переходит в состояние двойной деградации, что означает, что защита четности не сохраняется.
- Риск потери данных резко возрастает, поэтому система отдает приоритет восстановлению. При этом используется больше ЦП, чтобы быстрее восстановить DPG.
- Операции восстановления XtremIO отдают приоритет операциям восстановления, а не пользовательскому вводу-выводу, потребляя ресурсы ЦП и памяти во избежание потери данных.
- Этот тип перестройки требует значительного обновления метаданных. Он должен рассчитать четность для каждой затронутой полосы данных и выполнить проверки целостности данных, чтобы убедиться в отсутствии повреждения.
Оповещения, которые могут появляться при восстановлении DPG:
| Имя оповещения | Код признака | Описание |
|---|---|---|
rebuild_0_to_20_done |
XTR0800211 |
Началась перестройка DPG. |
rebuild_20_to_40_done |
XTR0800221 |
Выполняется восстановление DPG. Выполнено более 20 процентов работ по капитальному ремонту. |
rebuild_40_to_60_done |
XTR0800231 |
Выполняется восстановление DPG. Выполнено более 40 процентов работ по восстановлению. |
rebuild_60_to_80_done |
XTR0800241 |
Выполняется восстановление DPG. Выполнено более 60 процентов работ по восстановлению. |
rebuild_99_done |
XTR0800251 |
Выполняется восстановление DPG. Выполнено более 80 процентов работ по восстановлению. |
rg_state_integrate |
XTR0800904 |
DPG выполняет интеграцию твердотельных накопителей. |
ssd_assigning_to_rg |
XTR0900106 |
SSD назначается DPG. |
Команда CLI show-data-protection-groups Также можно запустить для проверки хода перестроения DPG:
xmcli (tech)> show-data-protection-groups Name Index Cluster-Name Index State Num-Of-SSDs Useful-SSD-Space User-Space User-Space-In-Use Rebuild-Progress Preparation-Progress Proactive-Metadata-Loading Rebuild-Prevention Brick-Name Index X1-DPG-1 1 LAB-XIO001 1 normal 28 97.809T 85.690T 65.344T 0 0 False none X1 1 X2-DPG-1 3 LAB-XIO001 1 double_degraded 26 97.809T 83.690T 65.359T 0 54 False assigning_disk X2 2
Resolution
При одновременном сбое двух твердотельных накопителей в одном DPG производительность может снизиться из-за ресурсов, затрачиваемых на восстановление четности. Нет способа остановить перестройку DPG, как нет и команды для ее ускорения. Однако, если у заказчика наблюдается значительное снижение производительности из-за режима защиты с двойным ухудшением производительности (rg_double_degrade), следующие действия могут помочь уменьшить воздействие, если это возможно:
- Приостановите любые операции резервного копирования, репликации или интенсивные задания ввода-вывода до завершения перестроения DPG.
- По возможности переключите большинство активных хостов на другое хранилище до завершения перестройки DPG.
- Если используются виртуальные машины, выключите или перенесите виртуальные машины или переведите хосты в режим обслуживания.
- По возможности используйте QoS или регулирование на стороне хоста, чтобы снизить нагрузку на массив во время восстановления.
После завершения перестройки DPG следует устранить все связанные с этим проблемы для производительности.
Additional Information
Статьи по теме:
(Для просмотра этих статей может потребоваться вход в систему в качестве зарегистрированного пользователя службы поддержки Dell.)