XtremIO. В DPG одновременно произошел сбой двух твердотельных накопителей, что привело к снижению производительности

Summary: В этой статье представлена информация о том, как XtremIO устраняет одновременные сбои двух твердотельных накопителей (SSD) в группе защиты данных (DPG), и объясняется, как это может повлиять на производительность. Кроме того, в нем содержатся рекомендации по снижению влияния на производительность во время перестройки DPG. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Сбой второго твердотельного накопителя наблюдается в случае сбоя второго твердотельного накопителя до того, как DPG завершит восстановление после сбоя предыдущего твердотельного накопителя.

Cause

В случае сбоя одного твердотельного накопителя в XtremIO DPG восстанавливает оставшиеся работоспособные твердотельные накопители для обеспечения защиты данных. Процесс восстановления DPG отличается в случае сбоя одного твердотельного накопителя и в случае одновременного отказа двух твердотельных накопителей.

Если выходит из строя только один твердотельный накопитель:

  • Система переходит в одно состояние ограниченной функциональности и имеет только один блок четности для восстановления данных.
  • Перестройка DPG начинается с восстановления данных с неисправного твердотельного накопителя на оставшихся работоспособных твердотельных накопителях для возврата к состоянию двойного четности для защиты данных.
  • Когда DPG восстанавливается после сбоя одного твердотельного накопителя, процесс восстановления выполняется в фоновом режиме, и входящий ввод-вывод по-прежнему имеет приоритет.

При одновременном сбое двух твердотельных накопителей в одном DPG:

  • Система переходит в состояние двойной деградации, что означает, что защита четности не сохраняется.
  • Риск потери данных резко возрастает, поэтому система отдает приоритет восстановлению. При этом используется больше ЦП, чтобы быстрее восстановить DPG.
  • Операции восстановления XtremIO отдают приоритет операциям восстановления, а не пользовательскому вводу-выводу, потребляя ресурсы ЦП и памяти во избежание потери данных.
  • Этот тип перестройки требует значительного обновления метаданных. Он должен рассчитать четность для каждой затронутой полосы данных и выполнить проверки целостности данных, чтобы убедиться в отсутствии повреждения.

Оповещения, которые могут появляться при восстановлении DPG:

Имя оповещения Код признака Описание
rebuild_0_to_20_done XTR0800211 Началась перестройка DPG.
rebuild_20_to_40_done XTR0800221 Выполняется восстановление DPG. Выполнено более 20 процентов работ по капитальному ремонту.
rebuild_40_to_60_done XTR0800231 Выполняется восстановление DPG. Выполнено более 40 процентов работ по восстановлению.
rebuild_60_to_80_done XTR0800241 Выполняется восстановление DPG. Выполнено более 60 процентов работ по восстановлению.
rebuild_99_done XTR0800251 Выполняется восстановление DPG. Выполнено более 80 процентов работ по восстановлению.
rg_state_integrate XTR0800904 DPG выполняет интеграцию твердотельных накопителей.
ssd_assigning_to_rg XTR0900106 SSD назначается DPG.


Команда CLI show-data-protection-groups Также можно запустить для проверки хода перестроения DPG:

xmcli (tech)> show-data-protection-groups
Name     Index Cluster-Name   Index State           Num-Of-SSDs Useful-SSD-Space User-Space User-Space-In-Use Rebuild-Progress Preparation-Progress Proactive-Metadata-Loading Rebuild-Prevention Brick-Name Index
X1-DPG-1 1     LAB-XIO001 1     normal          28          97.809T          85.690T    65.344T           0                0                    False                      none               X1         1
X2-DPG-1 3     LAB-XIO001 1     double_degraded 26          97.809T          83.690T    65.359T           0                54                   False                      assigning_disk     X2         2

Resolution

ПРИМЕЧАНИЕ. Важно уделять первоочередное внимание замене твердотельных накопителей в случае их выхода из строя. При замене твердотельного накопителя дождитесь завершения восстановления DPG, прежде чем приступать к какой-либо дополнительной замене.
 

При одновременном сбое двух твердотельных накопителей в одном DPG производительность может снизиться из-за ресурсов, затрачиваемых на восстановление четности. Нет способа остановить перестройку DPG, как нет и команды для ее ускорения. Однако, если у заказчика наблюдается значительное снижение производительности из-за режима защиты с двойным ухудшением производительности (rg_double_degrade), следующие действия могут помочь уменьшить воздействие, если это возможно:

  1. Приостановите любые операции резервного копирования, репликации или интенсивные задания ввода-вывода до завершения перестроения DPG.
  2. По возможности переключите большинство активных хостов на другое хранилище до завершения перестройки DPG.
  3. Если используются виртуальные машины, выключите или перенесите виртуальные машины или переведите хосты в режим обслуживания.
  4. По возможности используйте QoS или регулирование на стороне хоста, чтобы снизить нагрузку на массив во время восстановления.

После завершения перестройки DPG следует устранить все связанные с этим проблемы для производительности.

Additional Information

Affected Products

XtremIO, XtremIO X2
Article Properties
Article Number: 000355127
Article Type: Solution
Last Modified: 18 Sept 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.