Data Domain. Передовые подходы к миграции данных в системах PowerProtect Data Domain с использованием репликации MTree

Summary: В этой статье рассматривается подготовка к переносу данных с использованием репликации Mtree (MRepl) из устаревших систем PowerProtect Data Domain (PPDD) без внутренней поддержки QAT-карты. Например, DD9500 и DD9800. Крайне важно учитывать текущую рабочую нагрузку системы, чтобы избежать непредвиденных побочных эффектов, которые могут отрицательно повлиять на результаты миграции данных. Эта статья поможет спланировать операции миграции, для которых требуется новая конфигурация контекста репликации MTree (MRepl) с использованием устаревших систем PPDD в качестве источника. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

С внедрением платформ 16-го поколения перенос определенных MTree из устаревшей системы PPDD в более новую систему является обычным требованием.
В процессе переноса создаются новые контексты репликации Mtree. Для минимизации перерывов в работе необходимо учитывать следующее.

  • Текущая системная нагрузка, связанная с операциями резервного копирования 
  • Различия в возможностях сжатия (например, поддержка карт QAT)
  • Внезапное включение новых конфигураций контекста Mrepl
  • Ошибки оборудования, влияющие на процесс сборки мусора (GC) 

Чтобы сохранить целостность данных и обеспечить соответствие требованиям соглашений об уровне обслуживания, на определенных рабочих пороговых значениях в системе может произойти критическая ошибка.
Механизм защиты от паники запускает действия по самоустранению, чтобы обеспечить надежную работу системы.

 

В этой статье рассматриваются эти вопросы и даются рекомендации по предотвращению непредвиденных простоев, которые могут помешать планам миграции. 

 

Текущая нагрузка на систему в результате операций резервного копирования:
 

Сначала сосредоточьтесь на текущих системных операциях. Перед миграцией отслеживайте ключевые метрики. К ним относятся текущие рабочие нагрузки, загрузка ЦП, использование памяти, состояние сети и оповещения об оборудовании.
Цель состоит в том, чтобы сохранить работу системы в пределах нормальных параметров. 
 

Различия в возможностях сжатия:
При подготовке к переносу с использованием репликации Mtree (Mrepl) учитывайте различия в возможностях сжатия между системами.
В некоторых устаревших системах отсутствует встроенная плата сжатия для выполнения операций, связанных со сжатием.
Системы DD9900, DD9400 или DD6900 позволяют подключать внешнюю плату QAT для ускорения операций сжатия.
Если плата QAT отсутствует (например, DD9800, DD9500), она использует ресурсы ЦП и памяти для выполнения задач сжатия и распаковки.
 

При настройке новых контекстов репликации без поддержки QAT сначала необходимо распаковать данные.
Это может привести к резкому увеличению загрузки ЦП на этапе инициализации репликации.
Исходный ресурс проверяет целевой ресурс, чтобы определить доступный тип платы сжатия.
Если целевым ресурсом является система 16-го поколения (DD9910, DD9410 или DD6410), источник должен распаковать данные из устаревшего формата «gzfast». Затем он должен сжать его до формата LZ.

 

Постепенно внедряйте новую конфигурацию контекста mrepl:
 

Во время аварийного восстановления (DR) при репликации данных из одной системы Data Domain в другую задания репликации обычно запускаются после завершения приема данных.
Это гарантирует, что целевая площадка получит все реплицированные данные.
 

Если для переноса определены новые контексты репликации, во время инициализации репликации исходная система должна обрабатывать важные данные.
Это связано с тем, что в целевом ресурсе отсутствуют дедуплицированные данные, а оптимизация пока невозможна. Это приводит к увеличению нагрузки на исходную систему.
 


Чтобы избежать этого, когда система продолжает обрабатывать рабочие нагрузки резервного копирования (ввода-вывода), постепенно внедряйте контексты репликации, связанные с переносом. 
Определите низкую пропускную способность репликации, чтобы ограничить ресурсы, выделенные для этих контекстов репликации, связанных с переносом.
После начала репликации для построения оптимизаций в целевой системе и проверки рабочих параметров добавьте дополнительные контексты репликации (переноса). Или измените пропускную способность репликации на существующих системах.

Цель состоит в том, чтобы избежать срабатывания защитных механизмов системы. Это приводит к критическим ошибкам в системе, которые могут повлиять на выполнение переноса.
Помните, что эталонные значения производительности системы рассчитываются на основе работающих рабочих нагрузок, а не новых рабочих нагрузок.
 

Настраивайте постепенное регулирование во время сценариев миграции.
Команду «replication throttle add» можно использовать для планирования определенного момента времени и выделения определенной пропускной способности (в Мбит/с) для регулирования.
Инициировать новые задания репликации с ограниченной доступной пропускной способностью (снижение пропускной способности). Затем оцените влияние на работу системы.

Во время выполнения задания репликации значение дроссельной заслонки можно увеличить, чтобы обеспечить дополнительную пропускную способность.

Кроме того, рекомендуется отслеживать системную аналитику, включая использование ресурсов ЦП, памяти и сети, доступных в DDSM.

 

Ошибки оборудования, влияющие на процесс сборки мусора (GC):
 

Еще одним фактором, который потенциально может привести к снижению производительности резервного копирования или репликации, является сбой оборудования, особенно во время операций сборки мусора по умолчанию. В нормальных условиях эксплуатации механизм сборки мусора в системах PPDD выполняет операции по переработке пространства, не влияя на операции получения, восстановления или репликации. В определенных ситуациях система предлагает параметры для определения регулирования сборки мусора, что позволяет системным администраторам дополнительно контролировать время выполнения процессов очистки системы. 

Конфигурация регулирования по умолчанию для сборки мусора не влияет на резервное копирование и восстановление. В большинстве случаев наблюдаемое воздействие связано с отказом оборудования. Например, когда определенные диски требуют замены, текущие требования системы к операциям ввода-вывода могут замедлить хранение резервных копий и восстановление и, как следствие, повлиять на общие операции GC. 

Операционная система Data Domain предоставляет комплексные механизмы оповещений о таких проблемах с оборудованием, заблаговременно выдавая оповещения при обнаружении этих условий. Это позволяет операторам резервного копирования оперативно решать проблемы, связанные с оборудованием. 

Также важно учитывать, что операции репликации не менее важны, чем резервное копирование и восстановление. Каждая платформа предоставляет фиксированное количество потоков для каждого задания и может обрабатывать параллельные операции в пределах определенных ограничений для соответствия соглашениям об уровне обслуживания (SLA).

 

Заключение
 

Успешная миграция данных с помощью репликации Mtree требует тщательного учета следующих аспектов.

  • Мониторинг текущей рабочей нагрузки системы из операций резервного копирования
  • Обзор устаревших платформ, таких как DD9800 или DD9500
  • Используйте другой алгоритм сжатия (gzfast).
  • При создании новых контекстов репликации MTree (MRepl) в эксплуатируемой системе постепенно внедряйте новые конфигурации контекста Mrepl
  • Внимательно отслеживайте влияние новых рабочих нагрузок на систему.
  • Отслеживайте потенциальные ошибки оборудования (влияющие на операции процесса сборки памяти).


Следуя этим передовым практикам, можно свести к минимуму сбои и сохранить стабильность системы.
Внедрение этих рекомендаций помогает избежать непредвиденных простоев и упрощает миграцию данных.

Additional Information

Affected Products

Data Domain
Article Properties
Article Number: 000317549
Article Type: How To
Last Modified: 08 May 2025
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.