Avamar и Data Domain. Высокий коэффициент использования DD на целевом устройстве: анализ и передовые практики
Summary: Использование дисков в исходной и целевой системах Data Domain не должно быть абсолютно одинаковым. В этом документе описаны возможные причины, по которым система назначения Data Domain может демонстрировать более высокий коэффициент использования, чем исходная система Data Domain. Важно отметить, что расхождение в использовании может быть результатом сочетания приведенных ниже причин. ...
Symptoms
Целевая система Data Domain демонстрирует более высокий коэффициент использования, чем исходная система Data Domain.
Cause
С точки зрения Avamar:
Откат
В случае отката до исходной системы Data Domain система назначения Data Domain может хранить дополнительные данные за несколько дней, в зависимости от времени отката. Это расхождение будет существовать до истечения срока действия дополнительных резервных копий в системе назначения.
Пример. DD1 реплицируется в DD2. Поскольку откат выполняется на 2 дня, в исходной системе есть 3 резервных копии, а в систему назначения реплицируются пять резервных копий.
Частичные репликации
Если репликация не завершается успешно, уже реплицированные данные хранятся в течение не менее семи дней и удаляются в процессе очистки системы Data Domain. Частичная репликация содержит данные и отпечатки пальцев, которые позволяют быстрее выполнить повторную попытку репликации данных.
Издержки на частичную репликацию могут быть такими же высокими, как и объем реплицированных данных, если сбой репликации происходит прямо перед завершением.
Разница в сроках хранения
В конфигурации сервера Avamar можно настроить хранение реплик на целевом сервере дольше, чем на исходном. Это приведет к различиям в коэффициенте использования ресурса хранения.
Различия в конфигурации Avamar
Резервное копирование контрольных точек на сервере Avamar может занимать значительное пространство. Если оно настроено только на целевом устройстве Avamar, оно увеличит коэффициент использования Data Domain на целевом устройстве.
С точки зрения Data Domain:
Отпечаток пальца.
При отправке данных в Data Domain во время репликации для них выполняется дедупликация. Сначала в систему назначения Data Domain отправляется отпечаток пальца, чтобы проверить, имеются ли в системе назначения данные.
-
Если система Data Domain сообщает, что отпечаток пальца присутствует, повторная отправка данных не требуется.
-
Если система Data Domain сообщает, что отпечаток пальца не найден, это означает, что:
-
отпечаток пальца отсутствует;
-
система назначения Data Domain содержит отпечаток пальца, но все равно хочет, чтобы данные были отправлены для улучшения особого размещения в Data Domain;
-
система Data Domain занята и не хочет выполнять полный поиск.
-
Если в систему Data Domain отправляются дубликаты данных, дедупликация данных будет выполняться во время очистки путем удаления дополнительных копий данных.
Целевая система Data Domain будет иметь более высокий коэффициент использования, но разница не должна быть большой.
Издержки метаданных.
К каждому файлу резервной копии прилагаются метаданные о файлах, а также отпечаток пальца для каждого файла.
Пример. Для файла размером 1 Тбайт коэффициент использования составляет 0,3% от размера файла.
Для среднего фрагмента данных размером 8 Кбайт имеется 82 байт метаданных. Это примерно 0,01% издержек для емкости после сжатия.
Эти издержки также увеличиваются из-за интеграции с Avamar, поскольку Avamar объединяет резервные копии для получения полной синтетической резервной копии из инкрементной при каждом завершении резервного копирования.
Мы также наблюдаем увеличение издержек метаданных при пропуске резервного копирования или при внеочередной репликации данных.
Единственными резервными копиями, которые не создают эти издержки, являются резервные копии виртуальных машин. Затраты на метаданные сведены к минимуму.
Пример. При внеочередной репликации резервной копии создается резервная копия L0 на целевом устройстве, которая имеет намного большие издержки метаданных, чем копия Inc. Допустим, у нас есть резервные копии за 5 дней.
Репликация от самых старых к самым новым:
Первая репликация будет L0, а все последующие будут Inc.
1xL0 + 4xInc
Репликация от самых новых к самым старым:
Репликация пропускает резервное копирование:
Отслеживание файлов
Системе Data Domain должно быть известно, как создавать каждый файл из дедуплицированных фрагментов. Если в системе Data Domain нет этой информации, она должна перестроить ее и заново создать цепочку отпечатков пальцев. Это может привести к значительному увеличению емкости.
Существует два сценария, которые могут привести к значительному увеличению емкости системы назначения Data Domain:
1. Отслеживание файлов не выполняется:
Пример. Если система назначения Data Domain настроена в DNS с несколькими IP-адресами и IP-адреса распределяются циклическим перебором, исходная система Data Domain будет подключаться к разным IP-адресам каждый раз. Копия данных, отправленных вчера, не будет распознана, и будет отправлено больше данных, что также увеличит затраты на метаданные.
Эта проблема может возникнуть, если после завершения отката сервера Avamar для SFS_BFT_ENABLED остается значение «false».
Это может привести к очень большому расхождению. Место освобождается по истечении срока хранения резервных копий.
Data Domain запрашивает дубликаты данных до 6% логического размера для оптимизации дедупликации «на лету».
Разница в дедупликации и сжатии.
Системы Data Domain самостоятельно дедуплицируют и сжимают данные в локальном хранилище независимо, и в зависимости от способа хранения данных назначения эти процессы не будут равнозначны, что приведет к различиям в коэффициенте использования.
Очистка Data Domain
Если очистка исходной и целевой системы Data Domain выполняется в разные дни, или если одна из систем выполняет очистку чаще или дольше, это приведет к несоответствию в используемой емкости.
Resolution
Передовые практики.
Поскольку между двумя системами Data Domain, исходной и целевой, будут расхождения в использовании, существуют некоторые передовые практики, которые помогут свести разницу к минимуму.
-
Минимизируйте возможность отката, устраняя сбои hfscheck и оборудования сразу же при их появлении.
-
Убедитесь, что репликации выполняются успешно. При возникновении проблем с выполнением репликации обратитесь в службу поддержки Dell Technologies для проверки конфигурации.
-
Если требуется сохранить одинаковый коэффициент использования на обеих системах Data Domain, сохраните одинаковое хранение исходных и целевых резервных копий и убедитесь, что резервное копирование контрольных точек одинаково на обоих серверах Avamar.
-
Убедитесь, что репликации всегда выполняются с самых старых к самым новым, а резервные копии не пропускаются.
-
Если в системе Data Domain настроено несколько IP-адресов, убедитесь, что IP-адреса не распределяются циклическим перебором.
-
Обе системы Data Domain, исходную и целевую, должны выполнять очистку в один день и в одно время.
-
Установите для SFS_BFT_ENABLED значение true. Эта функция должна быть разрешена службой технической поддержки (создайте заявку на обслуживание и сошлитесь на эту статью базы знаний# — 182755).