Data Domain Влияние преобразования в сжатие GZ на производительность очистки и систему Data Domain

Сводка: В этой статье представлена информация о различных алгоритмах сжатия, поддерживаемых DDR, а также о влиянии преобразования системы для использования алгоритма GZ.

Данная статья применяется к Данная статья не применяется к Эта статья не привязана к какому-либо конкретному продукту. В этой статье указаны не все версии продуктов.

Инструкции

РЕШЕНИЕ

В настоящее время DDOS поддерживает четыре различных типа сжатия с различными уровнями сжатия нагрузки на процессор. В следующей таблице приведены характеристики каждого варианта.
 

type         expected-comp               CPU-load 
----------   --------------------   -------------- 
none         1.0x                       0x 
lz(default)  2.0x                       1x 
gzfast       2.5x                       2x 
gz           3.0x                       5x
Например, алгоритм сжатия gz обеспечивает примерно 3-кратное локальное сжатие, но использует примерно в 5 раз больше ресурсов ЦП для выполнения части сжатия кода, чем lz. Ожидаемые значения сжатия могут сильно различаться в зависимости от типа данных. Для некоторых типов данных gz может быть только на 10% лучше, чем lz, в то время как для других типов данных он в 2 раза или лучше, чем lz.
 
Как правило, файлы с большим количеством похожих строк данных, как правило, сжимаются лучше при gz, чем при lz.

Примеры таких наборов данных:

  • Файлы базы данных.
  • Файлы журналов.

Последствия использования GZ Compression:

Поскольку более сильные алгоритмы сжатия используют больше ресурсов ЦП, они могут иметь значительные последствия для производительности.

  • Резервное копирование с низким уровнем дедупликации выполняется медленнее, так как необходимо сжать больше новых данных и записать их на диск. В частности, при первом полном резервном копировании производительность составит 50% от номинальной пиковой пропускной способности.
  • Поскольку очистка распаковывает и снова сжимает данные во время их выполнения, очистка может занять больше времени и замедлить другие операции в системе, такие как резервное копирование и репликация.
  • Исходный DDR в паре репликации каталогов сжимает данные, используя алгоритм сжатия, используемый целевой системой, перед отправкой данных. Таким образом, если в целевой системе используется алгоритм сжатия gz, репликация может выполняться медленнее, а другие операции в системе, такие как резервное копирование и очистка, могут выполняться медленнее. 

Таким образом, переход на сжатие GZ — это решение, которое следует принимать в зависимости от рабочей нагрузки, с которой столкнется система. В противном случае проблема емкости, по сути, превратится в проблему производительности.

В следующем разделе мы опишем характеристики рабочей нагрузки, в которых GZ может быть полезен.

Кому следует использовать сжатие GZ?

Приложения с высокой дедупликацией, низким оттоком и низкими требованиями к производительности резервного копирования являются идеальными кандидатами для использования gz. Хорошим примером являются приложения Near-Line. Большинство модулей DDR, используемых в полевых условиях, уже используют gz.

Как изменить тип сжатия?

Для изменения типа сжатия используйте следующие команды:

# filesys disable
# filesys option set local-compression-type {none | lz | gzfast | gz}
# filesys enable

 

ПРЕДУПРЕЖДЕНИЕ. Прежде чем изменять тип локального сжатия, необходимо завершить работу файловой системы. Затем его можно перезапустить сразу после установки параметра сжатия.

После изменения типа сжатия все новые операции записи будут использовать новый тип сжатия, а все уже записанные данные будут лениво преобразованы в новый тип сжатия во время очистки. Отложенное преобразование означает, что не все контейнеры будут повторно сжаты во время первого раунда очистки. Для полного сжатия всех данных, имеющихся на DDR перед изменением политики сжатия, требуется несколько циклов очистки.

Политика очистки определяет, какие контейнеры выбираются в конкретном раунде очистки, и только эти контейнеры сжимаются повторно. Политика очистки основана на объеме ненужных данных, хранящихся в данном контейнере.  Ненужные данные — это удаленные данные, на которые больше не ссылается пространство имен. Чем больше мусора в контейнере, тем больше вероятность того, что он будет выбран для очистки.

Если клиент хочет оплатить разовый хит, он может выполнить следующую процедуру:

  1. Отключите DDFS с помощью команды:

    filesys disable
  2. Используйте следующую команду для отключения отложенного преобразования (требуется режим SE):

    reg set system.GC_APPLY_LAZY_CONVERSION=false
  3. Включите DDFS с помощью команды:

    filesys enable

В результате первая очистка после изменения типа сжатия и отключения отложенного преобразования может занять больше времени. При изменении типа сжатия следует внимательно следить за системой в течение недели или двух, чтобы убедиться, что она работает правильно.


Дополнительная информация

    СПРАВОЧНАЯ ИНФОРМАЦИЯ

    Влияние преобразования в 180977 сжатия LZ на производительность системы и очистки

    Затронутые продукты

    Data Domain

    Продукты

    Data Domain
    Свойства статьи
    Номер статьи: 000004020
    Тип статьи: How To
    Последнее изменение: 23 Sep 2024
    Версия:  6
    Получите ответы на свои вопросы от других пользователей Dell
    Услуги технической поддержки
    Проверьте, распространяются ли на ваше устройство услуги технической поддержки.