Data Domain Влияние преобразования в сжатие GZ на производительность очистки и систему Data Domain

Summary: В этой статье представлена информация о различных алгоритмах сжатия, поддерживаемых DDR, а также о влиянии преобразования системы для использования алгоритма GZ.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

РЕШЕНИЕ

В настоящее время DDOS поддерживает четыре различных типа сжатия с различными уровнями сжатия нагрузки на процессор. В следующей таблице приведены характеристики каждого варианта.
 

type         expected-comp               CPU-load 
----------   --------------------   -------------- 
none         1.0x                       0x 
lz(default)  2.0x                       1x 
gzfast       2.5x                       2x 
gz           3.0x                       5x
Например, алгоритм сжатия gz обеспечивает примерно 3-кратное локальное сжатие, но использует примерно в 5 раз больше ресурсов ЦП для выполнения части сжатия кода, чем lz. Ожидаемые значения сжатия могут сильно различаться в зависимости от типа данных. Для некоторых типов данных gz может быть только на 10% лучше, чем lz, в то время как для других типов данных он в 2 раза или лучше, чем lz.
 
Как правило, файлы с большим количеством похожих строк данных, как правило, сжимаются лучше при gz, чем при lz.

Примеры таких наборов данных:

  • Файлы базы данных.
  • Файлы журналов.

Последствия использования GZ Compression:

Поскольку более сильные алгоритмы сжатия используют больше ресурсов ЦП, они могут иметь значительные последствия для производительности.

  • Резервное копирование с низким уровнем дедупликации выполняется медленнее, так как необходимо сжать больше новых данных и записать их на диск. В частности, при первом полном резервном копировании производительность составит 50% от номинальной пиковой пропускной способности.
  • Поскольку очистка распаковывает и снова сжимает данные во время их выполнения, очистка может занять больше времени и замедлить другие операции в системе, такие как резервное копирование и репликация.
  • Исходный DDR в паре репликации каталогов сжимает данные, используя алгоритм сжатия, используемый целевой системой, перед отправкой данных. Таким образом, если в целевой системе используется алгоритм сжатия gz, репликация может выполняться медленнее, а другие операции в системе, такие как резервное копирование и очистка, могут выполняться медленнее. 

Таким образом, переход на сжатие GZ — это решение, которое следует принимать в зависимости от рабочей нагрузки, с которой столкнется система. В противном случае проблема емкости, по сути, превратится в проблему производительности.

В следующем разделе мы опишем характеристики рабочей нагрузки, в которых GZ может быть полезен.

Кому следует использовать сжатие GZ?

Приложения с высокой дедупликацией, низким оттоком и низкими требованиями к производительности резервного копирования являются идеальными кандидатами для использования gz. Хорошим примером являются приложения Near-Line. Большинство модулей DDR, используемых в полевых условиях, уже используют gz.

Как изменить тип сжатия?

Для изменения типа сжатия используйте следующие команды:

# filesys disable
# filesys option set local-compression-type {none | lz | gzfast | gz}
# filesys enable

 

ПРЕДУПРЕЖДЕНИЕ. Прежде чем изменять тип локального сжатия, необходимо завершить работу файловой системы. Затем его можно перезапустить сразу после установки параметра сжатия.

После изменения типа сжатия все новые операции записи будут использовать новый тип сжатия, а все уже записанные данные будут лениво преобразованы в новый тип сжатия во время очистки. Отложенное преобразование означает, что не все контейнеры будут повторно сжаты во время первого раунда очистки. Для полного сжатия всех данных, имеющихся на DDR перед изменением политики сжатия, требуется несколько циклов очистки.

Политика очистки определяет, какие контейнеры выбираются в конкретном раунде очистки, и только эти контейнеры сжимаются повторно. Политика очистки основана на объеме ненужных данных, хранящихся в данном контейнере.  Ненужные данные — это удаленные данные, на которые больше не ссылается пространство имен. Чем больше мусора в контейнере, тем больше вероятность того, что он будет выбран для очистки.

Если клиент хочет оплатить разовый хит, он может выполнить следующую процедуру:

  1. Отключите DDFS с помощью команды:

    filesys disable
  2. Используйте следующую команду для отключения отложенного преобразования (требуется режим SE):

    reg set system.GC_APPLY_LAZY_CONVERSION=false
  3. Включите DDFS с помощью команды:

    filesys enable

В результате первая очистка после изменения типа сжатия и отключения отложенного преобразования может занять больше времени. При изменении типа сжатия следует внимательно следить за системой в течение недели или двух, чтобы убедиться, что она работает правильно.


Additional Information

    СПРАВОЧНАЯ ИНФОРМАЦИЯ

    Влияние преобразования в 180977 сжатия LZ на производительность системы и очистки

    Affected Products

    Data Domain

    Products

    Data Domain
    Article Properties
    Article Number: 000004020
    Article Type: How To
    Last Modified: 23 Sep 2024
    Version:  6
    Find answers to your questions from other Dell users
    Support Services
    Check if your device is covered by Support Services.