Data Domain Влияние преобразования в сжатие GZ на производительность очистки и систему Data Domain
Summary: В этой статье представлена информация о различных алгоритмах сжатия, поддерживаемых DDR, а также о влиянии преобразования системы для использования алгоритма GZ.
Instructions
РЕШЕНИЕ
В настоящее время DDOS поддерживает четыре различных типа сжатия с различными уровнями сжатия нагрузки на процессор. В следующей таблице приведены характеристики каждого варианта.
type expected-comp CPU-load ---------- -------------------- -------------- none 1.0x 0x lz(default) 2.0x 1x gzfast 2.5x 2x gz 3.0x 5x
Например, алгоритм сжатия gz обеспечивает примерно 3-кратное локальное сжатие, но использует примерно в 5 раз больше ресурсов ЦП для выполнения части сжатия кода, чем lz. Ожидаемые значения сжатия могут сильно различаться в зависимости от типа данных. Для некоторых типов данных gz может быть только на 10% лучше, чем lz, в то время как для других типов данных он в 2 раза или лучше, чем lz.
Как правило, файлы с большим количеством похожих строк данных, как правило, сжимаются лучше при gz, чем при lz.
Примеры таких наборов данных:
- Файлы базы данных.
- Файлы журналов.
Последствия использования GZ Compression:
Поскольку более сильные алгоритмы сжатия используют больше ресурсов ЦП, они могут иметь значительные последствия для производительности.
- Резервное копирование с низким уровнем дедупликации выполняется медленнее, так как необходимо сжать больше новых данных и записать их на диск. В частности, при первом полном резервном копировании производительность составит 50% от номинальной пиковой пропускной способности.
- Поскольку очистка распаковывает и снова сжимает данные во время их выполнения, очистка может занять больше времени и замедлить другие операции в системе, такие как резервное копирование и репликация.
- Исходный DDR в паре репликации каталогов сжимает данные, используя алгоритм сжатия, используемый целевой системой, перед отправкой данных. Таким образом, если в целевой системе используется алгоритм сжатия gz, репликация может выполняться медленнее, а другие операции в системе, такие как резервное копирование и очистка, могут выполняться медленнее.
Таким образом, переход на сжатие GZ — это решение, которое следует принимать в зависимости от рабочей нагрузки, с которой столкнется система. В противном случае проблема емкости, по сути, превратится в проблему производительности.
В следующем разделе мы опишем характеристики рабочей нагрузки, в которых GZ может быть полезен.
Кому следует использовать сжатие GZ?
Приложения с высокой дедупликацией, низким оттоком и низкими требованиями к производительности резервного копирования являются идеальными кандидатами для использования gz. Хорошим примером являются приложения Near-Line. Большинство модулей DDR, используемых в полевых условиях, уже используют gz.
Как изменить тип сжатия?
Для изменения типа сжатия используйте следующие команды:
# filesys disable
# filesys option set local-compression-type {none | lz | gzfast | gz}
# filesys enable
После изменения типа сжатия все новые операции записи будут использовать новый тип сжатия, а все уже записанные данные будут лениво преобразованы в новый тип сжатия во время очистки. Отложенное преобразование означает, что не все контейнеры будут повторно сжаты во время первого раунда очистки. Для полного сжатия всех данных, имеющихся на DDR перед изменением политики сжатия, требуется несколько циклов очистки.
Политика очистки определяет, какие контейнеры выбираются в конкретном раунде очистки, и только эти контейнеры сжимаются повторно. Политика очистки основана на объеме ненужных данных, хранящихся в данном контейнере. Ненужные данные — это удаленные данные, на которые больше не ссылается пространство имен. Чем больше мусора в контейнере, тем больше вероятность того, что он будет выбран для очистки.
Если клиент хочет оплатить разовый хит, он может выполнить следующую процедуру:
-
Отключите DDFS с помощью команды:
filesys disable
-
Используйте следующую команду для отключения отложенного преобразования (требуется режим SE):
reg set system.GC_APPLY_LAZY_CONVERSION=false
-
Включите DDFS с помощью команды:
filesys enable
В результате первая очистка после изменения типа сжатия и отключения отложенного преобразования может занять больше времени. При изменении типа сжатия следует внимательно следить за системой в течение недели или двух, чтобы убедиться, что она работает правильно.
Additional Information
СПРАВОЧНАЯ ИНФОРМАЦИЯ
Влияние преобразования в 180977 сжатия LZ на производительность системы и очистки