转换为 GZ 压缩对 Data Domain 系统和清理性能的影响
Summary: 本文提供有关 DDR 上支持的不同压缩算法的信息,以及将系统转换为使用 GZ 算法的影响。
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Instructions
解决方案
DDOS 目前支持四种不同的压缩类型,具有不同压缩级别的 CPU 负载。下表汇总了每个选项的特征:
type expected-comp CPU-load ---------- -------------------- -------------- none 1.0x 0x lz(default) 2.0x 1x gzfast 2.5x 2x gz 3.0x 5x
例如,gz 压缩算法提供大约 3 倍的本地压缩,但使用大约 5 倍的 CPU 来运行代码的压缩部分。根据数据类型,预期的压缩数字可能会有很大差异。对于某些数据类型,gz 可能只比 lz 好 10%,而对于其他数据类型,它是 lz 的 2 倍或好。
通常,具有大量相似数据字符串的文件在使用 gz 时的压缩效果往往比使用 lz 时更好。
此类数据集的示例包括:
- 数据库文件。
- 日志文件。
使用 GZ 压缩的后果:
由于更强的压缩算法使用更多 CPU,因此它们可能会产生明显的性能后果:
- 重复数据消除率低的备份运行速度较慢,因为必须压缩更多新数据并将其写入磁盘。特别是,第一次完整备份可能会达到额定峰值吞吐量的 50%。
- 由于清理会在数据运行时解压缩并重新压缩数据,因此运行清理可能需要更长时间,并且可能会降低系统上的其他活动(如备份和复制)的速度。
- 目录复制对中的源 DDR 在发送数据之前使用目标使用的压缩算法压缩数据。因此,如果目标使用 gz 压缩算法,则复制可能会运行速度较慢,并可能导致系统上的其他活动(如备份和清理)运行速度变慢。
因此,转换为 GZ 压缩是应根据系统将经历的工作负载做出的决定。否则,容量问题实质上会转化为性能问题。
在下一节中,我们将介绍工作负载的特征,GZ 将在其中发挥作用。
谁应该使用 GZ 压缩?
具有高重复数据消除率、低流失率和低备份性能要求的应用程序非常适合使用 gz。一个很好的例子是近线应用。现场用于近线应用的大多数 DDR 都已使用 gz。
如何更改压缩类型?
使用以下命令更改压缩类型:
# filesys disable
# filesys option set local-compression-type {none | lz | gzfast | gz}
# filesys enable
警告:在更改本地压缩类型之前,必须关闭文件系统。然后,可以在设置压缩选项后立即重新启动它。
更改压缩类型后,所有新的写入操作都将使用新的压缩类型,并且已写入的任何数据都将在清理过程中延迟转换为新的压缩类型。延迟转换意味着在第一轮清理期间,并非所有容器都会被重新压缩。在更改压缩策略之前,需要执行几轮清理才能完全重新压缩 DDR 上的所有现有数据。
清理策略确定在特定一轮清理中选择哪些容器,并且仅重新压缩那些容器。清理策略基于给定容器保存的垃圾数据量。 垃圾数据是指命名空间不再引用的已删除数据。容器的垃圾越多,就越有可能被选中进行清洁。
如果客户想要支付一次性点击费用,他们可以按照以下步骤操作:
-
使用以下命令禁用 DDFS:
filesys disable
-
使用以下命令禁用延迟转换(需要 SE 模式):
reg set system.GC_APPLY_LAZY_CONVERSION=false
-
使用以下命令启用 DDFS:
filesys enable
因此,更改压缩类型并禁用延迟转换后的第一次清理可能需要更长的时间才能运行。每当更改压缩类型时,您都应仔细监视系统一周或两周,以确保其运行良好。
Additional Information
Affected Products
Data DomainProducts
Data DomainArticle Properties
Article Number: 000004020
Article Type: How To
Last Modified: 23 Sep 2024
Version: 6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.