GZ圧縮への変換によるData Domainシステムとクリーニングのパフォーマンスへの影響
Summary: この記事では、DDRでサポートされているさまざまな圧縮アルゴリズムと、GZアルゴリズムを使用するようにシステムを変換した場合の影響について説明します。
Instructions
対処法
DDOSは現在、圧縮CPU負荷のレベルが異なる4つの異なる圧縮タイプをサポートしています。次の表は、各オプションの特性をまとめたものです。
type expected-comp CPU-load ---------- -------------------- -------------- none 1.0x 0x lz(default) 2.0x 1x gzfast 2.5x 2x gz 3.0x 5x
たとえば、gz 圧縮アルゴリズムでは、ローカル圧縮は約 3 倍ですが、コードの圧縮部分を実行するために lz の約 5 倍の CPU が使用されます。予想される圧縮率は、データ型によって大きく異なる場合があります。一部のデータ型では、gz は lz よりも 10% しか優れていませんが、他のデータ型では lz の 2 倍以上です。
一般に、類似したデータ文字列が多数あるファイルは、lz よりも gz の方が圧縮率が高い傾向があります。
このようなデータセットの例は次のとおりです。
- データベース ファイル。
- ログ ファイル。
GZ 圧縮を使用した結果:
より強力な圧縮アルゴリズムはより多くのCPUを使用するため、パフォーマンスに大きな影響を与える可能性があります。
- 重複排除が少ないバックアップは、より多くの新しいデータを圧縮してディスクに書き込む必要があるため、実行速度が遅くなります。特に、最初のフル バックアップでは、定格ピーク スループットの50%を達成する可能性があります。
- クリーニングでは、実行中にデータを展開および再圧縮するため、クリーニングの実行に時間がかかり、バックアップやレプリケーションなど、システム上の他のアクティビティが遅くなる場合があります。
- ディレクトリ レプリケーション ペアのソースDDRは、データを送信する前に、デスティネーションで使用される圧縮アルゴリズムを使用してデータを圧縮します。したがって、デスティネーションがgz圧縮アルゴリズムを使用している場合、レプリケーションの実行速度が遅くなり、バックアップやクリーニングなど、システム上の他のアクティビティの実行速度が遅くなる可能性があります。
したがって、GZ圧縮への変換は、システムが経験するワークロードに基づいて決定する必要があります。そうしないと、容量の問題が本質的にパフォーマンスの問題に変換されます。
次のセクションでは、GZが役立つワークロードの特性について説明します。
GZ圧縮を使用する必要があるのは誰ですか?
高い重複排除、低いチャーン、低いバックアップ パフォーマンスの要件を持つアプリケーションは、gzを使用する理想的な候補です。ニアライン アプリケーションが良い例です。ニアライン アプリケーションに使用されるフィールドのほとんどのDDRでは、すでにgzが使用されています。
圧縮タイプを変更するにはどうすればよいですか?
次のコマンドを使用して、圧縮タイプを変更します。
# filesys disable
# filesys option set local-compression-type {none | lz | gzfast | gz}
# filesys enable
圧縮タイプが変更されると、すべての新しい書き込みで新しい圧縮タイプが使用され、すでに書き込まれたデータは、クリーニング中に新しい圧縮タイプに遅延変換されます。遅延変換とは、最初のクリーニング中にすべてのコンテナーが再圧縮されないことを意味します。圧縮ポリシーを変更する前に、DDRに存在するすべてのデータを完全に再圧縮するには、数回のクリーニングが必要です。
クリーニング ポリシーは、特定のクリーニング ラウンドで選択されるコンテナを決定し、それらのコンテナのみが再圧縮されます。クリーニング ポリシーは、特定のコンテナーが保持するガベージ データの量に基づいています。 ガベージ データとは、削除されたデータがネームスペースによって参照されなくなったことを意味します。コンテナのゴミが多いほど、クリーニング対象として選択される可能性が高くなります。
お客様が 1 回限りのヒットの支払いを希望する場合は、次の手順に従います。
-
次のコマンドを使用してDDFSを無効にします。
filesys disable
-
次のコマンドを使用して遅延変換を無効にします( SEモードが必要)。
reg set system.GC_APPLY_LAZY_CONVERSION=false
-
次のコマンドを使用してDDFSを有効にします。
filesys enable
その結果、圧縮タイプを変更し、遅延変換を無効にした後の最初のクリーニングの実行に時間がかかる場合があります。圧縮タイプを変更するたびに、システムが正常に動作していることを確認するために、1〜2週間にわたってシステムを注意深く監視する必要があります。