Avamar-Data Domain:ターゲットでのDD使用率が高い:分析とベスト プラクティス
Summary: ソースとターゲットのData Domainが、ディスク使用率がまったく同じであることは想定されていません。このドキュメントでは、ターゲットData DomainがソースData Domainよりも高い使用率を示す問題の考えられる理由について説明します。 使用率の不一致は、以下の理由の組み合わせの結果である可能性があることに注意してください。
Symptoms
ターゲットData Domainは、ソースData Domainよりも高い使用率を示します。
Cause
Avamarの観点から:
ロールバック
ソースData Domainでロールバックが行われる場合、ターゲットData Domainはロールバック時間に応じて追加の日数のデータを保持できます。この不一致は、ターゲットの追加バックアップが期限切れになるまで存在します。
例:DD1はDD2にレプリケートします。ロールバックは2日前であるため、ソースには3個のバックアップがありますが、ターゲットには5個のバックアップがレプリケートされています。
部分的なレプリケーション
レプリケーションが正常に完了しない場合、すでにレプリケートされているデータは少なくとも7日間保存され、Data Domainクリーニングによってクリーニングされます。 部分レプリケーションには、データと指紋認証が含まれるため、データのレプリケーションの後続の再試行をより高速に実行できます。
部分レプリケーションのオーバーヘッドは、レプリケーションが完了する直前に失敗した場合、レプリケートされたデータの量と同じ量になる可能性があります。
保存期間の違い
Avamarサーバー構成では、ターゲット サーバー上のレプリカをソースよりも長く保持するように設定できます。これにより、容量使用率が異なってきます。
Avamar構成の違い
Avamarサーバー上のチェックポイント バックアップが大幅に大きくなる可能性があります。チェックポイント バックアップがターゲットのAvamarでのみ構成されている場合は、ターゲットのData Domainの使用率が増加します。
Data Domainの観点から:
指紋。
レプリケーション中にデータがData Domainに送信されると、重複排除されます。最初に、データの指紋がターゲットData Domainに送信され、ターゲットにデータがあるかどうかを確認します。
-
Data Domainが指紋が存在すると返信した場合、データを再送信する必要はありません。
-
Data Domainが指紋が見つからないと返信しない場合は、次のいずれかを意味します。
-
指紋がない
-
ターゲットData Domainには指紋があるが、Data Domain上の特別なローカリティーを向上させるために、データを送信する必要がある。
-
Data Domainはビジー状態で、検索全体を完了することができない。
-
重複データがData Domainに送信された場合、データの余分なコピーを削除することで、クリーニング中にデータが重複排除されます。
ターゲットData Domainの使用率は高くなりますが、バリエーションを大きくすることはできません。
メタデータのオーバーヘッド
バックアップされた各ファイルには、そのファイル情報メタデータが付属しており、それぞれの指紋も含まれています。
例:1TBのファイルの場合、使用コストはファイル サイズの0.3%です。
平均8kBのデータ チャンクには、82Bのメタデータがあります。 これは、圧縮後の容量の約0.01%のオーバーヘッドです。
Avamarはバックアップを組み合わせて、バックアップが完了するたびに増分から合成フル バックアップを取得するため、このオーバーヘッドはさらに増加します。
また、バックアップがスキップされたり、データが順序に従わずにレプリケートされたりすると、メタデータのオーバーヘッドが増加することも確認できます。
このオーバーヘッドが発生しないバックアップは、VMバックアップのみです。メタデータのコストが最小限に抑えられます。
例:バックアップが順序に従わずにレプリケートされると、ターゲットにL0バックアップが作成され、Incよりもはるかに大きなメタデータ オーバーヘッドが発生します。たとえば、5日分のバックアップがあるとします。
最も古いレプリケーションから最新のレプリケーション:
最初のレプリケーションはL0で、それ以降はすべてIncになります。
1xL0 + 4xInc
最新のレプリケーションから最も古いレプリケーション:
レプリケーションがバックアップをスキップ:
ファイル追跡
Data Domainは、重複排除されたチャンクから各ファイルを構築する方法を把握する必要があります。Data Domainにこの情報がない場合は、この情報を再構築し、指紋認証の手順を再作成する必要があります。これにより、容量が大幅に増加する可能性があります。
ターゲットData Domainの容量が大幅に増加する可能性があるシナリオには次の2つがあります。
1.ファイル追跡が失われる。
Example: ターゲットData Domainが複数のIPを持つDNSで設定され、IPがラウンド ロビンで配分される場合、ソースData Domainは毎回異なるIPに接続します。昨日送信されたデータのコピーは認識されず、さらに多くのデータが送信されるため、メタデータのコストも増加します。
この問題は、Avamar Serverのロールバックが完了した後に SFS_BFT_ENABLED をfalseのままにした場合に発生する可能性があります。
これにより、非常に大きな不一致が発生する可能性があります。 バックアップの有効期限が切れると、スペースが再利用されます。
インライン重複排除
Data Domainは、インライン重複排除を最適化するために、データの論理サイズの最大6%の重複データを要求します。
重複排除と圧縮の違い
Data Domainは、ローカル ストレージ上のデータの重複排除と圧縮を独自かつ個別に実行します。また、ターゲット データの保存方法によっては、データ量は等しくなくなり、使用率の違いを引き起こします。
Data Domainのクリーニング
ソースとターゲットのData Domainが異なる日にクリーニングを実行している場合、またはいずれかのData Domainの方がクリーニングをより頻繁または長時間実行している場合は、使用されている容量に不一致が出てきます。
Resolution
ベスト プラクティス:
ソースとターゲットの2つのData Domainシステム間で使用率に不一致があるため、違いを最小限に抑えるために役立つベスト プラクティスがいくつかあります。
-
hfscheckの障害とハードウェア障害が発生したらすぐに対処することで、ロールバックの可能性を最小限に抑えます。
-
レプリケーションが正常に完了していることを確認します。レプリケーションの完了に関する継続的な問題がある場合は、デル・テクノロジーズのサポートに連絡して構成を確認してください。
-
2つのData Domainを同様の使用率で維持する必要がある場合は、バックアップのソース コピーとターゲット コピーで同じ保存期間を維持し、両方のAvamarサーバーでチェックポイント バックアップが同じ設定になっていることを確認します。
-
レプリケーションが常に一番古いものから最新のものの順に行われ、バックアップがスキップされていないことを確認します。
-
Data Domainが複数のIPで構成されている場合は、IPがラウンドロビン方式で配分されていないことを確認します。
-
ソースおよびターゲットの両方のData Domainシステムを持ち、同じ日時にクリーニングを実行します。
-
SFS_BFT_ENABLEDをtrueに設定します。 これは、テクニカル サポートが有効にする必要があります(SRを発行し、このKB#-182755を参照してください)