「Data Domain:Mtreeレプリケーションを使用したPowerProtect Data Domainシステムでのデータ移行のベスト プラクティス
Summary: この記事では、内部QATカード サポートのないレガシーPowerProtect Data Domain (PPDD)システムからMtreeレプリケーション(MRepl)を使用してデータを移行するための準備について説明します。たとえば、DD9500やDD9800などです。データ移行の結果に悪影響を及ぼす可能性のある予期しない副作用を回避するために、現在のシステム運用ワークロードを考慮することが重要です。 この記事は、レガシーPPDDシステムをソースとして使用して、新しいMtreeレプリケーション(MRepl)コンテキスト構成を必要とする移行操作を計画するのに役立ちます。 ...
Instructions
16Gプラットフォームの導入に伴い、特定のMTreeをレガシーPPDDから新しいシステムに移行することが一般的な要件となります
移行プロセスにより、新しいMtreeレプリケーション コンテキストが作成されます。中断を最小限に抑えるために、次の点を考慮してください。
- バックアップ オペレーションによる現在のシステム ワークロード
- 圧縮機能の違い(QATカードのサポートなど)
- 新しいMreplコンテキスト構成の突然の組み込み
- ガベージ コレクション(GC)プロセスに影響を与えるHWエラー
データの整合性を維持し、サービス レベル アグリーメントを満たすために、特定の動作しきい値でシステムがパニックを起こすことがあります
パニックメカニズムは、システムが常に確実に動作するように、自己修正アクションをトリガーします。
ここでは、これらの考慮事項について説明し、移行計画を妨げる可能性のある予期しないダウンタイムを防ぐ方法について説明します。
バックアップ操作による現在のシステム ワークロード:
最初は現在のシステム運用に焦点を当てます。移行前に、主要なメトリックを監視します。これには、進行中のワークロード、CPUの利用率、メモリー使用量、ネットワーク ステータス、ハードウェア アラートが含まれます
目的は、システムの動作を通常のパラメーター内に保持することです。
圧縮機能の違い:
Mtreeレプリケーション(Mrepl)を使用して移行の準備をする際は、システム間の圧縮機能の格差を考慮してください
一部のレガシー システムには、圧縮関連の操作を支援するオンボード圧縮カードがありません。
DD9900、DD9400、またはDD6900システムでは、外部QATカードを接続して圧縮操作を高速化できます
QATカード(DD9800、DD9500など)が存在しない場合、圧縮および解凍タスクのためにCPUとメモリー リソースに依存します。
QATサポートなしで新しいレプリケーション コンテキストを構成する場合は、まずデータを圧縮解除する必要があります。
これにより、レプリケーションの初期化フェーズ中にCPU使用率が急上昇する可能性があります。
ソースはデスティネーションをチェックして、使用可能な圧縮カードのタイプを識別します。
16Gシステム(DD9910、DD9410、またはDD6410)がターゲットの場合、ソースは従来の「gzfast」形式からデータを解凍する必要があります。次に、LZ形式に圧縮する必要があります。
新しいmreplコンテキスト構成を徐々に組み込みます。
ディザスター リカバリー(DR)中に、1つのData Domainから別のData Domainにデータをレプリケートする場合、通常、レプリケーション ジョブはデータの取得が完了した後に開始されます。
これにより、デスティネーション サイトはレプリケートされたすべてのデータを確実に受信します。
移行のために新しいレプリケーション コンテキストが定義されている場合、ソースはレプリケーションの初期化中に重要なデータを処理する必要があります
これは、デスティネーションに重複排除されたデータが不足しており、最適化がまだ不可能であるためです。これにより、ソース システムの負荷が増加します。
これを軽減するために、システムがバックアップ ワークロード(I/O)の処理を継続する場合は、移行に関連するレプリケーション コンテキストを徐々に組み込みます。
これらの移行関連のレプリケーション コンテキストに割り当てられるリソースを制限するには、低いレプリケーション スループットを定義します
レプリケーションがデスティネーションで最適化の構築を開始し、運用パラメーターが検証されたら、レプリケーション(移行)コンテキストをさらに追加します。または、既存のレプリケーション スループットを変更します。
目的は、システムの保護メカニズムをトリガーしないようにすることです。これにより、システム パニックが発生し、移行に影響を与える可能性があります
システム パフォーマンスの基準値は、新しいワークロードではなく、運用中のワークロードに基づいて計算されることに注意してください。
移行シナリオ中に調整を段階的に構成します。
「replication throttle add」コマンドを使用すると、特定のポイント イン タイムをスケジュールし、スロットリングに定義された帯域幅(Mbps単位)を割り当てることができます。
新しいレプリケーション ジョブは、使用可能な帯域幅が制限された状態で開始します(スロットルを低くします)。次に、システム運用への影響を評価します
レプリケーション ジョブが進行中になったら、スロットルを増やして追加の帯域幅を提供できます
また、DDSMで利用可能なCPU、メモリー、ネットワーク使用量などのシステム分析を監視することもお勧めします。
ガベージ コレクション(GC)プロセスに影響を与えるHWエラー:
バックアップまたはレプリケーションのパフォーマンスを低下させる可能性のあるもう1つの要因は、特にデフォルトのガベージ コレクション操作中のハードウェア障害に関連しています。通常の運用状態では、PPDDシステムのガベージ コレクション メカニズムは、取得、リストア、レプリケーション操作に影響を与えることなく、スペースのリサイクル アクティビティを完了します。特定の状況では、システムにガベージ コレクションのスロットルを定義するオプションが用意されており、システム管理者はシステムのクリーニング プロセスを実行するタイミングをさらに制御できます。
ガベージ コレクションのデフォルト スロットル構成は、バックアップとリストアには影響しません。影響が見られるほとんどのインスタンスは、ハードウェア障害に関連しています。たとえば、特定のドライブの交換が必要な場合、システムの継続的なI/O要求によってバックアップとリストアのストレージの速度が低下し、結果的にGC操作全体に影響が及ぶ可能性があります。
Data Domain Operating Systemは、このようなハードウェアの問題に対して包括的なアラート メカニズムを提供し、これらの条件が検出されるとプロアクティブにアラートを生成します。これにより、バックアップ オペレーターはハードウェア関連の問題を迅速に解決できます。
考慮すべきもう1つの重要な要素は、レプリケーション アクティビティがバックアップおよびリストアと同様に重要であるということです。設計上、各プラットフォームはジョブごとに固定数のストリームを提供し、サービス レベル アグリーメント(SLA)を満たすために定義された制限の下で同時操作を処理できます。
結論:
Mtreeレプリケーションを使用したデータ移行を成功させるには、次の点を慎重に検討する必要があります。
- バックアップ オペレーションからの現在のシステム ワークロードのモニタリング
- DD9800やDD9500などのレガシー プラットフォームについて理解する
- 別の圧縮アルゴリズム(gzfast)を使用します。
- 運用中のシステムで新しいMTreeレプリケーション(MRepl)コンテキストが作成されると、新しいMreplコンテキスト構成を徐々に組み込みます
- 新しいワークロードがシステムに与える影響を注意深く監視します。
- 潜在的なハードウェア エラーを監視します(ガベージ コレクション プロセスからの操作に影響します)。
次のベスト プラクティスに従って、中断を最小限に抑え、システムの安定性を維持します
これらの推奨事項を実装することで、予期しないダウンタイムを回避し、データ移行を容易にすることができます。