Avamarスペース再利用プロセス - パート2: 計算
Summary: この記事では、Avamarスペースの再利用の「処理」部分について説明します。 処理は、既存のストライプを取得し、その中のデータを処理してスペースを効率的に再利用する重要なバックグラウンド プロセスです。
Symptoms
この記事では、ガベージ コレクションされたストライプを再利用用に準備する処理の処理に重点を置いています。
「Avamarのスペース再利用」の完全なシリーズの記事を以下に示します。
- Avamarスペース再利用プロセス - パート1: ガベージ コレクション
- Avamarスペース再利用プロセス - パート2: 計算
- Avamarスペース再利用プロセス - パート3: RMCP(チェックポイント プロセス)の削除
この文書では、以下について説明します。
- Avamarの「処理」メンテナンス プロセス中に何が起こるか。
- Avamarシステムにストライプを定期的に「実行」する必要がある理由。
対象読者:
この記事は、Avamarシステムをサポートまたは管理するユーザーを対象としています。Avamarのメンテナンス操作が連携して、期限切れのデータをシステムから保存、保護、クリアする方法について説明します。読者は、Avamarのメンテナンス スケジュール、Avamarシステムにデータを保存する方法、データ ストライプの構築方法に精通していることを前提としています。また、読者がこのシリーズの最初の記事を読み、理解していることを前提としています。この記事では、Avamarガベージ コレクションについて説明します。
通常、処理が最適に実行されない場合に発生する症状:
-
チェックポイントオーバーヘッドが高い
-
バックアップ パフォーマンスの低下
この文書では、以下について説明します。
- 何が必要か
- 締めくくりが重要な理由
- 操作の仕組みの概要
- 実行できる2つの方法
- 非同期処理
- 同期処理
- 非同期処理の実行を妨げる可能性がある状況
- トラブルシューティングと、実行に関連する便利なコマンド
- 参考資料、詳細な読み取り、関連するKB記事
Cause
Resolution
Avamarで「締めくくり」とは何ですか?
ガベージ コレクションは、バックアップによって参照されなくなったデータを識別します。
チャンク ヘッダー ディスクリプターが変更され、削除するチャンクが示されます。これらのチャンクを含むデータ ストライプは変更されません。
これらのチャンクの削除は、処理の際の副次的な影響として発生します。
処理はAvamarのメンテナンス操作で、ガベージ コレクションされたストライプを変更して、これらのストライプ内の空き領域を連続して確保します。
ストライプを操作して空き領域を連続させることで、Avamarは受信バックアップ データ用のスペースを効率的に再利用します。
ハード ディスクの従来のデフラグと同様の方法で処理を行うことを考えてみてください。
データ コンテナ をより効率的に再利用するには、データを別の場所に移動する必要があります。
ディスクデフラグユーティリティは、データの関連要素を回転ハードディスクの隣接部分に移動して、シーケンシャルアクセス時間を短縮します。
ただし、データをストライプの下部に移動して、新しい受信チャンク用のスペースを確保します。
アナロジー:
前面の出入り口が1つあり、出口ドアがないバスを想像してみてください。人(チャンク)は、前面ドアを使用してバスに入ります。
これは、Star Philosophyの「ビーム・ミー・アップ・Scotty」テクノロジーを使用してのみ、人々が離れる特別なバスです。
バスがフルから始まります。
数人が廃止されると、バスにはより多くの乗客のためのスペースがあります。
人が入り口から離れるまで、他に誰も当てはまりません。つまり、前面ドアの近くにスペースを確保するために、バスの背面に向かって「突っ込んだ」と言います。
実行が重要な理由:
バックアップ データがAvamarに書き込まれた場合の動作について説明します。これは、処理が重要である理由を説明します。
バックアップ データを受け入れる準備として、Avamarは、最も連続した空き領域がある各データ ノード上のストライプを選択します。ストライプはアクティブ ストライプとしてマークされます。
新しい受信バックアップ データは、アクティブ ストライプに追加されます。
ストライプがいっぱいになると、次の最もフルでなくなるストライプはアクティブ ストライプとしてマークされます。
不十分な処理が行われたシステムを想像してみてください。
「処理可能な」ストライプ(ガベージ コレクション済みだが、まだ処理されていない)は、比較的空である可能性があります。
この比較的空のストライプは、より連続した空き領域を持つ別のストライプがある場合、アクティブ ストライプとして選択されません。
次の図では、図の両方のストライプがガベージ コレクションされていますが、データ ストライプ2のみが処理されています。
データ ストライプ1の空き容量が大きくても、ストライプ2には、より有用な連続したスペースがあります。
Avamarは、ストライプ2をアクティブ ストライプとして選択します。
Avamarストレージ使用率が増加すると、アクティブ ストライプは、ますますフルになるストライプのプールから選択されます。
ストライピングが期限切れになっている場合、ストライプの再利用は非効率的です。
その量のデータが変更されていない場合でも、受信データを平均1日収集するには、より多くのストライプが必要です。
より多くのストライプを使用してデータを収集すると、ストライプがより効率的に再利用された場合よりもチェックポイントオーバーヘッドが高くなります。
このため、Avamarが定期的に十分な処理を実行する機会があることを常に確認してください。
実行はどのように機能しますか?
システムがストライプで処理を実行すると、次のようになります。
-
curディレクトリーのストライプ ファイルからメモリーにデータを読み取ります。
-
チャンク ヘッダーによって参照されるチャンクを決定します。
-
ストライプ ファイルとチャンク ヘッダーをディスクに書き換えます。ストライプ ファイルには、チャンク ヘッダーによって参照されるアイテムのみが取り込まれます。
ストライプ ファイルを変更すると、ハード リンクが切断され、ファイル システムの使用率が向上します。
Avamarバージョン5.0以降では、ストライプは処理後もフル サイズのままです。これにより、時間の経過とともにファイル システムが断片化されるのを回避できます。
いつから実行されますか?
非同期処理: デフォルトおよび優先される処理の実行方法。
非同期処理処理は、「ブラックアウト ウィンドウ」の後半、ガベージ コレクションがタイムアウトした後、次の状況でのみ実行されます。
-
非同期実行パラメーターがtrueに設定されている場合。
-
計算可能なストライプがある場合*。
-
達成目標や1日の制限に達していない場合は*。
-
システムがアイドル状態*の場合(バックアップやその他のメンテナンスが進行中ではない)。
-
システムが書き込み可能で、disknoflushに到達していない場合。
非同期処理は、プリエンプティブな操作です。
専用の時間とリソースを使用して、バックアップ ウィンドウの前にストライプを準備します。
これを示す添付のダイアグラムであるブラックアウト ウィンドウ.jpgを参照してください。
処理のパフォーマンスはどの程度ですか?
ブラックアウト ウィンドウ中に使用するストライプを事前に準備することで、Avamarはバックアップ スケジュール中に可能な限り迅速にデータを取得できます。
コマンドを入力すると、ストライプの内容が変更されます。多くの処理が実行されると、「cur」ディレクトリーに格納されているデータと大きな違いが発生します。
これにより、チェックポイント オーバーヘッドが増加し、データ ノードの データ/ パーティション内のスペースの消費量が増加します。
Avamarは、次の日に予想される受信データの量に対応するために準備する必要があるストライプの数を予測します。
計算は、過去N日間の移動平均に基づいています(たとえば、Nは最大10または14です)。
このセルフ チューニング メカニズムにより、Avamarは、不要な量のチェックポイント オーバーヘッドを引き起こすことなく、バックアップが最適に実行するのに十分なストライプを処理できます。
システムの変更率が突然上昇した場合、Avamarが徐々に増加する処理制限を採用するまでに数日かかることが分かりました。
非同期処理で十分なストライプを準備できない場合は、同期処理によって処理されます。
同期処理:
非同期の処理処理で十分なストライプを事前に準備できない場合、または非同期実行パラメーターがfalseに設定されている場合、処理はバックアップと同期して実行されます。
オン デマンド の処理とも呼ばれるこの処理モードは、必要に応じて実行され、ストライプが処理可能で、ノードのアクティブ ストライプになる準備ができている場合は、ストライプ上で動作します。
バックアップを使用して処理を同期的に実行できるため、ディスクI/Oリソースの競合が激化します。
ビジー状態のシステムでは、バックアップ ジョブが完了するまでに時間がかかる場合があります。
システムで高いチェックポイント オーバーヘッドが発生している場合に、同期処理のみを実行するようにAvamarを設定することもできます。これが完了した場合は、それが必要であると考える理由をお客様に伝え、トレードオフについて説明します。
A 2つの処理モードの概要:
非同期の処理:
- Avamarサーバーパラメーターの設定は asynccrunching=true。
- 通常の1日分のデータを取得した場合、バックアップ パフォーマンスが向上します。
- チェックポイントオーバーヘッドが高くなります。
- デフォルトの動作モード。
- オペレーティング システムの容量が大きい状況では、チェックポイントのオーバーヘッドを削減するために無効にできます。
同期処理:
- Avamarサーバーパラメーターの設定は asynccrunching=false
- 必要に応じて実行
- チェックポイント オーバーヘッド要件の低減
- バックアップ時間が長くなる可能性がある
- デフォルトの動作モードではない
非同期処理の実行を妨げるものは何ですか?
asynccrunching configパラメーターはfalseです。
-
バックアップが進行中
-
1日の制限に達しました
-
サーバーは読み取り専用
-
サーバーの実行レベルが「admin」よりも低い
-
ストライプ変換が進行中です
-
disknoflushの制限に達しました
-
適用されているAvamarサーバーは、hfscheckインスタンス(CGSANとも呼ばれる)を実行しています。
-
HFScheckが開始されています
Additional Information