Dell Unity:パフォーマンスの問題を引き起こしているスナップショット キューの大容量化または増大
Summary: Dell Unity:パフォーマンスの問題と高負荷のストレージ プロセッサー(SP)CPUの原因となる、スナップショット キューの大きいまたは増加する
Symptoms
- 目標リカバリー ポイント(RPO)の値が、より積極的と見なされる値(つまり、10分)に削減されました。」
- 「目標リカバリー ポイント(RPO )は、障害発生時に失われる可能性のある許容可能なデータ量を示す用語で、単位時間で測定されます。非同期レプリケーション セッションをセットアップする場合、RPOに基づいて自動同期化を構成できます。最短5分から最長1,440分(24時間)のRPOを指定できます。デフォルトのRPOは60分(1時間)のインターバルに設定されています。同期レプリケーションの場合、RPOは0に固定されます。」
- LUNに「破棄中」状態のスナップショットが多数あります。
- 「破棄中」状態のスナップショットの数は、時間の経過とともに増加しています。
- 相関するIOPS/帯域幅ワークロードを使用しない高SP CPU。
- LUNとバックエンド ドライブはキューイングが発生し、レスポンス タイムが長くなります。
Unisphereの[Block]セクションで確認できます。LUNごとの読み出しを取得するには、[Snapshots]列を必ず追加してください。1つまたは複数のLUNに対して多数のスナップショットが表示されている場合は、いくつかの事柄
ことを示しています。個々のLUNに移動し、[Snapshots]タブを選択して、[State]([destroying])と[Taken by]([Replication])を確認します。
Cause
キューイングが構築される原因は多数考えられます。主な原因の1つは、RPOが「積極的すぎる」と見なされることに起因しています
ネイティブ非同期ブロック レプリケーション:
ネイティブ非同期ブロック レプリケーションでは、2つのスナップショット間の差分を使用してデータを転送します。レプリケーション セッションの有効期間中に、変更を転送するときにスナップショットの「更新」が複数回行われます
スナップショットが更新されると、実際には削除され、バックグラウンドで再作成されます。
特に注目すべき懸念事項は、スナップショット機能に関連するSP CPUの消費量と追加のバックエンドI/Oです
Unityアレイは、比較的妥当な時間内にスナップショットを完全に削除することができないため、「削除予定」状態になるスナップショットの割合が、一定時間内に完全に削除されるスナップショットの割合をはるかに上回っています。RPO値を小さくすると、一定時間内にスナップショットの作成または削除が行われる量が増加します。
Resolution
破棄状態のスナップショットが最も多いLUNの場合、スナップショットの削除が追いつくまで、RPOを少なくともデフォルト(60分)に設定します。キューに入れられていたスナップショットの数に応じて、値をこの新しいRPOのままにし、それに応じて判断することができます。
「デル・テクノロジーズでは、スナップショットがアクティブなハイブリッド プールにフラッシュ階層を含めることをお勧めします。
スナップショットにより、システムの全体的なCPU負荷が増加し、ストレージ プール内の全体的なドライブIOPSが増加します。 また、スナップショットは、プール容量を使用して、スナップショットによって追跡されている古いデータを格納します。これにより、スナップショットが削除されるまで、プールで使用される容量が増加します。 ストレージ プールのパフォーマンスと容量の両方の要件を計画する際には、スナップショットのオーバーヘッドを考慮してください。
ストレージ オブジェクトでスナップショットを有効にする前に、システムを監視し、既存のリソースが追加のワークロード要件を満たすことができることを確認することをお勧めします(表2の「ハードウェア機能ガイドライン」セクションを参照)。 一度に少数のストレージ オブジェクトでスナップショットを有効にしてから、システムを監視し、システムが推奨される動作範囲内にあることを確認してから、さらにスナップショットを有効にします。
スナップショットの操作(作成、削除など)は、時間をずらして実行することをお勧めします。 これは、異なるストレージ オブジェクトのセットに対して異なるスナップショット スケジュールを使用することで実現できます。 また、FAST VPの再配置が完了した後に、スナップショット操作をスケジュールすることをお勧めします。
スナップショットはシステムによって非同期的に削除されます。スナップショットの削除処理中は、「破棄中」とマークされます。 システムが時間の経過とともに「破棄中」のスナップショットを蓄積している場合は、既存のスナップショット スケジュールが厳しすぎることを示している可能性があります。スナップショットを作成する頻度が低いほど、より予測可能なレベルのパフォーマンスを実現できる場合があります。
Dell Unityは、スナップショットの削除操作を調整して、ホストI/Oへの影響を軽減します。 スナップショットの削除は、システム使用率が低い期間に、より迅速に実行されます。Dell Unity:Best Practices Guide
Additional Information