XtremIO:SSDの障害によるXtremIOアレイのパフォーマンス インパクト
Summary: SSDの障害によるXtremIOアレイのパフォーマンス インパクト
Symptoms
XtremIO DPGで単一または複数のSSD障害が発生すると、XtremIOアレイのパフォーマンスに影響する可能性があります。この状況の原因を理解するには、DPGの動作とDPGの状態について説明する必要があります。
- 主なDPG事業:
DPGの再構築:
- いつ: SSDに障害が発生した場合
- 理由: ダブル パリティー保護の復元
DPGの統合:
- いつ: 技術者が故障したSSDを新品のドライブと交換する場合
- 理由: 新しいSSDをDPGに追加します
DPGの状態:
- [Healthy]:ダブル パリティー保護
- 単一縮退: シングル パリティー保護
- ダブル デグレード: パリティ保護なし
- 失敗: データの損失
XtremIOはCAS(Content Aware Storage)です。したがって、DPGへのI/O操作はすべて統計的にランダムであり、ユーザーのランダムまたはシーケンシャルなワークロードに関係なく、同じパフォーマンスを達成できます。もう1つのメリットは、SSDに障害が発生した場合に、クラスターがページを元の場所に戻す必要がないことです。
CASではない他のアレイには、順次論理データと順次物理データの両方の要件があります。データを元の場所に返さないと、シーケンシャルI/Oパフォーマンスが失われます。
DPG再構築の説明:
SSDが取り外された場合、またはSYMが自動DPG再構築を発行すると、DPG再構築では次の2つの操作を実行する必要があります。
フェーズ1:失われたすべてのデータをリカバリーし、他の場所に書き込む:
失われたページ(データ + パリティ)はDPG(新しい書き込みフロー)にリカバリーされます
PLBM/HMDテーブルがアップデートされます。
フェーズ2:すべてのストライプのパリティー情報の更新:
データ/パリティー ページを移動するには、(すべてのストライプにわたる)すべてのパリティーを更新する必要があります
どちらの操作でも、時間を節約し、書き込みを減らすために、すべてのストライプを更新する必要があります。どちらも 1 回のイテレーションで実行されます。
DPG統合の説明: 新しいSSDをDPGに追加するには、手動での操作が必要です。
- 技術者による手動操作が必要です(新しいSSDをDAEスロットに設置します)。
- 重要度がほとんどない/まったくない(再構築とは対照的)
要求されると、DPG統合プロセスによってパリティ ブロックのバランスが取られます。パリティ ブロックのみが元のSSDにリカバリーされます(均等なパリティ分散を実現するため)。これは、新しいSSDの割り当て、追加、統合によって行われます。
Cause
XtremIO DPGでの単一または複数のSSD障害
Resolution
上記の情報に基づくと、DPGの再構築/統合中にクラスター リソースの使用率がいくらか上昇しますが、通常はパフォーマンスやレイテンシーが顕著に増加することはありません。ただし、 二重のDPG再構築 中、クラスターは、データの整合性を確保し、データ ロスを回避するために、障害が発生したSSDをできるだけ早く再構築するために、 ほぼすべての リソースを集中させます。これは設計上想定されており、すべての操作が完了すると、パフォーマンスは通常のパフォーマンスに戻ります。