ECS:4ノードECSクラスターでのノード停止に伴う消失訂正符号の再構築
Summary: ECSバージョン3.4以降では、4ノードECSクラスターでノードが停止した場合、消失訂正符号の再構築は自動的に開始されません。
Symptoms
3.4より前のECSバージョンでは、正常なノードが3つしか残っていない場合、ECSは、ノードごとに1つずつ、3つのミラーリングされたコピーにお客様のデータのリストアを開始しました。この設計上の決定は、お客様のデータのデータ保護を最大化するために行われました。このプロセスは、EC(消失訂正符号)廃棄とも呼ばれます
ECは、ディスクまたはノードの障害からデータを保護しながら、ストレージ スペースを削減するアルゴリズムです。
データが消失訂正符号化されている場合、ECS上で必要な物理スペースは、お客様のデータを格納するために約1.33倍になります(12のデータ セグメント + 4つのパリティ セグメント)。 ただし、ECSがECの廃棄を開始すると、お客様のデータに必要な物理スペースが1.33倍から3倍に増加します
これにより、ECSの容量使用率がしきい値90%に達し、ECSが読み取り専用モードになり、データが使用できなくなる可能性があります。
Cause
Resolution
データ保護を強化し、容量しきい値90%を超えないようにするために、正常なノードが3つしかないECSクラスターのデフォルトの動作が変更されました
3.4では、3つのノードのみが正常/オンラインの場合、ECSはEC廃棄を自動的に実装しないように設計が変更されました。システムは縮退状態で実行され、パフォーマンスの問題が発生する可能性がありますが、DUは回避される可能性があります。新しい書き込みは引き続き3つのミラー コピーとして書き込まれ、4+ノードがオンラインになり、書き込みが可能になると消失訂正符号化されます
追加のドライブ障害が発生すると、DUが孤立し、潜在的なデータ ロス(DL)の可能性がわずかに高まる可能性がありますが、その可能性はほとんどありません。
また、ECSを5ノード以上に拡張することも検討してください。これにより、ノード障害時にECSがパフォーマンスの低下、DU、DLの状況にさらされる可能性が低くなります。ECSアーキテクチャの詳細については、『ECS管理者ガイド』を参照してください。