ECS : Reconstruction du codage d’effacement avec panne de nœud sur un cluster ECS à quatre nœuds
Summary: À partir d’ECS version 3.4, la reconstruction du codage d’effacement n’est pas lancée automatiquement en cas de panne d’un nœud sur un cluster ECS à quatre nœuds.
Symptoms
Dans les versions d’ECS antérieures à la version 3.4, s’il ne restait que trois nœuds sains, ECS lançait la restauration des données client vers trois copies en miroir, une par nœud. Cette décision de conception a été prise pour optimiser la protection des données des clients. Ce processus est également connu sous le nom de retrait
EC (Erasure Coding).EC est un algorithme qui réduit l’espace de stockage tout en protégeant les données contre les pannes de disque ou de nœud.
Lorsque les données sont codées par effacement, l’espace physique requis sur un ECS est d’environ 1,33 fois pour stocker les données client (12 segments de données + 4 segments de parité). Toutefois, si ECS commence à retirer ECS, l’espace physique requis pour les données client passe de 1,33 à 3 fois.
ECS peut alors atteindre le seuil d’utilisation de la capacité de 90 %, ce qui entraîne le passage d’ECS en mode lecture seule et l’indisponibilité des données.
Cause
Resolution
Afin d’améliorer la protection des données et d’éviter de dépasser le seuil de capacité de 90 %, le comportement par défaut des clusters ECS avec seulement trois nœuds sains a été modifié.
Dans la version 3.4, la modification de conception a été apportée de sorte qu’ECS n’implémente plus automatiquement ECS Retiring lorsque seulement trois nœuds sont intègres/en ligne. Le système fonctionne dans un état dégradé et peut rencontrer des problèmes de performances, mais il est susceptible d’éviter une indisponibilité des données. Les nouvelles écritures continuent d’être écrites sous la forme de trois copies en miroir et seront codées par effacement une fois qu’il y aura 4+ nœuds en ligne et disponibles pour l’écriture.
Toute panne de disque supplémentaire peut provoquer des indisponibilité des données isolées. Elle peut également augmenter légèrement l’exposition à une perte de données (DL) potentielle, mais cela reste peu probable.
Envisagez également d’étendre ECS à cinq nœuds ou plus. ECS est ainsi moins exposé à la dégradation des performances, à l’indisponibilité des données et aux situations de perte de données en cas de défaillance d’un nœud. Pour plus d’informations sur l’architecture ECS, consultez le Guide d’administration d’ECS.