ECS: Recriação da codificação de eliminação com paralisação do nó em um cluster do ECS de quatro nós
Summary: A partir do ECS versão 3.4, a reconstrução da codificação de eliminação não será iniciada automaticamente se houver uma interrupção de nó em um cluster do ECS de quatro nós.
Symptoms
Nas versões do ECS anteriores à 3.4, se restivessem apenas três nós íntegros, o ECS iniciava a restauração dos dados do cliente para três cópias espelhadas, uma por nó. Essa decisão de design foi tomada para maximizar a proteção de dados dos clientes. O processo também é conhecido como desativação de EC (Erasure Coding).
EC é um algoritmo que reduz o espaço de armazenamento e, ao mesmo tempo, protege os dados contra falhas de disco ou nó.
Quando os dados são codificados para eliminação, o espaço físico necessário em um ECS é de aproximadamente 1,33 vez para armazenar dados do cliente (12 segmentos de dados + 4 segmentos de paridade). No entanto, se o ECS iniciar a desativação do EC, o espaço físico necessário para os dados do cliente aumentará de 1,33 para 3 vezes.
Isso pode fazer com que o ECS atinja o limite de 90% de utilização da capacidade, fazendo com que o ECS entre no modo somente leitura e indisponibilidade de dados.
Cause
Resolution
Para aprimorar a proteção de dados e evitar exceder o limite de capacidade de 90%, o comportamento padrão para clusters do ECS com apenas três nós íntegros foi alterado.
No 3.4, a alteração no design foi feita de tal forma que o ECS não implementará mais a desativação automática do EC quando apenas três nós estiverem íntegros/on-line. O sistema é executado em um estado degradado e pode encontrar problemas de desempenho, mas é provável que evite um DU. As novas gravações continuarão a ser gravadas como três cópias espelhadas e serão codificadas para eliminação quando houver 4+ nós on-line e disponíveis para gravação.
Qualquer falha adicional na unidade pode causar DUs isoladas, além de aumentar um pouco a exposição a uma possível perda de dados (DL), mas ainda é improvável.
Além disso, considere expandir o ECS para cinco ou mais nós. Ele diminui a exposição do ECS a situações de degradação do desempenho, DU e DL durante a falha do nó. Para obter mais detalhes sobre a arquitetura do ECS, consulte o Guia do Administrador do ECS.