ECS: Opětovné vytvoření s výpadkem uzlu v clusteru ECS se čtyřmi uzly
Summary: Od verze ECS 3.4 se opětovné vytvoření Erasure Coding automaticky nespustí, pokud dojde k výpadku uzlu v clusteru ECS se čtyřmi uzly.
Symptoms
Pokud ve verzích ECS starších než 3.4 zůstaly v pořádku pouze tři uzly, systém ECS zahájil obnovení zákaznických dat na tři zrcadlené kopie, jednu na každý uzel. Toto rozhodnutí bylo učiněno s cílem maximalizovat ochranu zákaznických dat. Tento proces je také znám jako vyřazení EC (Erasure Coding).
EC je algoritmus, který snižuje úložný prostor a zároveň chrání data před selháním disku nebo uzlu.
Pokud jsou data kódována pro vymazání, je fyzický prostor potřebný v systému ECS přibližně 1,33x pro ukládání zákaznických dat (12 datových segmentů + 4 paritní segmenty). Pokud však systém ECS začne vyřazovat EC, fyzický prostor potřebný pro zákaznická data se zvýší z 1,33x na 3x.
To může vést k tomu, že systém ECS dosáhne prahové hodnoty 90% využití kapacity, což způsobí přechod do režimu pouze pro čtení a nedostupnost dat.
Cause
Resolution
Aby se zlepšila ochrana dat a zabránilo se překročení prahové hodnoty 90% kapacity, bylo změněno výchozí chování clusterů ECS s pouze třemi uzly, které jsou v pořádku.
Ve verzi 3.4 byla provedena změna designu tak, že systém ECS již nebude implementovat automatické vyřazení EC, když jsou v pořádku nebo online pouze tři uzly. Systém běží v degradovaném stavu a může dojít k problémům s výkonem, ale pravděpodobně se vyhne DU. Nové zápisy se dál zapisují jako tři zrcadlené kopie a budou zakódované pro vymazání, jakmile budou 4+ uzlů online a budou k dispozici pro zápis.
Jakákoli další selhání disku mohou způsobit izolované du. Může také mírně zvýšit riziko potenciální ztráty dat (DL), což je však stále nepravděpodobné.
Zvažte také rozšíření systému ECS na pět a více uzlů. Snižuje vystavení ECS stavům snížení výkonu, situacím DU a DL během selhání uzlu. Další podrobnosti o architektuře ECS naleznete v příručce správce systému ECS.