ECS: Gjenoppbygging av slettingskoding med nodeavbrudd på en ECS-klynge med fire noder
Summary: Fra og med ECS versjon 3.4 Sletting Koding Gjenoppbygging startes ikke automatisk hvis det er et nodeavbrudd på en ECS-klynge med fire noder.
Symptoms
Hvis bare tre friske noder gjensto i ECS-versjoner før 3.4, startet ECS gjenopprettingen av kundedataene til tre speilede kopier, én per node. Denne designbeslutningen ble tatt for å maksimere databeskyttelsen for kundedata. Prosessen er også kjent som EC (Erasure Coding) pensjonering.
EC er en algoritme som reduserer lagringsplassen samtidig som den beskytter data mot disk- eller nodefeil.
Når data slettekodes, er den fysiske plassen som kreves på en ECS, omtrent 1,33 ganger for lagring av kundedata (12 datasegmenter + 4 paritetssegmenter). Hvis ECS imidlertid starter EC-avviklingen, øker den fysiske plassen som kreves for kundedata, fra 1,33 ganger til 3 ganger.
Dette kan føre til at ECS når terskelen for kapasitetsutnyttelse på 90 %, noe som fører til at ECS går inn i skrivebeskyttet modus og at data blir utilgjengelig.
Cause
Resolution
For å forbedre databeskyttelsen og unngå å overskride kapasitetsterskelen på 90 % ble standardvirkemåten for ECS-klynger med bare tre sunne noder endret.
I 3.4 ble designendringen gjort slik at ECS ikke lenger vil implementere EC Retiring automatisk når bare tre noder er sunne/online. Systemet kjører i en redusert tilstand og kan støte på ytelsesproblemer, men vil sannsynligvis unngå en DU. Nye skriveoperasjoner fortsetter å bli skrevet som tre speilede kopier og vil bli slettet når det er 4+ noder online og tilgjengelig for skriving
.Eventuelle ekstra stasjonsfeil kan forårsake isolerte DU-er, det kan også øke eksponeringen for et potensielt datatap (DL), men det er fortsatt usannsynlig.
Vurder også å utvide ECS til fem eller flere noder. Det reduserer ECS-eksponering for ytelsesreduksjon, DU og DL-situasjoner under nodefeil. Hvis du vil ha mer informasjon om ECS-arkitektur, kan du se administratorveiledningen for ECS.