ECS: Efficienza dello storage
Riepilogo: Questo articolo illustra l'efficienza dello storage per ECS.
Istruzioni
ECS utilizza i codici di erasure per la protezione dei dati.
Sebbene sia più efficiente dello storage rispetto ad altre forme di protezione, ad esempio il mirroring, comporta un certo overhead di storage.
ECS fornisce un meccanismo in cui l'efficienza dello storage aumenta con l'utilizzo di tre o più siti.
In una configurazione di replica geografica con più siti/VDC, ECS replica i blocchi dal VDC primario a un sito remoto per fornire high availability.
Tuttavia, questa semplice replica può comportare un overhead elevato dello spazio su disco.
Per ovviare a questo problema, ECS utilizza una tecnica innovativa per ridurre l'overhead, preservando al contempo le funzionalità di high availability.
Questo può essere illustrato con un semplice esempio.
Si considerino 3 VDC in un ambiente multisito: VDC1, VDC2 e VDC3 e che VDC1 abbia il blocco C1 e VDC2 abbia il blocco C2.
Con la replica semplice, una copia secondaria di C1 e una copia secondaria di C2 possono essere posizionate in VDC3. Poiché tutti i blocchi hanno le stesse dimensioni, ciò comporta un totale di 4 x 128 MB di spazio utilizzato per archiviare 2 x 128 MB di object.
In questa situazione, ECS può eseguire un operazione XOR di C1 e C2 (matematicamente scritta come C1 C2) e posizionarla in VDC3 ed eliminare le singole copie secondarie di C1 e C2.
Invece di utilizzare 2 x 128 MB di spazio in VDC3, ECS ora utilizza solo 128 MB (l'operazione XOR genera un nuovo blocco della stessa dimensione).
In questo caso, se VDC1 si interrompe, ECS può ricostruire C1 utilizzando C2 da VDC2 e i dati (C1 C2) da VDC3. Analogamente, se VDC2 si interrompe, ECS può ricostruire C2 utilizzando C1 da VDC1 e i dati (C1 C2) da VDC3.
Con l'aumento del numero di siti collegati, l'algoritmo ECS è più efficiente nel ridurre l'overhead.
La Tabella 10 fornisce informazioni sull'overhead di storage in base al numero di siti per la codifica di erasure normale di 12+4 e la codifica di erasure dell'archivio cold di 10+2 e illustra come ECS diventi più efficiente in termini di storage man mano che vengono collegati più siti. Per ottenere un overhead inferiore, è necessario scrivere la stessa quantità di dati in ogni sito.
In alcuni scenari, potrebbe essere necessaria la replica su tutti i siti per una maggiore protezione dei dati e migliori prestazioni di lettura. L'abilitazione di questa funzione disabiliterà la funzionalità XOR per l'efficienza dello storage descritta. La replica in tutti i siti è disponibile in ECS 2.2 e versioni successive.