Dopad převodu na kompresi GZ na systém Data Domain a výkon čištění
Summary: Tento článek obsahuje informace o různých algoritmech komprese podporovaných v zařízení DDR spolu s dopadem převodu systému na použití algoritmu GZ.
Instructions
ŘEŠENÍ
DDOS v současné době podporuje čtyři různé typy komprese s různými úrovněmi zatížení procesoru kompresí. Následující tabulka shrnuje charakteristiky jednotlivých možností:
type expected-comp CPU-load ---------- -------------------- -------------- none 1.0x 0x lz(default) 2.0x 1x gzfast 2.5x 2x gz 3.0x 5x
Například kompresní algoritmus gz poskytuje přibližně 3x místní kompresi, ale ke spuštění kompresní části kódu používá přibližně 5x více CPU než lz. Očekávané hodnoty komprese se mohou značně lišit v závislosti na datovém typu. U některých datových typů může být gz pouze o 10 % lepší než lz, zatímco u jiných datových typů je to 2x nebo lepší než lz.
Obecně platí, že soubory s velkým množstvím podobných řetězců dat mají tendenci se komprimovat lépe pomocí gz než lz.
Mezi příklady takových datových sad patří:
- Databázové soubory.
- Soubory protokolu.
Důsledky použití komprese GZ:
Vzhledem k tomu, že silnější kompresní algoritmy využívají více procesoru, mohou mít významné důsledky pro výkon:
- Zálohy s nízkou deduplikací probíhají pomaleji, protože je třeba zkomprimovat a zapsat na disk více nových dat. Konkrétně první úplná záloha pravděpodobně dosáhne 50 % jmenovité propustnosti ve špičce.
- Vzhledem k tomu, že čištění dekomprimuje a znovu komprimuje spuštěná data, může čištění trvat déle a může zpomalit další aktivity v systému, jako jsou zálohy a replikace.
- Zdrojový server DDR v páru replikace adresáře komprimuje data pomocí kompresního algoritmu používaného cílem před odesláním dat. Pokud tedy cíl používá kompresní algoritmus gz, replikace může probíhat pomaleji a může zpomalit další aktivity v systému, například zálohování a čištění.
Proto je přechod na kompresi GZ rozhodnutím, které by mělo být přijato na základě pracovní zátěže, kterou bude systém zažívat. V opačném případě se problém s kapacitou v podstatě převede na problém s výkonem.
V následující části popíšeme charakteristiky úlohy, ve které by GZ byla užitečná.
Kdo by měl používat kompresi GZ?
Aplikace s vysokou mírou duplicit, nízkou četností změn a nízkými požadavky na výkon zálohování jsou ideálními kandidáty pro použití gz. Dobrým příkladem jsou nearline aplikace. Většina pamětí DDR v terénu, které se používají pro nearline aplikace, již gz používá.
Jak mohu změnit typ komprese?
Chcete-li změnit typ komprese, použijte následující příkazy:
# filesys disable
# filesys option set local-compression-type {none | lz | gzfast | gz}
# filesys enable
Po změně typu komprese budou všechny nové zápisy používat nový typ komprese a všechna již zapsaná data se během čištění laxně převedou na nový typ komprese. Opožděná konverze znamená, že ne všechny kontejnery budou během prvního kola čištění znovu komprimovány. Úplná opětovná komprese všech dat existujících v DDR před změnou zásad komprese vyžaduje několik kol čištění.
Zásady čištění určují, které kontejnery se vyberou v konkrétním kole čištění a pouze tyto kontejnery se znovu zkomprimují. Zásady čištění jsou založené na množství dat odpadu, které daný kontejner obsahuje. Odpadová data znamenají odstraněná data, na která již obor názvů neodkazuje. Čím více odpadu nádoba obsahuje, tím je pravděpodobnější, že bude vybrána k čištění.
Pokud chce zákazník zaplatit jednorázový požadavek na server, může postupovat podle následujícího postupu:
-
Zakažte DDFS pomocí příkazu:
filesys disable
-
Chcete-li zakázat opožděný převod (vyžaduje režim SE), použijte následující příkaz:
reg set system.GC_APPLY_LAZY_CONVERSION=false
-
Povolte DDFS pomocí příkazu:
filesys enable
V důsledku toho může první čištění po změně typu komprese a zakázání opožděného převodu trvat déle. Kdykoli měníte typ komprese, měli byste pečlivě sledovat systém po dobu jednoho nebo dvou týdnů, abyste se ujistili, že se chová dobře.