Dopad převodu na kompresi GZ na systém Data Domain a výkon čištění

Summary: Tento článek obsahuje informace o různých algoritmech komprese podporovaných v zařízení DDR spolu s dopadem převodu systému na použití algoritmu GZ.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

ŘEŠENÍ

DDOS v současné době podporuje čtyři různé typy komprese s různými úrovněmi zatížení procesoru kompresí. Následující tabulka shrnuje charakteristiky jednotlivých možností:
 

type         expected-comp               CPU-load 
----------   --------------------   -------------- 
none         1.0x                       0x 
lz(default)  2.0x                       1x 
gzfast       2.5x                       2x 
gz           3.0x                       5x
Například kompresní algoritmus gz poskytuje přibližně 3x místní kompresi, ale ke spuštění kompresní části kódu používá přibližně 5x více CPU než lz. Očekávané hodnoty komprese se mohou značně lišit v závislosti na datovém typu. U některých datových typů může být gz pouze o 10 % lepší než lz, zatímco u jiných datových typů je to 2x nebo lepší než lz.
 
Obecně platí, že soubory s velkým množstvím podobných řetězců dat mají tendenci se komprimovat lépe pomocí gz než lz.

Mezi příklady takových datových sad patří:

  • Databázové soubory.
  • Soubory protokolu.

Důsledky použití komprese GZ:

Vzhledem k tomu, že silnější kompresní algoritmy využívají více procesoru, mohou mít významné důsledky pro výkon:

  • Zálohy s nízkou deduplikací probíhají pomaleji, protože je třeba zkomprimovat a zapsat na disk více nových dat. Konkrétně první úplná záloha pravděpodobně dosáhne 50 % jmenovité propustnosti ve špičce.
  • Vzhledem k tomu, že čištění dekomprimuje a znovu komprimuje spuštěná data, může čištění trvat déle a může zpomalit další aktivity v systému, jako jsou zálohy a replikace.
  • Zdrojový server DDR v páru replikace adresáře komprimuje data pomocí kompresního algoritmu používaného cílem před odesláním dat. Pokud tedy cíl používá kompresní algoritmus gz, replikace může probíhat pomaleji a může zpomalit další aktivity v systému, například zálohování a čištění. 

Proto je přechod na kompresi GZ rozhodnutím, které by mělo být přijato na základě pracovní zátěže, kterou bude systém zažívat. V opačném případě se problém s kapacitou v podstatě převede na problém s výkonem.

V následující části popíšeme charakteristiky úlohy, ve které by GZ byla užitečná.

Kdo by měl používat kompresi GZ?

Aplikace s vysokou mírou duplicit, nízkou četností změn a nízkými požadavky na výkon zálohování jsou ideálními kandidáty pro použití gz. Dobrým příkladem jsou nearline aplikace. Většina pamětí DDR v terénu, které se používají pro nearline aplikace, již gz používá.

Jak mohu změnit typ komprese?

Chcete-li změnit typ komprese, použijte následující příkazy:

# filesys disable
# filesys option set local-compression-type {none | lz | gzfast | gz}
# filesys enable

 

VÝSTRAHA: Před změnou typu lokální komprese musí být systém souborů vypnut. Poté jej lze restartovat ihned po nastavení možnosti komprese.

Po změně typu komprese budou všechny nové zápisy používat nový typ komprese a všechna již zapsaná data se během čištění laxně převedou na nový typ komprese. Opožděná konverze znamená, že ne všechny kontejnery budou během prvního kola čištění znovu komprimovány. Úplná opětovná komprese všech dat existujících v DDR před změnou zásad komprese vyžaduje několik kol čištění.

Zásady čištění určují, které kontejnery se vyberou v konkrétním kole čištění a pouze tyto kontejnery se znovu zkomprimují. Zásady čištění jsou založené na množství dat odpadu, které daný kontejner obsahuje.  Odpadová data znamenají odstraněná data, na která již obor názvů neodkazuje. Čím více odpadu nádoba obsahuje, tím je pravděpodobnější, že bude vybrána k čištění.

Pokud chce zákazník zaplatit jednorázový požadavek na server, může postupovat podle následujícího postupu:

  1. Zakažte DDFS pomocí příkazu:

    filesys disable
  2. Chcete-li zakázat opožděný převod (vyžaduje režim SE), použijte následující příkaz:

    reg set system.GC_APPLY_LAZY_CONVERSION=false
  3. Povolte DDFS pomocí příkazu:

    filesys enable

V důsledku toho může první čištění po změně typu komprese a zakázání opožděného převodu trvat déle. Kdykoli měníte typ komprese, měli byste pečlivě sledovat systém po dobu jednoho nebo dvou týdnů, abyste se ujistili, že se chová dobře.


Additional Information

Affected Products

Data Domain

Products

Data Domain
Article Properties
Article Number: 000004020
Article Type: How To
Last Modified: 23 Sep 2024
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.