Data Domain - pakkaamisen usein kysytyt kysymykset
Summary: Tässä artikkelissa vastataan yleisimpiin pakkausta koskeviin kysymyksiin. Data Domain Restorers on tietotyypistä riippumaton. Restorer käyttää pakkausalgoritmeja, jotka varmuuskopioivat vain yksilölliset tiedot - päällekkäiset mallit tai useat varmuuskopiot tallennetaan vain kerran. Tyypillinen pakkaussuhde on 20:1 useiden viikkojen päivittäisissä ja lisäävissä varmuuskopioinneissa. Myös tietotyyppi vaikuttaa pakkaussuhteeseen, joten pakatut kuvatiedostot, tietokannat ja pakatut arkistot (esimerkiksi .zip tiedostot) eivät pakkaa hyvin. ...
Instructions
KOSKEE SEURAAVIA:
- Kaikki DDR:t
- Kaikki tiedotteet
Pakkaaminen: Usein kysyttyjä kysymyksiä:
1. Käyttävätkö lisäävät ja täydelliset varmuuskopioinnit samaa levytilaa?
Ihannetapauksessa tämä olisi totta. Käytännössä täysi varmuuskopiointi vie hieman enemmän tilaa kuin lisäävä seuraavista syistä. Nämä syyt selittävät myös, miksi täydellinen varmuuskopio tietojen muutosten jälkeen kuluttaa silti positiivisen määrän tilaa.
- Metatiedot vievät noin 0,5 % varmuuskopion loogisesta koosta. Oletetaan, että koko looginen koko on 100 Gt ja inkrementaalin 2 Gt. Oletetaan, että inkrementaalinen pakkaus on 1 Gt. Sitten täysi kestää vähintään 1.5 Gt.
- DD-pakkausmoduuli kirjoittaa joitakin päällekkäisiä datasegmenttejä suorituskyvyn parantamiseksi. Mitä huonompi tietojen paikallisuus muutoksilla on, sitä enemmän kaksoiskappaleita kirjoitetaan. Kaksoiskappaleet otetaan myöhemmin talteen filesys cleaning -toiminnolla. Olen nähnyt, että noin 2% loogisesta koosta kirjoitetaan uudelleen kaksoiskappaleeksi. Olettaen, että kaksoiskappaleita on tällä tasolla, täysi voi kestää 1 Gt (pakattu) + 0,5 Gt (metatiedot) +2 Gt (kaksoiskappaleet) = 3,5 Gt. Kirjoitettujen kaksoiskappaleiden määrää voidaan hallita järjestelmäparametrilla, mutta emme yleensä viritä tätä parametria kenttään.
- Tietojen segmentointi voi vaihdella hieman varmuuskopioinnista varmuuskopiointiin riippuen siitä, missä järjestyksessä NFS-asiakas lähettää tiedot. Tämä järjestys ei ole deterministinen. Yleensä segmentointialgoritmi sietää muutoksia ja uudelleenjärjestelyä. Se luo kuitenkin myös joitain "pakotettuja" segmenttejä, jotka ovat alttiita muutoksille ja uudelleenjärjestelyille. Tyypillisesti noin 0,2% segmenteistä on pakotettu, joten voidaan odottaa, että paljon enemmän tilaa käytetään.
2. "filesys show space" ja "filesys show compression" näyttävät eri numerot:
Filesys show space määrittää pakkaussuhteen, joka perustuu tallennettujen tietojen loogiseen kokoon ja komennon suoritushetkellä käytettyyn levytilaan.
Filesys show compression määrittää pakkaussuhteen sen mukaan, miten kukin tiedosto on pakattu luontihetkellä.
Tiedostotyyppiä "filesys show compression" käytetään enimmäkseen tukeen ja virheenkorjaukseen. Tiedostojen poistamisen yhteydessä "filesys show compression" yliarvioi pakkaussuhteen.
Oletuksena on esimerkiksi, että ensimmäinen täysi varmuuskopio saa 2x pakkauksen. Seuraava täydellinen varmuuskopio ilman tietojen muutoksia saa 200x pakkauksen. Ensimmäinen täysi varmuuskopio poistetaan. "filesys show space" näyttää pakkaussuhteeksi 2x. "filesys show compression" näyttää nyt pakkaussuhteeksi 200x, koska ainoa olemassa oleva tiedosto sai nyt 200x pakkauksen, kun se luotiin.
Edellä mainitussa esimerkissä tiedoston "filesys show space" kumulatiivinen suhde on toisen varmuuskopioinnin jälkeen noin 4x. Kumulatiivinen suhde paranisi asymptoottisesti kohti 200x, jos jatkaisimme enemmän varmuuskopioita ilman poistoa.
On joitain muita pieniä eroja:
- "filesys show compression" ei ota huomioon säilötason hävikkiä, mikä yliarvioi pakkaussuhteen entisestään
- "filesys show compression" ei ota huomioon kaksoiskappaleiden eliminointia globaalilla pakkauksella, mikä aliarvioi pakkaussuhteen
- Filesys Show Compression -komento antaa tiedosto- tai hakemistokohtaisia tietoja, kun taas filesys show space on rajoitettu koko järjestelmään
- Tiedosto filesys show compression kertoo yleisen ja paikallisen pakkauksen välisen jaottelun, kun taas filesys show space ei
VIITTEET
- Miksi "filesys show space" ja "vtl tape show summary" pakkaussuhteet ovat erilaiset?
Kohdassa "vtl tape show summary" näkyvän pakkaussuhteen on tarkoitus vastata tiedostoa "filesys show compression /backup/vtc".
Yleisemmin tälle VTL-komennolle voidaan antaa valinnainen suodatin nauhakasettien osajoukon valitsemiseksi, ja pakkauksen oletetaan vastaavan "filesys show compression" -toimintoa kyseisessä kasettien alijoukossa.
VTL UI -koodissa olevan virheen vuoksi "vtl tape show summary" -kohdassa näkyvä pakkaus on kuitenkin virheellinen. Tämä on tunnettu ongelma, joka korjataan julkaisuversiossa 4.5.0.0.
- Miksi "filesys show compression last 24 hours" ei vastaa VTL:n odotuksia?
VTL:ssä sellaisten komentojen kuin "filesys show compression last 24 hours" tulos ei useinkaan vastaa odotuksia muiden lähteiden, kuten system show performancen, perusteella.
Ongelma johtuu "filesys show compression" (fsc) -kohdan erityispiirteistä. Yleensä "filesys show compression" näyttää valittujen tiedostojen kumulatiiviset tilastot. Tarkennus "viimeiset 24 tuntia" valitsee tiedostot, jotka on päivitetty viimeisen 24 tunnin aikana. Tilastot ovat edelleen kumulatiivisia sen jälkeen, kun tiedosto luotiin tai lyhennettiin viimeksi nollakokoon. Jos tiedosto on lisätty viimeisten 24 tunnin aikana, tiedoston kumulatiiviset tilastot ennen viimeistä 24 tuntia näkyvät tiedostoissa näkyvät 24 tunnin pakkaukset.
Muissa kuin VTL-ympäristöissä varmuuskopiotiedostot kirjoitetaan vain kerran, joten päivitettyjen ja luotujen tiedostojen välillä ei ole paljon eroja. VTL:ssä varmuuskopiot voidaan liittää olemassa oleviin nauhatiedostoihin. Harkitse esimerkiksi nauhaa, jonka kapasiteetti on 100 Gt ja joka on täytetty 50 gigatavuun asti. Jos nauhalle on liitetty 10 Gt dataa viimeisen 24 tunnin aikana, tiedoston alkuperäiset tavut 60 gigatavun arvoisena näkyy tiedostossa tiedostossa "Original Cledition last 24 hours".
- Miten kumulatiivinen puristussuhde lasketaan?
Yksittäiset puristussuhteet eivät täsmää lineaarisesti.
Oletetaan, että ensimmäisen täyden varmuuskopion pakkaus on 2x ja toisen täyden varmuuskopion pakkaus on 20x. Kumulatiivinen pakkaus ei ole (2+20)/2 tai 11x, vaan 2/(1/2+1/20) tai 3,64x.
Yleensä pienemmillä puristussuhteilla on suurempi vaikutus kumulatiiviseen puristussuhteeseen kuin korkeammilla.
Oletetaan, että ith-varmuuskopiolla on looginen koko si ja pakkaussuhde ci. Tämän jälkeen k-varmuuskopioiden kumulatiivinen pakkaussuhde voidaan laskea seuraavasti:
C = (looginen kokonaiskoko)/(käytetty tila yhteensä)
looginen kokonaiskoko = s1 + s2 + .. + SK
Käytetty kokonaistila = S1/C1 + S2/C2 + ... + SK/CK
Usein loogiset koot ovat suunnilleen samat. Tässä tapauksessa yllä oleva laskelma yksinkertaistuu seuraavasti:
Jos esimerkiksi ensimmäinen täysi varmuuskopio saa 3x pakkauksen ja jokainen seuraava täysi saa 30x pakkauksen ja säilytysaika on 30 päivää, käyttäjä näkee kumulatiivisen pakkauksen 30/(1/3+29/30) tai 23x.
- Miten Data Domain -pakkaus toimii?
Tähän kysymykseen vastataan yksityiskohtaisesti erillisessä tietämyskannan artikkelissa "Data Domain Compression" Data Domain: Data Domain -pakkaamisen ymmärtäminen
- Tukeeko Data Domain multipleksointia?
Varmuuskopiointisovelluksen multipleksoidut tiedot johtavat erittäin heikkoon yleiseen tieto-optimointiin. Lisätietoja on aiheeseen liittyvässä artikkelissa Varmuuskopiointiohjelmiston multipleksointia ei tueta Data Domainissa: Multipleksointi varmuuskopiointiohjelmistossa.
- Miksi hakemiston yleinen pakkaus näkyy paremmin 1:1-hakemiston replikoinnissa?
Tämä johtuu yleensä järjestelmään kirjoitettujen päällekkäisten segmenttien tason vaihteluista:
-
Lähteeseen tallennettujen tietojen kaksoiskappaleet on poistettu kerran verrattuna lähteeseen aiemmin tallennettuihin tietoihin.
-
Langan kautta lähetetyt tiedot on poistettu kerran - kopioon tallennettuja tietoja vastaan.
-
Kopioon tallennetut tiedot on poistettu kaksoiskappaleista kahdesti, kerran, kun tiedot lähetettiin langan yli, ja uudelleen, kun vastaanotetut tiedot kirjoitetaan kopioon.
Koska deduplikointi jättää joitakin kaksoiskappaleita, useita kertoja deduplikoitujen tietojen kaksoiskappaleita on vähemmän. Lähteeseen tallennetut ja langan kautta lähetetyt tiedot deduplikoidaan kerran, joten ne ovat suunnilleen samat, olettaen, että lähteeseen tallennetut tiedot ja kopio ovat samanlaisia. Kopioon tallennetut tiedot deduplikoidaan kahdesti, joten ne pakataan paremmin.
Tiedostojärjestelmän puhdistus poistaa suurimman osan kaksoiskappaleista. Kun lähde ja replika on puhdistettu, sinne tallennettujen tietojen määrän pitäisi olla suunnilleen sama.
- Mikä on pakkauksen muutos, kun käytetään paikallisia lz-, gzfast- ja gz-pakkausasetuksia?
Filesys Option Set Pakkaus {None | LZ | GZFAST | GZ}
Varoitus: Ennen paikallisen pakkaustyypin muuttamista tiedostojärjestelmä on sammutettava. Se voidaan käynnistää uudelleen heti, kun pakkausasetus on asetettu.
Yleensä pakkausjärjestys on seuraava:
Karkea ero on:
- lz - gzfast tarjoaa ~ 15% paremman pakkauksen ja kuluttaa 2x prosessoria
- LZ - GZ tarjoaa ~ 30% paremman pakkauksen ja kuluttaa 5x prosessoria
- GZFAST - GZ antaa ~ 10-15% paremman pakkauksen
Huomaa, että paikallisen pakkauksen muuttaminen vaikuttaa ensin uusiin tietoihin, jotka kirjoitetaan DataDomain Restoreriin muutoksen jälkeen. Vanhat tiedot säilyttävät aiemman pakkausmuotonsa seuraavaan puhdistusjaksoon asti. Seuraava puhdistus kopioi kaikki vanhat tiedot uuteen pakkausmuotoon. Tämän vuoksi puhdistus kestää paljon kauemmin ja vaatii enemmän suoritinta.
Jos asiakkaan järjestelmän suoritin on vähissä, erityisesti jos asiakas tekee varmuuskopiointia ja replikointia samanaikaisesti, varmuuskopiointi ja/tai replikointi voi hidastua. Asiakas saattaa haluta nimenomaisesti varata jonkin aikaa tämän muuntamisen tekemiseen.
Tietoviitteet:
Additional Information