Data Domain -käyttöjärjestelmä ei tue tietojen ennakoivaa uudelleentasapainotusta tallennuksessa Data Domain -tiedostojärjestelmän kapasiteetin laajentamisen jälkeen

Summary: Tässä artikkelissa kerrotaan, että DDOS (Data Domain -käyttöjärjestelmä) ei tue tallennuksen tietojen tasapainottamista uudelleen sen jälkeen, kun DDFS (Data Domain File System) -tiedostojärjestelmää on laajennettu Data Domain Restorerissa (DDR) ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Kuten monien tallennusjärjestelmien kohdalla, useimpien Data Domain Restorer (DDR) -mallien kapasiteettia voidaan lisätä lisäämällä järjestelmään ulkoisia tallennuskotelohyllyjä (ES30, DS60) ja laajentamalla sitten Data Domain File System (DDFS) näihin kotelohyllyihin. Milloin tämä tehdään:
  • Uudet kotelohyllyt on kiinnitetty fyysisesti (kaapeloitu päällä)
  • DDOS (Data Domain Operating System) skannaa tallennustilan uudelleen ja tunnistaa uudet kehikkohyllyt
  • Nämä uudet kotelohyllyt lisätään sitten DDR:n tallennustasoon (aktiivinen taso tai tietty arkistoyksikkö)
  • Tätä tasoa voidaan sitten laajentaa verkossa ilman DDFS-katkosta
  • Kaikki kyseiseen tallennustasoon kirjoitetut uudet tiedot kirjoitetaan olemassa oleville ja uusille hyllyille
  • Olemassa olevien hyllyjen tietoja ei kuitenkaan tasapainoteta uudelleen uusien kotelohyllyjen välillä
Voit selittää tämän tarkemmin:
  • DDOS:ssa tietojen tallennusyksikkö on 4,5 Mt:n "kontti"
  • Kun ne luodaan, 4,5 Mt: n säiliöt kirjoitetaan vastaavan tason arkistoyksikön kaikkien kotelohyllyjen päälle pyöreällä robin-tavalla
  • Kun tason arkistointiyksikköön lisätään uusia kotelohyllyjä, DDFS alkaa kirjoittaa uusia 4,5 Mt:n säilöjä näihin koteloihin olemassa olevien koteloiden lisäksi (uudet kotelot sisältyvät round robin -konttien kirjoittamiseen)
  • DDOS ei kuitenkaan pyri (tai tarjoa mitään erityisiä toimintoja) siirtääkseen tason olemassa olevia säiliöitä olemassa olevista hyllykoteloista uusiin
Tämä tarkoittaa, että hyllykoteloiden lisääminen voi jättää liitetyn tallennustilan tiedot "epätasapainoon". Esimerkki:
  • DDR: n aktiivisessa kerroksessa on aluksi yksi kotelo, joka on 90% täynnä
  • Aktiiviselle tasolle on lisätty uusi kotelo ja DDFS laajennettu tähän koteloon
  • Äskettäin luotujen 4,5 Mt:n säilöjen kirjoitukset ovat nyt pyöreitä olemassa olevissa ja uusissa koteloissa
  • Tämä jättää olemassa olevan kotelon vajaaksi vapaan tilan, kun taas äskettäin lisätty kotelo on lähes tyhjä
Tässä skenaariossa useiden tallennusjärjestelmien avulla järjestelmänvalvoja voi tasapainottaa liitettyjen koteloiden tietoja uudelleen ja siirtää ennakoivasti joitakin tietoja olemassa olevista koteloista uusiin lisättyihin koteloihin varmistaakseen, että kaikkien koteloiden käytetty kapasiteetti on suunnilleen sama). Huomaa kuitenkin, että DDOS EI tarjoa tätä toimintoa ja että DDFS:n rakenteen vuoksi sitä ei tarvita, koska tietojen tasapainottaminen tapahtuu luonnollisesti ajan mittaan.

Tietojen tasapainottaminen suoritetaan kahdella toiminnolla:
  • Roskien keräyksen puhdistus
  • Paikkakunnan korjaus
Kutakin näistä toiminnoista ja siitä, miten ne aiheuttavat tietojen automaattisen tasapainottamisen, käsitellään tarkemmin alla.

Roskien keräyksen puhdistus

Jätteiden keräyspuhdistus (GC) on ajoitettu toiminto, joka suoritetaan säännöllisesti DDR:ssä (oletusarvoisesti kerran viikossa aktiivista tasoa vasten ja, olettaen, että tilan palautus on käytössä, tarvittaessa arkistoyksiköitä vastaan). Kun se suoritetaan:
  • Tunnistaa, mitkä tasoarkistoyksikön fyysiset tiedot ovat "reaaliaikaisia" (joita käyttää yksi tai useampi tiedostojärjestelmän tiedosto tai objektit, kuten tilannevedokset) tai "kuolleita" (mikään objekti ei viittaa niihin, joten ne ovat tarpeettomia järjestelmälle)
  • Määrittää 4,5 Mt:n säilöt, jotka sisältävät suurimman osan tason arkistointiyksikön "kuolleista" tiedoista
  • Lukee nämä 4,5 Mt:n säilöt ja poimii kaikki niiden sisältämät "reaaliaikaiset" tiedot - tämä "kopioidaan eteenpäin" äskettäin luotuihin 4,5 Mt:n säilöihin, jotka kirjoitetaan tasoarkistoyksikön kaikille hyllyille
  • Poistaa vanhat 4,5 Mt:n säilöt, poistaa niiden sisältämät kuolleet tiedot ja vapauttaa levyllä olevaa tilaa uudelleenkäyttöä varten
Kun GC toimii järjestelmässä, jossa on minkäänlaista tietojen epätasapainoa, on odotettavissa, että suurin osa vanhoista tiedoista (ja siten suurin osa kuolleista tiedoista) säilytetään vanhemmissa hyllykoteloissa tasoarkistoyksikössä. Tämän seurauksena suurin osa säiliöistä, jotka luetaan, kopioidaan eteenpäin ja poistetaan, ovat vanhemmissa hyllykoteloissa. Äskettäin luodut säiliöt on kuitenkin kirjoitettu pyöreässä robin-muodossa tason kaikkien hyllyjen väliin. Tämän seurauksena suurin osa GC: n vapauttamasta tilasta on vanhemmilla hyllyillä, kun taas äskettäin kulunut tila on kaikilla hyllyillä.

Yksinkertaisena esimerkkinä:
  • DDR: n aktiivinen taso sisältää kaksi hyllyä - ensimmäinen hylly sisältää 10000 4,5 Mt: n säiliötä, kun taas toinen hylly sisältää 100 4,5 Mt: n säiliötä (jokaista toisen hyllyn konttia kohden on 100 säiliötä ensimmäisellä hyllyllä)
  • GC ajaa ja kopioi tietoja 5000 säiliöstä ensimmäiselle hyllylle
  • Näiden 5000 säilön reaaliaikaiset tiedot aiheuttavat 1000 uuden 4,5 Mt:n säilön luomisen
  • Nämä 1000 uutta 4,5 Mt:n konttia on kirjoitettu molemmille hyllyille
  • Kun GC on valmis, ensimmäiseen hyllyyn mahtuu 5500 4,5 Mt:n konttia, kun taas toiseen hyllyyn mahtuu 600 konttia (jokaista toisen hyllyn konttia kohden ensimmäisellä hyllyllä on noin yhdeksän konttia)
  • Yhden kaasukromatografian aikana ensimmäisen ja toisen hyllyn välinen konttien epätasapaino on pienentynyt 10-kertaiseksi – tämän odotetaan vähenevän edelleen kaasukromatkoilla seuraavien läpivientijaksojen aikana, mikä tarkoittaa, että tiedot tasapainottuvat hyllyjen välillä luonnollisesti ajan myötä
Paikkakunnan korjaus:

Kun tiedosto kirjoitetaan DDR: ään, suoritetaan seuraavat korkean tason toiminnot:
  • Tiedosto on jaettu loogisiin paloihin (kutsutaan segmenteiksi), joiden koko on 4-12 kilotavua
  • Jokainen segmentti tarkistetaan, onko se jo levyllä sillä tasolla, jolle tiedostoa kirjoitetaan
  • Jos segmentti on jo olemassa, se on datan kaksoiskappale ja juuri kirjoitetun tiedoston segmentti korvataan osoittimella levyllä oleviin tietoihin
  • Jos segmenttiä ei ole, se on ainutlaatuista dataa, ja siksi se pakataan uuteen 4,5 Mt:n säiliöön ja kirjoitetaan levylle
Kaikilla tiedostoilla on käsite "locality" eli se, kuinka peräkkäisiä tietosegmentit, joihin kyseinen tiedosto viittaa, ovat DDR:n levyllä. On selvää, että tiedostoilla, joilla on korkea deduplikointisuhde (jotka sisältävät suuren määrän päällekkäisiä tietoja), on todennäköisesti huonompi sijainti kuin yksilöllisellä tiedostolla, koska nieltynä niiden tiedot korvataan osoittimilla olemassa oleviin tietoihin, jotka saattavat olla hajallaan vastaavan tason arkistointiyksikön säilöissä/levyissä.

DDR: n tietojen hyvän lukusuorituskyvyn saavuttaminen edellyttää, että tiedostolla on hyvä "paikallisuus" (sen tiedot ovat suhteellisen peräkkäisiä levyllä), jotta DDFS-eteenpäin lukevat algoritmit voivat toimia optimaalisesti. Huomaa myös, että DDFS olettaa, että tiedosto, josta todennäköisimmin luetaan (palautusta tai replikointia varten), on tietyn varmuuskopion uusin kopio. Tämän seurauksena tietyntyyppisille tiedoille (kuten virtuaalisille synteettisille materiaaleille) suoritetaan prosessi, jota kutsutaan "paikalliseksi korjaukseksi" äskettäin kirjoitettujen tiedostotietojen paikallisuuden optimoimiseksi. Kun ajetaan, paikkakunnan korjaus:
  • Tutki tietoja, joihin tiedosto viittaa, etsimällä osia, joissa tiedot eivät ole peräkkäisiä levyllä (näyttää huonon sijainnin)
  • Lue nämä ei-peräkkäiset tiedot levyltä ja kirjoita ne uudelleen peräkkäin (päällekkäisinä tietoina) juuri luotuihin 4,5 Mt:n säilöihin
Tämän jälkeen on odotettavissa, että vanha (ei-peräkkäinen) kopio päällekkäisistä tiedoista tunnistetaan "kuolleeksi" seuraavan GC-ajon aikana ja poistetaan järjestelmästä. Huomioi sen vuoksi seuraavat:
  • Järjestelmissä, joissa tiedot ovat epätasapainossa, useimpien vanhojen ei-peräkkäisten tietojen odotetaan olevan vanhoilla, täysipainoisemmilla koteloiden hyllyillä
  • Kun nämä tiedot kirjoitetaan peräkkäin uudelleen päällekkäisinä tietoina, ne sijoitetaan uusiin 4,5 Mt:n säilöihin, jotka ovat round robin kaikissa vastaavan tason koteloissa
  • Tämän seurauksena suurin osa paikalliskorjauksen luomista "kuolleista" (vanhoista päällekkäisistä tiedoista) on vanhoilla, täyteen asutuilla hyllyillä
  • Kun GC toimii, suurin osa "kuolleista" tiedoista löytyy sitten vanhoilta täyteen asutuilta hyllyiltä ja poistetaan (vapauttamalla tilaa näillä hyllyillä) yllä kuvatulla tavalla
Johtopäätös

Tämän seurauksena DDR voi normaalin paikallisen korjaus- ja puhdistustoiminnon (GC) avulla tasapainottaa tietoja läpinäkyvästi hyllyjen välillä ajan mittaan. Tämä tapahtuu ilman järjestelmänvalvojien lisätoimia, mikä tarkoittaa, että erityisiä tietojen tasapainotustoimintoja ei tarvita, kuten joskus nähdään muissa tallennusjärjestelmissä. Tasapainottamisen nopeuden lisäämiseksi on sen vuoksi tarpeen joko:
  • Lisää tietojen "vaihtuvuutta" DDR:ssä
  • Lisää DDR:ssä paikallisesti korjattavien tietojen määrää
Jos haluat keskustella lisää näistä vaihtoehdoista, ota yhteyttä sopimuksen tehneeseen tukipalveluntarjoajaan ja mainitse tämän artikkelin tiedot.

Affected Products

Data Domain
Article Properties
Article Number: 000019150
Article Type: How To
Last Modified: 29 Jul 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.