Veelgestelde vragen over DDOS fysieke capaciteitsmeting of fysieke capaciteitsrapportage
Summary: Veelgestelde vragen over Data Domain Operating System (DD OS), fysieke capaciteitsmeting (PCM) of fysieke capaciteitsrapportage (PCR).
Instructions
Versie 5.7 van het Data Domain Operating System (DD OS) introduceert nieuwe functionaliteit die bekend staat als Physical Capacity Measurement (PCM) of Physical Capacity Reporting (PCR).
In dit artikel worden veelvoorkomende gebruiksscenario's en vragen over deze functie beschreven. PCM en PCR worden in dit document door elkaar gebruikt.
Wat is fysieke capaciteitsmeting (PCM)?
PCM is een nieuwe functie die wordt ondersteund in DD OS 5.7 en hoger waarmee het nauwkeurige gebruik van de harde schijf kan worden berekend aan de hand van een mappenstructuur, een verzameling mapstructuren, mtree of een verzameling MTrees.
Hoe verschilt dit van functies in eerdere releases van DDOS?
Wanneer een bestand wordt opgenomen op een DDR, leggen we verschillende statistieken over het bestand vast. Een van die statistieken is "post-lc bytes" of de fysieke hoeveelheid ruimte die een bestand inneemt wanneer het naar het systeem wordt geschreven. We kunnen post-lc bytes voor een bestands- of mappenstructuur weergeven met behulp van de filesys show compression Command - bijvoorbeeld:
sysadmin@dd9500# filesys show compression /data/col1/jf1 Total files: 4; bytes/storage_used: 1.3 Original Bytes: 4,309,378,324 Globally Compressed: 3,242,487,836 Locally Compressed: 3,293,594,658 Meta-data: 13,897,112
Dit geeft aan dat de bovenstaande mappenstructuur vier bestanden bevat die in totaal 3.293.594.658 bytes (3,07 GB) fysieke ruimte gebruikten toen ze werden opgenomen.
PCM is een poging om inconsistente resultaten te voorkomen die worden veroorzaakt doordat de bovenstaande statistieken verouderd raken. Aangezien PCM rapporten van het gebruik van de harde schijf op een bepaald moment kan genereren, zijn de bovenstaande beperkingen niet langer van toepassing en zijn de resultaten gegarandeerd nauwkeuriger.
Zijn er feiten of opstellingen bekend waarvan bekend is dat de door PCM berekende resultaten niet optimaal nauwkeurig zijn?
PCM voert steekproeven uit voor het berekenen van de schijfruimte die wordt gebruikt door bestanden in de padset. Dat betekent dat sommige bestanden mogelijk worden weggelaten uit de telling voor unieke segmenten, omdat er om prestatieredenen geen rekening wordt gehouden met bestanden die kleiner zijn dan een bepaalde grootte. De minimale grootte van de afzonderlijke bestanden in de padsets die PCM-taken overwegen voor opsomming (en dus de bestanden waarvoor het verantwoordelijk is voor schijfruimte die wordt gebruikt) is afhankelijk van de gemiddelde grootte van het bestandssysteemsegment:
- Als de gemiddelde segmentgrootte 4 K is, worden bestanden van 4 MB en kleiner genegeerd door PCM
- Als de gemiddelde segmentgrootte 8 K is, worden bestanden van 8 MB en kleiner genegeerd door PCM
- Als de gemiddelde segmentgrootte 12 K is, worden bestanden van 12 MB en kleiner genegeerd door PCM
Klantgegevens uit de praktijk laten zien dat de gemiddelde segmentgrootte voor de meest voorkomende gebruiksscenario's rond de 9 KB schommelt, dus een geschat cijfer voor bestanden die niet in aanmerking worden genomen bij het berekenen van de gebruikte schijfruimte is kleiner dan 9 MB.
Zijn er extra licenties vereist voor PCM?
Nee - PCM is geen gelicentieerde functie en daarom zijn er geen extra licenties vereist om PCM te gebruiken.
Is PCM-ondersteuning op alle platformen?
Nee - PCM wordt ondersteund op alle hardware- en Virtual Data Domain-appliances (DDVE), behalve op Active Tier on Object Storage (ATOS) DDVE's.
PCM meet en inventariseert alleen de bestanden op de actieve laag: Bestanden in Cloud Units (of voor legacy Extended Retention, die in Archiver-units) zijn niet opgenomen in de grootteberekening voor PCM-taken.
Zijn er nog andere voorwaarden vereist voordat PCM kan worden gebruikt?
PCM is standaard uitgeschakeld in DDOS 5.7. Voordat het kan worden gebruikt, moet het worden ingeschakeld en moet de cache worden geïnitialiseerd, zoals hieronder wordt weergegeven:
sysadmin@dd9500# compression physical-capacity-measurement enable and-initialize physical-capacity-measurement enabled. Initialization started.
Opmerking: De PCM-cache wordt gebruikt om toekomstige PCM-taken te versnellen en het initialiseren van de cache kan veel tijd in beslag nemen. Desondanks kunnen PCM-taken in de wachtrij worden geplaatst terwijl de PCM-cache wordt geïnitialiseerd.
Hoe berekent PCM de totale gebruik?
PCM gebruikt mtree-snapshots om het fysieke gebruik voor een groep bestanden te bepalen. Wanneer een PCM-taak wordt gestart, gebeurt het volgende:
- Er wordt een mtree-snapshot gemaakt tegen onderliggende MTrees.
sysadmin@dd9500# snapshot list mtree /data/col1/jf2 Snapshot Information for MTree: /data/col1/jf2 ---------------------------------------------- Name Pre-Comp (GiB) Create Date Retain Until Status --------------------------------- -------------- ----------------- ----------------- ------- pcr_snap_1440284055_1440360259_19 6.0 Aug 23 2015 13:04 Dec 31 1969 16:00 expired --------------------------------- -------------- ----------------- ----------------- -------
- PCM zoekt naar bestanden van de snapshot die in de PCM-taak moeten worden uitgevoerd (dat wil zeggen in de opgegeven padsets of MTrees).
- PCM doorloopt de segmentstructuur van deze bestanden om in wezen een lijst samen te stellen met unieke segmentvingerafdrukken waarnaar door alle bestanden wordt verwezen.
- PCM vindt vervolgens overeenkomstige segmenten op schijf (binnen de containerset) en berekent de som van de grootte van die segmenten.
-
De som van de grootte van deze segmenten vertegenwoordigt het huidige gebruik van de harde schijf door de bijbehorende bestanden.
- Naast het bovenstaande kan de vooraf gecomprimeerde grootte van de set bestanden worden gevonden in de bijbehorende bestandsmetadata.
- Zodra PCM-taken zijn voltooid, verlopen de onderliggende PCM-snapshots voor latere verwijdering.
Hoe werken PCM-taken?
PCM-taken worden ingediend door een gebruiker (of door een planning) en worden toegevoegd aan een PCM-werkwachtrij. Afhankelijk van de systeemworkload kunnen PCM-taken dan uit de wachtrij worden geplukt en onmiddellijk worden gestart of worden uitgesteld.
Voorbeelden van redenen waarom PCM-taken kunnen worden uitgesteld zijn:
- Het opschonen van actieve lagen wordt uitgevoerd op het systeem - PCM-taken en het opschonen van actieve lagen kunnen niet parallel worden uitgevoerd. Als gevolg hiervan worden PCM-taken die in de wachtrij zijn geplaatst terwijl het opschonen van de actieve laag wordt uitgevoerd, uitgesteld totdat de opschoning van de actieve laag is voltooid.
- Er worden al enkele PCM-taken uitgevoerd tegen onderliggende MTrees - PCM maakt gebruik van mtree-snapshots en er zijn strikte limieten voor het aantal PCM-snapshots dat een bepaalde gebruiker op een bepaald moment kan maken tegen één mtree. Als deze limieten worden overschreden door een nieuwe PCM-taak, wordt de taak uitgesteld totdat de bestaande taak is voltooid.
Is het mogelijk om de resources die PCM op een systeem gebruikt te controleren?
PCM maakt gebruik van een throttling-mechanisme dat vergelijkbaar is met dat van active tier clean, dat wil zeggen dat de PCM-throttle kan worden ingesteld van 0 (niet agressief) tot 100 (agressief). Het is duidelijk dat hoe hoger de throttle, hoe meer resources worden gebruikt door PCM en hoe groter de impact die PCM-taken kunnen hebben op andere workloads op het systeem.
Standaard is de PCM-throttle ingesteld op 20, dat wil zeggen:
sysadmin@dd9500# compression physical-capacity-measurement throttle show Throttle is set to 20 percent (default).
De PCM-gashendel kan als volgt worden gewijzigd, waarbij de wijziging naar de gashendel onmiddellijk plaatsvindt (dat wil zeggen dat er geen DDFS-herstart vereist is voor PCM om de nieuwe gasklepinstelling op te pikken):
sysadmin@dd9500# compression physical-capacity-measurement throttle set 50 Throttle set to 50 percent.
Wat zijn padsets?
PCM-taken kunnen op twee manieren worden uitgevoerd, namelijk:
- Tegen een vooraf gedefinieerde 'padset' (dat wil zeggen, door de gebruiker gespecificeerde verzameling directory's)
- Tegen een enkele mtree
Voordat taken kunnen worden uitgevoerd op een bepaalde padset, moet de padenset als volgt worden gemaakt of gedefinieerd:
sysadmin@dd9500# compression physical-capacity-measurement pathset create jfall paths /data/col1/jf1,/data/col1/jf2 Pathset "jfall" created.Specifieke mappen kunnen als volgt worden toegevoegd aan of verwijderd uit een bestaande padset:
sysadmin@dd9500# compression physical-capacity-measurement pathset del jfall paths /data/col1/jf2 Path(s) deleted from pathset "jfall". sysadmin@dd9500# compression physical-capacity-measurement pathset add jfall paths /data/col1/jf2 Path(s) added to pathset "jfall".
Alle gemaakte padsets worden als volgt weergegeven:
sysadmin@dd9500# compression physical-capacity-measurement pathset show list Pathset Number of paths Measurement-retention (days) --------------- --------------- ---------------------------- jf1 1 180 jf2 1 180 jfall 2 180 phys-gandhi3 1 180 phys-gandhi5-fc 1 180 phys-gandhi5 1 180 phys2-gandhi3 2 180 --------------- --------------- ---------------------------- 7 pathset(s) found.
Als u specifieke paden wilt weergeven die binnen een padset zijn gedefinieerd, wordt pathset show detailed commando wordt gebruikt:
sysadmin@dd9500# compression physical-capacity-measurement pathset show detailed jfall Pathset: jfall Number of paths: 2 Measurement-retention: 180 day(s) Paths: /data/col1/jf1 /data/col1/jf2 sysadmin@dd9500#
Als u een pad wilt verwijderen, stelt u het pathset destroy Opdracht kan worden gebruikt:
sysadmin@dd9500# compression physical-capacity-measurement pathset destroy jfall
Opmerking: Hiermee wordt alle geschiedenis voor de opgegeven padset verwijderd.
Hoe wordt een PCM-taak gestart?
Er wordt een nieuwe PCM-taak ingediend bij de PCM-werkwachtrij met behulp van het sample start commando, dat wil zeggen:
sysadmin@dd9500# compression physical-capacity-measurement sample start pathsets jfall Measurement task(s) submitted and will begin as soon as resources are available.
In het bovenstaande voorbeeld is een vooraf gedefinieerde padset gebruikt. Als u een PCM-taak wilt indienen voor één mtree, wordt de mtree opgegeven, dat wil zeggen:
sysadmin@dd9500# compression physical-capacity-measurement sample start mtrees /data/col1/backup Measurement task(s) submitted and will begin as soon as resources are available.
Standaard worden PCM-taken ingediend met de prioriteit 'normaal'. Het is ook mogelijk om een prioriteit van spoed op te geven:
sysadmin@dd9500# compression physical-capacity-measurement sample start pathsets jf1 priority urgent Measurement task(s) submitted and will begin as soon as resources are available.
Opdrachten met prioriteit 'dringend' worden eerder in de wachtrij geplaatst dan opdrachten met prioriteit 'normaal' (wat betekent dat ze worden opgepakt en gewerkt in plaats van ingediende opdrachten met prioriteit 'normaal').
Een lijst met ingediende of actieve taken wordt weergegeven met behulp van het sample show current commando, bijvoorbeeld:
sysadmin@dd9500# compression physical-capacity-measurement sample show current Task ID Type Name User State Creation Time Measurement Time Start Time Priority Percent (Submitted Time) Done ----------- ---- ----- -------- --------- ------------------- ------------------- ---------- -------- -------- 47244640259 PS jf2 sysadmin Scheduled 2015/08/23 12:24:12 2015/08/23 12:24:12 -- Urgent 0 47244640258 PS jf1 sysadmin Scheduled 2015/08/23 12:24:09 2015/08/23 12:24:09 -- Urgent 0 47244640257 PS jfall sysadmin Scheduled 2015/08/23 12:23:06 2015/08/23 12:23:06 -- Normal 0 ----------- ---- ----- -------- --------- ------------------- ------------------- ---------- -------- -------- sysadmin@dd9500#
Kunnen PCM-taken worden ingepland?
Ja - Als een specifieke PCM-taak regelmatig moet worden uitgevoerd, is deze zo gepland dat deze automatisch wordt uitgevoerd zoals vereist. Bijvoorbeeld:
sysadmin@dd9500# compression physical-capacity-measurement schedule create jf_sched pathsets jfall,jf1,jf2 time 1400 Schedule "jf_sched" created.
Opmerking: Planningen worden gemaakt om dagelijks, op specifieke dagen van de week of bepaalde dagen van elke maand uit te voeren.
Een bestaand schema wordt aangepast met behulp van de schedule modify Opdracht:
sysadmin@dd9500# compression physical-capacity-measurement schedule modify jf_sched priority urgent time 1700 day Wed,Fri Schedule "jf_sched" modified.
Daarnaast kunnen er als volgt padsets worden toegevoegd of verwijderd aan een bestaand schema:
sysadmin@dd9500# compression physical-capacity-measurement schedule del jf_sched pathsets jf2 Schedule "jf_sched" modified. sysadmin@dd9500# compression physical-capacity-measurement schedule add jf_sched pathsets jf2 Schedule "jf_sched" modified.
Opmerking: Een schema kan niet alleen padsets OF MTrees bevatten (dat wil zeggen dat de twee niet kunnen worden gecombineerd):
sysadmin@dd9500# compression physical-capacity-measurement schedule create jf_sched2 mtrees /data/col1/backup time 1400 Schedule "jf_sched2" created. sysadmin@dd9500# compression physical-capacity-measurement schedule add jf_sched2 pathsets jfall **** Failed to add: this schedule is only for mtrees.
Als u details van bestaande schema's wilt bekijken, kiest u schedule show all commando wordt gebruikt, bijvoorbeeld:
sysadmin@dd9500# compression physical-capacity-measurement schedule show all Name: jf_sched Status: enabled Priority: urgent Frequency: weekly on Wed, Fri Time: 17:00 Pathset(s): jfall jf1 jf2 Name: jf_sched2 Status: enabled Priority: normal Frequency: daily Time: 14:00 MTree(s): /data/col1/backup
Bestaande schema's kunnen onmiddellijk worden uitgeschakeld of ingeschakeld, dat wil zeggen:
sysadmin@dd9500# compression physical-capacity-measurement schedule disable jf_sched2 Schedule "jf_sched2" disabled. sysadmin@dd9500# compression physical-capacity-measurement schedule enable jf_sched2 Schedule "jf_sched2" enabled.
Een schema kan ook worden vernietigd:
sysadmin@dd9500# compression physical-capacity-measurement schedule destroy jf_sched2 Schedule "jf_sched2" destroyed.
Opmerking: Hiermee wordt de geschiedenis voor de bijbehorende mtrees/pathsets NIET verwijderd (dit betekent dat nieuwe PCM-taken niet automatisch worden gepland).
Hoe worden geplande taken gestart?
Wanneer een PCM-schema wordt toegevoegd en ingeschakeld, wordt een overeenkomstige vermelding toegevoegd aan /etc/crontab, dat wil zeggen:
# # collection.1.crontab.pcr.jf_sched.0 # 00 17 * * Wed,Fri root /ddr/bin/ddsh -a compression physical-capacity-measurement sample start force priority urgent objects-from-schedule jf_sched
Opmerking: De cron-taak wordt verwijderd uit
/etc/crontab Als het schema is uitgeschakeld of vernietigd.
Kan ik stoppen met het uitvoeren van een PCM-taak?
Ja - Actieve PCM-taken kunnen worden afgebroken met behulp van de taak-id of pathset-/mtree-namen. We zien bijvoorbeeld dat er twee PCM-taken in de wachtrij staan:
SE@dd9500## compression physical-capacity-measurement sample show current Task ID Type Name User State Creation Time Measurement Time Start Time Priority Percent (Submitted Time) Done ------------ ---- ----- -------- --------- ------------------- ------------------- ---------- -------- -------- 124554051585 PS jfall sysadmin Scheduled 2015/08/30 16:00:48 2015/08/30 16:00:48 -- Normal 0 124554051586 PS jfall sysadmin Scheduled 2015/08/30 16:01:55 2015/08/30 16:01:55 -- Normal 0 ------------ ---- ----- -------- --------- ------------------- ------------------- ---------- -------- --------
Deze taken kunnen worden afgebroken met behulp van de taak-id (om één taak te stoppen):
SE@dd9500## compression physical-capacity-measurement sample stop task-id 124554051585 ** This will abort any submitted or running compression physical-capacity-measurement sampling tasks. Do you want to proceed? (yes|no) [no]: yes 1 task(s) aborted.
Waardoor we één lopende taak overhouden:
SE@dd9500## compression physical-capacity-measurement sample show current Task ID Type Name User State Creation Time Measurement Time Start Time Priority Percent (Submitted Time) Done ------------ ---- ----- -------- --------- ------------------- ------------------- ---------- -------- -------- 124554051586 PS jfall sysadmin Scheduled 2015/08/30 16:01:55 2015/08/30 16:01:55 -- Normal 0 ------------ ---- ----- -------- --------- ------------------- ------------------- ---------- -------- --------
Of naam van padset:
SE@dd9500## compression physical-capacity-measurement sample stop pathsets jfall ** This will abort any submitted or running compression physical-capacity-measurement sampling tasks. Do you want to proceed? (yes|no) [no]: yes 1 task(s) aborted.
Waardoor we zonder werk komen te zitten:
SE@dd9500## compression physical-capacity-measurement sample show current No measurement tasks found.
Hoe kunnen details van voltooide taken worden weergegeven?
Details van voltooide taken worden bekeken met het sample show history Opdracht. Als u bijvoorbeeld details voor één padset wilt weergeven, doet u het volgende:
SE@dd9500## compression physical-capacity-measurement sample show history pathset jfall Pathset: jfall Measurement Time Logical Used Physical Used Global-Comp Local-Comp Total-Comp (Pre-Comp) (Post-Comp) Factor Factor Factor (GiB) (GiB) (Reduction %) ------------------- ------------ ------------- ----------- ---------- -------------- 2015/08/23 12:23:06 7.0 4.2 1.70x 0.98x 1.67x (40.24%) 2015/08/23 13:04:20 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 2015/08/26 14:00:01 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 2015/08/27 14:00:01 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 2015/08/28 14:00:02 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 2015/08/29 14:00:02 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 2015/08/30 14:00:01 10.0 6.2 1.63x 0.98x 1.61x (37.84%) ------------------- ------------ ------------- ----------- ---------- -------------- Total number of measurements retrieved = 7.
De parameter gedetailleerde geschiedenis toont ook de begin- en eindtijden van elke taak:
SE@dd9500## compression physical-capacity-measurement sample show detailed-history pathset jfall Pathset: jfall Measurement Time Logical Used Physical Used Global-Comp Local-Comp Total-Comp Task ID Task Start Time Task End Time (Pre-Comp) (Post-Comp) Factor Factor Factor (GiB) (GiB) (Reduction %) ------------------- ------------ ------------- ----------- ---------- -------------- ------------ ------------------- ------------------- 2015/08/23 12:23:06 7.0 4.2 1.70x 0.98x 1.67x (40.24%) 47244640257 2015/08/23 12:25:19 2015/08/23 12:25:23 2015/08/23 13:04:20 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 51539607553 2015/08/23 13:05:45 2015/08/23 13:05:48 2015/08/26 14:00:01 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 77309411329 2015/08/26 14:02:50 2015/08/26 14:02:50 2015/08/27 14:00:01 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 85899345921 2015/08/27 14:03:06 2015/08/27 14:03:06 2015/08/28 14:00:02 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 94489280513 2015/08/28 14:02:50 2015/08/28 14:02:51 2015/08/29 14:00:02 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 103079215105 2015/08/29 14:01:40 2015/08/29 14:01:41 2015/08/30 14:00:01 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 115964116993 2015/08/30 14:04:12 2015/08/30 14:04:12 ------------------- ------------ ------------- ----------- ---------- -------------- ------------ ------------------- ------------------- Total number of measurements retrieved = 7.
Opmerking: Beide opdrachten kunnen worden gewijzigd om alleen resultaten over een bepaalde periode op te halen:
SE@dd9500## compression physical-capacity-measurement sample show history pathset jfall last 2days Pathset: jfall Measurement Time Logical Used Physical Used Global-Comp Local-Comp Total-Comp (Pre-Comp) (Post-Comp) Factor Factor Factor (GiB) (GiB) (Reduction %) ------------------- ------------ ------------- ----------- ---------- -------------- 2015/08/29 14:00:02 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 2015/08/30 14:00:01 10.0 6.2 1.63x 0.98x 1.61x (37.84%) ------------------- ------------ ------------- ----------- ---------- -------------- Total number of measurements retrieved = 2.
Of tussen specifieke datums of tijden:
SE@dd9500## compression physical-capacity-measurement sample show history pathset jfall start 08231010 end 08231400 Pathset: jfall Measurement Time Logical Used Physical Used Global-Comp Local-Comp Total-Comp (Pre-Comp) (Post-Comp) Factor Factor Factor (GiB) (GiB) (Reduction %) ------------------- ------------ ------------- ----------- ---------- -------------- 2015/08/23 12:23:06 7.0 4.2 1.70x 0.98x 1.67x (40.24%) 2015/08/23 13:04:20 10.0 6.2 1.63x 0.98x 1.61x (37.84%) ------------------- ------------ ------------- ----------- ---------- -------------- Total number of measurements retrieved = 2.
Hoe lang wordt een specifieke geschiedenis bewaard voor een specifieke padset/mtree?
Standaard worden de resultaten van elke ingestelde PCM-pad 180 dagen bewaard. Dit kan worden gewijzigd door wijziging van de bijbehorende padset:
SE@dd9500## compression physical-capacity-measurement pathset modify jfall measurement-retention 14 Measurement-retention changed to 14 day(s).
De PCM-geschiedenis wordt bewaard in de historische database van de systemen. Als de historische database verloren gaat of beschadigd raakt, gaan hierdoor ook details van de hele PCM-geschiedenis verloren.
Zijn er kanttekeningen waar u op moet letten bij het gebruik van PCM?
PCM-taken worden onderbroken als het systeem minder dan 10% beschikbare ruimte heeft.
PCM-taken worden onderbroken terwijl de opschooncyclus wordt uitgevoerd.
Zoals eerder vermeld, is PCM een tool die wordt gebruikt om het fysieke gebruik door een specifieke set directory's/mtrees te berekenen. Bij het berekenen van resultaten voor een specifieke padset of verzameling MTrees, telt PCM slechts één keer de grootte van elk uniek gegevenssegment dat wordt gebruikt door de padset of verzameling MTrees.
Als bestanden die worden gededupliceerd met dezelfde gegevens zich in meerdere verschillende PCM-taken bevinden, kan elk van de segmenten waaruit de bestanden bestaan meerdere keren worden geteld (één keer door elke PCM-taak). Dit betekent dat hoewel de resultaten van elke afzonderlijke PCM-taak nauwkeurig zijn, de resultaten van meerdere PCM-taken niet kunnen worden opgeteld om een nauwkeurig fysiek gebruik te geven voor de som van padsets/mtrees in de taken.
Vanwege de manier waarop PCM-taken worden samengesteld, wordt de padset of MTree post-comp-ruimte die op schijf wordt gebruikt:
- PCM-taken houden geen rekening met dode data (schijfruimte die wordt gebruikt door verwijderde bestanden, welke ruimte op schijf mogelijk nog niet is vrijgemaakt door GC uit te voeren).
- PCM houdt geen rekening met data die zijn vergrendeld in snapshots die zijn gemaakt voor de MTree of padsets die worden gemeten.
Ik heb bijvoorbeeld een mtree met de naam /data/col1/jf1 waarin ik drie bestanden van 1Gb maak, dat wil zeggen:
!!!! dd9500 YOUR DATA IS IN DANGER !!!! # for i in 1 2 3 ; do
> dd if=/dev/urandom of=/data/col1/jf1/${i} bs=1024k count=1024
> done
Vervolgens kopieer ik die bestanden naar een tweede mtree (/data/col1/jf2):
!!!! dd9500 YOUR DATA IS IN DANGER !!!! # cp /data/col1/jf1/1 /data/col1/jf2/4 !!!! dd9500 YOUR DATA IS IN DANGER !!!! # cp /data/col1/jf1/2 /data/col1/jf2/5 !!!! dd9500 YOUR DATA IS IN DANGER !!!! # cp /data/col1/jf1/3 /data/col1/jf2/6
Ten slotte maak ik een nieuw bestand van 1 Gb in /data/col1/jf2:
!!!! dd9500 YOUR DATA IS IN DANGER !!!! # dd if=/dev/urandom of=/data/col1/jf2/7 bs=1024k count=1024 1024+0 records in 1024+0 records out
Als lokale compressie van gegevens buiten beschouwing wordt gelaten en alleen deduplicatie wordt overwogen, is het duidelijk dat elke mtree de volgende hoeveelheid fysieke ruimte gebruikte toen de bestanden werden geschreven:
/data/col1/jf1: 3Gb
/data/col1/jf2: 1 Gb (voor het nieuwe bestand: gekopieerde bestanden zouden zijn gededupliceerd met bestaande data, waardoor ze minimale fysieke ruimte zouden hebben verbruikt).
Als gevolg hiervan wordt de som van het gebruik van de fysieke ruimte door /data/col1/jf1 als /data/col1/jf2 moet ongeveer 4 GB zijn.
Er worden drie PCM-padsets gemaakt:
JF1 met /data/col1/JF1
JF2 met /data/col1/JF2
JFALL met data/col1/JF1 en /data/col1/JF2
De PCM-taken worden als volgt uitgevoerd en geleverd:
Pathset: jf1 Measurement Time Logical Used Physical Used Global-Comp Local-Comp Total-Comp (Pre-Comp) (Post-Comp) Factor Factor Factor (GiB) (GiB) (Reduction %) ------------------- ------------ ------------- ----------- ---------- -------------- 2015/08/23 12:24:09 3.0 3.2 0.96x 0.98x 0.94x (-6.21%) ------------------- ------------ ------------- ----------- ---------- -------------- Pathset: jf2 Measurement Time Logical Used Physical Used Global-Comp Local-Comp Total-Comp (Pre-Comp) (Post-Comp) Factor Factor Factor (GiB) (GiB) (Reduction %) ------------------- ------------ ------------- ----------- ---------- -------------- 2015/08/23 12:24:12 4.0 4.2 0.98x 0.98x 0.96x (-4.14%) ------------------- ------------ ------------- ----------- ---------- --------------
Deze waarden zijn juist omdat elke PCM-taak alleen kijkt naar fysieke data waarnaar wordt verwezen door de bestanden in de bijbehorende padset. Dit betekent dat gegevens voor bestanden die zijn gekopieerd, twee keer worden geteld (één keer bij elke PCM-taak).
Het lijkt misschien redelijk dat om volledig fysiek gebruik te krijgen door de /data/col1/jf1 als /data/col1/jf2 MTrees, kunnen we de waarden van 'fysiek gebruikt' optellen uit de bovenstaande outputs.
Om een nauwkeurige waarde te krijgen voor het totale fysieke gebruik van /data/col1/jf1 als /data/col1/jf2, is het noodzakelijk om één PCM-taak uit te voeren die beide MTrees omvat (dat wil zeggen: jfall gebruiken). Dit zorgt ervoor dat dubbele segmenten slechts één keer worden geteld en niet twee keer zoals in het bovenstaande voorbeeld, namelijk:
Pathset: jfall Measurement Time Logical Used Physical Used Global-Comp Local-Comp Total-Comp (Pre-Comp) (Post-Comp) Factor Factor Factor (GiB) (GiB) (Reduction %) ------------------- ------------ ------------- ----------- ---------- -------------- 2015/08/23 12:23:06 7.0 4.2 1.70x 0.98x 1.67x (40.24%) ------------------- ------------ ------------- ----------- ---------- --------------
Samengevat kan de uitvoer van meerdere PCM-taken niet worden opgeteld om een nauwkeurig fysiek gebruik voor een set padsets/mtrees te geven. In plaats daarvan moet één PCM-padset worden gedefinieerd die alle vereiste mtrees/directory's omvat, omdat dit ervoor zorgt dat dubbele data slechts één keer worden geteld. Als dit niet wordt gedaan en er bijvoorbeeld voor elke mtree op een systeem een aparte PCM-taak zou worden uitgevoerd, dan is het heel goed mogelijk dat de totale gebruikte fysieke capaciteit de ruwe capaciteit van het systeem overschrijdt.
Kunnen PCM-taken alleen worden ingediend door de DDSH command line of kan er ook een UI gebruikt worden?
In dit document wordt de Data Domain opdrachtregelinterface (DDSH) gebruikt om PCM-taken te configureren, in te dienen en te controleren.