Ofte stillede spørgsmål om DDOS-måling af fysisk kapacitet eller rapportering af fysisk kapacitet
Summary: Ofte stillede spørgsmål om Data Domain Operating System (DD OS), Physical Capacity Measurement (PCM) eller Physical Capacity Reporting (PCR).
Instructions
Version 5.7 af Data Domain Operating System (DD OS) introducerer nye funktioner kendt som fysisk kapacitetsmåling (PCM) eller fysisk kapacitetsrapportering (PCR).
I denne artikel beskrives almindelige eksempler på brug og spørgsmål vedrørende denne funktion. PCM og PCR bruges i flæng i dette dokument.
Hvad er måling af fysisk kapacitet (PCM)?
PCM er en ny funktion, der understøttes i DD OS 5.7 og nyere, som gør det muligt at beregne den nøjagtige harddiskudnyttelse af et mappetræ, en samling mappetræer, MTree eller en samling MTrees.
Hvordan adskiller dette sig fra funktioner i tidligere versioner af DDOS?
Når en fil indtages på en DDR, registrerer vi forskellige statistikker om filen. En sådan statistik er "post-lc bytes" eller den fysiske mængde plads, der tages af en fil, når den skrives til systemet. Vi kan se post-lc bytes for en fil eller et mappetræ ved hjælp af filesys show compression kommando - for eksempel:
sysadmin@dd9500# filesys show compression /data/col1/jf1 Total files: 4; bytes/storage_used: 1.3 Original Bytes: 4,309,378,324 Globally Compressed: 3,242,487,836 Locally Compressed: 3,293,594,658 Meta-data: 13,897,112
Dette indikerer, at ovenstående mappetræ indeholder fire filer, der i alt brugte 3.293.594.658 bytes (3.07 GB) fysisk plads, når de blev indtaget.
PCM er et forsøg på at undgå, at inkonsekvente resultater skyldes, at ovenstående statistikker bliver forældede. Da PCM kan generere rapporter om harddiskudnyttelse på et bestemt tidspunkt, gælder ovenstående begrænsninger ikke længere, og resultaterne er garanteret mere nøjagtige.
Er der nogen kendte fakta eller opsætninger, hvor resultater beregnet af PCM vides at være mindre end optimalt nøjagtige?
PCM foretager sampling til beregning af den diskplads, der bruges af filer i stisættet. Det betyder, at nogle filer kan udelades af optællingen for unikke segmenter, fordi der af hensyn til ydeevnen ikke tages højde for filer, der er mindre end en given størrelse. Minimumstørrelsen af de individuelle filer i de stisæt, som PCM-job tager i betragtning til optælling (og dermed dem, det tegner sig for diskplads, der bruges til), afhænger af den gennemsnitlige filsystemsegmentstørrelse:
- Hvis den gennemsnitlige segmentstørrelse er 4 K, ignoreres filer på 4 MB eller mindre af PCM
- Hvis den gennemsnitlige segmentstørrelse er 8 K, ignoreres filer på 8 MB og mindre af PCM
- Hvis den gennemsnitlige segmentstørrelse er 12 K, ignoreres filer på 12 MB og mindre af PCM
Kundedata fra den virkelige verden viser, at den gennemsnitlige segmentstørrelse svæver omkring 9 KB i de mest almindelige brugstilfælde, så et omtrentligt tal for filer, der ikke tages i betragtning, når en PCM beregner den anvendte diskplads, ville være dem, der er mindre end 9 MB.
Kræves der yderligere licenser til PCM?
Nej - PCM er ikke en licenseret funktion, og der kræves derfor ingen yderligere licenser for at bruge PCM.
Er PCM-understøttelse på alle platforme?
Nej - PCM understøttes på alle hardware- og Virtual Data Domain-enheder (DDVE), undtagen på ATOS-DDVE (Active Tier on Object Storage).
PCM måler og optæller kun filerne på det aktive niveau: Filer, der er placeret i cloud-enheder (eller for ældre udvidet opbevaring, dem i arkiveringsenheder) er ikke med i størrelsesberegningen for PCM-job.
Kræves der andre forudsætninger, før PCM kan bruges?
Som standard er PCM deaktiveret i DDOS 5.7. Før den kan bruges, skal den være aktiveret, og dens cache initialiseres som vist nedenfor:
sysadmin@dd9500# compression physical-capacity-measurement enable and-initialize physical-capacity-measurement enabled. Initialization started.
Bemærk: PCM-cachen bruges til at fremskynde fremtidige PCM-job, og initialisering af cachen kan tage lang tid. På trods af disse kan PCM-job begynde at blive sat i kø, mens PCM-cachen initialiseres.
Hvordan beregner PCM det samlede forbrug?
PCM bruger MTree-snapshots til at bestemme den fysiske udnyttelse af en gruppe filer. Når et PCM-job starter, sker der følgende:
- Der oprettes et MTree-snapshot i forhold til underliggende MTrees.
sysadmin@dd9500# snapshot list mtree /data/col1/jf2 Snapshot Information for MTree: /data/col1/jf2 ---------------------------------------------- Name Pre-Comp (GiB) Create Date Retain Until Status --------------------------------- -------------- ----------------- ----------------- ------- pcr_snap_1440284055_1440360259_19 6.0 Aug 23 2015 13:04 Dec 31 1969 16:00 expired --------------------------------- -------------- ----------------- ----------------- -------
- PCM finder filer fra snapshottet, som skal være i PCM-jobbet (det vil sige i de angivne stisæt eller MTrees).
- PCM går i segmenttræet for disse filer for i det væsentlige at opbygge en liste over unikke segmentfingeraftryk, der refereres til af alle filerne.
- PCM finder derefter tilsvarende segmenter på disken (inden for beholdersættet) og beregner summen af størrelsen af disse segmenter.
-
Summen af størrelsen af disse segmenter repræsenterer den aktuelle harddiskudnyttelse af de tilsvarende filer.
- Ud over ovenstående kan den forudkomprimerede størrelse af sættet af filer findes fra de tilsvarende filmetadata.
- Når PCM-job er fuldført, udløber underliggende PCM-snapshots til senere fjernelse.
Hvordan fungerer PCM-job?
PCM-job sendes af en bruger (eller efter en tidsplan) og føjes til en PCM-arbejdskø. Afhængigt af systemets workload kan PCM-job derefter hentes fra køen og startes med det samme, eller de kan udskydes i længere tid.
Eksempler på, hvorfor PCM-job kan udskydes, er som følger:
- Aktiv niveaurensning kører på systemet – PCM-job og aktiv niveaurensning kan ikke køre parallelt. Resultatet er, at PCM-job, der er sat i kø, mens aktiv niveaurensning kører, udskydes, indtil rensning af aktivt niveau er fuldført.
- Der er allerede nogle PCM-job, der kører mod underliggende MTrees - PCM bruger MTree-snapshots, og der er strenge grænser for, hvor mange PCM-snapshots en given bruger kan oprette på et givet tidspunkt mod et enkelt MTree. Hvis disse grænser overskrides af et nyt PCM-job, udskydes jobbet, indtil det eksisterende job er fuldført.
Er det muligt at kontrollere de ressourcer, der bruges af PCM på et system?
PCM bruger en gasspjældsmekanisme, der ligner den, der bruges af aktiv tier clean, dvs. PCM-gashåndtaget kan indstilles fra 0 (ikke aggressiv) til 100 (aggressiv). Det er klart, at jo højere gashåndtaget er, jo flere ressourcer bruges PCM, og jo større indflydelse kan PCM-job have på anden arbejdsbelastning på systemet.
Som standard er PCM-gashåndtaget indstillet til 20, det vil sige:
sysadmin@dd9500# compression physical-capacity-measurement throttle show Throttle is set to 20 percent (default).
PCM-gasspjældet kan ændres som følger, idet ændringen til gasspjældet finder sted med det samme (dvs. der kræves ingen DDFS-genstart, for at PCM kan hente den nye gasindstilling):
sysadmin@dd9500# compression physical-capacity-measurement throttle set 50 Throttle set to 50 percent.
Hvad er stisæt?
PCM-job kan køres på to måder, det vil sige:
- I forhold til et foruddefineret "stisæt" (dvs. brugerspecificeret samling af mapper)
- Mod et enkelt mtree
Før job kan køres mod et givet kurvesæt, skal kurvesættet oprettes eller defineres på følgende måde:
sysadmin@dd9500# compression physical-capacity-measurement pathset create jfall paths /data/col1/jf1,/data/col1/jf2 Pathset "jfall" created.Specifikke mapper kan føjes til eller fjernes fra et eksisterende stisæt på følgende måde:
sysadmin@dd9500# compression physical-capacity-measurement pathset del jfall paths /data/col1/jf2 Path(s) deleted from pathset "jfall". sysadmin@dd9500# compression physical-capacity-measurement pathset add jfall paths /data/col1/jf2 Path(s) added to pathset "jfall".
Alle stisæt, der blev oprettet, vises som følger:
sysadmin@dd9500# compression physical-capacity-measurement pathset show list Pathset Number of paths Measurement-retention (days) --------------- --------------- ---------------------------- jf1 1 180 jf2 1 180 jfall 2 180 phys-gandhi3 1 180 phys-gandhi5-fc 1 180 phys-gandhi5 1 180 phys2-gandhi3 2 180 --------------- --------------- ---------------------------- 7 pathset(s) found.
Hvis du vil have vist bestemte kurver, der er defineret i et kurvesæt, skal ikonet pathset show detailed Kommandoen bruges:
sysadmin@dd9500# compression physical-capacity-measurement pathset show detailed jfall Pathset: jfall Number of paths: 2 Measurement-retention: 180 day(s) Paths: /data/col1/jf1 /data/col1/jf2 sysadmin@dd9500#
Hvis du vil slette en sti, skal du angive pathset destroy Kommandoen kan bruges:
sysadmin@dd9500# compression physical-capacity-measurement pathset destroy jfall
Bemærk: Dette fjerner al historik for det angivne kurvesæt.
Hvordan startes et PCM-job?
Et nyt PCM-job sendes til PCM-arbejdskøen ved hjælp af sample start kommando, det vil sige:
sysadmin@dd9500# compression physical-capacity-measurement sample start pathsets jfall Measurement task(s) submitted and will begin as soon as resources are available.
I ovenstående eksempel blev der brugt et foruddefineret kurvesæt. For at indsende et PCM-job mod et enkelt MTree angives MTree, det vil sige:
sysadmin@dd9500# compression physical-capacity-measurement sample start mtrees /data/col1/backup Measurement task(s) submitted and will begin as soon as resources are available.
PCM-job indsendes som standard med prioriteten "normal". Det er også muligt at angive en prioritet af hastende:
sysadmin@dd9500# compression physical-capacity-measurement sample start pathsets jf1 priority urgent Measurement task(s) submitted and will begin as soon as resources are available.
Job med prioriteten 'haster' står i kø foran dem med prioriteten 'normal' (hvilket betyder, at de afhentes og arbejdes frem for alle indsendte job med prioritet 'normal').
Der vises en liste over sendte eller igangværende job ved hjælp af ikonet sample show current kommando, for eksempel:
sysadmin@dd9500# compression physical-capacity-measurement sample show current Task ID Type Name User State Creation Time Measurement Time Start Time Priority Percent (Submitted Time) Done ----------- ---- ----- -------- --------- ------------------- ------------------- ---------- -------- -------- 47244640259 PS jf2 sysadmin Scheduled 2015/08/23 12:24:12 2015/08/23 12:24:12 -- Urgent 0 47244640258 PS jf1 sysadmin Scheduled 2015/08/23 12:24:09 2015/08/23 12:24:09 -- Urgent 0 47244640257 PS jfall sysadmin Scheduled 2015/08/23 12:23:06 2015/08/23 12:23:06 -- Normal 0 ----------- ---- ----- -------- --------- ------------------- ------------------- ---------- -------- -------- sysadmin@dd9500#
Kan PCM-job planlægges?
Ja – hvis et bestemt PCM-job skal køres regelmæssigt, er det planlagt til at køre automatisk efter behov. F.eks.:
sysadmin@dd9500# compression physical-capacity-measurement schedule create jf_sched pathsets jfall,jf1,jf2 time 1400 Schedule "jf_sched" created.
Bemærk: Tidsplaner oprettes til at køre dagligt, på bestemte ugedage eller bestemte dage i hver måned.
En eksisterende tidsplan ændres ved hjælp af ikonet schedule modify Kommando:
sysadmin@dd9500# compression physical-capacity-measurement schedule modify jf_sched priority urgent time 1700 day Wed,Fri Schedule "jf_sched" modified.
Derudover kan en eksisterende plan have stisæt tilføjet eller fjernet som følger:
sysadmin@dd9500# compression physical-capacity-measurement schedule del jf_sched pathsets jf2 Schedule "jf_sched" modified. sysadmin@dd9500# compression physical-capacity-measurement schedule add jf_sched pathsets jf2 Schedule "jf_sched" modified.
Bemærk: En plan kan ikke kun indeholde kurvesæt ELLER MTrees (dvs. de to kan ikke blandes):
sysadmin@dd9500# compression physical-capacity-measurement schedule create jf_sched2 mtrees /data/col1/backup time 1400 Schedule "jf_sched2" created. sysadmin@dd9500# compression physical-capacity-measurement schedule add jf_sched2 pathsets jfall **** Failed to add: this schedule is only for mtrees.
Hvis du vil have vist detaljer om eksisterende tidsplaner, vises ikonet schedule show all kommando bruges, for eksempel:
sysadmin@dd9500# compression physical-capacity-measurement schedule show all Name: jf_sched Status: enabled Priority: urgent Frequency: weekly on Wed, Fri Time: 17:00 Pathset(s): jfall jf1 jf2 Name: jf_sched2 Status: enabled Priority: normal Frequency: daily Time: 14:00 MTree(s): /data/col1/backup
Eksisterende tidsplaner kan deaktiveres eller aktiveres med det samme, dvs.:
sysadmin@dd9500# compression physical-capacity-measurement schedule disable jf_sched2 Schedule "jf_sched2" disabled. sysadmin@dd9500# compression physical-capacity-measurement schedule enable jf_sched2 Schedule "jf_sched2" enabled.
En tidsplan kan også ødelægges:
sysadmin@dd9500# compression physical-capacity-measurement schedule destroy jf_sched2 Schedule "jf_sched2" destroyed.
Bemærk: Dette fjerner IKKE historikken for de tilsvarende MTrees/pathsets (det betyder, at nye PCM-job ikke planlægges automatisk).
Hvordan startes planlagte job?
Når en PCM-plan tilføjes og aktiveres, medfører dette, at der føjes en tilsvarende post til /etc/crontabDet er:
# # collection.1.crontab.pcr.jf_sched.0 # 00 17 * * Wed,Fri root /ddr/bin/ddsh -a compression physical-capacity-measurement sample start force priority urgent objects-from-schedule jf_sched
Bemærk: Cron-jobbet fjernes fra
/etc/crontab hvis tidsplanen er deaktiveret eller ødelagt.
Kan jeg stoppe med at køre et PCM-job?
Ja – Kørsel af PCM-job kan afbrydes ved hjælp af enten opgave-id et eller navnene stisæt/MTree. For eksempel ser vi, at vi har to PCM-job i kø:
SE@dd9500## compression physical-capacity-measurement sample show current Task ID Type Name User State Creation Time Measurement Time Start Time Priority Percent (Submitted Time) Done ------------ ---- ----- -------- --------- ------------------- ------------------- ---------- -------- -------- 124554051585 PS jfall sysadmin Scheduled 2015/08/30 16:00:48 2015/08/30 16:00:48 -- Normal 0 124554051586 PS jfall sysadmin Scheduled 2015/08/30 16:01:55 2015/08/30 16:01:55 -- Normal 0 ------------ ---- ----- -------- --------- ------------------- ------------------- ---------- -------- --------
Disse job kan afbrydes ved hjælp af enten opgave-id et (for at stoppe et enkelt job):
SE@dd9500## compression physical-capacity-measurement sample stop task-id 124554051585 ** This will abort any submitted or running compression physical-capacity-measurement sampling tasks. Do you want to proceed? (yes|no) [no]: yes 1 task(s) aborted.
Efterlader os med et enkelt løbejob:
SE@dd9500## compression physical-capacity-measurement sample show current Task ID Type Name User State Creation Time Measurement Time Start Time Priority Percent (Submitted Time) Done ------------ ---- ----- -------- --------- ------------------- ------------------- ---------- -------- -------- 124554051586 PS jfall sysadmin Scheduled 2015/08/30 16:01:55 2015/08/30 16:01:55 -- Normal 0 ------------ ---- ----- -------- --------- ------------------- ------------------- ---------- -------- --------
Eller navn på stisæt:
SE@dd9500## compression physical-capacity-measurement sample stop pathsets jfall ** This will abort any submitted or running compression physical-capacity-measurement sampling tasks. Do you want to proceed? (yes|no) [no]: yes 1 task(s) aborted.
Efterlader os uden job:
SE@dd9500## compression physical-capacity-measurement sample show current No measurement tasks found.
Hvordan vises oplysninger om fuldførte job?
Oplysninger om fuldførte job vises med ikonet sample show history Kommando. Sådan får du f.eks. vist detaljer for et enkelt kurvesæt:
SE@dd9500## compression physical-capacity-measurement sample show history pathset jfall Pathset: jfall Measurement Time Logical Used Physical Used Global-Comp Local-Comp Total-Comp (Pre-Comp) (Post-Comp) Factor Factor Factor (GiB) (GiB) (Reduction %) ------------------- ------------ ------------- ----------- ---------- -------------- 2015/08/23 12:23:06 7.0 4.2 1.70x 0.98x 1.67x (40.24%) 2015/08/23 13:04:20 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 2015/08/26 14:00:01 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 2015/08/27 14:00:01 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 2015/08/28 14:00:02 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 2015/08/29 14:00:02 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 2015/08/30 14:00:01 10.0 6.2 1.63x 0.98x 1.61x (37.84%) ------------------- ------------ ------------- ----------- ---------- -------------- Total number of measurements retrieved = 7.
Parameteren detaljeret historik viser også start- og sluttidspunkterne for hvert job:
SE@dd9500## compression physical-capacity-measurement sample show detailed-history pathset jfall Pathset: jfall Measurement Time Logical Used Physical Used Global-Comp Local-Comp Total-Comp Task ID Task Start Time Task End Time (Pre-Comp) (Post-Comp) Factor Factor Factor (GiB) (GiB) (Reduction %) ------------------- ------------ ------------- ----------- ---------- -------------- ------------ ------------------- ------------------- 2015/08/23 12:23:06 7.0 4.2 1.70x 0.98x 1.67x (40.24%) 47244640257 2015/08/23 12:25:19 2015/08/23 12:25:23 2015/08/23 13:04:20 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 51539607553 2015/08/23 13:05:45 2015/08/23 13:05:48 2015/08/26 14:00:01 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 77309411329 2015/08/26 14:02:50 2015/08/26 14:02:50 2015/08/27 14:00:01 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 85899345921 2015/08/27 14:03:06 2015/08/27 14:03:06 2015/08/28 14:00:02 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 94489280513 2015/08/28 14:02:50 2015/08/28 14:02:51 2015/08/29 14:00:02 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 103079215105 2015/08/29 14:01:40 2015/08/29 14:01:41 2015/08/30 14:00:01 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 115964116993 2015/08/30 14:04:12 2015/08/30 14:04:12 ------------------- ------------ ------------- ----------- ---------- -------------- ------------ ------------------- ------------------- Total number of measurements retrieved = 7.
Bemærk: Begge kommandoer kan ændres, så de kun henter resultater over en bestemt tidsperiode:
SE@dd9500## compression physical-capacity-measurement sample show history pathset jfall last 2days Pathset: jfall Measurement Time Logical Used Physical Used Global-Comp Local-Comp Total-Comp (Pre-Comp) (Post-Comp) Factor Factor Factor (GiB) (GiB) (Reduction %) ------------------- ------------ ------------- ----------- ---------- -------------- 2015/08/29 14:00:02 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 2015/08/30 14:00:01 10.0 6.2 1.63x 0.98x 1.61x (37.84%) ------------------- ------------ ------------- ----------- ---------- -------------- Total number of measurements retrieved = 2.
Eller mellem bestemte datoer eller tidspunkter:
SE@dd9500## compression physical-capacity-measurement sample show history pathset jfall start 08231010 end 08231400 Pathset: jfall Measurement Time Logical Used Physical Used Global-Comp Local-Comp Total-Comp (Pre-Comp) (Post-Comp) Factor Factor Factor (GiB) (GiB) (Reduction %) ------------------- ------------ ------------- ----------- ---------- -------------- 2015/08/23 12:23:06 7.0 4.2 1.70x 0.98x 1.67x (40.24%) 2015/08/23 13:04:20 10.0 6.2 1.63x 0.98x 1.61x (37.84%) ------------------- ------------ ------------- ----------- ---------- -------------- Total number of measurements retrieved = 2.
Hvor længe opbevares en bestemt historik for et bestemt stisæt/mtree?
Som standard gemmes resultaterne for hvert PCM-stisæt i 180 dage. Dette kan ændres ved ændring af det tilsvarende banesæt:
SE@dd9500## compression physical-capacity-measurement pathset modify jfall measurement-retention 14 Measurement-retention changed to 14 day(s).
PCM-historikken findes i systemets historiske database. Som et resultat, hvis den historiske database går tabt eller beskadiges, går detaljer om al PCM-historie også tabt.
Er der nogen advarsler at være opmærksom på, når du bruger PCM?
PCM-job afbrydes, hvis systemet har mindre end 10 % ledig plads.
PCM-job afbrydes, mens rengøringscyklussen kører.
Som tidligere nævnt er PCM et værktøj, der bruges til at beregne fysisk udnyttelse af et bestemt sæt mapper / mtrees. Ved beregning af resultater for et bestemt stisæt eller sæt MTrees tæller PCM kun størrelsen af hvert unikt datasegment, der bruges af stisættet eller sættet af MTrees én gang.
Hvis filer, der deduplikerer mod de samme data, findes i flere forskellige PCM-job, kan hvert af de segmenter, der udgør filerne, tælles flere gange (én gang for hvert PCM-job). Det betyder, at mens resultaterne af hvert enkelt PCM-job er nøjagtige, kan resultaterne af flere PCM-job ikke summeres for at give nøjagtig fysisk udnyttelse af summen af stisæt/mtrees i jobbene.
På grund af den måde, PCM-job er sat sammen på, er stisættet eller MTree post-comp-plads, der bruges på disken:
- PCM-job tager ikke højde for døde data (diskplads, der bruges af slettede filer, hvilken plads på disken muligvis ikke er blevet genvundet ved at køre GC endnu).
- PCM tager ikke højde for data, der er låst i snapshots, der er oprettet til MTree, eller stisæt, der måles.
For eksempel har jeg et mtree kaldet /data/col1/jf1 hvor jeg opretter tre 1 GB-filer, det vil sige:
!!!! dd9500 YOUR DATA IS IN DANGER !!!! # for i in 1 2 3 ; do
> dd if=/dev/urandom of=/data/col1/jf1/${i} bs=1024k count=1024
> done
Jeg kopierer derefter disse filer til et andet mtree (/data/col1/jf2):
!!!! dd9500 YOUR DATA IS IN DANGER !!!! # cp /data/col1/jf1/1 /data/col1/jf2/4 !!!! dd9500 YOUR DATA IS IN DANGER !!!! # cp /data/col1/jf1/2 /data/col1/jf2/5 !!!! dd9500 YOUR DATA IS IN DANGER !!!! # cp /data/col1/jf1/3 /data/col1/jf2/6
Endelig opretter jeg en ny 1Gb-fil i /data/col1/jf2:
!!!! dd9500 YOUR DATA IS IN DANGER !!!! # dd if=/dev/urandom of=/data/col1/jf2/7 bs=1024k count=1024 1024+0 records in 1024+0 records out
Hvis lokal komprimering af data ignoreres, og kun deduplikering overvejes, er det klart, at hvert MTree brugte følgende mængde fysisk plads, da filerne blev skrevet:
/data/kol1/jf1: 3 GB
/data/kol1/jf2: 1 GB (for den nye fil - kopierede filer ville have deduplikeret mod eksisterende data, så de ville have brugt minimal fysisk plads).
Som følge heraf bliver summen af fysisk pladsudnyttelse ved /data/col1/jf1 og /data/col1/jf2 skal være omkring 4 GB.
Der oprettes tre PCM-stisæt:
JF1 indeholdende /data/COL1/JF1
JF2 indeholdende /data/COL1/
JF2 JFALL indeholdende data/COL1/JF1 og /data/COL1/JF2
PCM-jobbene køres og leverer output på følgende måde:
Pathset: jf1 Measurement Time Logical Used Physical Used Global-Comp Local-Comp Total-Comp (Pre-Comp) (Post-Comp) Factor Factor Factor (GiB) (GiB) (Reduction %) ------------------- ------------ ------------- ----------- ---------- -------------- 2015/08/23 12:24:09 3.0 3.2 0.96x 0.98x 0.94x (-6.21%) ------------------- ------------ ------------- ----------- ---------- -------------- Pathset: jf2 Measurement Time Logical Used Physical Used Global-Comp Local-Comp Total-Comp (Pre-Comp) (Post-Comp) Factor Factor Factor (GiB) (GiB) (Reduction %) ------------------- ------------ ------------- ----------- ---------- -------------- 2015/08/23 12:24:12 4.0 4.2 0.98x 0.98x 0.96x (-4.14%) ------------------- ------------ ------------- ----------- ---------- --------------
Disse værdier er korrekte, da hvert PCM-job kun ser på fysiske data, der refereres til af filerne i det tilsvarende stisæt. Det betyder, at data for filer, der blev kopieret, tælles to gange (en gang for hvert PCM-job).
Det kan synes rimeligt, at for at få total fysisk udnyttelse af /data/col1/jf1 og /data/col1/jf2 MTrees, kan vi opsummere værdierne for 'fysisk brugt' fra ovenstående output.
For at få en nøjagtig værdi for den samlede fysiske udnyttelse af /data/col1/jf1 og /data/col1/jf2, er det nødvendigt at køre et enkelt PCM-job, der dækker begge disse MTrees (dvs. brug jfall). Dette sikrer, at dublerede segmenter kun tælles én gang og ikke to gange som i eksemplet ovenfor, dvs.:
Pathset: jfall Measurement Time Logical Used Physical Used Global-Comp Local-Comp Total-Comp (Pre-Comp) (Post-Comp) Factor Factor Factor (GiB) (GiB) (Reduction %) ------------------- ------------ ------------- ----------- ---------- -------------- 2015/08/23 12:23:06 7.0 4.2 1.70x 0.98x 1.67x (40.24%) ------------------- ------------ ------------- ----------- ---------- --------------
Sammenfattende kan outputtet fra flere PCM-job ikke summeres for at give nøjagtig fysisk udnyttelse af et sæt kurvesæt/MTrees. I stedet skal der defineres et enkelt PCM-stisæt, der dækker alle nødvendige MTrees/mapper, da dette sikrer, at duplikatdata kun tælles én gang. Hvis dette ikke gøres, og der skulle køres et separat PCM-job for hvert mtree på et system, for eksempel, er resultaterne opsummeret, at det er fuldt ud muligt, at den samlede anvendte fysiske kapacitet overstiger systemets rå kapacitet.
Kan PCM-job kun indsendes af DDSH kommandolinje, eller kan en brugergrænseflade også bruges?
I dette dokument bruges Data Domain Command-Line Interface (DDSH) til at konfigurere, sende og gennemse PCM-job.