Ofte stillede spørgsmål om DDOS-måling af fysisk kapacitet eller rapportering af fysisk kapacitet

Summary: Ofte stillede spørgsmål om Data Domain Operating System (DD OS), Physical Capacity Measurement (PCM) eller Physical Capacity Reporting (PCR).

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Version 5.7 af Data Domain Operating System (DD OS) introducerer nye funktioner kendt som fysisk kapacitetsmåling (PCM) eller fysisk kapacitetsrapportering (PCR).

I denne artikel beskrives almindelige eksempler på brug og spørgsmål vedrørende denne funktion. PCM og PCR bruges i flæng i dette dokument.

Hvad er måling af fysisk kapacitet (PCM)?
PCM er en ny funktion, der understøttes i DD OS 5.7 og nyere, som gør det muligt at beregne den nøjagtige harddiskudnyttelse af et mappetræ, en samling mappetræer, MTree eller en samling MTrees.

Hvordan adskiller dette sig fra funktioner i tidligere versioner af DDOS?
Når en fil indtages på en DDR, registrerer vi forskellige statistikker om filen. En sådan statistik er "post-lc bytes" eller den fysiske mængde plads, der tages af en fil, når den skrives til systemet. Vi kan se post-lc bytes for en fil eller et mappetræ ved hjælp af filesys show compression kommando - for eksempel:

sysadmin@dd9500# filesys show compression /data/col1/jf1
Total files: 4;  bytes/storage_used: 1.3
       Original Bytes:        4,309,378,324
  Globally Compressed:        3,242,487,836
   Locally Compressed:        3,293,594,658
            Meta-data:           13,897,112

Dette indikerer, at ovenstående mappetræ indeholder fire filer, der i alt brugte 3.293.594.658 bytes (3.07 GB) fysisk plads, når de blev indtaget.
 

Bemærk: Disse statistikker genereres på tidspunktet for indtagelse og opdateres ikke efter dette tidspunkt. På grund af karakteren af deduplikering, når yderligere filer indtages eller slettes og rengøring køres, ændres det imidlertid, hvordan data på disken deduplikeres mod og som sådan den måde, hvorpå hver fil deduplikerer (og mængden af data er 'ejer'). På grund af dette bliver ovenstående statistikker forældede over tid og kan nogle gange eller arbejdsbelastninger blive unøjagtige.

PCM er et forsøg på at undgå, at inkonsekvente resultater skyldes, at ovenstående statistikker bliver forældede. Da PCM kan generere rapporter om harddiskudnyttelse på et bestemt tidspunkt, gælder ovenstående begrænsninger ikke længere, og resultaterne er garanteret mere nøjagtige.

Er der nogen kendte fakta eller opsætninger, hvor resultater beregnet af PCM vides at være mindre end optimalt nøjagtige?
PCM foretager sampling til beregning af den diskplads, der bruges af filer i stisættet. Det betyder, at nogle filer kan udelades af optællingen for unikke segmenter, fordi der af hensyn til ydeevnen ikke tages højde for filer, der er mindre end en given størrelse. Minimumstørrelsen af de individuelle filer i de stisæt, som PCM-job tager i betragtning til optælling (og dermed dem, det tegner sig for diskplads, der bruges til), afhænger af den gennemsnitlige filsystemsegmentstørrelse:
  • Hvis den gennemsnitlige segmentstørrelse er 4 K, ignoreres filer på 4 MB eller mindre af PCM
  • Hvis den gennemsnitlige segmentstørrelse er 8 K, ignoreres filer på 8 MB og mindre af PCM
  • Hvis den gennemsnitlige segmentstørrelse er 12 K, ignoreres filer på 12 MB og mindre af PCM

Kundedata fra den virkelige verden viser, at den gennemsnitlige segmentstørrelse svæver omkring 9 KB i de mest almindelige brugstilfælde, så et omtrentligt tal for filer, der ikke tages i betragtning, når en PCM beregner den anvendte diskplads, ville være dem, der er mindre end 9 MB.

Kræves der yderligere licenser til PCM?
Nej - PCM er ikke en licenseret funktion, og der kræves derfor ingen yderligere licenser for at bruge PCM.

Er PCM-understøttelse på alle platforme?
Nej - PCM understøttes på alle hardware- og Virtual Data Domain-enheder (DDVE), undtagen på ATOS-DDVE (Active Tier on Object Storage).

PCM måler og optæller kun filerne på det aktive niveau: Filer, der er placeret i cloud-enheder (eller for ældre udvidet opbevaring, dem i arkiveringsenheder) er ikke med i størrelsesberegningen for PCM-job.

Kræves der andre forudsætninger, før PCM kan bruges?
Som standard er PCM deaktiveret i DDOS 5.7. Før den kan bruges, skal den være aktiveret, og dens cache initialiseres som vist nedenfor:

sysadmin@dd9500# compression physical-capacity-measurement enable and-initialize
physical-capacity-measurement enabled. Initialization started.

Bemærk: PCM-cachen bruges til at fremskynde fremtidige PCM-job, og initialisering af cachen kan tage lang tid. På trods af disse kan PCM-job begynde at blive sat i kø, mens PCM-cachen initialiseres.

Hvordan beregner PCM det samlede forbrug?
PCM bruger MTree-snapshots til at bestemme den fysiske udnyttelse af en gruppe filer. Når et PCM-job starter, sker der følgende:
  • Der oprettes et MTree-snapshot i forhold til underliggende MTrees.
Bemærk: Dette snapshot har fået navnet pcr_snap_*, det vil sige:
sysadmin@dd9500# snapshot list mtree /data/col1/jf2
Snapshot Information for MTree: /data/col1/jf2
----------------------------------------------
Name                                Pre-Comp (GiB)   Create Date         Retain Until        Status
---------------------------------   --------------   -----------------   -----------------   -------
pcr_snap_1440284055_1440360259_19              6.0   Aug 23 2015 13:04   Dec 31 1969 16:00   expired
---------------------------------   --------------   -----------------   -----------------   -------
  • PCM finder filer fra snapshottet, som skal være i PCM-jobbet (det vil sige i de angivne stisæt eller MTrees).
  • PCM går i segmenttræet for disse filer for i det væsentlige at opbygge en liste over unikke segmentfingeraftryk, der refereres til af alle filerne.
  • PCM finder derefter tilsvarende segmenter på disken (inden for beholdersættet) og beregner summen af størrelsen af disse segmenter.
  • Summen af størrelsen af disse segmenter repræsenterer den aktuelle harddiskudnyttelse af de tilsvarende filer.
  • Ud over ovenstående kan den forudkomprimerede størrelse af sættet af filer findes fra de tilsvarende filmetadata.
  • Når PCM-job er fuldført, udløber underliggende PCM-snapshots til senere fjernelse.


Hvordan fungerer PCM-job?
PCM-job sendes af en bruger (eller efter en tidsplan) og føjes til en PCM-arbejdskø. Afhængigt af systemets workload kan PCM-job derefter hentes fra køen og startes med det samme, eller de kan udskydes i længere tid.

Eksempler på, hvorfor PCM-job kan udskydes, er som følger:

  • Aktiv niveaurensning kører på systemet – PCM-job og aktiv niveaurensning kan ikke køre parallelt. Resultatet er, at PCM-job, der er sat i kø, mens aktiv niveaurensning kører, udskydes, indtil rensning af aktivt niveau er fuldført.
  • Der er allerede nogle PCM-job, der kører mod underliggende MTrees - PCM bruger MTree-snapshots, og der er strenge grænser for, hvor mange PCM-snapshots en given bruger kan oprette på et givet tidspunkt mod et enkelt MTree. Hvis disse grænser overskrides af et nyt PCM-job, udskydes jobbet, indtil det eksisterende job er fuldført.


Er det muligt at kontrollere de ressourcer, der bruges af PCM på et system?
PCM bruger en gasspjældsmekanisme, der ligner den, der bruges af aktiv tier clean, dvs. PCM-gashåndtaget kan indstilles fra 0 (ikke aggressiv) til 100 (aggressiv). Det er klart, at jo højere gashåndtaget er, jo flere ressourcer bruges PCM, og jo større indflydelse kan PCM-job have på anden arbejdsbelastning på systemet.

Som standard er PCM-gashåndtaget indstillet til 20, det vil sige:

sysadmin@dd9500# compression physical-capacity-measurement throttle show
Throttle is set to 20 percent (default).

PCM-gasspjældet kan ændres som følger, idet ændringen til gasspjældet finder sted med det samme (dvs. der kræves ingen DDFS-genstart, for at PCM kan hente den nye gasindstilling):

sysadmin@dd9500# compression physical-capacity-measurement throttle set 50
Throttle set to 50 percent.


Hvad er stisæt?
PCM-job kan køres på to måder, det vil sige:

  • I forhold til et foruddefineret "stisæt" (dvs. brugerspecificeret samling af mapper)
  • Mod et enkelt mtree

Før job kan køres mod et givet kurvesæt, skal kurvesættet oprettes eller defineres på følgende måde:

sysadmin@dd9500# compression physical-capacity-measurement pathset create jfall paths /data/col1/jf1,/data/col1/jf2
Pathset "jfall" created.
Specifikke mapper kan føjes til eller fjernes fra et eksisterende stisæt på følgende måde:
sysadmin@dd9500# compression physical-capacity-measurement pathset del jfall paths /data/col1/jf2
Path(s) deleted from pathset "jfall".
sysadmin@dd9500# compression physical-capacity-measurement pathset add jfall paths /data/col1/jf2
Path(s) added to pathset "jfall".

Alle stisæt, der blev oprettet, vises som følger:

sysadmin@dd9500# compression physical-capacity-measurement pathset show list
Pathset           Number of paths   Measurement-retention (days)
---------------   ---------------   ----------------------------
jf1                             1                            180
jf2                             1                            180
jfall                           2                            180
phys-gandhi3                    1                            180
phys-gandhi5-fc                 1                            180
phys-gandhi5                    1                            180
phys2-gandhi3                   2                            180
---------------   ---------------   ----------------------------
7 pathset(s) found.

Hvis du vil have vist bestemte kurver, der er defineret i et kurvesæt, skal ikonet pathset show detailed Kommandoen bruges:

sysadmin@dd9500# compression physical-capacity-measurement pathset show detailed jfall
Pathset: jfall
    Number of paths: 2
    Measurement-retention: 180 day(s)
    Paths:
        /data/col1/jf1
        /data/col1/jf2
sysadmin@dd9500#

Hvis du vil slette en sti, skal du angive pathset destroy Kommandoen kan bruges:

sysadmin@dd9500# compression physical-capacity-measurement pathset destroy jfall

Bemærk: Dette fjerner al historik for det angivne kurvesæt.
 
Bemærk: Ad hoc-job mod et enkelt MTree kræver ikke en defineret sti, før de køres.


Hvordan startes et PCM-job?
Et nyt PCM-job sendes til PCM-arbejdskøen ved hjælp af sample start kommando, det vil sige:

sysadmin@dd9500# compression physical-capacity-measurement sample start pathsets jfall
Measurement task(s) submitted and will begin as soon as resources are available.

I ovenstående eksempel blev der brugt et foruddefineret kurvesæt. For at indsende et PCM-job mod et enkelt MTree angives MTree, det vil sige:

sysadmin@dd9500# compression physical-capacity-measurement sample start mtrees /data/col1/backup
Measurement task(s) submitted and will begin as soon as resources are available.

PCM-job indsendes som standard med prioriteten "normal". Det er også muligt at angive en prioritet af hastende:

sysadmin@dd9500# compression physical-capacity-measurement sample start pathsets jf1 priority urgent
Measurement task(s) submitted and will begin as soon as resources are available.

Job med prioriteten 'haster' står i kø foran dem med prioriteten 'normal' (hvilket betyder, at de afhentes og arbejdes frem for alle indsendte job med prioritet 'normal').

Der vises en liste over sendte eller igangværende job ved hjælp af ikonet sample show current kommando, for eksempel:

sysadmin@dd9500# compression physical-capacity-measurement sample show current
Task ID       Type   Name    User       State       Creation Time         Measurement Time      Start Time   Priority   Percent
                                                                          (Submitted Time)                              Done
-----------   ----   -----   --------   ---------   -------------------   -------------------   ----------   --------   --------
47244640259   PS     jf2     sysadmin   Scheduled   2015/08/23 12:24:12   2015/08/23 12:24:12   --           Urgent     0
47244640258   PS     jf1     sysadmin   Scheduled   2015/08/23 12:24:09   2015/08/23 12:24:09   --           Urgent     0
47244640257   PS     jfall   sysadmin   Scheduled   2015/08/23 12:23:06   2015/08/23 12:23:06   --           Normal     0
-----------   ----   -----   --------   ---------   -------------------   -------------------   ----------   --------   --------
sysadmin@dd9500#


Kan PCM-job planlægges?
Ja – hvis et bestemt PCM-job skal køres regelmæssigt, er det planlagt til at køre automatisk efter behov. F.eks.:

sysadmin@dd9500# compression physical-capacity-measurement schedule create jf_sched pathsets jfall,jf1,jf2 time 1400
Schedule "jf_sched" created.

Bemærk: Tidsplaner oprettes til at køre dagligt, på bestemte ugedage eller bestemte dage i hver måned.

En eksisterende tidsplan ændres ved hjælp af ikonet schedule modify Kommando:

sysadmin@dd9500# compression physical-capacity-measurement schedule modify jf_sched priority urgent time 1700 day Wed,Fri
Schedule "jf_sched" modified.

Derudover kan en eksisterende plan have stisæt tilføjet eller fjernet som følger:

sysadmin@dd9500# compression physical-capacity-measurement schedule del jf_sched pathsets jf2
Schedule "jf_sched" modified.
sysadmin@dd9500# compression physical-capacity-measurement schedule add jf_sched pathsets jf2
Schedule "jf_sched" modified.

Bemærk: En plan kan ikke kun indeholde kurvesæt ELLER MTrees (dvs. de to kan ikke blandes):
sysadmin@dd9500# compression physical-capacity-measurement schedule create jf_sched2 mtrees /data/col1/backup time 1400
Schedule "jf_sched2" created.
sysadmin@dd9500# compression physical-capacity-measurement schedule add jf_sched2 pathsets jfall
**** Failed to add: this schedule is only for mtrees.

Hvis du vil have vist detaljer om eksisterende tidsplaner, vises ikonet schedule show all kommando bruges, for eksempel:

sysadmin@dd9500# compression physical-capacity-measurement schedule show all
Name:      jf_sched
Status:    enabled
Priority:  urgent
Frequency: weekly on Wed, Fri
Time:      17:00
Pathset(s):
    jfall
    jf1
    jf2


Name:      jf_sched2
Status:    enabled
Priority:  normal
Frequency: daily
Time:      14:00
MTree(s):
    /data/col1/backup

Eksisterende tidsplaner kan deaktiveres eller aktiveres med det samme, dvs.:

sysadmin@dd9500# compression physical-capacity-measurement schedule disable jf_sched2
Schedule "jf_sched2" disabled.
sysadmin@dd9500# compression physical-capacity-measurement schedule enable jf_sched2
Schedule "jf_sched2" enabled.

En tidsplan kan også ødelægges:

sysadmin@dd9500# compression physical-capacity-measurement schedule destroy jf_sched2
Schedule "jf_sched2" destroyed.

Bemærk: Dette fjerner IKKE historikken for de tilsvarende MTrees/pathsets (det betyder, at nye PCM-job ikke planlægges automatisk).


Hvordan startes planlagte job?
Når en PCM-plan tilføjes og aktiveres, medfører dette, at der føjes en tilsvarende post til /etc/crontabDet er:

#
# collection.1.crontab.pcr.jf_sched.0
#
00 17 * * Wed,Fri  root /ddr/bin/ddsh -a compression physical-capacity-measurement sample start force priority urgent objects-from-schedule jf_sched

Bemærk: Cron-jobbet fjernes fra /etc/crontab hvis tidsplanen er deaktiveret eller ødelagt.


Kan jeg stoppe med at køre et PCM-job?
Ja – Kørsel af PCM-job kan afbrydes ved hjælp af enten opgave-id et eller navnene stisæt/MTree. For eksempel ser vi, at vi har to PCM-job i kø:

SE@dd9500## compression physical-capacity-measurement sample show current
Task ID        Type   Name    User       State       Creation Time         Measurement Time      Start Time   Priority   Percent
                                                                           (Submitted Time)                              Done
------------   ----   -----   --------   ---------   -------------------   -------------------   ----------   --------   --------
124554051585   PS     jfall   sysadmin   Scheduled   2015/08/30 16:00:48   2015/08/30 16:00:48   --           Normal     0
124554051586   PS     jfall   sysadmin   Scheduled   2015/08/30 16:01:55   2015/08/30 16:01:55   --           Normal     0
------------   ----   -----   --------   ---------   -------------------   -------------------   ----------   --------   --------

Disse job kan afbrydes ved hjælp af enten opgave-id et (for at stoppe et enkelt job):

SE@dd9500## compression physical-capacity-measurement sample stop task-id 124554051585
**   This will abort any submitted or running compression physical-capacity-measurement sampling tasks.
        Do you want to proceed? (yes|no) [no]: yes
1 task(s) aborted.

Efterlader os med et enkelt løbejob:

SE@dd9500## compression physical-capacity-measurement sample show current
Task ID        Type   Name    User       State       Creation Time         Measurement Time      Start Time   Priority   Percent
                                                                           (Submitted Time)                              Done
------------   ----   -----   --------   ---------   -------------------   -------------------   ----------   --------   --------
124554051586   PS     jfall   sysadmin   Scheduled   2015/08/30 16:01:55   2015/08/30 16:01:55   --           Normal     0
------------   ----   -----   --------   ---------   -------------------   -------------------   ----------   --------   --------

Eller navn på stisæt:

SE@dd9500## compression physical-capacity-measurement sample stop pathsets jfall
**   This will abort any submitted or running compression physical-capacity-measurement sampling tasks.
        Do you want to proceed? (yes|no) [no]: yes
1 task(s) aborted.

Efterlader os uden job:

SE@dd9500## compression physical-capacity-measurement sample show current
No measurement tasks found.


Hvordan vises oplysninger om fuldførte job?
Oplysninger om fuldførte job vises med ikonet sample show history Kommando. Sådan får du f.eks. vist detaljer for et enkelt kurvesæt:

SE@dd9500## compression physical-capacity-measurement sample show history pathset jfall
Pathset: jfall
Measurement Time      Logical Used   Physical Used   Global-Comp   Local-Comp       Total-Comp
                        (Pre-Comp)     (Post-Comp)        Factor       Factor           Factor
                             (GiB)           (GiB)                               (Reduction %)
-------------------   ------------   -------------   -----------   ----------   --------------
2015/08/23 12:23:06            7.0             4.2         1.70x        0.98x   1.67x (40.24%)
2015/08/23 13:04:20           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
2015/08/26 14:00:01           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
2015/08/27 14:00:01           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
2015/08/28 14:00:02           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
2015/08/29 14:00:02           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
2015/08/30 14:00:01           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
-------------------   ------------   -------------   -----------   ----------   --------------
Total number of measurements retrieved = 7.

Parameteren detaljeret historik viser også start- og sluttidspunkterne for hvert job:

SE@dd9500## compression physical-capacity-measurement sample show detailed-history pathset jfall
Pathset: jfall
Measurement Time      Logical Used   Physical Used   Global-Comp   Local-Comp       Total-Comp   Task ID        Task Start Time       Task End Time
                        (Pre-Comp)     (Post-Comp)        Factor       Factor           Factor
                             (GiB)           (GiB)                               (Reduction %)
-------------------   ------------   -------------   -----------   ----------   --------------   ------------   -------------------   -------------------
2015/08/23 12:23:06            7.0             4.2         1.70x        0.98x   1.67x (40.24%)   47244640257    2015/08/23 12:25:19   2015/08/23 12:25:23
2015/08/23 13:04:20           10.0             6.2         1.63x        0.98x   1.61x (37.84%)   51539607553    2015/08/23 13:05:45   2015/08/23 13:05:48
2015/08/26 14:00:01           10.0             6.2         1.63x        0.98x   1.61x (37.84%)   77309411329    2015/08/26 14:02:50   2015/08/26 14:02:50
2015/08/27 14:00:01           10.0             6.2         1.63x        0.98x   1.61x (37.84%)   85899345921    2015/08/27 14:03:06   2015/08/27 14:03:06
2015/08/28 14:00:02           10.0             6.2         1.63x        0.98x   1.61x (37.84%)   94489280513    2015/08/28 14:02:50   2015/08/28 14:02:51
2015/08/29 14:00:02           10.0             6.2         1.63x        0.98x   1.61x (37.84%)   103079215105   2015/08/29 14:01:40   2015/08/29 14:01:41
2015/08/30 14:00:01           10.0             6.2         1.63x        0.98x   1.61x (37.84%)   115964116993   2015/08/30 14:04:12   2015/08/30 14:04:12
-------------------   ------------   -------------   -----------   ----------   --------------   ------------   -------------------   -------------------
Total number of measurements retrieved = 7.

Bemærk: Begge kommandoer kan ændres, så de kun henter resultater over en bestemt tidsperiode:
SE@dd9500## compression physical-capacity-measurement sample show history pathset jfall last 2days
Pathset: jfall
Measurement Time      Logical Used   Physical Used   Global-Comp   Local-Comp       Total-Comp
                        (Pre-Comp)     (Post-Comp)        Factor       Factor           Factor
                             (GiB)           (GiB)                               (Reduction %)
-------------------   ------------   -------------   -----------   ----------   --------------
2015/08/29 14:00:02           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
2015/08/30 14:00:01           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
-------------------   ------------   -------------   -----------   ----------   --------------
Total number of measurements retrieved = 2.

Eller mellem bestemte datoer eller tidspunkter:

SE@dd9500## compression physical-capacity-measurement sample show history pathset jfall start 08231010 end 08231400
Pathset: jfall
Measurement Time      Logical Used   Physical Used   Global-Comp   Local-Comp       Total-Comp
                        (Pre-Comp)     (Post-Comp)        Factor       Factor           Factor
                             (GiB)           (GiB)                               (Reduction %)
-------------------   ------------   -------------   -----------   ----------   --------------
2015/08/23 12:23:06            7.0             4.2         1.70x        0.98x   1.67x (40.24%)
2015/08/23 13:04:20           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
-------------------   ------------   -------------   -----------   ----------   --------------
Total number of measurements retrieved = 2.


Hvor længe opbevares en bestemt historik for et bestemt stisæt/mtree?
Som standard gemmes resultaterne for hvert PCM-stisæt i 180 dage. Dette kan ændres ved ændring af det tilsvarende banesæt:

SE@dd9500## compression physical-capacity-measurement pathset modify jfall measurement-retention 14
Measurement-retention changed to 14 day(s).

PCM-historikken findes i systemets historiske database. Som et resultat, hvis den historiske database går tabt eller beskadiges, går detaljer om al PCM-historie også tabt.

Er der nogen advarsler at være opmærksom på, når du bruger PCM?
PCM-job afbrydes, hvis systemet har mindre end 10 % ledig plads.
PCM-job afbrydes, mens rengøringscyklussen kører.

Som tidligere nævnt er PCM et værktøj, der bruges til at beregne fysisk udnyttelse af et bestemt sæt mapper / mtrees. Ved beregning af resultater for et bestemt stisæt eller sæt MTrees tæller PCM kun størrelsen af hvert unikt datasegment, der bruges af stisættet eller sættet af MTrees én gang.
 

Bemærk: På grund af karakteren af deduplikering kan der være andre filer uden for de stisæt/MTrees, som jobbet køres mod, som også kan blive deduplikeret i forhold til de samme data.

Hvis filer, der deduplikerer mod de samme data, findes i flere forskellige PCM-job, kan hvert af de segmenter, der udgør filerne, tælles flere gange (én gang for hvert PCM-job). Det betyder, at mens resultaterne af hvert enkelt PCM-job er nøjagtige, kan resultaterne af flere PCM-job ikke summeres for at give nøjagtig fysisk udnyttelse af summen af stisæt/mtrees i jobbene.

På grund af den måde, PCM-job er sat sammen på, er stisættet eller MTree post-comp-plads, der bruges på disken:

  • PCM-job tager ikke højde for døde data (diskplads, der bruges af slettede filer, hvilken plads på disken muligvis ikke er blevet genvundet ved at køre GC endnu).
  • PCM tager ikke højde for data, der er låst i snapshots, der er oprettet til MTree, eller stisæt, der måles.

For eksempel har jeg et mtree kaldet /data/col1/jf1 hvor jeg opretter tre 1 GB-filer, det vil sige:

!!!! dd9500 YOUR DATA IS IN DANGER !!!! # for i in 1 2 3 ; do
> dd if=/dev/urandom of=/data/col1/jf1/${i} bs=1024k count=1024
> done

Jeg kopierer derefter disse filer til et andet mtree (/data/col1/jf2):

!!!! dd9500 YOUR DATA IS IN DANGER !!!! # cp /data/col1/jf1/1 /data/col1/jf2/4
!!!! dd9500 YOUR DATA IS IN DANGER !!!! # cp /data/col1/jf1/2 /data/col1/jf2/5
!!!! dd9500 YOUR DATA IS IN DANGER !!!! # cp /data/col1/jf1/3 /data/col1/jf2/6

Endelig opretter jeg en ny 1Gb-fil i /data/col1/jf2:

!!!! dd9500 YOUR DATA IS IN DANGER !!!! # dd if=/dev/urandom of=/data/col1/jf2/7 bs=1024k count=1024
1024+0 records in
1024+0 records out

Hvis lokal komprimering af data ignoreres, og kun deduplikering overvejes, er det klart, at hvert MTree brugte følgende mængde fysisk plads, da filerne blev skrevet:

/data/kol1/jf1: 3 GB
/data/kol1/jf2: 1 GB (for den nye fil - kopierede filer ville have deduplikeret mod eksisterende data, så de ville have brugt minimal fysisk plads).

Som følge heraf bliver summen af fysisk pladsudnyttelse ved /data/col1/jf1 og /data/col1/jf2 skal være omkring 4 GB.

Der oprettes tre PCM-stisæt:

JF1 indeholdende /data/COL1/JF1
JF2 indeholdende /data/COL1/
JF2 JFALL indeholdende data/COL1/JF1 og /data/COL1/JF2

PCM-jobbene køres og leverer output på følgende måde:

Pathset: jf1
Measurement Time      Logical Used   Physical Used   Global-Comp   Local-Comp       Total-Comp
                        (Pre-Comp)     (Post-Comp)        Factor       Factor           Factor
                             (GiB)           (GiB)                               (Reduction %)
-------------------   ------------   -------------   -----------   ----------   --------------
2015/08/23 12:24:09            3.0             3.2         0.96x        0.98x   0.94x (-6.21%)
-------------------   ------------   -------------   -----------   ----------   --------------


Pathset: jf2
Measurement Time      Logical Used   Physical Used   Global-Comp   Local-Comp       Total-Comp
                        (Pre-Comp)     (Post-Comp)        Factor       Factor           Factor
                             (GiB)           (GiB)                               (Reduction %)
-------------------   ------------   -------------   -----------   ----------   --------------
2015/08/23 12:24:12            4.0             4.2         0.98x        0.98x   0.96x (-4.14%)
-------------------   ------------   -------------   -----------   ----------   --------------

Disse værdier er korrekte, da hvert PCM-job kun ser på fysiske data, der refereres til af filerne i det tilsvarende stisæt. Det betyder, at data for filer, der blev kopieret, tælles to gange (en gang for hvert PCM-job).

Det kan synes rimeligt, at for at få total fysisk udnyttelse af /data/col1/jf1 og /data/col1/jf2 MTrees, kan vi opsummere værdierne for 'fysisk brugt' fra ovenstående output.
 

Bemærk: Dette giver 7,4 GB, hvilket tydeligvis ikke er korrekt (ovenfor blev det anslået, at den samlede udnyttelse på grund af deduplikering ville være omkring 4 GB).
 

For at få en nøjagtig værdi for den samlede fysiske udnyttelse af /data/col1/jf1 og /data/col1/jf2, er det nødvendigt at køre et enkelt PCM-job, der dækker begge disse MTrees (dvs. brug jfall). Dette sikrer, at dublerede segmenter kun tælles én gang og ikke to gange som i eksemplet ovenfor, dvs.:

Pathset: jfall
Measurement Time      Logical Used   Physical Used   Global-Comp   Local-Comp       Total-Comp
                        (Pre-Comp)     (Post-Comp)        Factor       Factor           Factor
                             (GiB)           (GiB)                               (Reduction %)
-------------------   ------------   -------------   -----------   ----------   --------------
2015/08/23 12:23:06            7.0             4.2         1.70x        0.98x   1.67x (40.24%)
-------------------   ------------   -------------   -----------   ----------   --------------

Sammenfattende kan outputtet fra flere PCM-job ikke summeres for at give nøjagtig fysisk udnyttelse af et sæt kurvesæt/MTrees. I stedet skal der defineres et enkelt PCM-stisæt, der dækker alle nødvendige MTrees/mapper, da dette sikrer, at duplikatdata kun tælles én gang. Hvis dette ikke gøres, og der skulle køres et separat PCM-job for hvert mtree på et system, for eksempel, er resultaterne opsummeret, at det er fuldt ud muligt, at den samlede anvendte fysiske kapacitet overstiger systemets rå kapacitet.

Kan PCM-job kun indsendes af DDSH kommandolinje, eller kan en brugergrænseflade også bruges?
I dette dokument bruges Data Domain Command-Line Interface (DDSH) til at konfigurere, sende og gennemse PCM-job.
 

Bemærk: PCM kan også bruges af brugergrænsefladen i Data Domain Enterprise Manager eller System Manager.
 
Bemærk: DDSH-grænsefladen har en grænse på maksimalt 256 tegn i en given kommando. Hvis PCM-job derfor skal konfigureres i forhold til en sti med et langt mappenavn, kan det være en fordel (eller endda påkrævet) at bruge en af de tilgængelige brugergrænseflader.

Affected Products

Data Domain, DD OS

Products

Data Domain
Article Properties
Article Number: 000058798
Article Type: How To
Last Modified: 05 Dec 2024
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.