DDOS-måling av fysisk kapasitet eller rapportering av fysisk kapasitet Ofte stilte spørsmål

Summary: Vanlige spørsmål om Data Domain Operating System (DD OS), Physical Capacity Measurement (PCM) eller Physical Capacity Reporting (PCR).

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Versjon 5.7 av Data Domain Operating System (DD OS) introduserer ny funksjonalitet kjent som Physical Capacity Measurement (PCM) eller Physical Capacity Reporting (PCR).

Denne artikkelen beskriver vanlige brukstilfeller og spørsmål rundt denne funksjonen. PCM og PCR brukes om hverandre i dette dokumentet.

Hva er fysisk kapasitetsmåling (PCM)?
PCM er en ny funksjon som støttes i DD OS 5.7 og nyere, og som gjør det mulig å beregne nøyaktig harddiskutnyttelse av et katalogtre, en samling av katalogtrær, mtree eller en samling MTrees.

Hvordan skiller dette seg fra funksjonene i tidligere versjoner av DDOS?
Når en fil tas inn på en DDR, registrerer vi ulike statistikker om filen. En slik statistikk er "post-lc byte" eller den fysiske mengden plass tatt av en fil når den skrives til systemet. Vi kan vise post-lc byte for en fil eller katalogtre ved hjelp av filesys show compression kommando - for eksempel:

sysadmin@dd9500# filesys show compression /data/col1/jf1
Total files: 4;  bytes/storage_used: 1.3
       Original Bytes:        4,309,378,324
  Globally Compressed:        3,242,487,836
   Locally Compressed:        3,293,594,658
            Meta-data:           13,897,112

Dette indikerer at katalogtreet ovenfor inneholder fire filer som totalt brukte 3 293 594 658 byte (3,07 GB) fysisk plass ved inntak.
 

Merk: Denne statistikken genereres på inntakstidspunktet og oppdateres først etter dette tidspunktet. På grunn av arten av de-duplisering, men som flere filer er inntatt eller slettet og rengjøring kjøre, hvordan data på disken er de-duplisert mot og som sådan måten hver fil de-dupliserer (og mengden av data er "eier") endringer. På grunn av dette blir statistikken ovenfor foreldet over tid, og noen ganger eller arbeidsbelastninger kan bli unøyaktig.

PCM er et forsøk på å unngå inkonsekvente resultater forårsaket av at statistikken ovenfor blir foreldet. Siden PCM kan generere rapporter om harddiskutnyttelse på et bestemt tidspunkt, gjelder ikke lenger begrensningene ovenfor, og resultatene er garantert mer nøyaktige.

Er det noen kjente fakta eller oppsett der resultater beregnet av PCM er kjent for å være mindre enn optimalt nøyaktige?
PCM tar prøver for å beregne diskplassen som brukes av filene i den angitte banen. Det betyr at noen filer kan utelates fra opplistingen for unike segmenter, fordi filer som er mindre enn en gitt størrelse, av ytelseshensyn ikke blir regnskapsført. Minimumsstørrelsen på de individuelle filene i banesettene som PCM-jobber vurderer for opplisting (og dermed de som det står for diskplass brukt til), avhenger av den gjennomsnittlige filsystemsegmentstørrelsen:
  • Hvis den gjennomsnittlige segmentstørrelsen er 4 K, ignoreres filer på 4 MB og mindre av PCM
  • Hvis den gjennomsnittlige segmentstørrelsen er 8 K, ignoreres filer på 8 MB og mindre av PCM
  • Hvis den gjennomsnittlige segmentstørrelsen er 12 K, ignoreres filer på 12 MB og mindre av PCM

Virkelige kundedata viser at gjennomsnittlig segmentstørrelse ligger rundt 9 kB for de vanligste brukstilfellene, så et omtrentlig tall for filer som ikke vurderes når en PCM beregner diskplass som brukes, er de som er mindre enn 9 MB.

Kreves det ytterligere lisenser for PCM?
Nei – PCM er ikke en lisensiert funksjon, og derfor kreves det ingen ekstra lisenser for å bruke PCM.

Er PCM-støtte i alle plattformer?
Nei – PCM støttes på alle Hardware og Virtual Data Domain-apparater (DDVE), bortsett fra på Active Tier on Object Storage (ATOS) DDVE-er.

PCM måler og nummererer bare filene på Active-nivået: Filer som sitter i Cloud Units (eller for eldre Extended Retention, de i Archiver Units) er ikke i størrelsesberegningen for PCM-jobber.

Er det noen andre forutsetninger som kreves før PCM kan brukes?
PCM er deaktivert i DDOS 5.7 som standard. Før den kan brukes, må den være aktivert og hurtigbufferen initialisert som vist nedenfor:

sysadmin@dd9500# compression physical-capacity-measurement enable and-initialize
physical-capacity-measurement enabled. Initialization started.

Merk: PCM-hurtigbufferen brukes til å øke hastigheten på fremtidige PCM-jobber, og initialisering av hurtigbufferen kan ta betydelig tid. Til tross for disse kan PCM-jobber begynne å bli lagt i kø mens PCM-hurtigbufferen initialiseres.

Hvordan beregner PCM brukstotaler?
PCM bruker mtree-øyeblikksbilder til å fastslå fysisk utnyttelse av en gruppe filer. Som et resultat, når en PCM-jobb starter, skjer følgende:
  • Et mtree-øyeblikksbilde opprettes mot underliggende MTrees.
Merk: Dette øyeblikksbildet heter pcr_snap_*, det vil si:
sysadmin@dd9500# snapshot list mtree /data/col1/jf2
Snapshot Information for MTree: /data/col1/jf2
----------------------------------------------
Name                                Pre-Comp (GiB)   Create Date         Retain Until        Status
---------------------------------   --------------   -----------------   -----------------   -------
pcr_snap_1440284055_1440360259_19              6.0   Aug 23 2015 13:04   Dec 31 1969 16:00   expired
---------------------------------   --------------   -----------------   -----------------   -------
  • PCM finner filer fra øyeblikksbildet som skal være i PCM-jobben (det vil si i banesettene eller MTrees spesifisert).
  • PCM går segmenttreet til disse filene for i hovedsak å bygge en liste over unike segmentfingeravtrykk referert til av alle filene.
  • PCM finner deretter tilsvarende segmenter på disken (i beholdersettet) og beregner summen av størrelsen på disse segmentene.
  • Summen av størrelsen på disse segmentene representerer gjeldende harddiskutnyttelse av de tilsvarende filene.
  • I tillegg til det ovennevnte kan den forhåndskomprimerte størrelsen på filsettet finnes fra de tilsvarende filmetadataene.
  • Når PCM-jobber er fullført, utløper underliggende øyeblikksbilder av PCM for senere fjerning.


Hvordan fungerer PCM-jobber?
PCM-jobber sendes av en bruker (eller etter en tidsplan) og legges til i en PCM-arbeidskø. Avhengig av systemets arbeidsmengde kan PCM-jobber deretter plukkes fra køen og startes umiddelbart, eller det kan bli utsatt for tid.

Eksempler på hvorfor PCM-jobber kan utsettes er som følger:

  • Rengjøring av aktivt nivå kjører på systemet – PCM-jobber og aktiv nivårengjøring kan ikke kjøres parallelt. Som et resultat av dette utsettes PCM-jobber som ligger i kø mens aktiv nivårensing kjører, til aktiv nivårengjøring er fullført.
  • Det er allerede noen PCM-jobber som kjører mot underliggende MTrees – PCM bruker mtree-øyeblikksbilder, og det er strenge grenser for hvor mange PCM-øyeblikksbilder en gitt bruker kan opprette på et gitt tidspunkt mot ett enkelt mtree. Hvis disse grensene overskrides av en ny PCM-jobb, utsettes jobben til den eksisterende jobben er fullført.


Er det mulig å kontrollere ressursene som PCM bruker på et system?
PCM bruker en strupemekanisme som ligner den som brukes av aktiv tier clean, det vil si at PCM-gassen kan stilles fra 0 (ikke aggressiv) til 100 (aggressiv). Det er klart at jo høyere gassen er, desto flere ressurser brukes av PCM, og jo større innvirkning kan PCM-jobber ha på annen arbeidsbelastning på systemet.

Som standard er PCM-gasspjeldet satt til 20, det vil si:

sysadmin@dd9500# compression physical-capacity-measurement throttle show
Throttle is set to 20 percent (default).

PCM-gasspjeld kan endres som følger, og gassendringen skjer umiddelbart (det vil si at ingen DDFS-omstart er nødvendig for at PCM skal hente den nye gassinnstillingen):

sysadmin@dd9500# compression physical-capacity-measurement throttle set 50
Throttle set to 50 percent.


Hva er stisett?
PCM-jobber kan kjøres på to måter, det vil si:

  • Mot et forhåndsdefinert "banesett" (det vil si brukerspesifisert samling av kataloger)
  • Mot et enkelt tre

Før jobber kan kjøres mot et gitt banesett, må banesettet opprettes eller defineres på følgende måte:

sysadmin@dd9500# compression physical-capacity-measurement pathset create jfall paths /data/col1/jf1,/data/col1/jf2
Pathset "jfall" created.
Spesifikke kataloger kan legges til eller fjernes fra en eksisterende bane som følger følger:
sysadmin@dd9500# compression physical-capacity-measurement pathset del jfall paths /data/col1/jf2
Path(s) deleted from pathset "jfall".
sysadmin@dd9500# compression physical-capacity-measurement pathset add jfall paths /data/col1/jf2
Path(s) added to pathset "jfall".

Alle stisett som ble opprettet, vises som følger:

sysadmin@dd9500# compression physical-capacity-measurement pathset show list
Pathset           Number of paths   Measurement-retention (days)
---------------   ---------------   ----------------------------
jf1                             1                            180
jf2                             1                            180
jfall                           2                            180
phys-gandhi3                    1                            180
phys-gandhi5-fc                 1                            180
phys-gandhi5                    1                            180
phys2-gandhi3                   2                            180
---------------   ---------------   ----------------------------
7 pathset(s) found.

Hvis du vil vise bestemte baner som er definert i et banesett, vises pathset show detailed kommando brukes:

sysadmin@dd9500# compression physical-capacity-measurement pathset show detailed jfall
Pathset: jfall
    Number of paths: 2
    Measurement-retention: 180 day(s)
    Paths:
        /data/col1/jf1
        /data/col1/jf2
sysadmin@dd9500#

Hvis du vil slette en bane, angir du ikonet pathset destroy Kommando kan brukes:

sysadmin@dd9500# compression physical-capacity-measurement pathset destroy jfall

Merk: Dette fjerner all historikk for den angitte banen.
 
Merk: Ad hoc-jobber mot ett enkelt MTree krever ikke et banesett som er definert før kjøring.


Hvordan startes en PCM-jobb?
En ny PCM-jobb sendes til PCM-arbeidskøen ved hjelp av sample start kommando, det vil si:

sysadmin@dd9500# compression physical-capacity-measurement sample start pathsets jfall
Measurement task(s) submitted and will begin as soon as resources are available.

I eksemplet ovenfor ble det brukt et forhåndsdefinert banesett. Hvis du vil sende inn en PCM-jobb mot ett enkelt MTREE, angis mtree, det vil si:

sysadmin@dd9500# compression physical-capacity-measurement sample start mtrees /data/col1/backup
Measurement task(s) submitted and will begin as soon as resources are available.

Som standard sendes PCM-jobber med prioriteten "normal". Det er også mulig å spesifisere en prioritet for haster:

sysadmin@dd9500# compression physical-capacity-measurement sample start pathsets jf1 priority urgent
Measurement task(s) submitted and will begin as soon as resources are available.

Jobber med prioritet som "haster" står i kø foran de med prioritet som "normal" (noe som betyr at de blir hentet og jobbet i stedet for eventuelle innsendte jobber med prioritet "normal").

En liste over innsendte eller kjørende jobber vises ved hjelp av sample show current kommando, for eksempel:

sysadmin@dd9500# compression physical-capacity-measurement sample show current
Task ID       Type   Name    User       State       Creation Time         Measurement Time      Start Time   Priority   Percent
                                                                          (Submitted Time)                              Done
-----------   ----   -----   --------   ---------   -------------------   -------------------   ----------   --------   --------
47244640259   PS     jf2     sysadmin   Scheduled   2015/08/23 12:24:12   2015/08/23 12:24:12   --           Urgent     0
47244640258   PS     jf1     sysadmin   Scheduled   2015/08/23 12:24:09   2015/08/23 12:24:09   --           Urgent     0
47244640257   PS     jfall   sysadmin   Scheduled   2015/08/23 12:23:06   2015/08/23 12:23:06   --           Normal     0
-----------   ----   -----   --------   ---------   -------------------   -------------------   ----------   --------   --------
sysadmin@dd9500#


Kan PCM-jobber planlegges?
Ja – hvis en bestemt PCM-jobb må kjøres regelmessig, er det planlagt å kjøre automatisk etter behov. Eksempel:

sysadmin@dd9500# compression physical-capacity-measurement schedule create jf_sched pathsets jfall,jf1,jf2 time 1400
Schedule "jf_sched" created.

Merk: Tidsplaner opprettes for å kjøre daglig, på bestemte dager i uken eller bestemte dager i hver måned.

En eksisterende tidsplan endres ved hjelp av schedule modify Kommandoen:

sysadmin@dd9500# compression physical-capacity-measurement schedule modify jf_sched priority urgent time 1700 day Wed,Fri
Schedule "jf_sched" modified.

I tillegg kan en eksisterende tidsplan ha banesett lagt til eller fjernet på følgende måte:

sysadmin@dd9500# compression physical-capacity-measurement schedule del jf_sched pathsets jf2
Schedule "jf_sched" modified.
sysadmin@dd9500# compression physical-capacity-measurement schedule add jf_sched pathsets jf2
Schedule "jf_sched" modified.

Merk: En tidsplan kan ikke bare inneholde banesett ELLER MTrees (det vil si at de to ikke kan blandes):
sysadmin@dd9500# compression physical-capacity-measurement schedule create jf_sched2 mtrees /data/col1/backup time 1400
Schedule "jf_sched2" created.
sysadmin@dd9500# compression physical-capacity-measurement schedule add jf_sched2 pathsets jfall
**** Failed to add: this schedule is only for mtrees.

Hvis du vil vise detaljer om eksisterende tidsplaner, vises schedule show all Kommando brukes, for eksempel:

sysadmin@dd9500# compression physical-capacity-measurement schedule show all
Name:      jf_sched
Status:    enabled
Priority:  urgent
Frequency: weekly on Wed, Fri
Time:      17:00
Pathset(s):
    jfall
    jf1
    jf2


Name:      jf_sched2
Status:    enabled
Priority:  normal
Frequency: daily
Time:      14:00
MTree(s):
    /data/col1/backup

Eksisterende tidsplaner kan deaktiveres eller aktiveres umiddelbart, det vil si:

sysadmin@dd9500# compression physical-capacity-measurement schedule disable jf_sched2
Schedule "jf_sched2" disabled.
sysadmin@dd9500# compression physical-capacity-measurement schedule enable jf_sched2
Schedule "jf_sched2" enabled.

En tidsplan kan også bli ødelagt:

sysadmin@dd9500# compression physical-capacity-measurement schedule destroy jf_sched2
Schedule "jf_sched2" destroyed.

Merk: Dette fjerner IKKE historikken for de tilsvarende mtrees/pathsets (det betyr at nye PCM-jobber ikke planlegges automatisk).


Hvordan startes planlagte jobber?
Når en PCM-plan legges til og aktiveres, fører dette til at en tilsvarende oppføring legges til /etc/crontabdet vil si:

#
# collection.1.crontab.pcr.jf_sched.0
#
00 17 * * Wed,Fri  root /ddr/bin/ddsh -a compression physical-capacity-measurement sample start force priority urgent objects-from-schedule jf_sched

Merk: cron-jobben fjernes fra /etc/crontab Hvis tidsplanen er deaktivert eller ødelagt.


Kan jeg slutte å kjøre en PCM-jobb?
Ja – kjøring av PCM-jobber kan avbrytes ved hjelp av enten oppgave-ID-en eller pathset/mtree-navnene. Vi ser for eksempel at vi har to PCM-jobber i kø:

SE@dd9500## compression physical-capacity-measurement sample show current
Task ID        Type   Name    User       State       Creation Time         Measurement Time      Start Time   Priority   Percent
                                                                           (Submitted Time)                              Done
------------   ----   -----   --------   ---------   -------------------   -------------------   ----------   --------   --------
124554051585   PS     jfall   sysadmin   Scheduled   2015/08/30 16:00:48   2015/08/30 16:00:48   --           Normal     0
124554051586   PS     jfall   sysadmin   Scheduled   2015/08/30 16:01:55   2015/08/30 16:01:55   --           Normal     0
------------   ----   -----   --------   ---------   -------------------   -------------------   ----------   --------   --------

Disse jobbene kan avbrytes ved hjelp av enten task-id (for å stoppe en enkelt jobb):

SE@dd9500## compression physical-capacity-measurement sample stop task-id 124554051585
**   This will abort any submitted or running compression physical-capacity-measurement sampling tasks.
        Do you want to proceed? (yes|no) [no]: yes
1 task(s) aborted.

Etterlater oss med en enkelt løpejobb:

SE@dd9500## compression physical-capacity-measurement sample show current
Task ID        Type   Name    User       State       Creation Time         Measurement Time      Start Time   Priority   Percent
                                                                           (Submitted Time)                              Done
------------   ----   -----   --------   ---------   -------------------   -------------------   ----------   --------   --------
124554051586   PS     jfall   sysadmin   Scheduled   2015/08/30 16:01:55   2015/08/30 16:01:55   --           Normal     0
------------   ----   -----   --------   ---------   -------------------   -------------------   ----------   --------   --------

Eller banesettnavn:

SE@dd9500## compression physical-capacity-measurement sample stop pathsets jfall
**   This will abort any submitted or running compression physical-capacity-measurement sampling tasks.
        Do you want to proceed? (yes|no) [no]: yes
1 task(s) aborted.

Etterlater oss uten jobb:

SE@dd9500## compression physical-capacity-measurement sample show current
No measurement tasks found.


Hvordan kan detaljer om fullførte jobber vises?
Detaljer om fullførte jobber vises med sample show history Kommandoen. Hvis du for eksempel vil vise detaljer for ett enkelt banesett:

SE@dd9500## compression physical-capacity-measurement sample show history pathset jfall
Pathset: jfall
Measurement Time      Logical Used   Physical Used   Global-Comp   Local-Comp       Total-Comp
                        (Pre-Comp)     (Post-Comp)        Factor       Factor           Factor
                             (GiB)           (GiB)                               (Reduction %)
-------------------   ------------   -------------   -----------   ----------   --------------
2015/08/23 12:23:06            7.0             4.2         1.70x        0.98x   1.67x (40.24%)
2015/08/23 13:04:20           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
2015/08/26 14:00:01           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
2015/08/27 14:00:01           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
2015/08/28 14:00:02           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
2015/08/29 14:00:02           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
2015/08/30 14:00:01           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
-------------------   ------------   -------------   -----------   ----------   --------------
Total number of measurements retrieved = 7.

Parameteren for detaljert historikk viser også start- og sluttidspunkt for hver jobb:

SE@dd9500## compression physical-capacity-measurement sample show detailed-history pathset jfall
Pathset: jfall
Measurement Time      Logical Used   Physical Used   Global-Comp   Local-Comp       Total-Comp   Task ID        Task Start Time       Task End Time
                        (Pre-Comp)     (Post-Comp)        Factor       Factor           Factor
                             (GiB)           (GiB)                               (Reduction %)
-------------------   ------------   -------------   -----------   ----------   --------------   ------------   -------------------   -------------------
2015/08/23 12:23:06            7.0             4.2         1.70x        0.98x   1.67x (40.24%)   47244640257    2015/08/23 12:25:19   2015/08/23 12:25:23
2015/08/23 13:04:20           10.0             6.2         1.63x        0.98x   1.61x (37.84%)   51539607553    2015/08/23 13:05:45   2015/08/23 13:05:48
2015/08/26 14:00:01           10.0             6.2         1.63x        0.98x   1.61x (37.84%)   77309411329    2015/08/26 14:02:50   2015/08/26 14:02:50
2015/08/27 14:00:01           10.0             6.2         1.63x        0.98x   1.61x (37.84%)   85899345921    2015/08/27 14:03:06   2015/08/27 14:03:06
2015/08/28 14:00:02           10.0             6.2         1.63x        0.98x   1.61x (37.84%)   94489280513    2015/08/28 14:02:50   2015/08/28 14:02:51
2015/08/29 14:00:02           10.0             6.2         1.63x        0.98x   1.61x (37.84%)   103079215105   2015/08/29 14:01:40   2015/08/29 14:01:41
2015/08/30 14:00:01           10.0             6.2         1.63x        0.98x   1.61x (37.84%)   115964116993   2015/08/30 14:04:12   2015/08/30 14:04:12
-------------------   ------------   -------------   -----------   ----------   --------------   ------------   -------------------   -------------------
Total number of measurements retrieved = 7.

Merk: Begge kommandoene kan endres slik at de bare henter resultater over en bestemt tidsperiode:
SE@dd9500## compression physical-capacity-measurement sample show history pathset jfall last 2days
Pathset: jfall
Measurement Time      Logical Used   Physical Used   Global-Comp   Local-Comp       Total-Comp
                        (Pre-Comp)     (Post-Comp)        Factor       Factor           Factor
                             (GiB)           (GiB)                               (Reduction %)
-------------------   ------------   -------------   -----------   ----------   --------------
2015/08/29 14:00:02           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
2015/08/30 14:00:01           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
-------------------   ------------   -------------   -----------   ----------   --------------
Total number of measurements retrieved = 2.

Eller mellom bestemte datoer eller klokkeslett:

SE@dd9500## compression physical-capacity-measurement sample show history pathset jfall start 08231010 end 08231400
Pathset: jfall
Measurement Time      Logical Used   Physical Used   Global-Comp   Local-Comp       Total-Comp
                        (Pre-Comp)     (Post-Comp)        Factor       Factor           Factor
                             (GiB)           (GiB)                               (Reduction %)
-------------------   ------------   -------------   -----------   ----------   --------------
2015/08/23 12:23:06            7.0             4.2         1.70x        0.98x   1.67x (40.24%)
2015/08/23 13:04:20           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
-------------------   ------------   -------------   -----------   ----------   --------------
Total number of measurements retrieved = 2.


Hvor lenge oppbevares en bestemt historikk for et bestemt stisett/mtree?
Som standard beholdes resultatene av hvert PCM-banesett i 180 dager. Dette kan endres ved å endre det tilsvarende banesettet:

SE@dd9500## compression physical-capacity-measurement pathset modify jfall measurement-retention 14
Measurement-retention changed to 14 day(s).

PCM-historikk oppbevares i systemets historiske database. Som et resultat, hvis den historiske databasen går tapt eller skadet, går også detaljer om all PCM-historie tapt.

Er det noen forbehold å være oppmerksom på når du bruker PCM?
PCM-jobber deaktiveres hvis systemet har mindre enn 10 % tilgjengelig plass.
PCM-jobber deaktiveres mens oppryddingssyklusen kjører.

Som tidligere nevnt er PCM et verktøy som brukes til å beregne fysisk utnyttelse av et bestemt sett med kataloger / mtrees. Ved beregning av resultater for et bestemt banesett eller sett med MTrees, teller PCM bare størrelsen på hvert unike segment av data som brukes av banesettet eller settet med MTrees én gang.
 

Merk: På grunn av dedupliseringens natur kan det være andre filer utenfor banesettene/mtreene som jobben kjøres mot, som også kan deduplisere mot de samme dataene.

Som et resultat av dette, hvis filer som dedupliseres mot de samme dataene, er i flere forskjellige PCM-jobber, kan hvert av segmentene som utgjør filene, telles flere ganger (én gang ved hver PCM-jobb). Dette betyr at selv om resultatene av hver enkelt PCM-jobb er nøyaktige, kan ikke resultatene av flere PCM-jobber summeres for å gi nøyaktig fysisk utnyttelse for summen av stisett/mtreer i jobbene.

På grunn av måten PCM-jobber er satt sammen, banen satt eller MTree post-comp plass som brukes på disken:

  • PCM-jobber tar ikke hensyn til døde data (diskplass som brukes av slettede filer, som plassen på disken kanskje ikke har blitt gjenvunnet ved å kjøre GC ennå).
  • PCM tar ikke hensyn til data som er låst i øyeblikksbilder som er opprettet for MTree eller banesett som måles.

For eksempel har jeg et mtree som heter /data/col1/jf1 der jeg oppretter tre 1 Gb-filer, det vil si:

!!!! dd9500 YOUR DATA IS IN DANGER !!!! # for i in 1 2 3 ; do
> dd if=/dev/urandom of=/data/col1/jf1/${i} bs=1024k count=1024
> done

Jeg deretter kopiere disse filene til en annen mtree (/data/col1/jf2):

!!!! dd9500 YOUR DATA IS IN DANGER !!!! # cp /data/col1/jf1/1 /data/col1/jf2/4
!!!! dd9500 YOUR DATA IS IN DANGER !!!! # cp /data/col1/jf1/2 /data/col1/jf2/5
!!!! dd9500 YOUR DATA IS IN DANGER !!!! # cp /data/col1/jf1/3 /data/col1/jf2/6

Til slutt oppretter jeg en ny 1Gb-fil i /data/col1/jf2:

!!!! dd9500 YOUR DATA IS IN DANGER !!!! # dd if=/dev/urandom of=/data/col1/jf2/7 bs=1024k count=1024
1024+0 records in
1024+0 records out

Hvis lokal komprimering av data ignoreres, og bare deduplisering vurderes, er det klart at hvert mtree brukte følgende mengde fysisk plass da filene ble skrevet:

/data/col1/jf1: 3Gb
/data/col1/jf2: 1Gb (for den nye filen - kopierte filer ville ha de-duplisert mot eksisterende data så ville ha forbrukt minimal fysisk plass).

Som et resultat av summen av fysisk plassutnyttelse av /data/col1/jf1 og /data/col1/jf2 bør være rundt 4 GB.

Det opprettes tre PCM-baner:

jf1 som inneholder /data/col1/jf1
jf2 som inneholder /data/col1/jf2
jfall som inneholder data/col1/jf1 og /data/col1/jf2

PCM-jobbene kjøres og gir utdata som følger:

Pathset: jf1
Measurement Time      Logical Used   Physical Used   Global-Comp   Local-Comp       Total-Comp
                        (Pre-Comp)     (Post-Comp)        Factor       Factor           Factor
                             (GiB)           (GiB)                               (Reduction %)
-------------------   ------------   -------------   -----------   ----------   --------------
2015/08/23 12:24:09            3.0             3.2         0.96x        0.98x   0.94x (-6.21%)
-------------------   ------------   -------------   -----------   ----------   --------------


Pathset: jf2
Measurement Time      Logical Used   Physical Used   Global-Comp   Local-Comp       Total-Comp
                        (Pre-Comp)     (Post-Comp)        Factor       Factor           Factor
                             (GiB)           (GiB)                               (Reduction %)
-------------------   ------------   -------------   -----------   ----------   --------------
2015/08/23 12:24:12            4.0             4.2         0.98x        0.98x   0.96x (-4.14%)
-------------------   ------------   -------------   -----------   ----------   --------------

Disse verdiene er riktige siden hver PCM-jobb bare ser på fysiske data som refereres til av filene i det tilsvarende banesettet. Dette betyr at data for filer som ble kopiert, telles to ganger (én gang ved hver PCM-jobb).

Det kan virke rimelig at for å få total fysisk utnyttelse av /data/col1/jf1 og /data/col1/jf2 MTrees, kan vi summere verdiene av 'fysisk brukt' fra de ovennevnte utgangene.
 

Merk: Dette gir 7.4Gb som er klart ikke riktig (over det ble anslått at på grunn av de-duplisering total utnyttelse ville være rundt 4GB).
 

For å få en nøyaktig verdi for total fysisk utnyttelse av /data/col1/jf1 og /data/col1/jf2, er det nødvendig å kjøre en enkelt PCM-jobb som dekker begge disse MTrees (det vil si bruk jfall). Dette sikrer at dupliserte segmenter bare telles én gang og ikke to ganger som i eksemplet ovenfor, det vil si:

Pathset: jfall
Measurement Time      Logical Used   Physical Used   Global-Comp   Local-Comp       Total-Comp
                        (Pre-Comp)     (Post-Comp)        Factor       Factor           Factor
                             (GiB)           (GiB)                               (Reduction %)
-------------------   ------------   -------------   -----------   ----------   --------------
2015/08/23 12:23:06            7.0             4.2         1.70x        0.98x   1.67x (40.24%)
-------------------   ------------   -------------   -----------   ----------   --------------

Oppsummert kan ikke utdataene fra flere PCM-jobber summeres for å gi nøyaktig fysisk utnyttelse for et sett med banesett/mtrees. I stedet bør et enkelt PCM-banesett defineres som dekker alle nødvendige mtrees/kataloger, da dette sikrer at dupliserte data bare telles én gang. Hvis dette ikke gjøres og en separat PCM-jobb skal kjøres for hvert mtree på et system, for eksempel, er resultatene oppsummert fullt mulig at den totale fysiske kapasiteten som brukes overstiger systemets ukomprimerte kapasitet.

Kan PCM-jobber bare sendes inn av DDSH kommandolinje eller kan et brukergrensesnitt også brukes?
I dette dokumentet brukes Data Domain-kommandolinjegrensesnittet (DDSH) til å konfigurere, sende og gjennomgå PCM-jobber.
 

Merk: PCM kan også brukes av Data Domain Enterprise Manager eller System Manager UI.
 
Merk: DDSH-grensesnittet har en grense på maksimalt 256 tegn i en gitt kommando. Som et resultat, hvis PCM-jobber må konfigureres mot en bane med et langt katalognavn, kan det være fordelaktig (eller til og med nødvendig) å bruke et av de tilgjengelige brukergrensesnittene.

Affected Products

Data Domain, DD OS

Products

Data Domain
Article Properties
Article Number: 000058798
Article Type: How To
Last Modified: 05 Dec 2024
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.