Data Domain: En introduktion til langsigtet opbevaring/rensning på cloudniveau/affaldsindsamling på Data Domain Restorers (DDRs)
Summary: Denne artikel er en introduktion til rensning/affaldsindsamling med hensyn til det cloudniveau, der er konfigureret på Data Domain Restorers (DDRs) ved hjælp af funktionalitet til cloud/langsigtet opbevaring (LTR) ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Instructions
DDOS (Data Domain Operating System) 6.0 introducerer en ny funktion, der kaldes cloudopbevaring eller langsigtet opbevaring (LTR). Denne funktion gør det muligt at føje et andet niveau af objektbaseret storage, der leveres af en cloududbyder, til visse modeller af Data Domain Restorer (DDR) med en tilknyttet CLOUD_CAPACITY licens.
På systemer, der bruger LTR, skrives filer, der indtages af DDR, oprindeligt til det aktive niveau (lokalt tilsluttet lager). Dataflytningspolitikker/aldersgrænser konfigureres derefter pr. MTree-basis, således at visse filer, der kræver langvarig opbevaring, senere overføres fra det aktive til cloudniveauet af dataflytningsprocessen (en regelmæssigt planlagt opgave).
Filer på cloudniveauet kan slettes som normalt, men tilknyttet plads på cloud-/objektlager frigøres ikke umiddelbart til brug. Hvis du vil fjerne overflødige data fra clouden, skal cloudniveauet renses.
Cloudniveauets struktur:
Cloudniveauet er opdelt i "cloudenheder". Bemærk, at:
# cloudenhedsliste
Navn Profilstatus
----------------------- ------------ ------
B-enhed LTR-ECS-Ben Aktiv <=== ECS-udbyder
cloud-enhed-virtustream1 virtustream1 Aktiv <=== Virtustream-udbyder
----------------------- ------------ ------
Grundlæggende begreber inden for cloudrensning:
Desværre er disse oplysninger i øjeblikket ikke tilgængelige via Data Domain Command Line Shell (DDSH) for igangværende rensning af cloudenheder.
Derudover vises følgende i DDFS-logfiler, hvis cloud clean startes manuelt eller via dens tidsplan:
Planlægning af rensning i skyen:
I DDOS 6.0 og senere er den måde, hvorpå clean på aktivt niveau planlægges, ikke ændret - som standard er clean på aktivt niveau planlagt til at køre en gang om ugen kl. 0600 tirsdag, dvs.:
# filesys clean show schedule
Filesystem cleaning er planlagt til at køre "Tue" på "0600".
Cloud-rydning er som standard planlagt til at køre efter hver 4. aktivering af planlagt aktiv niveaurensning. For at få vist tidsplanen for rensning i skyen skal følgende kommando bruges:
# cloudrensningsfrekvens vises
Rengøringsfrekvensen for Cloud-niveauet er indstillet til at køre efter hver 4 aktive oprydningscyklusser.
Som følge heraf startes cloud clean på et system med standardkonfiguration hver 4. uge - hvis systemet har to cloud-enheder, rengøres hver enhed en gang hver 8. uge.
For at ændre frekvensen for rensning i skyen kan følgende kommando bruges:
# Frekvens for rensning i cloudmiljø 2
Rensningsfrekvens for cloud-niveauer er indstillet til at køre efter hver 2. oprydningscyklus på det aktive niveau.
For at nulstille cloud clean til standardplanen for efter hver 4 aktive niveauer renses, kan følgende kommando bruges:
# cloud clean frequency reset
Cloud tier cleaning frequency nulstilles til standard (hver 4 clean functional cleaning cycles).
Bemærk, at tidsplanen for rensning i clouden ikke omfatter manuelt startede rene cyklusser på aktivt niveau. Som følge heraf vil Cloud Tier Clean på ovenstående system kun starte en gang hver 4. uge, selvom Active Tier Clean blev kørt manuelt hver dag.
Det er også muligt helt at deaktivere planlagt cloud clean ved hjælp af følgende kommando:
# cloud clean frekvens set never
Cloud tier cleaning frequency er indstillet til "never".
I dette tilfælde kører Cloud Clean kun, når den startes manuelt.
For at stoppe en aktuelt kørende cloud clean kan følgende kommando bruges:
# cloud clean stop
For at finde ud af, hvornår cloud clean sidst kørte, kan følgende kommando bruges:
# cloud clean status
Cloud tier cleaning afsluttet kl. 2016/08/01 20:54:43.
Algoritme til rensning af cloud:
Cloudclean bruger den samme rene algoritme, som er konfigureret til det aktive niveau. I DDOS 6.0 (og nyere) er dette som standard perfekt fysisk affaldsindsamling (PPGC), men dette kan ændres til fysisk affaldsindsamling (PGC) via systemparametre.
Bemærk, at indsamling af fysisk affald ikke bør deaktiveres, da brug af den traditionelle/komplette rensningsalgoritme til rengøring af en cloudenhed kan resultere i DDFS-panik/genstart
Algoritmen, der bruges til cloudrensning, vises i DDFS-logfiler, når rensning starter, dvs.:
06/28 10:51:56.960 (TID 0x7fc5bccb2d50): GC: gc_start_intern:
Valgt algoritme: Fysisk rengøring <=== PPGC eller PGC
07/27 12:21:18.224 (tid 0x7f92b8cfe7e0): GC: gc_start_intern: Valgt algoritme: Fuld rengøring <=== Traditionel GC
Bemærk, at det ud fra ovenstående output ikke er muligt at skelne mellem PPGC eller PGC - den specifikke anvendte algoritme er tydelig på grund af antallet af faser, der køres af clean - generelt:
Traditionel/fuld GC: 10 faser
PGC: 12 faser
PPGC: 6 faser
For yderligere oplysninger om ændring af den rene algoritme, der bruges på et system, skal du kontakte din kontraherede supportudbyder
Forskelle mellem clean pipe-faserne på aktivt niveau og clean copy på cloudniveau: Kopieringsfasen af clean er den fase,
hvor overflødige data på en DDR fysisk fjernes/plads genvindes.
Bemærk, at der er forskelle mellem, hvordan kopieringsfasen fungerer i forhold til det aktive niveau og cloudniveauet:
Aktivt niveau:
Cloud-niveau:
Komprimeringsområder, der er markeret til sletning, behandles asynkront af cloud clean – det betyder, at den ledige plads på en cloudenhed kan fortsætte med at stige, selv når cloud-rensningen er fuldført
Denne forskel skyldes de iboende omkostninger, der er forbundet med at læse/skrive store mængder data på cloud storage, men det betyder, at en cloudenhed kan blive kunstigt fuld (dvs. indeholde et stort antal komprimeringsområder, som hver indeholder en meget lille mængde levende data, hvilket forhindrer deres fjernelse).
Hvis denne situation opstår, er det muligt at indstille systemparametre, der tvinger en 'defragmenteringsrensning' af skyenheden - dette kopierer live-data fremad fra eksisterende komprimeringsregioner for at konsolidere live data i så få komprimeringsområder som muligt, så der kan frigøres plads.
For yderligere oplysninger om at køre en 'defragmenteringsren' bedes du kontakte din kontraherede supportudbyder.
På systemer, der bruger LTR, skrives filer, der indtages af DDR, oprindeligt til det aktive niveau (lokalt tilsluttet lager). Dataflytningspolitikker/aldersgrænser konfigureres derefter pr. MTree-basis, således at visse filer, der kræver langvarig opbevaring, senere overføres fra det aktive til cloudniveauet af dataflytningsprocessen (en regelmæssigt planlagt opgave).
Filer på cloudniveauet kan slettes som normalt, men tilknyttet plads på cloud-/objektlager frigøres ikke umiddelbart til brug. Hvis du vil fjerne overflødige data fra clouden, skal cloudniveauet renses.
Cloudniveauets struktur:
Cloudniveauet er opdelt i "cloudenheder". Bemærk, at:
- Cloudniveauet kan indeholde op til to cloudenheder
- Hver cloud-enhed kan være så stor som den maksimalt understøttede aktive niveaustørrelse for den givne DDR-model
- Hver cloudenhed kan klargøres fra forskellige udbydere af objektstorage
# cloudenhedsliste
Navn Profilstatus
----------------------- ------------ ------
B-enhed LTR-ECS-Ben Aktiv <=== ECS-udbyder
cloud-enhed-virtustream1 virtustream1 Aktiv <=== Virtustream-udbyder
----------------------- ------------ ------
Grundlæggende begreber inden for cloudrensning:
- Cloud-rensning fungerer kun mod en enkelt cloud-enhed under hver kørsel - for at bestemme den cloud-enhed, der rengøres, kan følgende meddelelse findes i DDFS-logfiler (/ddr/var/log/debug/ddfs.info) - i dette tilfælde renses cloud-unit-virtustream1-cloudenheden:
08/12 13:25:07.551 (TID 0x7f22991eb880): GC: Fysisk rensning kører på partitionen: cloud-unit-virtustream1, select_flags: Ingen, USR: PLANLAGT CLOUD-GC, asm: Ja
Desværre er disse oplysninger i øjeblikket ikke tilgængelige via Data Domain Command Line Shell (DDSH) for igangværende rensning af cloudenheder.
- Hvis et system har flere cloud-enheder konfigureret, vil cloud clean afrunde rensning af disse enheder, der forsøger at rense en enkelt enhed, hver gang cloud clean køres
- Cloud clean kan startes manuelt eller automatisk via en tidsplan - for at starte manuelt bruges følgende kommando:
# Ren cloud-start [navn på cloudenhed]
- Active tier clean og cloud clean kan ikke køre parallelt (fordi begge bruger de samme hukommelsesstrukturer i DDFS)
- Hvis aktiv niveaurensning kører (startes enten manuelt eller via tidsplanen), og cloud clean forsøges startet, vil det medføre fejl, dvs.:
# cloud clean start cloudunit2
Kunne ikke starte: aktiverniveaurensning kører i øjeblikket. Brug 'filesys clean watch' til at overvåge dets fremskridt.
Kunne ikke starte: aktiverniveaurensning kører i øjeblikket. Brug 'filesys clean watch' til at overvåge dets fremskridt.
- Hvis cloud clean er startet automatisk (dvs. via tidsplanen), og active tier clean startes, afbrydes clean fra cloudenheden, så active tier clean kan køre. Dette angives af følgende i DDFS-logfiler:
08/12 13:25:24.532 (TID 0x7f2277e9d210): gc_asm_start: Afbryd planlagt cloud-GC
- Hvis cloud clean er startet manuelt, og active forsøges startet, vil active tier clean ikke starte – cloud clean vil blive kørt til færdiggørelse, dvs.:
# filesys ren start
Rensning kan ikke starte, da Cloud Tier-rensning er i gang. Brug "cloud clean watch" til at overvåge fremskridt.
Rensning kan ikke starte, da Cloud Tier-rensning er i gang. Brug "cloud clean watch" til at overvåge fremskridt.
- En cloud-enhed skal have oplevet mindst 1 % data "churn" (dvs. >= 1 % af de data, der aktuelt er på cloudenheden, skal anses for at være overflødige og derfor aftagelige), for at cloud clean starter. Hvis dette ikke er tilfældet, vises følgende på kommandolinjen, hvis cloud clean startes manuelt:
# cloud clean start cloudunit2
Kunne ikke starte: cloud-enheden "cloudunit2" har ikke tilstrækkelige data, der kan rengøres.
Kunne ikke starte: cloud-enheden "cloudunit2" har ikke tilstrækkelige data, der kan rengøres.
Derudover vises følgende i DDFS-logfiler, hvis cloud clean startes manuelt eller via dens tidsplan:
07/26 15:38:58.496 (TID 0x7f7a450fd340): GC: CP: CloudUnit2 har 0 % churn, minimum churn nødvendig for at køre GC: 1%
07/26 15:38:58.496 (TID 0x7f7a450fd340): GC: CP: CloudUnit2 har ikke tilstrækkelig churn til, at GC kan køre
07/26 15:38:58.496 (TID 0x7f7a450fd340): GC: CP: CloudUnit2 har ikke tilstrækkelig churn til, at GC kan køre
- Hvis et system indeholder to cloud-enheder, og planlagt rensning af den første enhed mislykkes af en eller anden grund (f.eks. utilstrækkelig churn), vil clean automatisk forsøge at starte mod den anden enhed (dvs. der er ikke noget krav om at vente på den næste planlagte kørsel af cloud clean for den anden enhed, der skal rengøres)
- Cloud-rensning kan begrænses (svarende til aktiv niveaurensning) for at bestemme, hvilken handling der skal udføres, når systemet er under betydelig anden arbejdsbelastning (dvs. indtagelse/gendannelse/replikering).
Som med aktiv niveaurengøring indstilles gashåndtaget som en procentdel mellem 0 og 100:
0%: Cloud-rensning frigiver hurtigt ressourcer til andre workloads og kan derfor køre langsomt, men medfører minimal påvirkning af systemets samlede ydeevne
100 %: Cloud clean frigiver ikke ressourcer til andre workloads og kører derfor så hurtigt som muligt, men kan have en betydelig indvirkning på systemets samlede ydeevne
Cloud clean throttle er som standard indstillet til 50 %:
# Cloud clean throttle show
Cloud Tier cleaning throttle er indstillet til 50 procent
For at ændre gashåndtaget kan følgende kommando bruges - bemærk, at den nye gasværdi træder i kraft med det samme, og der er ikke noget krav om at genstarte DDFS
eller Cloud Clean efter ændring af throttle:
# Cloud Clean throttle set 75
Cloud tier cleaning throttle set til 75 procent
0%: Cloud-rensning frigiver hurtigt ressourcer til andre workloads og kan derfor køre langsomt, men medfører minimal påvirkning af systemets samlede ydeevne
100 %: Cloud clean frigiver ikke ressourcer til andre workloads og kører derfor så hurtigt som muligt, men kan have en betydelig indvirkning på systemets samlede ydeevne
Cloud clean throttle er som standard indstillet til 50 %:
# Cloud clean throttle show
Cloud Tier cleaning throttle er indstillet til 50 procent
For at ændre gashåndtaget kan følgende kommando bruges - bemærk, at den nye gasværdi træder i kraft med det samme, og der er ikke noget krav om at genstarte DDFS
eller Cloud Clean efter ændring af throttle:
# Cloud Clean throttle set 75
Cloud tier cleaning throttle set til 75 procent
Planlægning af rensning i skyen:
I DDOS 6.0 og senere er den måde, hvorpå clean på aktivt niveau planlægges, ikke ændret - som standard er clean på aktivt niveau planlagt til at køre en gang om ugen kl. 0600 tirsdag, dvs.:
# filesys clean show schedule
Filesystem cleaning er planlagt til at køre "Tue" på "0600".
Cloud-rydning er som standard planlagt til at køre efter hver 4. aktivering af planlagt aktiv niveaurensning. For at få vist tidsplanen for rensning i skyen skal følgende kommando bruges:
# cloudrensningsfrekvens vises
Rengøringsfrekvensen for Cloud-niveauet er indstillet til at køre efter hver 4 aktive oprydningscyklusser.
Som følge heraf startes cloud clean på et system med standardkonfiguration hver 4. uge - hvis systemet har to cloud-enheder, rengøres hver enhed en gang hver 8. uge.
For at ændre frekvensen for rensning i skyen kan følgende kommando bruges:
# Frekvens for rensning i cloudmiljø 2
Rensningsfrekvens for cloud-niveauer er indstillet til at køre efter hver 2. oprydningscyklus på det aktive niveau.
For at nulstille cloud clean til standardplanen for efter hver 4 aktive niveauer renses, kan følgende kommando bruges:
# cloud clean frequency reset
Cloud tier cleaning frequency nulstilles til standard (hver 4 clean functional cleaning cycles).
Bemærk, at tidsplanen for rensning i clouden ikke omfatter manuelt startede rene cyklusser på aktivt niveau. Som følge heraf vil Cloud Tier Clean på ovenstående system kun starte en gang hver 4. uge, selvom Active Tier Clean blev kørt manuelt hver dag.
Det er også muligt helt at deaktivere planlagt cloud clean ved hjælp af følgende kommando:
# cloud clean frekvens set never
Cloud tier cleaning frequency er indstillet til "never".
I dette tilfælde kører Cloud Clean kun, når den startes manuelt.
For at stoppe en aktuelt kørende cloud clean kan følgende kommando bruges:
# cloud clean stop
For at finde ud af, hvornår cloud clean sidst kørte, kan følgende kommando bruges:
# cloud clean status
Cloud tier cleaning afsluttet kl. 2016/08/01 20:54:43.
Algoritme til rensning af cloud:
Cloudclean bruger den samme rene algoritme, som er konfigureret til det aktive niveau. I DDOS 6.0 (og nyere) er dette som standard perfekt fysisk affaldsindsamling (PPGC), men dette kan ændres til fysisk affaldsindsamling (PGC) via systemparametre.
Bemærk, at indsamling af fysisk affald ikke bør deaktiveres, da brug af den traditionelle/komplette rensningsalgoritme til rengøring af en cloudenhed kan resultere i DDFS-panik/genstart
Algoritmen, der bruges til cloudrensning, vises i DDFS-logfiler, når rensning starter, dvs.:
06/28 10:51:56.960 (TID 0x7fc5bccb2d50): GC: gc_start_intern:
Valgt algoritme: Fysisk rengøring <=== PPGC eller PGC
07/27 12:21:18.224 (tid 0x7f92b8cfe7e0): GC: gc_start_intern: Valgt algoritme: Fuld rengøring <=== Traditionel GC
Bemærk, at det ud fra ovenstående output ikke er muligt at skelne mellem PPGC eller PGC - den specifikke anvendte algoritme er tydelig på grund af antallet af faser, der køres af clean - generelt:
Traditionel/fuld GC: 10 faser
PGC: 12 faser
PPGC: 6 faser
For yderligere oplysninger om ændring af den rene algoritme, der bruges på et system, skal du kontakte din kontraherede supportudbyder
Forskelle mellem clean pipe-faserne på aktivt niveau og clean copy på cloudniveau: Kopieringsfasen af clean er den fase,
hvor overflødige data på en DDR fysisk fjernes/plads genvindes.
Bemærk, at der er forskelle mellem, hvordan kopieringsfasen fungerer i forhold til det aktive niveau og cloudniveauet:
Aktivt niveau:
- Data, der skrives til det aktive niveau af en DDR, er indeholdt i 4,5 Mb beholdere
- Som standard vil en beholder kun blive betragtet som "kopi" ved ren, hvis den indeholder <= 92% "live" (dvs. aktivt refererede) data
- De levende data ekstraheres fra containeren og skrives til en ny beholder (sammen med live-data fra andre kopierede containere) i slutningen af filsystemet
- Diskindekser opdateres, så de afspejler den nye beholder med live-data
- Den oprindelige beholder (der indeholder både aktive og døde data) slettes derefter, og den underliggende diskplads gøres tilgængelig til brug
Cloud-niveau:
- Data, der skrives til cloudniveauet i en DDR, struktureres anderledes – i stedet for at blive placeret i 4,5 Mb beholdere skrives individuelle databidder (64 Kb komprimeringsområder) til cloudenheden (BEMÆRK: For DDOS 6.1.2.0 og nyere vil objekter, der er gemt i cloudenheden, være større, se Data Domain: Stor objektstørrelse til Cloud Tier for detaljer)
- I stedet for at udtrække dynamiske data fra et eksisterende komprimeringsområde og kopiere dette fremadrettet, vil cloud clean kun overveje komprimeringsområder, der udelukkende indeholder døde data til sletning
Som et resultat, hvis et komprimeringsområde indeholder en enkelt meget lille mængde data, der stadig er live (refereret af en fil), slettes det ikke, og døde data inden for komprimeringsområdet fjernes ikke fra disken (dvs. ingen af den plads, der bruges af komprimeringsområdet, genvindes)
Komprimeringsområder, der er markeret til sletning, behandles asynkront af cloud clean – det betyder, at den ledige plads på en cloudenhed kan fortsætte med at stige, selv når cloud-rensningen er fuldført
Denne forskel skyldes de iboende omkostninger, der er forbundet med at læse/skrive store mængder data på cloud storage, men det betyder, at en cloudenhed kan blive kunstigt fuld (dvs. indeholde et stort antal komprimeringsområder, som hver indeholder en meget lille mængde levende data, hvilket forhindrer deres fjernelse).
Hvis denne situation opstår, er det muligt at indstille systemparametre, der tvinger en 'defragmenteringsrensning' af skyenheden - dette kopierer live-data fremad fra eksisterende komprimeringsregioner for at konsolidere live data i så få komprimeringsområder som muligt, så der kan frigøres plads.
For yderligere oplysninger om at køre en 'defragmenteringsren' bedes du kontakte din kontraherede supportudbyder.
Affected Products
Data DomainProducts
Data DomainArticle Properties
Article Number: 000019165
Article Type: How To
Last Modified: 25 Jul 2025
Version: 3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.