Data Domain: Bedste fremgangsmåde for datamigration på PowerProtect Data Domain-systemer ved hjælp af MTree-replikering
Summary: Denne artikel omhandler forberedelse til migrering af data ved hjælp af Mtree-replikering (MRepl) fra ældre PowerProtect Data Domain-systemer (PPDD) uden intern QAT-kortunderstøttelse. For eksempel DD9500 og DD9800. Det er vigtigt at overveje den aktuelle arbejdsbelastning for systemdriften for at undgå uventede bivirkninger, der kan påvirke datamigreringsresultaterne negativt. Denne artikel hjælper med at planlægge migreringshandlinger, der kræver en ny Mtree Replication (MRepl)-kontekstkonfiguration ved hjælp af ældre PPDD-systemer som kilde. ...
Instructions
Med introduktionen af 16G-platforme er migrering af specifikke MTrees fra ældre PPDD til et nyere system et almindeligt krav.
Migreringsprocessen opretter nye Mtree-replikeringskontekster. Overvej følgende for at sikre minimal afbrydelse.
- Aktuel systembelastning fra sikkerhedskopieringshandlinger
- Forskelle i komprimeringsegenskaber (f.eks. understøttelse af QAT-kort)
- Pludselig inkorporering af nye Mrepl-kontekstkonfigurationer
- HW-fejl, der påvirker affaldsindsamlingsprocessen (GC)
For at bevare dataintegriteten og overholde serviceniveauaftaler kan systemet gå i panik ved visse driftstærskler.
Panikmekanismen udløser selvkorrigerende handlinger for at sikre, at systemet altid fungerer pålideligt.
Heri diskuteres disse overvejelser, og vejledninger i, hvordan du forhindrer uventet nedetid, der kan forstyrre migreringsplanerne.
Aktuel systembelastning fra Backup Operations:
Fokuser i første omgang på den aktuelle systemdrift. Før migreringen skal du overvåge vigtige målepunkter. Disse omfatter løbende arbejdsbelastninger, CPU-udnyttelse, hukommelsesforbrug, netværksstatus og hardwareadvarsler.
Målet er at bevare systemets drift inden for normale parametre.
Forskelle i komprimeringsegenskaber:
Når du forbereder migrering ved hjælp af Mtree-replikering (Mrepl), skal du overveje forskellen i komprimeringsegenskaber mellem systemerne.
Nogle ældre systemer mangler et indbygget komprimeringskort til at hjælpe med komprimeringsrelaterede operationer.
DD9900-, DD9400- eller DD6900-systemerne gør det muligt at tilslutte et eksternt QAT-kort for at fremskynde komprimeringshandlingerne.
Når der ikke findes et QAT-kort (f.eks. DD9800, DD9500), er det afhængigt af CPU- og hukommelsesressourcer til komprimerings- og dekomprimeringsopgaver.
Når du konfigurerer nye replikeringskontekster uden QAT-understøttelse, skal dataene først dekomprimeres.
Dette kan resultere i en stigning i CPU-forbruget under replikeringsinitialiseringsfasen.
Kilden kontrollerer destinationen for at identificere, hvilken type komprimeringskort der er tilgængelig.
Når et 16G-system (DD9910, DD9410 eller DD6410) er destinationen, skal kilden dekomprimere data fra det ældre 'gzfast'-format. Det skal derefter komprimere det til LZ-formatet.
Indarbejd gradvist ny Mrepl-kontekstkonfiguration:
Når du replikerer data fra ét Data Domain til et andet under genoprettelse efter nedbrud (DR), starter replikeringsjob typisk, når dataindtagelsen er fuldført.
Dette sikrer, at destinationswebstedet modtager alle replikerede data.
Når der defineres nye replikeringskontekster til overførsel, skal kilden håndtere vigtige data under replikeringsinitialisering.
Dette skyldes, at destinationen mangler deduplikerede data, og optimering er endnu ikke mulig. Dette resulterer i en øget belastning på kildesystemet.
Når systemet fortsætter med at behandle I/O (Backup Workloads), skal du gradvist inkorporere replikeringskontekster, der er knyttet til migreringen, for at afhjælpe dette.
Definer et lavt replikeringsgennemløb for at begrænse de ressourcer, der allokeres til disse overførselsrelaterede replikeringskontekster.
Når replikering begynder at bygge optimeringer på destinationen, og de driftsmæssige parametre er valideret, skal du tilføje flere replikeringskontekster (migrering). Du kan også ændre replikeringshastigheden på eksisterende.
Målet er at undgå at udløse systemets beskyttelsesmekanismer. Dette fører til systempanik, som kan påvirke migreringer.
Husk, at referencer til systemydeevne beregnes ud fra workloads i drift, ikke for nye workloads.
Konfigurere begrænsninger gradvist under migreringsscenarier.
Kommandoen "replication throttle add" kan bruges til at planlægge et bestemt tidspunkt og allokere en defineret båndbredde (i Mbps) til begrænsning.
Start nye replikeringsjob med en begrænset tilgængelig båndbredde (lavere gasspjæld). Vurder derefter indvirkningen på systemdriften.
Når replikeringsjobbet er i gang, kan gashåndtaget øges for at give ekstra båndbredde.
Det anbefales også at overvåge systemanalyser, herunder CPU, hukommelse og netværksforbrug, der er tilgængelige på DDSM.
HW-fejl, der påvirker affaldsindsamlingsprocessen (GC):
En anden faktor, der potentielt kan forårsage forringelse af sikkerhedskopierings- eller replikeringsydeevnen, er forbundet med hardwarefejl, især under standardaffaldsindsamlingshandlinger. Under normale driftsforhold fuldfører affaldsindsamlingsmekanismen på PPDD-systemer rumgenbrugsaktiviteter uden at påvirke indtagelses-, gendannelses- eller replikeringsoperationer. I visse situationer tilbyder systemet muligheder for at definere affaldsindsamlingsbegrænsning, hvilket giver systemadministratorer yderligere kontrol over, hvornår systemets rengøringsprocesser finder sted.
Standardbegrænsningskonfigurationen for affaldsindsamling påvirker ikke sikkerhedskopieringer og gendannelser. De fleste tilfælde, hvor der observeres en påvirkning, er knyttet til hardwarefejl. Når visse drev f.eks. skal udskiftes, kan systemets løbende I/O-krav gøre lagringen af sikkerhedskopier og gendannelser langsommere og dermed påvirke den samlede GC-drift.
Data Domain-operativsystemet indeholder omfattende advarselsmekanismer for sådanne hardwareproblemer og udsender proaktivt advarsler, når disse forhold registreres. Dette gør det lettere for backupoperatører hurtigt at løse hardwarerelaterede problemer.
En anden vigtig faktor at overveje er, at replikeringsaktiviteter er lige så vigtige som sikkerhedskopiering og gendannelse. Hver platform er designet til at levere et fast antal strømme for hvert job og kan behandle samtidige handlinger under de definerede grænser for at overholde serviceniveauaftaler (SLA'er).
Konklusion:
Vellykket datamigrering ved hjælp af Mtree-replikering kræver nøje overvejelse af følgende;
- Overvågning af den aktuelle systembelastning fra sikkerhedskopieringshandlinger
- Forstå ældre platforme som DD9800 eller DD9500
- Brug en anden komprimeringsalgoritme (gzfast).
- Når der oprettes nye MTree-replikeringskontekster (MRepl) på et system, der er i drift, skal du gradvist inkorporere de nye Mrepl-kontekstkonfigurationer
- Overvåg nøje virkningen af de nye workloads på systemet.
- Overvåg potentielle hardwarefejl (som påvirker driften fra affaldsindsamlingsprocessen).
Ved at følge disse bedste fremgangsmåder minimeres afbrydelser, og systemet holdes stabilt.
Implementering af disse anbefalinger hjælper med at undgå uventet nedetid og letter datamigrering.