Data Domain: Jak vyřešit problémy s vysokým využitím místa nebo nedostatkem dostupné kapacity v zařízeních DDR (Data Domain Restorer)

Сводка: Tento článek obsahuje podrobný postup, který vám pomůže s problémy týkajícími se vysokého využití prostoru nebo nedostatku dostupné kapacity v zařízeních DDR (Data Domain Restorer)

Данная статья применяется к Данная статья не применяется к Эта статья не привязана к какому-либо конкретному продукту. В этой статье указаны не все версии продуктов.

Симптомы

 
Všechna zařízení DDR (Data Domain Restorer) obsahují fond / prostor úložiště známý jako „aktivní vrstva“:
  • Jedná se o oblast disku, kam se ukládají nové soubory / data a kde zůstává většina souborů zařízení DDR, dokud klientská zálohovací aplikace neukončí jejich platnost nebo je neodstraní.
  • V zařízeních DDR konfigurovaných s funkcí ER (Extended Retention) nebo LTR (Long Term Retentition) je možné pravidelně přesouvat data za účelem migrace starých souborů z aktivní vrstvy do archivní či cloudové vrstvy.
  • Jediným způsobem, jak uvolnit místo v aktivní vrstvě, které zabírají odstraněné / migrované soubory, je spustit proces čištění / úlohu Garbage Collection.
Aktuální využití aktivní vrstvy lze zobrazit pomocí příkazů „filesys show space“ nebo „df“:
 
# df

Active Tier:
Resource           Size GiB   Used GiB   Avail GiB   Use%   Cleanable GiB*
----------------   --------   --------   ---------   ----   --------------
/data: pre-comp           -    33098.9           -      -                -
/data: post-comp    65460.3      518.7     64941.6     1%              0.0
/ddvar                 29.5       19.7         8.3    70%                -
/ddvar/core            31.5        0.2        29.7     1%                -
----------------   --------   --------   ---------   ----   --------------

Upozorňujeme, že se pod aktivní vrstvou mohou v případě konfigurace zobrazovat podrobnosti o archivní či cloudové vrstvě.

Využití aktivní vrstvy musí být pečlivě řízeno, jinak může dojít k následujícím problémům:
  • V aktivní vrstvě může být nedostatek volného místa, takže se zobrazí následující výstrahy / zprávy:
EVT-SPACE-00004: Space usage in Data Collection has exceeded 95% threshold.
  • Pokud je aktivní vrstva zaplněna ze 100 %, nebude možné do zařízení DDR zapsat žádná nová data, což může způsobit selhání zálohování / replikace – v takovém případě se mohou zobrazit například následující výstrahy / zprávy:
CRITICAL: MSG-CM-00002: /../vpart:/vol1/col1/cp1/cset: Container set [ID sady kontejneru] out of space
  • Za určitých okolností může zaplnění místa v aktivní vrstvě způsobit přepnutí systému DDFS (Data Domain File System) do režimu pouze ke čtení, takže nebude možné odstranit stávající soubory.
Cílem tohoto článku znalostní databáze je:
  • Vysvětlit, proč se může aktivní vrstva zaplnit.
  • Popsat jednoduchou sadu kontrol, kterými lze určit příčinu vysokého využití aktivní vrstvy, a odpovídající nápravné kroky.
Pozor:
  • Tento článek není vyčerpávající (tj. může dojít k určitým situacím, kdy se aktivní vrstva zařízení DDR zaplní / zaznamená vysoké využití z důvodu, který není v tomto dokumentu popsán). Předpokládá se však, že článek pokrývá většinu běžných problémů / příčin.
  • Tento článek nepojednává o vysokém využití archivní a cloudové vrstvy.

Причина

 



 
Aktivní vrstva DDR může z několika důvodů zaznamenat neočekávaně vyšší využití:
  • U klienta nedochází ke správnému vypršení platnosti/odstranění záložních souborů/sady uložení z důvodu nesprávných zásad uchovávání nebo konfigurace záložní aplikace
  • Kvůli zpoždění replikace se v aktivní vrstvě uchovává velké množství starých dat, která čekají na replikaci.
  • Data, která se zapisují do aktivní vrstvy, mají neočekávaně nižší celkový poměr komprese
  • Systém nebyl správně nadimenzován, tj. je zkrátka příliš malý na to, aby mohl pojmout množství dat, které se na něj pokouší uložit
  • Zálohy se skládají z velkého počtu velmi malých souborů – tyto soubory zabírají mnohem více místa, než se po prvním zápisu očekává. Tento prostor by se však měl během čištění / úlohy Garbage Collection znovu uvolnit.
  • V systémech konfigurovaných s funkcí ER / LTR nedochází k pravidelnému přesunu dat, kvůli čemuž staré soubory, které by měly být migrovány do archivní / cloudové vrstvy, zůstanou v aktivní vrstvě.
  • Nedochází k pravidelnému spouštění čištění / úlohy Garbage Collection
  • V zařízení DDR jsou přítomny staré snapshoty Mtree nebo velké množství snapshotů Mtree, které brání úloze čištění znovu uvolnit z prostoru odstraněné soubory / data

Разрешение

Krok 1 – Určete, zda je nutné spustit čištění aktivní vrstvy

Operační systém DDOS (Data Domain Operating System) se pokusí zachovat hodnotu čítače s názvem „Cleanable GiB“ pro aktivní vrstvu. Jedná se o odhad, kolik fyzického prostoru (post-comp) by mohlo být v aktivní vrstvě znovu uvolněno spuštěním čištění / úlohy Garbage Collection. Tento čítač lze zobrazit příkazy „filesys show space“ / „df“:
 
Active Tier:
Resource           Size GiB    Used GiB   Avail GiB   Use%   Cleanable GiB*
----------------   --------   ---------   ---------   ----   --------------
/data: pre-comp           -   7259347.5           -      -                -
/data: post-comp   304690.8    251252.4     53438.5    82%           51616.1 <=== NOTE
/ddvar                 29.5        12.5        15.6    44%                -
----------------   --------   ---------   ---------   ----   --------------

Pokud platí jedna z uvedených podmínek:
  • Hodnota čítače „Cleanable GiB“ je velká
  • Systém DDFS je zaplněn ze 100 % (a je tedy v režimu pouze pro čtení)
Než budete pokračovat v dalších krocích v tomto dokumentu, je třeba provést čištění a nechat jej dokončit. Chcete-li spustit čištění, použijte příkaz „filesys clean start“, tj.:
 
# filesys clean start
Cleaning started.  Use 'filesys clean watch' to monitor progress.

K potvrzení, že čištění bylo spuštěno podle očekávání, lze použít příkaz „filesys status“, tj.:
 
# filesys status
The filesystem is enabled and running.
Cleaning started at 2017/05/19 18:05:58: phase 1 of 12 (pre-merge)
 50.6% complete, 64942 GiB free; time: phase  0:01:05, total  0:01:05

Pozor:
  • Pokud nelze čištění spustit, požádejte o další pomoc smluvního poskytovatele podpory – příčinou může být chyba systému „missing segment error“.
  • Pokud je čištění již spuštěno, při dalším pokusu o spuštění se zobrazí následující zpráva:
**** Cleaning already in progress.  Use 'filesys clean watch' to monitor progress.
  • Žádné místo v aktivní vrstvě nebude uvolněno, dokud čištění nedosáhne fáze kopírování (ve výchozím nastavení se jedná o fázi 9 v systému DDOS 5.4.x a starším a o fázi 11 v systému DDOS 5.5.x a novějším). Další informace o fázích čištění viz: https://support.emc.com/kb/446734
  • Čištění nemusí znovu uvolnit místo označené čítačem „Cleanable GiB“, jelikož je tato hodnota v podstatě odhadem. Další informace o tomto tématu viz: https://support.emc.com/kb/485637
  • Čištění nemusí během jednoho cyklu uvolnit veškerý potenciální prostor – v zařízeních DDR s velmi velkými datovými sadami bude čištění probíhat v části systému souborů s největším počtem přebytečných dat (tj. za účelem uvolnění co největšího prostoru během doby čištění). V některých případech může být nutné čištění spustit vícekrát, než se uvolní veškerý potenciální prostor.
  • Pokud byla hodnota čítače „Cleanable GiB“ příliš velká, může to znamenat, že čištění nebylo spouštěno v pravidelných intervalech – zkontrolujte, že byl nastaven plán čištění:
# filesys clean show schedule

Pokud je to nutné, nastavte plán čištění aktivní vrstvy – například na spouštění každé úterý v 6:00:

# filesys clean set schedule Tue 0600
Filesystem cleaning is scheduled to run "Tue" at "0600".


Upozorňujeme, že u systémů nakonfigurovaných s funkcí Extended Retention (ER) lze čištění nakonfigurovat tak, aby se spouštělo po dokončení přesunu dat, a není třeba vytvářet vlastní samostatný plán. Tento scénář je popsán dále v tomto dokumentu

Po dokončení čištění určete pomocí příkazů „filesys show space“ / „df“, zda byly problémy s využitím vyřešeny. Pokud je využití stále vysoké, pokračujte zbývajícími kroky v tomto článku.

Krok 2 – Zkontrolujte, zda oproti zdrojovým kontextům replikace dochází k velké prodlevě replikace

Nativní replikace systému Data Domain stojí na základě konceptu „kontextů replikace“. Například pokud je třeba replikovat data mezi systémy:
  • Kontexty replikace se vytvářejí ve zdrojovém a cílovém zařízení DDR.
  • Dojde k inicializaci kontextů.
  • Po dokončení inicializace bude replikace pravidelně odesílat aktualizace/data Delta ze zdroje do cíle, aby zajistila synchronizaci dat v systémech.
Pokud se zdrojový kontext replikace zpožďuje, stará data mohou zůstat na disku zdrojového systému (prodleva kontextů replikace nemůže způsobit nadměrné využití v cílovém systému):
  • Kontexty replikace adresářů (používají se při replikaci jednoho adresářového stromu z adresáře /data/col1/backup mezi systémy):
Replikace adresářů používá ve zdrojovém zařízení DDR protokol replikace ke sledování souborů, které ještě nebyly replikovány do cílového zařízení.
Pokud je kontext replikace adresáře zpožděný, protokol replikace ve zdrojovém zařízení DDR bude sledovat velký počet souborů, které čekají na replikaci.
I když dojde k odstranění těchto souborů, zatímco na ně protokol replikace stále odkazuje, funkce čištění nebude moci uvolnit místo na disku zaplnění těmito soubory.
  •  Kontexty replikace Mtree (používají se při replikaci libovolného fondu Mtree jiného než /data/col1/backup mezi systémy):
Replikace Mtree pomocí snapshotů vytvořených ve zdrojovém a cílovém systému určuje rozdíly mezi systémy, a tedy soubory, které je třeba odeslat ze zdrojového systému do toho cílového.
Pokud je kontext replikace Mtree zpožděný, příčinou může být skutečnost, že odpovídající fond Mtree používá velmi staré snapshoty vytvořené ve zdrojovém a cílovém systému.
I kdyby tyto soubory pocházely z replikovaného fondu Mtree zdrojového systému a existovaly by v době vytvoření snapshotů replikace Mtree v systému, čištění by nedokázalo uvolnit místo na disku využité těmito soubory.
  • Kontexty replikace sběru (používané při replikaci celého obsahu z jednoho zařízení DDR do jiného systému):
Replikace sběru provádí „blokovou“ replikaci všech dat ve zdrojovém systému do cílového systému.
Pokud je replikace sběru zpožděná, pak funkce čištění ve zdrojovém systému nebude fungovat optimálně – v tomto případě se vygeneruje výstraha, která uvádí, že probíhá částečné čištění, aby se zabránilo použití synchronizace s cílovým systémem.
Funkce čištění proto nebude moci ve zdrojovém zařízení DDR uvolnit tolik místa, kolik se očekává.

 Chcete-li zjistit, zda jsou kontexty replikace zpožděny, je třeba provést následující kroky:
  • Určete název hostitele aktuálního systému:
sysadmin@dd4200# hostname
The Hostname is: dd4200.ddsupport.emea
  • Určete datum a čas v aktuálním systému:
sysadmin@dd4200# date
Fri May 19 19:04:06 IST 2017
  • Zobrazte seznam kontextů replikace konfigurovaných v systému s parametrem „synced as of time“. Upozorňujeme, že požadované kontexty jsou ty, kde parametr „destination“ NEOBSAHUJE název hostitele aktuálního systému (což znamená, že aktuální systém je zdrojem) a parametr „synced as of time“ je značně zastaralý:
sysadmin@dd4200# replication status
CTX   Destination                                                                          Enabled   Connection     Sync'ed-as-of-time   Tenant-Unit
---   ----------------------------------------------------------------------------------   -------   ------------   ------------------   -----------    
3     mtree://dd4200.ddsupport.emea/data/col1/DFC                                          no        idle           Thu Jan 8 08:58     -   <=== NOT INTERESTING  - CURRENT SYSTEM IS THE DESTINATION
9     mtree://BenDDVE.ddsupport.emea/data/col1/BenMtree                                    no        idle           Mon Jan 25 14:48     -   <=== INTERESTING - LAGGING AND CURRENT SYSTEM IS THE SOURCE
13    dir://DD2500-1.ddsupport.emea/backup/dstfolder                                       no        disconnected   Thu Mar 30 17:55     -   <=== INTERESTING - LAGGING AND CURRENT SYSTEM IS THE SOURCE
17    mtree://DD2500-1.ddsupport.emea/data/col1/oleary                                     yes       idle           Fri May 19 18:57     -   <=== NOT INTERESTING - CONTEXT IS UP TO DATE   
18    mtree://dd4200.ddsupport.emea/data/col1/testfast                                     yes       idle           Fri May 19 19:18     -   <=== NOT INTERESTING - CONTEXT IS UP TO DATE
---   ----------------------------------------------------------------------------------   -------   ------------   ------------------   -----------

Kontexty, pro které je současný systém zdrojem a které vykazují značnou prodlevu, nebo kontexty, které již nejsou vyžadovány, by měly být přerušeny. To lze provést spuštěním následujícího příkazu ve zdrojovém a cílovém systému:
 
# replication break [cíl]

Chcete-li například přerušit kontexty „Interesting“ uvedené výše, je třeba ve zdroji a cíli spustit následující příkazy:
 
(dd4200.ddsupport.emea): # replication break mtree://BenDDVE.ddsupport.emea/data/col1/BenMtree
(BenDDVE.ddsupport.emea): # replication break mtree://BenDDVE.ddsupport.emea/data/col1/BenMtree

 
(dd4200.ddsupport.emea): # replication break dir://DD2500-1.ddsupport.emea/backup/dstfolder
(DD2500-1.ddsupport.emea): # replication break dir://DD2500-1.ddsupport.emea/backup/dstfolder

Pozor:
  • Po přerušení kontextů bude nutné provést čištění aktivní vrstvy, aby se v ní opět uvolnil potenciální prostor.
  • Pokud po přerušení kontextů použijete replikaci Mtree, snapshoty replikace Mtree mohou zůstat na disku. Před spuštěním čištění proveďte krok 5 a ukončete platnost veškerých přebytečných snapshotů.
  • Pokud je zdrojový / cílový fond Mtree konfigurován tak, aby migroval data do archivní, nebo cloudové vrstvy, postupujte při přerušování kontextů replikace Mtree opatrně, jelikož by tyto kontexty nemuselo být možné v budoucnu znovu vytvořit / inicializovat. Důvodem je to, že se po inicializaci kontextu replikace Mtree ve zdrojovém systému vytvoří snapshot Mtree, který obsahuje podrobnosti o všech souborech ve fondu Mtree (bez ohledu na vrstvu). Tento snapshot je poté zcela replikován do aktivní vrstvy cílového systému. Kvůli tomu nebude možné v případě, kdy aktivní vrstva cílového systému nemá dostatek volného místa pro příjem všech dat Mtree ze zdrojového systému, dokončit inicializaci. Další informace o tomto problému vám poskytne váš smluvní poskytovatel podpory.
  • Pokud dojde k přerušení kontextu replikace sběru, kontext nebude možné znovu vytvořit/inicializovat bez předchozího zničení instance DDFS v cílovém zařízení DDR (a ztráty všech dat v tomto systému). V důsledku toho může následná inicializace trvat výrazně dlouhou dobu / zabrat výraznou šířku pásma sítě, jelikož všechna data ze zdroje musí být fyzicky znovu replikována do cílového systému.
Krok 3 – Vyhledejte fondy Mtree, které již nejsou potřeba

Obsah systému DDFS je logicky rozdělen do fondů Mtree. Je běžné, že jednotlivé zálohovací aplikace/klienti provádí zápisy do jednotlivých fondů Mtree. Pokud je zálohovací aplikace vyřazena z provozu, nebude již schopna zapisovat data do zařízení DDR nebo je z ní mazat, což může způsobit, že v systému zůstanou uchované staré či nadbytečné fondy Mtree. Data v těchto fondech Mtree budou i nadále existovat a zabírat místo na disku zařízení DDR. V důsledku toho by se měly odstranit veškeré takové nadbytečné fondy Mtree. Například:
  • Získejte seznam fondů Mtree v systému:
# mtree list
Name                                                            Pre-Comp (GiB)   Status 
-------------------------------------------------------------   --------------   -------
/data/col1/Budu_test                                                     147.0   RW     
/data/col1/Default                                                      8649.8   RW     
/data/col1/File_DayForward_Noida                                          42.0   RW/RLCE
/data/col1/labtest                                                      1462.7   RW     
/data/col1/oscar_data                                                      0.2   RW     
/data/col1/test_oscar_2                                                  494.0   RO/RD     
-------------------------------------------------------------   --------------   -------
  • Všechny fondy Mtree, které již nejsou potřeba, byste měli odstranit pomocí příkazu „mtree delete“, tj.:
# mtree delete [název fondu mtree]

Například:

# mtree delete /data/col1/Budu_test
...
MTree "/data/col1/Budu_test" deleted successfully.
  • Místo na disku, které odstraněný fond Mtree zabírá, se znovu uvolní při příštím spuštění čištění aktivní vrstvy / úlohy Garbage Collection.
Pozor:
  • Před odstraněním fondů Mtree, které slouží jako cílové umístění pro replikaci Mtree (tj. ve výstupu seznamu Mtree mají stav RO/RD), by mělo nejdříve dojít k přerušení příslušných kontextů replikace.
  • Fondy Mtree, které se používají jako logické úložné jednotky (LSU) DDBoost nebo fondy virtuální páskové knihovny (VTL), nemusí být možné odstranit pomocí příkazu „mtree delete“ – další podrobnosti o odstranění takových fondů Mtree naleznete v příručce správce systému Data Domain.
  • Nelze odstranit fondy Mtree, které jsou konfigurované pro zajišťovací zámek (tj. mají stav RLCE nebo RLGE) – u jednotlivých souborů ve fondu Mtree je nutné zrušit zajišťovací zámek a odstranit fondy ručně – další podrobnosti naleznete v příručce správce systému Data Domain.
Krok 4 – Zkontrolujte staré / přebytečné snapshoty Mtree

Snapshot systému Data Domain představuje snapshot k určitému bodu v čase odpovídajícího fondu Mtree. V důsledku toho:
  • Snapshot bude obsahovat informace o veškerých souborech, které existují ve fondu Mtree v době vytvoření snapshotu.
  • Zatímco snapshot bude existovat i po odstranění / smazání těchto souborů, funkce čištění nebude moci znovu uvolnit fyzický prostor na disku, který soubory zabírají – data musí být v systému přítomná pro případ, že se někdo později pokusí získat přístup ke kopii souborů v snapshotu.
Chcete-li určit, zda některé fondy Mtree obsahují staré či nadbytečné snapshoty, je třeba provést následující kroky:
  • Získejte seznam fondů Mtree v systému pomocí příkazu „mtree list“, jak je uvedeno v kroku 3.
  • Získejte seznam stávajících snapshotů každého fondu Mtree pomocí příkazu „snapshot list“:
# snapshot list mtree [název fondu mtree]

Při spuštění příkazu ve fondu Mtree bez snapshotů se zobrazí následující výstup:
 
# snapshot list mtree /data/col1/Default
Snapshot Information for MTree: /data/col1/Default
----------------------------------------------
No snapshots found.

Při spuštění příkazu ve fondu Mtree se snapshoty se zobrazí následující výstup:
 
# snapshot list mtree /data/col1/labtest
Snapshot Information for MTree: /data/col1/labtest
----------------------------------------------
Name                                  Pre-Comp (GiB)   Create Date         Retain Until        Status 
------------------------------------  --------------   -----------------   -----------------   -------
testsnap-2016-03-31-12-00                     1274.5   Mar 31 2016 12:00   Mar 26 2017 12:00   expired
testsnap-2016-05-31-12-00                     1198.8   May 31 2016 12:00   May 26 2017 12:00          
testsnap-2016-07-31-12-00                     1301.3   Jul 31 2016 12:00   Jul 26 2017 12:00          
testsnap-2016-08-31-12-00                     1327.5   Aug 31 2016 12:00   Aug 26 2017 12:00          
testsnap-2016-10-31-12-00                     1424.9   Oct 31 2016 12:00   Oct 26 2017 13:00          
testsnap-2016-12-31-12-00                     1403.1   Dec 31 2016 12:00   Dec 26 2017 12:00          
testsnap-2017-01-31-12-00                     1421.0   Jan 31 2017 12:00   Jan 26 2018 12:00          
testsnap-2017-03-31-12-00                     1468.7   Mar 31 2017 12:00   Mar 26 2018 12:00      
REPL-MTREE-AUTO-2017-05-11-15-18-32           1502.2   May 11 2017 15:18   May 11 2018 15:18         

-----------------------------------   --------------   -----------------   -----------------   -------
  • V případě stávajících snapshotů použijte výstup z příkazu „snapshot list mtree [název fondu mtree]“ a určete snapshoty, které:
Nejsou označené jako „expired“ (viz sloupec Status).
Byly vytvořeny před významně dlouhou dobou (například snapshoty z výše uvedeného seznamu vytvořené v roce 2016).

Aby bylo možné tyto snapshoty při spuštění čištění odstranit a uvolnit místo na disku, platnost snapshotů musí být ukončena:

# snapshot expire [název snapshotu] mtree [název fondu mtree]

Například:
 
# snapshot expire testsnap-2016-05-31-12-00 mtree /data/col1/labtest
Snapshot "testsnap-2016-05-31-12-00" for mtree "/data/col1/labtest" will be retained until May 19 2017 19:31.
  • Pokud příkaz „snapshot list“ spustíte znovu, tyto snapshoty se nyní zobrazí jako „expired“:
# snapshot list mtree /data/col1/labtest
Snapshot Information for MTree: /data/col1/labtest
----------------------------------------------
Name                                  Pre-Comp (GiB)   Create Date         Retain Until        Status 
------------------------------------  --------------   -----------------   -----------------   -------
testsnap-2016-03-31-12-00                     1274.5   Mar 31 2016 12:00   Mar 26 2017 12:00   expired
testsnap-2016-05-31-12-00                     1198.8   May 31 2016 12:00   May 26 2017 12:00   expired       
testsnap-2016-07-31-12-00                     1301.3   Jul 31 2016 12:00   Jul 26 2017 12:00          
testsnap-2016-08-31-12-00                     1327.5   Aug 31 2016 12:00   Aug 26 2017 12:00          
testsnap-2016-10-31-12-00                     1424.9   Oct 31 2016 12:00   Oct 26 2017 13:00          
testsnap-2016-12-31-12-00                     1403.1   Dec 31 2016 12:00   Dec 26 2017 12:00          
testsnap-2017-01-31-12-00                     1421.0   Jan 31 2017 12:00   Jan 26 2018 12:00          
testsnap-2017-03-31-12-00                     1468.7   Mar 31 2017 12:00   Mar 26 2018 12:00      
REPL-MTREE-AUTO-2017-05-11-15-18-32           1502.2   May 11 2017 15:18   May 11 2018 15:18         

-----------------------------------   --------------   -----------------   -----------------   -------

Pozor:
  • Není možné určit, kolik fyzických dat jednotlivý snapshot nebo sada snapshotů uloží na disk – jediná hodnota ohledně prostoru spojená se snapshotem, je údaj o předem komprimované (logické) velikosti fondu Mtree z doby vytvoření snapshotu (jak je patrné ve výše uvedeném výstupu).
  • Snapshoty s názvem „REPL-MTREE-AUTO-YYYY-MM-DD-HH-MM-SS“ jsou spravovány replikací Mtree a za normálních okolností by nemělo být nutné ručně ukončovat jejich platnost (pokud tyto snapshoty již nejsou potřeba, replikace ukončí jejich platnost automaticky). Pokud jsou takové snapshoty velmi staré, znamená to, že je odpovídající kontext replikace pravděpodobně velmi zpožděný (jak je popsáno v kroku 2).
  • Po přerušení kontextu replikace Mtree tato replikace vytvoří snapshoty s názvem „REPL-MTREE-RESYNC-RESERVE-YYYY-MM-DD-HH-MM-SS“. Díky nim lze zabránit opětovné úplné synchronizaci dat replikace v případě, že později dojde k opětovnému vytvoření přerušeného kontextu (například pokud byl kontext přerušen kvůli chybě). Pokud se replikace znovu nevytvoří, lze platnost těchto kontextů ukončit ručně, jak je popsáno výše.
  • Snapshoty s vypršenou platností budou v systému existovat až do příštího spuštění čištění / úlohy Garbage Collection – v tomto případě budou fyzicky odstraněny a smazány z výstupu příkazu „snapshot list mtree [název fondu mtree]“ – funkce čištění pak může znovu uvolnit jakékoli místo na disku, které tyto snapshoty zabíraly.
Krok 5 – Zkontrolujte, zda se v systému nenachází neočekávaný počet starých souborů

Výpisy automatické podpory ze zařízení DDR obsahují histogramy, které uvádí rozdělení souborů v zařízení DDR podle věku – například:
 
File Distribution
-----------------
448,672 files in 5,276 directories

                          Count                         Space
               -----------------------------   --------------------------
         Age         Files       %    cumul%        GiB       %    cumul%
   ---------   -----------   -----   -------   --------   -----   -------
       1 day         7,244     1.6       1.6     4537.9     0.1       0.1
      1 week        40,388     9.0      10.6    63538.2     0.8       0.8
     2 weeks        47,850    10.7      21.3    84409.1     1.0       1.9
     1 month       125,800    28.0      49.3   404807.0     5.0       6.9
    2 months       132,802    29.6      78.9   437558.8     5.4      12.3
    3 months         8,084     1.8      80.7   633906.4     7.8      20.1
    6 months         5,441     1.2      81.9  1244863.9    15.3      35.4
      1 year        21,439     4.8      86.7  3973612.3    49.0      84.4
    > 1 year        59,624    13.3     100.0  1265083.9    15.6     100.0
   ---------   -----------   -----   -------   --------   -----   -------

To se může hodit, pokud chcete určit, zda jsou v systému přítomny soubory, jejichž platnost ještě nevypršela nebo které nebyly odstraněny, jak zálohovací aplikace klienta očekávala. Pokud například zálohovací aplikace, u které byla maximální doba uchování pro jakýkoliv soubor nastavena na 6 měsíců, provedla zápis do výše uvedeného systému, je okamžitě zřejmé, že aplikace neukončuje platnost nebo neodstraňuje soubory podle očekávání, jelikož je v zařízení DDR k dispozici přibližně 80 000 souborů starších než 6 měsíců.

Upozorňujeme, že:
  • Ukončování platnosti / odstraňování souborů má na starost zálohovací aplikace.
  • Zařízení DDR nikdy automaticky neukončí platnost / neodstraní soubory – pokud mu zálohovací aplikace explicitně nenařídí odstranit soubor, bude soubor dál existovat v zařízení DDR a zabírat jeho místo.
Kvůli tomu by problémy, jako je tento, měl nejprve prozkoumat tým podpory dodavatele zálohovací aplikace.

V případě potřeby může podpora systému Data Domain poskytnout další reporty za účelem:
  • Zadejte název / dobu úpravy všech souborů v zařízení DDR seřazených podle věku (aby bylo možné určit název / umístění jakýchkoli starých dat).
  • Rozdělte histogramy stáří souborů do samostatných reportů pro aktivní / archivní / cloudovou vrstvu (kde je povolena funkce ER / LTR).
Postup:
  • Shromážděte důkazy podle popisu v odstavci „Shromažďování sfs_dump“ v části Poznámky tohoto dokumentu.
  • Otevřete požadavek na servisní službu u smluvního poskytovatele podpory.
Po odstranění starých / přebytečných souborů bude nutné spustit čištění / úlohu Garbage Collection aktivní vrstvy, aby se znovu uvolnil fyzický prostor v aktivní vrstvě.

Krok 6 – Vyhledejte zálohy, které obsahují velký počet malých souborů

Kvůli návrhu systému DDFS mohou malé soubory (v podstatě jakýkoli soubor menší než přibližně 10 Mb) při prvním zápisu do zařízení DDR zabírat nadměrné místo. Může za to architektura „SISL“ (Stream Informed Segment Layout), která způsobuje, že malé soubory zabírají více samostatných 4,5Mb bloků místa na disku. Například 4Kb soubor může při prvotním zápisu zabrat na fyzickém disku až 9 Mb místa.

Toto nadměrné množství prostoru se následně znovu uvolní po spuštění čištění / úlohy Garbage Collection (data z malých souborů se totiž poté seskupí do menšího počtu 4,5Mb bloků), nicméně se může stát, že menší modely zařízení DDR budou při spuštění takových záloh vykazovat nadměrné využití a zaplnění.

Výpisy automatické podpory obsahují histogramy souborů rozdělených podle velikosti, například:
 
                          Count                         Space
               -----------------------------   --------------------------
        Size         Files       %    cumul%        GiB       %    cumul%
   ---------   -----------   -----   -------   --------   -----   -------
       1 KiB         2,957    35.8      35.8        0.0     0.0       0.0
      10 KiB         1,114    13.5      49.3        0.0     0.0       0.0
     100 KiB           249     3.0      52.4        0.1     0.0       0.0
     500 KiB         1,069    13.0      65.3        0.3     0.0       0.0
       1 MiB           113     1.4      66.7        0.1     0.0       0.0
       5 MiB           446     5.4      72.1        1.3     0.0       0.0
      10 MiB           220     2.7      74.8        1.9     0.0       0.0
      50 MiB         1,326    16.1      90.8       33.6     0.2       0.2
     100 MiB            12     0.1      91.0        0.9     0.0       0.2
     500 MiB           490     5.9      96.9      162.9     0.8       1.0
       1 GiB            58     0.7      97.6       15.6     0.1       1.1
       5 GiB            29     0.4      98.0       87.0     0.5       1.6
      10 GiB            17     0.2      98.2      322.9     1.7       3.3
      50 GiB            21     0.3      98.4     1352.7     7.0      10.3
     100 GiB            72     0.9      99.3     6743.0    35.1      45.5
     500 GiB            58     0.7     100.0    10465.9    54.5     100.0
   > 500 GiB             0     0.0     100.0        0.0     0.0     100.0
   ---------   -----------   -----   -------   --------   -----   -------

Pokud je patrný důkaz o tom, že zálohování provádí zápis velkého počtu malých souborů, systém se mezi jednotlivými cykly čištění / úlohy Garbage Collection může potýkat s významným dočasným zvýšením využití. V této situaci je vhodnější změnit metodologii zálohování tak, aby se všechny malé soubory před zápisem do zařízení DDR zahrnuly do jednoho většího archivu (například do souboru tar). Upozorňujeme, že žádný takový archiv by neměl být komprimován ani šifrován (to by poškodilo poměr komprese a deduplikace těchto dat).

Krok 7 – Zkontrolujte, zda je poměr deduplikace nižší, než se očekávalo

Hlavním účelem zařízení DDR je deduplikovat a komprimovat přijímaná data. Poměr deduplikace a komprese velmi závisí na použití systému a typu dat, které obsahuje, avšak v mnoha případech bude platit „očekávaný“ celkový poměr komprese založený na výsledcích získaných prostřednictvím testování konceptů apod. K určení aktuálního celkového poměru komprese systému (a tedy toho, zda splňuje očekávání) lze použít příkaz „filesys show compression. Například:
 
# filesys show compression

From: 2017-05-03 13:00 To: 2017-05-10 13:00

Active Tier:
                   Pre-Comp   Post-Comp   Global-Comp   Local-Comp      Total-Comp
                      (GiB)       (GiB)        Factor       Factor          Factor
                                                                     (Reduction %)
----------------   --------   ---------   -----------   ----------   -------------
Currently Used:*    20581.1       315.4             -            -    65.3x (98.5)
Written:
  Last 7 days         744.0         5.1         80.5x         1.8x   145.6x (99.3)
  Last 24 hrs
----------------   --------   ---------   -----------   ----------   -------------
 * Does not include the effects of pre-comp file deletes/truncates

Ve výše uvedeném příkladu systém dosahuje v aktivní vrstvě celkového poměru komprese 65,3x (což je velmi dobré). Pokud však tato hodnota ukazuje, že celkový poměr komprese nesplňuje daná očekávání, bude pravděpodobně nutné další šetření. Upozorňujeme, že zkoumání poměru komprese, který je neočekávaně nižší, je komplexní situace, která může mít mnoho hlavních příčin. Další informace o tomto zkoumání najdete v následujícím článku: https://support.emc.com/kb/487055

Krok 8 – Zkontrolujte, zda systém slouží jako zdroj pro replikaci sběru

Pokud používáte replikaci sběru, když je zdrojový systém fyzicky větší než cílový systém, bude velikost zdrojového systému uměle omezena tak, aby odpovídala velikosti cílového systému (tj. část disku zdrojového systému bude označena jako nepoužitelná). Důvodem je to, že při použití replikace sběru musí být cílový systém kopií zdrojového systému na úrovni bloků. Pokud je však zdrojový systém fyzicky větší než cílový systém, může se do zdrojového systému zapsat nadměrné množství dat, které pak není možné replikovat do cílového systému (protože je již zaplněný). Této situaci se lze vyhnout omezením velikosti zdrojového systému tak, aby odpovídala velikosti cílového systému.
  • Pomocí příkazů z kroku 2 zkontrolujte, zda je systém slouží jako zdroj pro replikaci sběru. Spusťte tedy příkaz „replication status“ a zjistěte, zda nějaký kontext replikace začíná na „col://“ (což značí replikaci kolekce) a v cílovém systému NEOBSAHUJE název hostitele místního systému (což znamená, že tento systém musí být zdrojem kontextu replikace).
  • Pokud je systém zdrojem pro replikaci sběru, zkontrolujte velikost aktivní vrstvy obou systémů tak, že se k nim přihlásíte a spustíte příkaz „filesys show space“ – porovnejte u obou velikost „post-comp“.
  • Pokud je zdrojový systém výrazně větší než cílový systém, pak bude velikost jeho aktivní vrstvy uměle omezena.
  • Chcete-li umožnit využití veškerého místa ve zdrojovém systému pro data, je třeba provést následující kroky:
Přidejte do aktivní vrstvy cílového systému další úložiště, jehož velikost je >= velikosti aktivní vrstvy zdrojového systému.
Přerušte kontext replikace sběru (pomocí příkazů z kroku 2) – upozorňujeme, že tak evidentně znemožníte replikaci dat ze zdrojového systému -> cílové zařízení DDR.

Jakmile provedete jeden z těchto kroků, v aktivní vrstvě zdrojového systému se okamžitě uvolní další prostor (tj. před použitím tohoto prostoru není nutné v aktivní vrstvě spouštět čištění / úlohu Garbage Collection).

Krok 9 – Zkontrolujte, zda pravidelně probíhá přesun dat

Pokud je zařízení DDR konfigurováno s funkcí ER (Extended Retention), nebo LTR (Long Term Retention), bude k němu připojena druhá vrstva úložiště (archivní vrstva v případě funkce ER nebo cloudová vrstva v případě funkce LTR). V této situaci jsou zásady pro přesun dat pravděpodobně konfigurovány s fondy Mtree, aby bylo možné migrovat starší / neupravená data vyžadující dlouhodobé uchování z aktivní vrstvy do alternativní vrstvy úložiště, takže prostor zaplněný těmito soubory v aktivní vrstvě může být fyzicky znovu uvolněn pomocí čištění / úlohy Garbage Collection. Pokud jsou zásady pro přesun dat konfigurovány nesprávně nebo pokud proces přesunu dat neprobíhá pravidelně, stará data zůstanou v aktivní vrstvě déle, než se očekávalo, a budou nadále zaplňovat fyzické místo na disku.
  • Nejprve ověřte, zda je systém konfigurován pro funkci ER nebo LTR. Spusťte tedy příkaz „filesys show space“ a pokuste se najít archivní či cloudovou vrstvu – upozorňujeme, že aby bylo možné tyto alternativní vrstvy úložiště používat, musí mít velikost „post-comp“ > 0 GB:
# filesys show space
...
Archive Tier:
Resource           Size GiB   Used GiB   Avail GiB   Use%   Cleanable GiB
----------------   --------   --------   ---------   ----   -------------
/data: pre-comp           -     4163.8           -      -               -
/data: post-comp    31938.2     1411.9     30526.3     4%               -
----------------   --------   --------   ---------   ----   -------------

# filesys show space
...
Cloud Tier
Resource           Size GiB   Used GiB   Avail GiB   Use%   Cleanable GiB
----------------   --------   --------   ---------   ----   -------------
/data: pre-comp           -        0.0           -      -               -
/data: post-comp   338905.8        0.0    338905.8     0%             0.0
----------------   --------   --------   ---------   ----   -------------

Upozorňujeme, že se funkce ER a LTR vzájemně vylučují, takže systém bude obsahovat buď pouze aktivní vrstvu (není nakonfigurována funkce ER ani LTR), aktivní a archivní vrstvu (nakonfigurována funkce ER), nebo aktivní a cloudovou vrstvu (nakonfigurována funkce LTR).
  • Pokud je systém konfigurován s funkcí ER, nebo LTR, zkontrolujte, zda zásady pro přesun dat u fondů Mtree odpovídají očekávání, a nastavte je tak, aby se stará data přesunula do alternativní vrstvy úložiště:
ER: # archive data-movement policy show
LTR: # data-movement policy show

Pokud jsou zásady pro přesun dat nesprávné nebo chybí, je třeba to napravit – pomoc s tímto postupem najdete v příručce správce systému Data Domain.
  • Pokud je systém nakonfigurován s funkcí ER nebo LTR, zkontrolujte, zda je přesun dat naplánován v pravidelných intervalech, aby bylo možné fyzicky migrovat soubory / data z aktivní vrstvy do alternativního úložiště:
ER: # archive data-movement schedule show
LTR: # data-movement schedule show

Upozorňujeme, že systém Data Domain obecně doporučuje provádět přesun dat prostřednictvím automatizovaného plánu, někteří zákazníci se však rozhodnou tento proces spouštět dle potřeby. V této situaci byste měli přesun dat spouštět pravidelně pomocí příkazu:
 
ER: # archive data-movement start
LTR: # data-movement start

Další informace o úpravě plánu pro přesun dat najdete v příručce správce systému Data Domain.
  • Pokud je systém konfigurován s funkcí ER nebo LTR, zkontrolujte, kdy proběhl poslední přesun dat:
ER: # archive data-movement status
LTR: # data-movement status

Pokud přesun dat neproběhl už po určitou dobu, pokuste se spustit proces ručně, a sledujte data pomocí následujících příkazů:
 
ER: # archive data-movement watch
LTR: # data-movement watch

Pokud se přenos dat z jakéhokoli důvodu nespustí, obraťte se s žádostí o další pomoc na smluvního poskytovatele podpory.
  • Po dokončení přesunu dat by se mělo spustit čištění aktivní vrstvy (upozorňujeme, že se po dokončení přesunu dat může spustit automaticky), aby se fyzicky uvolnil prostor v aktivní vrstvě využívaný migrovanými soubory:
# filesys clean start

U systémů s funkcí ER je běžné naplánovat přesun dat v pravidelných intervalech (tj. jednou týdně) a pak nakonfigurovat čištění aktivní vrstvy tak, aby se spouštělo po dokončení přesunu dat. V této situaci nemá čištění aktivní vrstvy svůj vlastní nezávislý plán. Chcete-li tento plán nakonfigurovat, nejprve odeberte aktuální plán čištění aktivní vrstvy:

# filesys clean set schedule never


Nakonfigurujte přesun dat tak, aby probíhal pravidelně a pak se automaticky spustilo čištění aktivní vrstvy – nastavte například přesun dat na každé úterý v 6:00 a následné čištění aktivní vrstvy:

# archive data-movement schedule set days Tue time 0600
The Archive data movement schedule has been set.
Archive data movement is scheduled to run on day(s) "tue" at "06:00" hrs


Následujícím způsobem lze zkontrolovat, zda je spuštění čištění aktivní vrstvy naplánováno na dobu po dokončení přesunu dat:

# archive show config
Enabled                                         Yes                               
Data movement Schedule                          Run on day(s) "tue" at "06:00" hrs   <=== SCHEDULE
Data movement throttle                          100 percent                       
Default age threshold data movement policy      14 days                           
Run filesys clean after archive data movement   Yes   <=== RUN CLEAN ON COMPLETION
Archive Tier local compression                  gz                                
Packing data during archive data movement       enabled                           
Space Reclamation                               disabled                          
Space Reclamation Schedule                      No schedule

U systémů s funkcí LTR je třeba konfigurovat čištění aktivní vrstvy s vlastním plánem.

Krok 10 – Přidejte do aktivní vrstvy další úložiště

Pokud jste provedli všechny předchozí kroky, cyklus čištění aktivní vrstvy se dokončí, ale v aktivní vrstvě je stále nedostatek volného místa, je pravděpodobné, že systém nebyl správně nadimenzován pro dané pracovní zatížení. V tomto případě je třeba provést jeden z následujících kroků:
  • Snižte pracovní zatížení systému – například:
Přesměrování podmnožiny záloh na alternativní úložiště.
Zkraťte dobu uchování záloh tak, aby jejich platnost vypršela / byly smazány rychleji.
Snižte počet / zkraťte dobu platnosti plánovaných snapshotů u fondů Mtree v systému.
Přerušte přebytečné kontexty replikace, pro které místní systém slouží jako cílové umístění, a poté odstraňte odpovídající fondy Mtree.
  • Přidejte do aktivní vrstvy systému další úložiště a rozšiřte jeho velikost:
# storage add [aktivní vrstva] enclosure [číslo skříně] | disk [číslo zařízení]
# filesys expand

Informace o přidání úložiště vám poskytne váš obchodní tým.

Дополнительная информация


Podpora systému Data Domain může generovat řadu reportů například s následujícími informacemi:
  • Seznam všech souborů v určité vrstvě (tj. aktivní / archivní / cloudová) seřazených podle stáří
  • Odhadovaný poměr velikosti a komprese podle fondu Mtree/hlavního adresářového stromu
  • Seznam všech souborů v určitém fondu Mtree seřazených podle stáří
  • atd.

K tomu je nutné shromáždit následující informace:
  • Nový balíček podpory ze zařízení DDR – další informace viz následující odkaz:https://support.emc.com/kb/323283.
  • Výstup „sfs_dump“ nebo „sfs_dump -c“:
Přihlaste se do rozhraní příkazového řádku DDR a přejděte do režimu SE (upozorňujeme, že v této chvíli mohou systémy nakonfigurované se šifrováním anebo zajišťovacím zámkem vyžadovat zadání přihlašovacích údajů uživatele s rolí „security“):
 
# system show serialno
[zobrazené sériové číslo systému]
# priv set se
[výzva k zadání hesla – zadejte sériové číslo systému uvedené výše]
 
Povolte protokolování v relaci terminálu. Pokud například používáte nástroj PuTTY, můžete to provést následujícím způsobem: Pravým tlačítkem klikněte na panel nabídek -> Change settings… -> Session -> Logging -> vyberte možnost „All session output“ a název souboru -> Apply.
Spusťte příkaz sfs_dump:

# se sfs_dump

Po dokončení si opatřete kopii protokolu relace pro další analýzu.
  • Report o umístění souboru (požadováno, pokud je systém nakonfigurován s funkcí ER nebo LTR):
Přihlaste se do rozhraní příkazového řádku DDR.
Povolte přihlašování k terminálové relaci. Pokud například používáte nástroj PuTTY, můžete to provést následujícím způsobem: Pravým tlačítkem klikněte na panel nabídek -> Change settings… -> Session -> Logging -> vyberte možnost „All session output“ a název souboru -> Apply.
Shromážděte report o umístění souboru:

ER: # archive report generate file-location
LTR: # filesys report generate file-location


Po dokončení pořiďte kopii protokolu relace pro další analýzu

Pokud potřebujete pomoc se sběrem výše uvedených položek nebo s jakýmkoli krokem v tomto archivu, obraťte se na smluvního poskytovatele podpory.

Затронутые продукты

Data Domain

Продукты

Data Domain
Свойства статьи
Номер статьи: 000054303
Тип статьи: Solution
Последнее изменение: 21 Jul 2025
Версия:  6
Получите ответы на свои вопросы от других пользователей Dell
Услуги технической поддержки
Проверьте, распространяются ли на ваше устройство услуги технической поддержки.