Data Domain. Как устранить проблемы, связанные с высоким коэффициентом использования пространства или недостатком доступной емкости в Data Domain Restorers (DDR)

Сводка: В этой статье содержится пошаговая процедура, которая поможет вам решить вопросы, связанные с высоким коэффициентом использования пространства или недостатком емкости на системах Data Domain Restorer (DDR) ...

Данная статья применяется к Данная статья не применяется к Эта статья не привязана к какому-либо конкретному продукту. В этой статье указаны не все версии продуктов.

Симптомы

 
Все Data Domain Restorer (DDR) содержат пул или область хранения, известную как «активный уровень».
  • Это область диска, где размещаются новые файлы и данные, и на большинстве DDR файлы остаются здесь до истечения срока действия или удаления с помощью клиентского приложения резервного копирования.
  • На DDR, сконфигурированных с Extended Retention (ER) или Long Term Retention (LTR), может периодически выполняться перемещение данных для переноса старых файлов с активного уровня в архивный уровень или уровень облака.
  • Единственный способ высвобождения на активном уровне пространства, использованного удаленными или перенесенными файлами, — это запуск процесса очистки или чистки памяти (GC).
Текущее использование активного уровня можно отобразить с помощью команд «filesys show space» или «df»:
 
# df

Active Tier:
Resource           Size GiB   Used GiB   Avail GiB   Use%   Cleanable GiB*
----------------   --------   --------   ---------   ----   --------------
/data: pre-comp           -    33098.9           -      -                -
/data: post-comp    65460.3      518.7     64941.6     1%              0.0
/ddvar                 29.5       19.7         8.3    70%                -
/ddvar/core            31.5        0.2        29.7     1%                -
----------------   --------   --------   ---------   ----   --------------

Обратите внимание, что при соответствующей настройке подробные сведения об уровнях архива и облака будут отображаться под активным уровнем.

Необходимо тщательно управлять использованием активного уровня, в противном случае может произойти следующее.
  • На активном уровне может наблюдаться нехватка свободного пространства, что приведет к появлению следующих оповещений или сообщений.
EVT-SPACE-00004: Space usage in Data Collection has exceeded 95% threshold.
  • Если активный уровень заполняется на 100%, новые данные не будут записываться в DDR, что может привести к сбою резервного копирования/репликации — в этом случае могут отображаться следующие оповещения или сообщения.
CRITICAL: MSG-CM-00002: /../vpart:/vol1/col1/cp1/cset: Container set [container set ID] out of space
  • В некоторых случаях заполнение активного уровня может стать причиной того, что файловая система Data Domain (DDFS) становится доступна только для чтения. На этом этапе существующие файлы невозможно удалить.
В этой статье базы знаний:
  • Объясняется, почему активный уровень может быть заполнен
  • Описывается простой набор проверок, которые можно выполнить для определения причины высокого коэффициента использования активного уровня и соответствующие действия по защите от этого.
Обратите внимание на следующее.
  • Эта статья не является исчерпывающей (т. е. может быть небольшое количество ситуаций, когда повышается коэффициент использования активного уровня DDR или DDR заполняется по причине, не описанной в данном документе), однако предполагается, что статья должна охватывать наиболее распространенные причины и проблемы.
  • В этой статье не описывается высокий уровень использования архивного уровня или уровня облака.

Причина

 



 
Использование активного уровня DDR может оказаться выше ожидаемого по ряду причин:
  • Срок действия файлов резервного копирования или наборов сохранений определяется некорректно, или они не удаляются приложением резервного копирования клиента из-за неправильной политики хранения или неверной конфигурации приложения резервного копирования.
  • Задержка репликации приводит к хранению на активном уровне большого объема старых данных, ожидающих репликации.
  • Объем данных, записываемых на активный уровень, имеет меньший, чем ожидалось, общий коэффициент сжатия.
  • Размер системы был задан неправильно, т. е. она слишком мала для объема данных, который пытаются сохранить на ней.
  • Резервные копии состоят из большого количества очень маленьких файлов, и эти файлы занимают намного больше места, чем ожидалось при первоначальной записи, однако это пространство должно быть освобождено во время очистки или чистки памяти.
  • Перемещение данных не выполняется регулярно в системах, настроенных на использование ER/LTR. Это приводит к тому, что старые файлы, которые необходимо перенести на уровни архива или облака, остаются на активном уровне.
  • Очистка или чистка памяти выполняется нерегулярно.
  • Избыточные или старые моментальные снимки mtree, существующие в DDR, препятствуют очистке пространства от удаленных файлов или данных.

Разрешение

Шаг 1. Определите, требуется ли выполнять очистку активного уровня

Операционная система Data Domain (DDOS) пытается поддерживать счетчик «Cleanable GiB» для активного уровня. Это оценка того, сколько физического пространства (после сжатия) может быть освобождено на активном уровне при выполнении очистки или чистки памяти. Этот счетчик отображается с помощью команд «filesys show space»/«df»:
 
Active Tier:
Resource           Size GiB    Used GiB   Avail GiB   Use%   Cleanable GiB*
----------------   --------   ---------   ---------   ----   --------------
/data: pre-comp           -   7259347.5           -      -                -
/data: post-comp   304690.8    251252.4     53438.5    82%           51616.1 <=== NOTE
/ddvar                 29.5        12.5        15.6    44%                -
----------------   --------   ---------   ---------   ----   --------------

Если:
  • Значение параметра «Cleanable GiB» большое.
  • DDFS заполнена на 100% (и поэтому доступна только для чтения).
Перед выполнением дальнейших действий, описанных в данном документе, необходимо выполнить очистку и дождаться ее завершения. Чтобы начать очистку, следует использовать команду «filesys clean start», т.е.:
 
# filesys clean start
Cleaning started.  Use 'filesys clean watch' to monitor progress.

Чтобы убедиться, что очистка запущена должным образом, можно использовать команду «filesys status», например:
 
# filesys status
The filesystem is enabled and running.
Cleaning started at 2017/05/19 18:05:58: phase 1 of 12 (pre-merge)
 50.6% complete, 64942 GiB free; time: phase  0:01:05, total  0:01:05

Обратите внимание на следующее.
  • Если очистка не запускается, обратитесь к поставщику услуг поддержки для получения дополнительной помощи — это может означать, что система обнаружила ошибку «missing segment error», которая блокирует очистку.
  • Если очистка уже выполняется, при попытке запуска отображается следующее сообщение:
**** Cleaning already in progress.  Use 'filesys clean watch' to monitor progress.
  • Пространство на активном уровне не будет освобождено/восстановлено до тех пор, пока при очистке не будет достигнут этап копирования (по умолчанию этап 9 в DDOS 5.4.x и более ранних версиях, этап 11 в DDOS 5.5.x и более поздних версиях). Для получения дополнительной информации по этапам очистки см.: https://support.emc.com/kb/446734
  • Объем пространства, обозначенный как «Cleanable GiB», может быть не освобожден, поскольку это значение является приблизительным. Дополнительные сведения об этой функции см. в статье: https://support.emc.com/kb/485637
  • Очистка может не освободить все возможное пространство за один цикл — это связано с тем, что в DDR, содержащих очень большие наборы данных, очистка будет работать с частью файловой системы, содержащей самые ненужные данные (например, чтобы освободить максимальный объем пространства за время, необходимое для очистки). В некоторых случаях потребуется запускать очистку несколько раз, пока не будет освобождено все возможное пространство.
  • Если значение параметра «Cleanable GiB» было очень большим, это может означать, что очистка не выполнялась регулярно — убедитесь, что очистка запланирована:
# filesys clean show schedule

При необходимости установите расписание очистки активного уровня — например, для запуска каждый вторник в 6:00:

# filesys clean set schedule Tue 0600
Filesystem cleaning is scheduled to run "Tue" at "0600".


Обратите внимание, что в системах с функцией Extended Retention (ER) очистка может быть настроена на запуск после завершения перемещения данных и может не иметь отдельного расписания. Такой сценарий рассматривается далее в этом документе.

После завершения очистки используйте команду «filesys show space» или «df», чтобы определить, устранены ли проблемы с использованием пространства. Если коэффициент использования по-прежнему высокий, выполните оставшиеся шаги, приведенные в этой статье.

Шаг 2. Проверка запаздывания больших объемов репликации относительно исходных контекстов репликации

Встроенная репликация Data Domain разработана на основе концепции «контекстов репликации». Примеры случаев, когда необходимо реплицировать данные между системами:
  • Контексты репликации создаются на исходных и целевых DDR.
  • Контексты инициализируются.
  • После завершения инициализации репликация будет периодически отправлять обновления или разницу из источника в целевую систему для синхронизации данных в системах.
Если контекст репликации источника запаздывает, это может привести к тому, что старые данные будут храниться на диске исходной системы (обратите внимание, что запаздывание контекстов репликации не может привести к чрезмерному использованию целевой системы):
  • Контексты репликации каталогов (используются при репликации одного дерева каталогов в /data/col1/backup между системами):
Репликация каталогов использует журнал репликации на исходном DDR для отслеживания оставшихся файлов, которые еще не были реплицированы в целевую систему
Если контекст репликации каталога запаздывает, журнал репликации на исходном DDR будет отслеживать большое количество файлов, ожидающих репликации
Даже если эти файлы будут удалены, а журнал репликации будет содержать ссылки на них, очистка не сможет освободить место на диске, занимаемое этими файлами.
  •  Контексты репликации MTree (используются при репликации любого дерева mtree, кроме /data/col1/backup между системами):
Репликация MTree использует моментальные снимки, созданные в исходной и целевой системах, чтобы определить различия между системами и, следовательно, какие файлы необходимо отправить из исходной системы в целевую систему
Если контекст репликации дерева mtree запаздывает, то соответствующие деревья mtree могут иметь очень старые моментальные снимки, созданные в исходной и целевой системах
Даже если файлы из реплицированного mtree в исходной системе существовали, когда в системе были созданы моментальные снимки репликации mtree, очистка не сможет освободить пространство на диске, занимаемое этими файлами.
  • Контексты репликации коллекции (используются при репликации всего содержимого одного DDR в другую систему):
Репликация коллекции выполняет «блочную» репликацию всех данных исходной системы в целевую систему
Если репликация коллекции запаздывает, то очистка исходной системы не сможет работать оптимально — в этом случае на исходной системе будет создано оповещение о том, что выполняется частичная очистка, чтобы избежать синхронизации с целевой системой
Поэтому очистка не может освободить столько пространства, сколько ожидалось на исходном DDR

 Чтобы определить, запаздывают ли контексты репликации, необходимо выполнить следующие действия:
  • Определите имя хоста текущей системы:
sysadmin@dd4200# hostname
The Hostname is: dd4200.ddsupport.emea
  • Определите дату и время в текущей системе:
sysadmin@dd4200# date
Fri May 19 19:04:06 IST 2017
  • Выведите список контекстов репликации, настроенных в системе, а также их значения «synced as of time». Обратите внимание, что нас интересуют контексты, где «destination» НЕ содержит имя хоста текущей системы (указывая на то, что текущая система является исходной), а «synced as of time» — существенно устаревший:
sysadmin@dd4200# replication status
CTX   Destination                                                                          Enabled   Connection     Sync'ed-as-of-time   Tenant-Unit
---   ----------------------------------------------------------------------------------   -------   ------------   ------------------   -----------    
3     mtree://dd4200.ddsupport.emea/data/col1/DFC                                          no        idle           Thu Jan 8 08:58     -   <=== НЕ ИНТЕРЕСУЕТ  — ТЕКУЩАЯ СИСТЕМА ЯВЛЯЕТСЯ ЦЕЛЕВОЙ
9     mtree://BenDDVE.ddsupport.emea/data/col1/BenMtree                                    no        idle           Mon Jan 25 14:48     -   <=== ИНТЕРЕСУЕТ — ЗАПАЗДЫВАНИЕ И ТЕКУЩАЯ СИСТЕМА ЯВЛЯЕТСЯ ИСХОДНОЙ
13    dir://DD2500-1.ddsupport.emea/backup/dstfolder                                       no        disconnected   Thu Mar 30 17:55     -   <=== ИНТЕРЕСУЕТ — ЗАПАЗДЫВАНИЕ И ТЕКУЩАЯ СИСТЕМА ЯВЛЯЕТСЯ ИСХОДНОЙ
17    mtree://DD2500-1.ddsupport.emea/data/col1/oleary                                     yes       idle           Fri May 19 18:57     -   <=== НЕ ИНТЕРЕСУЕТ — КОНТЕКСТ АКТУАЛЬНЫЙ
18    mtree://dd4200.ddsupport.emea/data/col1/testfast                                     yes       idle           Fri May 19 19:18     -   <=== НЕ ИНТЕРЕСУЕТ — КОНТЕКСТ АКТУАЛЬНЫЙ
---   ----------------------------------------------------------------------------------   -------   ------------   ------------------   -----------

Контексты, для которых текущая система является исходной, и которые показывают значительные задержки или контексты, которые больше не требуются, должны быть прерваны. Это можно сделать, выполнив следующую команду в исходной и целевой системах:
 
# replication break [destination]

Например, чтобы прервать «интересующие» контексты, показанные выше, необходимо выполнить следующую команду в исходной и целевой системах:
 
(dd4200.ddsupport.emea): # replication break mtree://BenDDVE.ddsupport.emea/data/col1/BenMtree
(BenDDVE.ddsupport.emea): # replication break mtree://BenDDVE.ddsupport.emea/data/col1/BenMtree

 
(dd4200.ddsupport.emea): # replication break dir://DD2500-1.ddsupport.emea/backup/dstfolder
(DD2500-1.ddsupport.emea): # replication break dir://DD2500-1.ddsupport.emea/backup/dstfolder

Обратите внимание на следующее.
  • Как только контексты будут прерваны, необходимо выполнить очистку активного уровня, чтобы освободить возможное пространство на активном уровне.
  • При использовании репликации дерева mtree после прерывания контекстов снимки репликации mtree могут остаться на диске. Убедитесь в том, что шаг 5 выполняется, чтобы истек срок действия любых ненужных моментальных снимков до запуска очистки.
  • Если дерево mtree исходной или целевой системы настроено на миграцию данных на уровни архива или облака, следует проявлять осторожность при прерывании соответствующих контекстов репликации mtree, так как эти контексты не могут быть повторно созданы или инициализированы в будущем. Причина в том, что при инициализации контекста репликации mtree в исходной системе создается моментальный снимок mtree, содержащий сведения обо всех файлах в mtree (независимо от уровня). Затем этот моментальный снимок реплицируется полностью на активный уровень целевой системы. В результате, если активный уровень целевой системы не имеет достаточного свободного пространства для загрузки всех данных mtree из исходной системы, инициализация не может быть завершена. Для получения дополнительной информации по этому вопросу обратитесь к поставщику услуг поддержки
  • Если контекст репликации коллекции поврежден, то его невозможно воссоздать/инициализировать без предварительного уничтожения экземпляра DDFS на целевом DDR (и потери всех данных в этой системе). В результате при последующей инициализации может потребоваться значительное время или пропускная способность сети, поскольку все данные из источника должны быть снова физически реплицированы в целевую систему.
Шаг 3. Проверьте наличие mtree, которые больше не требуются

Содержимое DDFS логически разделено на несколько mtree. Для отдельных приложений резервного копирования или клиентов обычным делом является запись в отдельные mtree. Если приложение резервного копирования выведено из эксплуатации, оно больше не сможет записывать и удалять данные из DDR. Это может привести к тому, что в системе будут оставаться старые или ненужные mtree. Данные в этих mtree будут существовать бесконечно долго, занимая пространство на диске DDR. Поэтому все такие ненужные mtree должны быть удалены. Пример.
  • Получите список mtree в системе:
# mtree list
Name                                                            Pre-Comp (GiB)   Status 
-------------------------------------------------------------   --------------   -------
/data/col1/Budu_test                                                     147.0   RW     
/data/col1/Default                                                      8649.8   RW     
/data/col1/File_DayForward_Noida                                          42.0   RW/RLCE
/data/col1/labtest                                                      1462.7   RW     
/data/col1/oscar_data                                                      0.2   RW     
/data/col1/test_oscar_2                                                  494.0   RO/RD     
-------------------------------------------------------------   --------------   -------
  • Любые mtree, которые больше не требуются, следует удалить с помощью команды «mtree delete», т.е.:
# mtree delete [mtree name]

Пример.

# mtree delete /data/col1/Budu_test
...
MTree "/data/col1/Budu_test" deleted successfully.
  • Пространство, занимаемое удаленным mtree на диске, будет освобождено при следующем запуске очистки или чистки памяти активного уровня.
Обратите внимание на следующее.
  • Для тех Mtree, которые являются целевыми для репликации mtree (т. е. имеют статус RO/RD в выводе списка mtree), необходимо прервать соответствующий контекст репликации до удаления mtree
  • Может оказаться, что mtree, которые используются в качестве логических устройств хранения DDBoost (LSU) или в качестве пулов виртуальных ленточных библиотек (VTL), будет невозможно удалить с помощью команды «mtree delete» — дополнительные сведения по их удалению см. в руководстве по администрированию Data Domain.
  • Mtree, настроенные для блокировки хранения (т. е. имеющие статус RLCE или RLGE), не могут быть удалены. Вместо этого для отдельных файлов в mtree необходимо снять блокировку хранения и удалять их по отдельности. Подробнее см. в руководстве по администрированию Data Domain
Шаг 4. Проверка наличия старых и ненужных моментальных снимков mtree

. Моментальный снимок Data Domain представляет собой моментальный снимок соответствующего mtree на определенный момент времени. Это означает следующее.
  • Моментальный снимок будет иметь ссылки на любые файлы, которые имеются в mtree во время создания моментального снимка.
  • Несмотря на то, что снимок файловой системы продолжает существовать, даже если эти файлы удалены, очистка не сможет освободить какое-либо физическое пространство, которое они используют на диске, потому что данные должны оставаться в системе, если впоследствии будет осуществляться доступ к копии файла в моментальном снимке.
Чтобы определить, имеются ли у каких-либо mtree старые/ненужные снимки, необходимо выполнить следующие действия.
  • Получите список mtree в системе с помощью команды «mtree list», как показано в шаге 3
  • Выведите список моментальных снимков, существующих для каждого mtree, с помощью команды «snapshot list»:
# snapshot list mtree [mtree name]

При запуске для mtree без моментальных снимков отображается следующее:
 
# snapshot list mtree /data/col1/Default
Snapshot Information for MTree: /data/col1/Default
----------------------------------------------
No snapshots found.

При запуске для mtree с моментальными снимками отображается следующее:
 
# snapshot list mtree /data/col1/labtest
Snapshot Information for MTree: /data/col1/labtest
----------------------------------------------
Name                                  Pre-Comp (GiB)   Create Date         Retain Until        Status 
------------------------------------  --------------   -----------------   -----------------   -------
testsnap-2016-03-31-12-00                     1274.5   Mar 31 2016 12:00   Mar 26 2017 12:00   expired
testsnap-2016-05-31-12-00                     1198.8   May 31 2016 12:00   May 26 2017 12:00          
testsnap-2016-07-31-12-00                     1301.3   Jul 31 2016 12:00   Jul 26 2017 12:00          
testsnap-2016-08-31-12-00                     1327.5   Aug 31 2016 12:00   Aug 26 2017 12:00          
testsnap-2016-10-31-12-00                     1424.9   Oct 31 2016 12:00   Oct 26 2017 13:00          
testsnap-2016-12-31-12-00                     1403.1   Dec 31 2016 12:00   Dec 26 2017 12:00          
testsnap-2017-01-31-12-00                     1421.0   Jan 31 2017 12:00   Jan 26 2018 12:00          
testsnap-2017-03-31-12-00                     1468.7   Mar 31 2017 12:00   Mar 26 2018 12:00      
REPL-MTREE-AUTO-2017-05-11-15-18-32           1502.2   May 11 2017 15:18   May 11 2018 15:18         

-----------------------------------   --------------   -----------------   -----------------   -------
  • Там, где существуют моментальные снимки, используйте вывод команды «snapshot list mtree [mtree name]», чтобы определить снимки, которые:
Не «просрочены» (см. столбец «status»)
Были созданы довольно давно (например, моментальные снимки из приведенного выше списка, созданные в 2016 году)

Необходимо сделать так, чтобы у этих моментальных снимков истек срок, чтобы их можно было удалить при выполнении очистки и освобождении пространства на диске:

# snapshot expire [snapshot name] mtree [mtree name]

Пример.
 
# snapshot expire testsnap-2016-05-31-12-00 mtree /data/col1/labtest
Snapshot "testsnap-2016-05-31-12-00" for mtree "/data/col1/labtest" will be retained until May 19 2017 19:31.
  • Если команду отображения списка моментальных снимков запустить повторно, эти снимки будут отображаться как просроченные:
# snapshot list mtree /data/col1/labtest
Snapshot Information for MTree: /data/col1/labtest
----------------------------------------------
Name                                  Pre-Comp (GiB)   Create Date         Retain Until        Status 
------------------------------------  --------------   -----------------   -----------------   -------
testsnap-2016-03-31-12-00                     1274.5   Mar 31 2016 12:00   Mar 26 2017 12:00   expired
testsnap-2016-05-31-12-00                     1198.8   May 31 2016 12:00   May 26 2017 12:00   expired       
testsnap-2016-07-31-12-00                     1301.3   Jul 31 2016 12:00   Jul 26 2017 12:00          
testsnap-2016-08-31-12-00                     1327.5   Aug 31 2016 12:00   Aug 26 2017 12:00          
testsnap-2016-10-31-12-00                     1424.9   Oct 31 2016 12:00   Oct 26 2017 13:00          
testsnap-2016-12-31-12-00                     1403.1   Dec 31 2016 12:00   Dec 26 2017 12:00          
testsnap-2017-01-31-12-00                     1421.0   Jan 31 2017 12:00   Jan 26 2018 12:00          
testsnap-2017-03-31-12-00                     1468.7   Mar 31 2017 12:00   Mar 26 2018 12:00      
REPL-MTREE-AUTO-2017-05-11-15-18-32           1502.2   May 11 2017 15:18   May 11 2018 15:18         

-----------------------------------   --------------   -----------------   -----------------   -------

Обратите внимание на следующее.
  • Невозможно определить, какой объем физических данных хранит на диске отдельный моментальный снимок или набор моментальных снимков — единственное значение «пространства», связанное со снимком файловой системы показывает размер предварительно сжатого (логического) mtree при создании моментального снимка (как показано в приведенном выше примере).
  • Снимки файловой системы с именем «REPL-MTREE-AUTO-YYYY-MM-DD-HH-MM-SS» управляются репликацией mtree, и в обычных условиях не нужно вручную задавать для них истечение срока действия (репликация приведет к автоматическому истечению срока действия этих моментальных снимков, когда они больше не требуются). Если такие моментальные снимки значительно устарели, это означает, что соответствующий контекст репликации, скорее всего, существенно запаздывает (как описано в шаге 2).
  • Моментальные снимки файловой системы с именем «REPL-MTREE-RESYNC-RESERVE-YYYY-MM-DD-HH-MM-SS» создаются путем репликации mtree в случае прерывания контекста репликации mtree. Их можно использовать для предотвращения полной повторной синхронизации данных репликации, если прерванный контекст будет вновь создан позже (например, если контекст был прерван по ошибке). Если репликация не будет восстановлена, истечение срока действия этих контекстов можно задать вручную, как описано выше.
  • Моментальные снимки с истекшим сроком действия будут существовать в системе до следующего запуска очистки или чистки памяти — на данном этапе они будут физически стерты и удалены из вывода команды «snapshot list mtree [mtree name]». Очистка позволит освободить дисковое пространство, которое занимали эти моментальные снимки.
Шаг 5. Проверьте наличие большого количества старых файлов в системе

Запросы автоподдержки из DDR содержат гистограммы, показывающие разбиение файлов в DDR по возрасту, например:
 
File Distribution
-----------------
448,672 files in 5,276 directories

                          Count                         Space
               -----------------------------   --------------------------
         Age         Files       %    cumul%        GiB       %    cumul%
   ---------   -----------   -----   -------   --------   -----   -------
       1 day         7,244     1.6       1.6     4537.9     0.1       0.1
      1 week        40,388     9.0      10.6    63538.2     0.8       0.8
     2 weeks        47,850    10.7      21.3    84409.1     1.0       1.9
     1 month       125,800    28.0      49.3   404807.0     5.0       6.9
    2 months       132,802    29.6      78.9   437558.8     5.4      12.3
    3 months         8,084     1.8      80.7   633906.4     7.8      20.1
    6 months         5,441     1.2      81.9  1244863.9    15.3      35.4
      1 year        21,439     4.8      86.7  3973612.3    49.0      84.4
    > 1 year        59,624    13.3     100.0  1265083.9    15.6     100.0
   ---------   -----------   -----   -------   --------   -----   -------

Это может быть полезно для нахождения в системе файлов, срок действия которых не истек и которые не были удалены, как ожидалось, приложением резервного копирования клиента. Например, если в указанную выше систему были внесены записи приложением резервного копирования, в котором максимальный срок хранения одного файла составлял 6 месяцев, очевидно, что приложение резервного копирования не выполняет удаление файлов и не устанавливает для них истечение срока действия, как ожидалось, так как примерно 80 000 файлов на DDR старше 6 месяцев.

Обратите внимание на следующее.
  • Приложение резервного копирования должно устанавливать истечение срока действия файлов или удалять их.
  • DDR никогда не устанавливает истечение срока действия и не удаляет файлы автоматически, если приложение резервного копирования не дает ему явные указания удалить файл. Файл будет по-прежнему находиться в DDR, бесконечно долго занимая пространство.
Поэтому такие проблемы должны быть сначала исследованы службой поддержки поставщиков приложения резервного копирования.

При необходимости служба поддержки Data Domain может предоставить дополнительные отчеты.
  • Предоставить имена и время изменения всех файлов в DDR, упорядоченные по возрасту (чтобы можно было определить имя и местонахождение любых старых данных).
  • Разделить гистограммы возраста файлов на отдельные отчеты для активного, архивного и облачного уровней (где включены функции ER/LTR).
Для этого выполните следующие действия.
  • Соберите доказательства, как описано в параграфе «Сбор sfs_dump» в разделе примечаний данного документа.
  • Откройте сервисную заявку у поставщика услуг поддержки.
После удаления старых или ненужных файлов необходимо запустить очистку или чистку памяти для физического освобождения пространства на активном уровне

Шаг 6. Проверьте наличие резервных копий, которые содержат большое количество небольших файлов

В связи с особенностями DDFS небольшие файлы (по сути, любой файл размером приблизительно менее 10 Мбайт) может занимать слишком много места при первоначальной записи в DDR. Это происходит из-за архитектуры «SISL» (Stream Informed Segment Layout), в которой небольшие файлы занимают на диске множество отдельных блоков по 4,5 Мбайт. Например, при первоначальной записи файл размером 4 Кбайт может занимать до 9 Мбайт физического дискового пространства.

Это избыточное пространство впоследствии высвобождается при выполнении очистки или чистки памяти (поскольку данные из небольших файлов затем объединяются в меньшее количество блоков объемом 4,5 Мбайт), но при этом небольшие модели DDR могут показывать чрезмерный коэффициент использования и заполняться при запуске такого резервного копирования.

Автоподдержка содержит гистограммы файлов, разбитые по размеру, например:
 
                          Count                         Space
               -----------------------------   --------------------------
        Size         Files       %    cumul%        GiB       %    cumul%
   ---------   -----------   -----   -------   --------   -----   -------
       1 KiB         2,957    35.8      35.8        0.0     0.0       0.0
      10 KiB         1,114    13.5      49.3        0.0     0.0       0.0
     100 KiB           249     3.0      52.4        0.1     0.0       0.0
     500 KiB         1,069    13.0      65.3        0.3     0.0       0.0
       1 MiB           113     1.4      66.7        0.1     0.0       0.0
       5 MiB           446     5.4      72.1        1.3     0.0       0.0
      10 MiB           220     2.7      74.8        1.9     0.0       0.0
      50 MiB         1,326    16.1      90.8       33.6     0.2       0.2
     100 MiB            12     0.1      91.0        0.9     0.0       0.2
     500 MiB           490     5.9      96.9      162.9     0.8       1.0
       1 GiB            58     0.7      97.6       15.6     0.1       1.1
       5 GiB            29     0.4      98.0       87.0     0.5       1.6
      10 GiB            17     0.2      98.2      322.9     1.7       3.3
      50 GiB            21     0.3      98.4     1352.7     7.0      10.3
     100 GiB            72     0.9      99.3     6743.0    35.1      45.5
     500 GiB            58     0.7     100.0    10465.9    54.5     100.0
   > 500 GiB             0     0.0     100.0        0.0     0.0     100.0
   ---------   -----------   -----   -------   --------   -----   -------

Если имеются доказательства, что при резервном копировании записывается очень большое количество небольших файлов, в системе может временно значительно возрастать коэффициент использования в промежутках между каждым вызовом процедуры очистки или чистки памяти. В этом случае рекомендуется изменить методологию резервного копирования, чтобы включить все небольшие файлы в один большой архив (например, файл tar), прежде чем записывать их в DDR. Обратите внимание, что любой такой архив не должен быть сжат или зашифрован (так как это может привести к повреждению коэффициента сжатия или коэффициента дедупликации данных).

Шаг 7. Проверьте, не является ли значение коэффициента дедупликации ниже ожидаемого

Основная цель DDR — дедупликация и сжатие данных устройства. Коэффициент дедупликации или сжатия в значительной степени зависит от сценария использования системы и типа данных, которые она хранит, однако во многих случаях существует «ожидаемый» коэффициент сжатия на основе результатов, полученных в ходе доказательного тестирования или аналогичных операций. Для определения текущего общего коэффициента сжатия системы (и, следовательно, соответствия требованиям) можно использовать команду «filesys show compression». Пример.
 
# filesys show compression

From: 2017-05-03 13:00 To: 2017-05-10 13:00

Active Tier:
                   Pre-Comp   Post-Comp   Global-Comp   Local-Comp      Total-Comp
                      (GiB)       (GiB)        Factor       Factor          Factor
                                                                     (Reduction %)
----------------   --------   ---------   -----------   ----------   -------------
Currently Used:*    20581.1       315.4             -            -    65.3x (98.5)
Written:
  Last 7 days         744.0         5.1         80.5x         1.8x   145.6x (99.3)
  Last 24 hrs
----------------   --------   ---------   -----------   ----------   -------------
 * Does not include the effects of pre-comp file deletes/truncates

В приведенном выше примере система достигает общего коэффициента сжатия 65,3x для активного уровня (что очень хорошо). Если, однако, это значение показывает, что общий коэффициент сжатия не соответствует ожиданиям, то, скорее всего, потребуется дальнейшее исследование. Обратите внимание, что выяснение причин того, почему коэффициент сжатия ниже ожидаемого, является непростой работой, так как может иметься множество корневых причин. Подробнее об этом процессе см. в следующей статье: https://support.emc.com/kb/487055

Шаг 8. Проверьте, является ли система источником для репликации коллекции

При использовании репликации коллекции, если размер исходной системы физически превышает размер целевой системы, размер исходной системы будет искусственно ограничен размером целевой системы (т. е. будет присутствовать область диска в исходной системе, которая будет помечена как неиспользуемая). Причина заключается в том, что при использовании репликации коллекции целевое устройство должно быть копией исходного на уровне блоков, однако если исходное устройство физически больше целевого, существует вероятность того, что в него могут быть записаны избыточные данные, которые затем не могут быть реплицированы в целевое устройство (так как оно уже заполнено). Можно избежать этого, ограничив размер исходной системы в соответствии с размером целевой системы.
  • С помощью команд из шага 2 проверьте, является ли система источником для репликации коллекции. Для этого запустите команду «replication status» и определите, имеются ли контексты репликации, начинающиеся с «col://» (указывает на репликацию коллекции), которые НЕ содержат имя хоста локальной системы в целевой системе (указывает, что эта система должна быть исходной для контекста репликации).
  • Если система является исходной для репликации коллекции, проверьте размер активного уровня каждой системы путем входа в каждую систему и выполнения команды «filesys show space» — сравните размер активных уровней «post-comp» на каждой.
  • Если размер исходной системы значительно больше целевой, то размер ее активного уровня будет искусственно ограничен.
  • Чтобы обеспечить возможность использования всего пространства в исходной системе для данных, необходимо выполнить следующие действия:
Добавьте дополнительное хранилище на активный уровень целевой системы, чтобы ее размер был >= размеру активного уровня целевой системы.
Прервите контекст репликации коллекции (с помощью команд из шага 2). Обратите внимание, что это не позволит реплицировать данные из исходной системы -> на целевой DDR.

Сразу после выполнения любого из этих действий на активном уровне исходной системы будет доступно дополнительное пространство (т. е. нет необходимости запускать очистку или чистку памяти активного уровня перед использованием этого пространства).

Шаг 9. Проверьте, регулярно ли выполняется перемещение данных

Если DDR настроен на Extended Retention (ER) или Long Term Retention (LTR), то к нему будет подключен второй уровень хранения (уровень архива для ER или уровень облака для LTR). В этом случае политики перемещения данных, скорее всего, настроены для mtree, чтобы переносить старые или неизмененные данные, требующие длительного хранения с активного уровня на альтернативный уровень хранения, чтобы пространство, используемое этими файлами на активном уровне, можно было физически освободить путем очистки или чистки памяти. Если политики перемещения данных настроены неправильно или процесс перемещения данных выполняется нерегулярно, старые данные останутся на активном уровне дольше, чем ожидалось, и будут занимать физическое пространство на диске.
  • Сначала проверьте, настроена ли система для ER или LTR, запустив команду «filesys show space» и проверив наличие архивного или облачного уровня. Обратите внимание, что для использования этих альтернативных уровней хранения необходимо указать размер после сжатия > 0 Гбайт:
# filesys show space
...
Archive Tier:
Resource           Size GiB   Used GiB   Avail GiB   Use%   Cleanable GiB
----------------   --------   --------   ---------   ----   -------------
/data: pre-comp           -     4163.8           -      -               -
/data: post-comp    31938.2     1411.9     30526.3     4%               -
----------------   --------   --------   ---------   ----   -------------

# filesys show space
...
Cloud Tier
Resource           Size GiB   Used GiB   Avail GiB   Use%   Cleanable GiB
----------------   --------   --------   ---------   ----   -------------
/data: pre-comp           -        0.0           -      -               -
/data: post-comp   338905.8        0.0    338905.8     0%             0.0
----------------   --------   --------   ---------   ----   -------------

Обратите внимание, что ER и LTR являются взаимоисключающими, поэтому система будет содержать либо только активный уровень (без ER/LTR), либо активный и архивный уровни (конфигурация ER), либо активный и облачный уровни (конфигурация LTR).
  • Если в системе используется конфигурация ER или LTR, убедитесь, что политики перемещения данных для mtree соответствуют ожидаемым параметрам и заданы таким образом, чтобы старые данные передавались на альтернативный уровень хранения.
ER: # archive data-movement policy show
LTR: # data-movement policy show

Если политики перемещения данных неверны или отсутствуют, это следует исправить. Для получения помощи в выполнении этой операции обратитесь к руководству администратора Data Domain.
  • Если в системе используется конфигурация ER или LTR, убедитесь, что запланировано перемещение данных с регулярными интервалами для физической миграции файлов и данных с активного уровня в альтернативное хранилище.
ER: # archive data-movement schedule show
LTR: # data-movement schedule show

Обратите внимание, что Data Domain обычно рекомендует выполнять перемещение данных по автоматизированному расписанию, однако некоторые заказчики предпочитают запускать этот процесс произвольно (при необходимости). В этом случае перемещение данных следует запускать регулярно, с помощью команд:
 
ER: # archive data-movement start
LTR: # data-movement start

Подробнее об изменении расписания перемещения данных см. в руководстве администратора Data Domain
  • Если система настроена на использование ER/LTR, проверьте время последнего перемещения данных:
ER: # archive data-movement status
LTR: # data-movement status

Если перемещение данных не выполнялось в течение некоторого времени, попытайтесь запустить процесс вручную, затем выполните мониторинг следующим образом.
 
ER: # archive data-movement watch
LTR: # data-movement watch

Если по какой-либо причине не удается начать перемещение данных, обратитесь за помощью к своему поставщику услуг поддержки.
  • После завершения перемещения данных необходимо выполнить очистку активного уровня (обратите внимание, что после завершения перемещения данных можно настроить автоматический запуск этой операции), чтобы убедиться в физическом освобождении пространства, используемого переносимыми файлами на активном уровне:
# filesys clean start

В системах ER обычно требуется запланировать регулярное перемещение данных (например, один раз в неделю), а по завершении выполнять очистку активного уровня. В этом случае для очистки активного уровня нет собственного независимого расписания. Чтобы настроить это, сначала удалите текущее расписание очистки активного уровня:

# filesys clean set schedule never


Настройте периодический запуск перемещения данных, а затем автоматическую очистку активного уровня — например, чтобы выполнять перемещение данных каждый вторник в 6:00 с последующей очисткой активного уровня:

# archive data-movement schedule set days Tue time 0600
The Archive data movement schedule has been set.
Archive data movement is scheduled to run on day(s) "tue" at "06:00" hrs


Убедиться, что запуск очистки активного уровня после завершения перемещения данных настроен, можно следующим образом:

# archive show config
Enabled                                         Yes                               
Data movement Schedule                          Run on day(s) "tue" at "06:00" hrs   <=== SCHEDULE
Data movement throttle                          100 percent                       
Default age threshold data movement policy      14 days                           
Run filesys clean after archive data movement   Yes   <=== RUN CLEAN ON COMPLETION
Archive Tier local compression                  gz                                
Packing data during archive data movement       enabled                           
Space Reclamation                               disabled                          
Space Reclamation Schedule                      No schedule

В системах LTR следует по-прежнему настраивать режим очистки активного уровня по собственному расписанию.

Шаг 10. Добавление дополнительного хранилища на активный уровень

Если все предыдущие шаги выполнены, очистка активного уровня завершается, однако на активном уровне по-прежнему недостаточно места, вероятно, система не была правильно сконфигурирована для рабочей нагрузки, которую она получает. В этом случае необходимо выполнить одно из следующих действий.
  • Снизить нагрузку на систему, например:
Перенаправить подмножество резервных копий в альтернативную систему хранения
Сократить период хранения резервных копий таким образом, чтобы срок их действия истекал быстрее или они быстрее удалялись
Сократить количество и срок действия запланированных моментальных снимков для mtree в системе
Прервать ненужные контексты репликации, для которых локальная система является целевой, а затем удалить соответствующие mtree.
  • Добавить дополнительное хранилище на активный уровень системы и увеличить его размер:
# storage add [tier active] enclosure [enclosure number] | disk [device number]
# filesys expand

Чтобы обсудить добавление системы хранения, обратитесь в отдел продаж.

Дополнительная информация


Поддержка Data Domain может генерировать несколько отчетов, в которых отображается следующая информация:
  • Список всех файлов на определенном уровне (например, активный, архивный или облачный), упорядоченных по возрасту
  • Расчетный размер и коэффициент сжатия по дереву mtree или основному дереву каталогов
  • Список всех файлов в определенном дереве mtree, упорядоченных по возрасту
  • и т.д.

Для этого необходимо собрать следующую информацию:
  • Новый пакет поддержки из DDR — дополнительную информацию см. в статье https://support.emc.com/kb/323283
  • Вывод команд «sfs_dump» или «sfs_dump -c»:
Войдите в интерфейс командной строки DDR и переведите устройство в режим SE (обратите внимание, что системы, в которых настроено шифрование и/или блокировка хранения, могут запрашивать учетные данные пользователя с ролью «security» на данном этапе):
 
# system show serialno
[отображается серийный номер системы]
# priv set se
[запрос пароля — введите серийный номер системы, приведенный выше]
 
Включите ведение журнала в сеансе терминала. Например, при использовании putty это можно сделать следующим образом: Нажмите правой кнопкой мыши на строке меню -> Change settings... -> Session -> Logging -> Выберите все выходные данные сеанса и выберите имя файла -> Apply
Выполните команду sfs_dump:

# se sfs_dump

По завершении получите копию журнала сеанса для дальнейшего анализа.
  • Отчет о местонахождении файла (требуется, если система настроена на использование ER или LTR):
Войдите в интерфейс командной строки DDR
Включите ведение журнала в сеансе терминала. Например, при использовании putty это можно сделать следующим образом: Нажмите правой кнопкой мыши на строке меню -> Change settings... -> Session -> Logging -> Выберите все выходные данные сеанса и выберите имя файла -> Apply
Сбор отчета о местонахождении файла:

ER: # archive report generate file-location
LTR: # filesys report generate file-location


После завершения получите копию журнала сеанса для дальнейшего анализа

Для получения помощи в сборе указанных выше данных или при выполнении любых действий, описанных в этом архиве, обратитесь к своему поставщику услуг поддержки.

Затронутые продукты

Data Domain

Продукты

Data Domain
Свойства статьи
Номер статьи: 000054303
Тип статьи: Solution
Последнее изменение: 21 Jul 2025
Версия:  6
Получите ответы на свои вопросы от других пользователей Dell
Услуги технической поддержки
Проверьте, распространяются ли на ваше устройство услуги технической поддержки.