Avamar. Действия по валидации сбоев сборки мусора в Avamar
Summary: Ниже приведены действия по валидации сбоев сборки мусора (GC) в Avamar.
Symptoms
Что такое чистка памяти?
Сборка мусора (GC) — это процесс удаления неиспользуемых фрагментов из резервных копий с истекшим сроком действия. Это позволит освободить дисковое пространство на сервере Avamar.
По умолчанию сборка мусора выполняется один раз в день, начиная с начала окна обслуживания.
Распространенные признаки неисправности:
MSG_ERR_DDR_ERRORMSG_ERR_DISKFULLMSG_ERR_MISCMSG_ERR_TRYAGAINLATERMSG_ERR_BADTIMESYNC
Cause
Распространенные причины сбоев GC:
MSG_ERR_DDR_ERROR
- Существует множество основных проблем, которые могут привести к сбою GC с
MSG_ERR_DDR_ERROR. Вот некоторые из этих причин:- Ошибки сети или подключения
- Проблемы с файловой системой Data Domain
- Устройство Data Domain заполняется
- Просроченный или неправильный пароль пользователя DD Boost
- Слишком много контрольных точек (Avamar) или моментальных снимков (Data Domain). Обычно это связано с
hfscheckСбои, не позволяющие «откатить» старые контрольные точки и снимки.
MSG_ERR_MISC или MSG_ERR_TRYAGAINLATER
- В Avamar v.7 резервное копирование может выполняться одновременно со сборкой мусора.
- Иногда при добавлении новых данных из резервных копий происходит процесс под названием «Разделение полосы индекса».
- Поскольку этот процесс «Разделение полосы индекса» не может быть запущен во время сборки мусора, появляется сообщение об одной из вышеуказанных ошибок.
- Индексные полосы на сетке, как правило, разделяются примерно в один и тот же период времени, что и друг друга на различных узлах.
- Иногда это может занять несколько дней.
- Avamar работает должным образом. Временное решение проблемы — не запускать резервное копирование во время GC.
MSG_ERR_BADTIMESYNC
- Это редкая проблема, которая наблюдается только в многоузловых сетках. Ошибка возникает, если время не синхронизировано между одним или несколькими узлами данных Avamar и служебным узлом.
- Скорее всего, все задачи обслуживания (GC, контрольная точка и
hfscheck)сообщают об одной и той же ошибке.
Resolution
Определение последнего состояния сборки памяти:
Информацию о последней сборке мусора можно просмотреть с помощью интерфейса командной строки, пользовательского интерфейса или пользовательского интерфейса сервера консоли управления (MCS).
Из интерфейса командной строки:

- Откройте сеанс SSH (например, putty) на Avamar Server и войдите в систему как «admin». Выполните следующие команды:
status.dpn avmaint gcstatus
- В следующих примерах показана успешная сборка мусора.
Last GC: finished Tue Jul 9 00:00:23 2024 after 00m 03s >> recovered 199.88 KB (OK) Last GC: finished Wed Jun 5 09:20:46 2024 after 00m 12s >> recovered 0.00 KB (OK)
- Если состояние отображается не «OK», возможно, возникла проблема со сборкой мусора:
Last GC: finished Mon Jun 17 09:02:41 2024 after 01m 51s >> recovered 14.98 MB (MSG_ERR_DDR_ERROR) Last GC: finished Thu Jun 13 07:06:54 2024 after 03m 41s >> recovered 0.00 KB (MSG_ERR_DISKFULL) Last GC: finished Mon Jun 10 19:04:58 2024 after 01m 01s >> recovered 0 KB (MSG_ERR_MISC) Last GC: finished Thu Jun 16:21:12 2024 after 00m 25s >> recovered 0 KB (MSG_ERR_BADTIMESYNC)
Из AUI:
- Проверьте состояние «Last Garbage Collection». Если состояние не отображается как ( OK), существует потенциальная проблема со сборкой мусора.
В пользовательском интерфейсе MCS:
- Если поле «Last Garbage collection» помечено красным значком «x», как показано выше, существует потенциальная проблема со сборкой мусора и требуется дальнейший анализ.
Если сборка мусора по-прежнему завершается сбоем из-за реальной проблемы (что подтверждено с помощью описанных выше действий), выберите соответствующие параметры в форме ответа на оповещения, чтобы передать сервисную заявку агенту поддержки.
Additional Information
Подтверждение ошибок после устранения проблемы:
Из интерфейса командной строки:
- Найдите неподтвержденные события, выполнив команду:
mccli event show --unack
- Подтвердите либо один код, введя уникальный идентификатор, либо все коды ошибок:
mccli event show --id-

Из AUI:
- Войдите в AUI и просмотрите панель управления.
- Нажмите на восклицательный знак, и на экране отобразится что-то похожее на следующее:
- Нажмите на Неподтвержденные события, и отобразится экран, похожий на следующий:
- Выберите событие (как показано выше) и нажмите Подтвердить.
Определение длительности сбоя сборки мусора.
Самый простой способ определить, как долго GC не выполняется, — использовать интерфейс командной строки (хотя эта информация также доступна как в пользовательском интерфейсе AUI, так и в пользовательском интерфейсе MCS)
Эта команда показывает все сбои сборки мусора за последние 30 дней:
dumpmaintlogs --types=gc --days=30 |grep "failed garbage collection"
2024/05/27-16:32:18.55893 {0.0} <4202> failed garbage collection with error MSG_ERR_DDR_ERROR
2024/05/28-16:32:37.92920 {0.0} <4202> failed garbage collection with error MSG_ERR_DDR_ERROR
2024/05/29-16:31:51.62962 {0.0} <4202> failed garbage collection with error MSG_ERR_DDR_ERROR
2024/05/30-16:31:55.18969 {0.0} <4202> failed garbage collection with error MSG_ERR_DDR_ERROR
2024/06/20-01:19:09.97961 {0.0} <4202> failed garbage collection with error MSG_ERR_DDR_ERROR
