Avamar. Создание контрольной точки для виртуальной машины завершилось сбоем и будет пропущена из резервного копирования
Summary: В этой статье базы знаний описаны решения по устранению ошибок создания контрольных точек Hyper-V при сбоях резервного копирования виртуальных машин (ВМ).
Symptoms
Резервное копирование Hyper-V виртуальных машин с использованием согласованного с приложениями моментального снимка в наборе данных может завершиться сбоем с ошибками, подобными следующим:
avhypervvss Error <43426>: Checkpoint creation for Virtual machine 'AVAMARPROD01v<GUID>' has failed and will be skipped from backup. For details, please check 'winclustersvc.log'.
avhypervvss Error <43426>: Checkpoint creation for Virtual machine 'DELLVM<GUID>' has failed and will be skipped from backup. For details, please check 'winclustersvc.log'.
Из winclustersvc.log могут появиться следующие ошибки:
Файл журнала находится в папке C:\Program Files\avs\var на активном узле службы DELL Avamar Backup Agent.
(Активный узел, которому принадлежит этот сервис, можно определить с помощью инструмента управления отказоустойчивым кластером.)
winclustersvc ERROR<0000>: Failed to execute CreateSnapshot method: Failed to create checkpoint on collection 'AvamarBackup_HVSVR02-03-app-20220503000228-0' (AEE36BC1-A2AD-4682-A71A-80B127A6839F).
winclustersvc ERROR<0000>: Failed to execute CreateSnapshot method: Not found .Cause
Эти сбои при создании контрольных точек могут возникнуть, если Hyper-V Manager не может создать производственные контрольные точки для затронутых виртуальных машин. Производственные контрольные точки эквивалентны согласованным с приложениями моментальным снимкам для резервных копий Hyper-V.)
Записи службы теневого копирования томов (VSS) на виртуальных машинах могут находиться в состоянии сбоя.
На виртуальных машинах может не хватить свободного дискового пространства в отдельных томах для создания моментального снимка VSS. Рекомендуется иметь от 10% до 20% свободного пространства в каждом томе жесткого диска.
На затронутых виртуальных машинах могут не установлены последние обновления и исправления служб Integration Services или операционной системы (ОС) Windows.
Если эти ошибки возникают на многих виртуальных машинах, возможно, не обновлены последние обновления ОС Windows на серверах хостов или узлах кластера. Это может привести к сбою резервного копирования, согласованного как с приложениями, так и с точки зрения сбоя.
Resolution
1. Протестируйте виртуальную машину, выполнив контрольные точки вручную с помощью Hyper-V Manager и выбрав только производственные контрольные точки, используя следующие параметры:

ВАЖНО! Снимите флажок «Создавать стандартные контрольные точки». Это заставляет Hyper-V Manager создавать производственные контрольные точки вместо стандартных контрольных точек. Производственные контрольные точки имитируют резервное копирование Avamar Hyper-V с использованием согласованного с приложениями моментального снимка.

Если при создании контрольной точки с помощью Hyper-V Manager не удается использовать производственную или стандартную версию, при необходимости обратитесь в службу поддержки Майкрософт.
Если производственная контрольная точка завершится сбоем, измените настройки, измените их на стандартные контрольные точки и повторите процедуру.
Если создание производственной контрольной точки завершилось сбоем, но стандартная контрольная точка работает, создайте отдельный набор данных и политику, а также создайте резервную копию виртуальных машин, используя уровень моментальных снимков, согласованных на уровне сбоя в наборе данных. Моментальный снимок, согласованный на уровне сбоя, коррелирует со стандартным созданием контрольной точки с помощью Hyper-V Manager.
2. Выполните вход на сбойные виртуальные машины и откройте PowerShell или командную строку Windows. Выполните следующую команду, чтобы проверить состояние модулей записи VSS:
vssadmin list writers
Если они находятся в состоянии сбоя, перезапустите соответствующие службы или перезагрузите виртуальные машины, чтобы вернуть устройства записи в работоспособное состояние.
См.: https://campus.barracuda.com/product/ISBKB/doc/93197282/the-vss-writer-is-in-a-bad-state/ (внешняя ссылка)
3. Выполните вход в сбойные виртуальные машины и убедитесь, что на томах жесткого диска свободно не менее 10–15%.
Перейдите в раздел «Администрирование Windows» -> > «Управление компьютером» -> > «Управление дисками» -> «Том диска»-> > нажмите правой кнопкой мыши и> выберите Свойства -> вкладка «Теневые копии» -> "Настройки".
Если настроено ограничение области хранения, при необходимости увеличьте максимальный размер. Или измените его на «No Limit», так как моментальные снимки VSS, созданные с помощью подключаемого модуля Avamar, являются временными:

4. Убедитесь, что на виртуальных машинах Windows установлены актуальные версии служб Integration Services. Для операционных систем Windows Server 2016 и 2019 для этого используется функция Центра обновления Windows.
В Windows Server 2012 и 2012 R2 это можно сделать вручную: https://www.zubairalexander.com/blog/how-to-update-integration-services-in-windows-server-2012-r2/ (внешняя ссылка)
5. Убедитесь, что на всех узлах кластера Hyper-V установлены последние обновления ОС Windows. Это можно проверить с помощью функции Центра обновления Windows.
6. Удалите все потерянные контрольные точки на виртуальной машине. Потерянные контрольные точки, оставшиеся после резервного копирования Avamar, имеют синтаксис «AvamarBackup_<<Avamar policy name>>-<<snapshot consistency level>>-<<backup job timestamp>>»
Пример:


Это контрольные точки восстановления, созданные во время резервного копирования Avamar, которые впоследствии не удалось объединить с родительскими файлами виртуального жесткого диска версии 2 (VHDX). Их невозможно удалить обычными методами в Hyper-V Manager.
При нажатии правой кнопкой мыши на контрольную точку НЕТ опции «Delete Checkpoint».
Чтобы удалить контрольные точки восстановления Avamar, выделите контрольную точку в Hyper-V Manager и нажмите клавишу Del (Delete) на клавиатуре. Потерянная контрольная точка восстановления объединяется с основным VHDX-файлом:

Однако удаление контрольных точек Avamar вручную может завершиться сбоем с открытым сообщением «Операция не может быть выполнена, пока объект находится в своем текущем состоянии».
В этом сценарии см. подробные процедуры и сценарии для удаления устаревших контрольных точек и групп vmgroup на всех узлах кластера в следующей статье: Windows Server. Интерактивная миграция Hyper-V может завершиться сбоем в результате контрольных точек восстановления.т контрольных точек восстановления
7. Примените последние оперативные исправления для используемой версии подключаемого модуля VSS Avamar Hyper-V. В следующей статье приведены номера исправлений и их расположение для скачивания. Сбой инкрементного RCT-бэкапа Avamar Hyper-V с сообщением «Не удалось получить экстенты RCT для дискового файла» или «Сбой создания опорной точки для виртуальной машины»
(В противном случае виртуальные машины не смогут создавать согласованные с приложениями моментальные снимки или контрольные точки.)
8. Создайте отдельную политику и набор данных для проблемных виртуальных машин, отредактируйте набор данных и измените уровень моментального снимка с «application» на «crash».