Avamar:虚拟机的检查点创建失败,将从备份中跳过
Summary: 本知识库文章提供了解决方案,用于解决虚拟机 (VM) 备份失败时的 Hyper-V 检查点创建错误。
Symptoms
使用数据集中的应用程序一致性快照执行虚拟机的 Hyper-V 备份可能会失败,并显示类似于以下内容的错误:
avhypervvss Error <43426>: Checkpoint creation for Virtual machine 'AVAMARPROD01v<GUID>' has failed and will be skipped from backup. For details, please check 'winclustersvc.log'.
avhypervvss Error <43426>: Checkpoint creation for Virtual machine 'DELLVM<GUID>' has failed and will be skipped from backup. For details, please check 'winclustersvc.log'.
从 winclustersvc.log 文件中,可能会显示以下错误:
日志文件位于 C:\Program Files\avs\var DELL Avamar Backup Agent 服务的活动节点上的文件夹。
(可以通过故障转移群集管理工具确定拥有该服务的活动节点。)
winclustersvc ERROR<0000>: Failed to execute CreateSnapshot method: Failed to create checkpoint on collection 'AvamarBackup_HVSVR02-03-app-20220503000228-0' (AEE36BC1-A2AD-4682-A71A-80B127A6839F).
winclustersvc ERROR<0000>: Failed to execute CreateSnapshot method: Not found .Cause
如果 Hyper-V Manager 无法为受影响的虚拟机创建生产检查点,则可能会发生这些检查点创建失败。生产检查点相当于 Hyper-V 备份的应用程序一致性快照)
虚拟机的卷影拷贝服务 (VSS) 编写器可能处于失败状态。
虚拟机的各个卷上可能没有足够的可用磁盘空间来创建 VSS 快照。建议每个硬盘卷的可用容量为 10% 到 20%。
受影响的 VM 可能没有最新的 Integration Services 或 Windows作系统 (OS) 更新和修补程序。
如果许多虚拟机出现故障并出现这些错误,则主机服务器或群集节点可能不会使用最新的 Windows OS 更新进行更新。这可能会导致应用程序一致性和崩溃一致性备份失败。
Resolution
1.通过使用 Hyper-V Manager 创建手动检查点并使用以下设置仅选择生产检查点来测试虚拟机:

重要提示: 清除“创建标准检查点”选项。这迫使 Hyper-V Manager 创建生产检查点,而不是标准检查点。生产检查点使用应用程序一致性快照模拟 Avamar Hyper-V 备份。

如果使用 Hyper-V 管理器创建的检查点无法使用生产或标准,则如有必要,请联系 Microsoft 支持。
如果生产检查点失败,则编辑设置并更改为标准检查点选项,然后重试该过程。
如果生产检查点创建失败,但标准检查点正常工作,请创建单独的数据集和策略,并使用数据集中的崩溃一致性快照级别备份虚拟机。崩溃一致性快照与使用 Hyper-V Manager 创建标准检查点相关。
2.登录到出现故障的虚拟机,然后打开 PowerShell 或 Windows 命令提示符。运行以下命令以检查 VSS 编写器的状态:
vssadmin list writers
如果它们处于故障状态,请重新启动相关服务或重新启动虚拟机,以使编写器恢复到良好状态。
参考: https://campus.barracuda.com/product/ISBKB/doc/93197282/the-vss-writer-is-in-a-bad-state/ (外部链接)
3.登录到出现故障的虚拟机,并检查硬盘卷是否至少有 10-15% 的可用磁盘空间。
转至 Windows 管理工具 -> 计算机管理 -> 磁盘管理 -> 磁盘卷 -> 右键单击 -> 选择属性 -> 卷影副本选项卡 -> 设置。
如果配置了存储区域限制,请在必要时增加最大大小。或者将其更改为“无限制”,因为使用 Avamar 插件创建的 VSS 快照是临时的:

4.确认 Windows 虚拟机上的集成服务是最新的。对于 Windows Server 2016 和 2019作系统,这使用 Windows 更新功能完成。
对于 Windows Server 2012 和 2012 R2,可以手动执行此作: https://www.zubairalexander.com/blog/how-to-update-integration-services-in-windows-server-2012-r2/(外部链接)
5.验证所有 Hyper-V 群集节点是否都具有最新的 Windows作系统更新。这可以使用 Windows 更新功能进行验证。
6.删除虚拟机上的任何孤立检查点。Avamar 备份遗留的孤立检查点的语法为”AvamarBackup_<<Avamar policy name>>-<<snapshot consistency level>>-<<backup job timestamp>>”
示例:


这些是在 Avamar 备份期间创建的“恢复”检查点,但之后未能合并回父虚拟硬盘 v2 (VHDX) 文件。无法在 Hyper-V Manager 中使用正常方法删除它们。
右键单击检查点没有“删除检查点”选项。
要删除 Avamar 恢复检查点,请在 Hyper-V Manager 中突出显示该检查点,然后按键盘上的 Del (删除)键。孤立的恢复检查点将合并到主 VHDX 文件中:

但是,手动删除 Avamar 检查点可能会失败,并显示打开的消息“当对象处于当前状态时,无法执行作”。
在这种情况下,请参阅以下文章,了解删除所有群集节点上的过时检查点和 vmgroup 的详细过程和脚本:Windows Server:Hyper-V 实时迁移可能会因恢复检查点而失败。恢复检查点数
7.为正在使用的 Avamar Hyper-V VSS 插件版本应用最新的热修复程序。以下文章提供了要下载的热修复程序编号和位置:Avamar Hyper-V 增量 RCT 备份失败,并显示“无法获取磁盘文件的 RCT 扩展区”或“虚拟机的参考点创建失败”
(否则,虚拟机可能无法执行应用程序一致的快照/检查点。)
8.为有问题的虚拟机创建单独的策略和数据集,编辑数据集并将快照级别从“application”更改为“crash”。