Avamar:在 Avamar 上验证垃圾数据收集失败的步骤

Summary: 以下是在 Avamar 上验证垃圾数据收集 (GC) 失败的步骤。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

垃圾回收是什么?

垃圾收集 (GC) 是从已过期的备份中删除未使用区块的过程。这将释放 Avamar Server 上的容量。

默认情况下,垃圾收集从维护窗口开始时每天运行一次。

常见故障症状:

以下是指示 GC 问题的最常见症状:
  • MSG_ERR_DDR_ERROR
  • MSG_ERR_DISKFULL
  • MSG_ERR_MISC
  • MSG_ERR_TRYAGAINLATER
  • MSG_ERR_BADTIMESYNC

Cause

GC 失败的常见原因:

MSG_ERR_DDR_ERROR
  • 有许多潜在问题可能导致 GC 失败,并且 MSG_ERR_DDR_ERROR。其中一些原因包括:
    • 网络或连接错误
    • Data Domain 文件系统问题
    • Data Domain 数据保护专用存储设备已满
    • DD Boost 用户密码已过期或不正确
    • 存在过多的检查点 (Avamar) 或快照 (Data Domain)。这通常与 hfscheck 不允许旧检查点和快照“滚存”的故障。
MSG_ERR_MISCMSG_ERR_TRYAGAINLATER
  • 在 Avamar v.7 中,备份可以与垃圾收集同时运行。
  • 有时,从备份添加新数据时,会发生称为“索引条带拆分”的过程。
  • 由于在垃圾数据收集运行时无法运行此“索引条带拆分”进程,因此会报告上述错误之一。
    • 网格上的索引条带倾向于在大约相同的时间段内拆分,这些时间段与各个节点上的相同时间段相同。
    • 有时这可能需要几天才能完成。
    • Avamar 正常工作。解决方法是不在 GC 期间运行备份。
MSG_ERR_BADTIMESYNC
  • 这是一个罕见的问题,仅在多节点网格上出现。当一个或多个 Avamar 数据节点与应用工具节点之间的时间不同步时,会发生该错误。
  • 可能所有维护任务(GC、检查点和 hfscheck) 报告相同的错误。 

Resolution

确定最新的垃圾数据收集状态:

可以使用 CLI、AUI 或 Management Console Server (MCS) UI 查看有关最新垃圾收集的信息。

从 CLI 中:

AVAMAR GC 状态 GIF

  • 打开与 Avamar Server 的 SSH 会话(例如 putty),并以“admin”身份登录。运行以下命令:
status.dpn
avmaint gcstatus
  • 以下示例显示了成功的垃圾回收:
Last GC: finished Tue Jul  9 00:00:23 2024 after 00m 03s >> recovered 199.88 KB (OK)
Last GC: finished Wed Jun  5 09:20:46 2024 after 00m 12s >> recovered 0.00 KB (OK)
  • 如果状态显示除 (OK) 以外的任何内容,则垃圾数据收集存在潜在问题:
Last GC: finished Mon Jun 17 09:02:41 2024 after 01m 51s >> recovered 14.98 MB (MSG_ERR_DDR_ERROR)
Last GC: finished Thu Jun 13 07:06:54 2024 after 03m 41s >> recovered 0.00 KB (MSG_ERR_DISKFULL)
Last GC: finished Mon Jun 10 19:04:58 2024 after 01m 01s >> recovered 0 KB (MSG_ERR_MISC)
Last GC: finished Thu Jun  16:21:12 2024 after 00m 25s >> recovered 0 KB (MSG_ERR_BADTIMESYNC)

从 AUI:

AUI GC 状态
  • 查看“上次垃圾数据收集状态”。如果状态显示除 (OK ) 以外的任何内容,则垃圾数据收集可能存在问题。

从 MCS UI 中:

垃圾数据收集状态失败 — Avamar MCS UI
  • 如果“上次垃圾数据收集”具有如上所示的 红色“x” ,则垃圾数据收集可能存在问题,需要进一步分析。

如果垃圾数据收集由于真正的问题(已使用上述步骤验证)仍然失败,请在警报响应表单中选择相应的选项,以将服务请求转给支持工程师。

Additional Information

解决问题后确认错误:

从 CLI 中:

  1. 通过运行以下命令查找未确认的事件:
mccli event show --unack
  1. 通过输入唯一 ID 确认单个代码或所有错误代码:
mccli event show --id-

CLI 确认

从 AUI:

  1. 登录到 AUI 并查看控制面板: 
AUI 确认
  1. 单击感叹号,屏幕将显示类似于以下内容的内容:
AUI 确认
  1. 单击未确认的事件,屏幕将显示类似于以下内容的内容:
AUI 确认
  1. 选择事件(如上所示),然后单击确认。

确定 GC 失败的时间长度:

确定 GC 失败时间的最简单方法是使用 CLI(尽管此信息在 AUI 和 MCS UI 中也可用)

以下命令显示过去 30 天内的所有垃圾数据收集失败:

dumpmaintlogs --types=gc --days=30 |grep "failed garbage collection"
2024/05/27-16:32:18.55893 {0.0} <4202> failed garbage collection with error MSG_ERR_DDR_ERROR
2024/05/28-16:32:37.92920 {0.0} <4202> failed garbage collection with error MSG_ERR_DDR_ERROR
2024/05/29-16:31:51.62962 {0.0} <4202> failed garbage collection with error MSG_ERR_DDR_ERROR
2024/05/30-16:31:55.18969 {0.0} <4202> failed garbage collection with error MSG_ERR_DDR_ERROR
2024/06/20-01:19:09.97961 {0.0} <4202> failed garbage collection with error MSG_ERR_DDR_ERROR

Affected Products

Avamar Server
Article Properties
Article Number: 000226150
Article Type: Solution
Last Modified: 28 Aug 2025
Version:  31
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.