Avamar - Data Domain:目标上的高 DD 利用率:分析和最佳实践
Summary: 源和目标 Data Domain 的磁盘利用率不需要完全相等。本文档介绍了目标 Data Domain 可能显示比源 Data Domain 更高的利用率的可能原因。 请务必注意,利用率的差异可能是由于以下原因的组合而导致的。
Symptoms
目标 Data Domain 显示的利用率高于源 Data Domain。
Cause
从 Avamar 的角度:
回滚
如果在源 Data Domain 上进行回滚,目标 Data Domain 可能保留额外天数的数据,具体取决于回滚时间。在目标上的额外备份到期之前,将存在此差异。
示例:DD1 复制到 DD2。由于回滚到 2 天前,我们看到源上有 3 个备份,但有 5 个备份复制到目标上。
部分复制
如果复制未成功完成,已复制的数据将存储至少七天,并通过 Data Domain 清理进行清理。 部分复制包含数据和指纹,可以使后续重新尝试数据复制更快地运行。
如果复制在即将完成之前出现故障,则部分复制开销可能与复制的数据量一样高。
保留时间差异
在 Avamar Server 配置中,可以进行设置,使副本在目标服务器上的保留时间长于源服务器。这将导致容量利用率差异。
Avamar 配置差异
Avamar Server 上的检查点备份可能很大。如果仅在目标 Avamar 上配置,则会提高目标服务器上 Data Domain 的利用率。
从 Data Domain 的角度:
指纹。
在复制期间将数据发送到 Data Domain 时,将对其进行重复数据消除。首先将数据的指纹发送到目标 Data Domain,以检查目标是否具有数据。
-
如果 Data Domain 返回有指纹的响应,则不需要重新发送数据
-
如果 Data Domain 未返回找不到指纹的响应,则表示:
-
没有指纹
-
目标 Data Domain 有指纹,但希望发送数据,以改善 Data Domain 上的特殊位置。
-
Data Domain 正忙,不想完成整个搜索。
-
如果重复数据被发送到 Data Domain,则将在清理过程中通过删除数据的额外副本对数据进行重复数据消除。
目标 Data Domain 将具有更高的利用率,但差异不应很大。
元数据开销。
每个备份的文件都附带其文件信息元数据,并且还包含每个文件的指纹。
示例:对于 1 TB 文件,利用率成本为文件大小的 0.3%。
对于一个平均 8 KB 的数据块,其中有 82B 的元数据。 对于压缩后容量,这大约是 0.01% 的开销。
此开销还会随 Avamar 集成增加,因为每次备份完成时,Avamar 会合并备份以从增量数据获得合成的完整备份。
我们还观察到,当存在跳过的备份或数据不按顺序复制时,元数据开销会增加。
唯一不创建此开销的备份是虚拟机备份。元数据成本非常小。
示例:当不按顺序复制备份时,将在目标上创建 L0 备份,其元数据开销比 Inc 大得多。假设我们有 5 天的备份。
从最旧到最新复制:
第一次复制将是 L0,随后所有复制都将是 Inc。
1xL0 + 4xInc
从最新到最旧复制:
复制跳过备份:
文件跟踪
Data Domain 必须知道如何根据经过重复数据消除的块构建每个文件。如果 Data Domain 没有此信息,则必须重建它并重新创建指纹链。这可能会导致容量显著增加。
有两种情况可能会导致目标 Data Domain 上的容量显著增加:
1.文件跟踪丢失:
示例:如果在具有多个 IP 的 DNS 中设置了目标 Data Domain,并且 IP 以循环方式分布,则源 Data Domain 每次都会连接到不同的 IP。昨天发送的数据副本将无法识别,并且会发送更多数据,这也会增加元数据成本。
如果 在 Avamar Server 回滚完成后SFS_BFT_ENABLED保留为 false,则可能会出现此问题。
这可能会导致非常大的差异。 备份到期后空间将被回收。
嵌入式重复数据消除
Data Domain 将要求最多相当于数据逻辑大小 6% 的重复数据,以优化其嵌入式重复数据消除。
重复数据消除和压缩的差异。
Data Domain 在其本地存储上独立执行自己的重复数据消除和数据压缩,取决于目标数据的存储方式,这将不相等,从而导致利用率差异。
Data Domain 清理
如果源和目标 Data Domain 在不同日期运行清理,或者其中一个 Data Domain 运行清理更频繁或更长时间,则使用的容量将存在差异。
Resolution
最佳实践:
由于两个 Data Domain 系统(源和目标)的利用率会存在差异,有一些最佳实践可以帮助尽可能减少差异:
-
当 hfscheck 失败和硬件故障发生时尽快进行处理,最大程度地降低回滚的可能性。
-
确保复制成功完成。如果持续发生问题导致复制无法完成,请联系 Dell Technologies 支持以检查配置。
-
如果您需要使两个 Data Domain 保持相同的利用率,请对备份的源副本和目标副本设置相同的保留时长,并确保在两个 Avamar Server 上对检查点备份进行相同的设置。
-
确保复制始终为“最旧到最新”,并且不会跳过任何备份。
-
如果 Data Domain 配置了多个 IP,请确保 IP 未以循环方式分布。
-
使源和目标 Data Domain 系统在同一天和同一时间运行清理。
-
将SFS_BFT_ENABLED设置为 true。 这必须由技术支持启用(提交 SR 并引用此 KB# - 182755)