NetWorker:Data Domain 之间的容量模式 vProxy 克隆作业性能问题

摘要: 使用本文帮助隔离 vProxy 克隆两个 Data Domain 之间的性能问题并进行故障排除。

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

  • vProxy 克隆速度已从 GB/秒下降到更传统、更逼真的速度。
  • 网络带宽被排除为瓶颈的原因,在克隆过程中仍远低于阈值。
  • 消息可在 ddfs 中找到信息日志指代受影响虚拟机磁盘的一个或多个 *-flat.vmdk 文件,其中包含:
    • synthesized_vbytes 0,以 recipe_repl FALSE 结尾
    • srepl_filecopy_recipe_validate_bf:基本文件的srepl_get_replica_attr,以错误结尾的文件句柄过时。
  • 克隆操作日志中找到的消息(当克隆调试级别为 3 或更高时)指的是受影响虚拟机磁盘的一个或多个 *-flat.vmdk 文件,其中包含:
    • 合成复制不能用于文件...path.../vm-vmnumber-disk-key-disknumber-flat.vmdk

原因

vProxy 使用虚拟合成来利用 VMware 的更改数据块跟踪 API,为备份和克隆操作提供巨大的收益。这需要在涉及的每个 Data Domain 上主动维护虚拟机文件集的内部关联。如果在准备使用虚拟合成进行克隆时出现问题,NetWorker 和 Data Domain 将回切到使用默认复制工作流。这需要处理整个虚拟磁盘文件,而不是仅处理更改的数据块,而不是仅处理 VMware API 提供的已更改数据块,即使由于重复数据消除而最终发送的数据很少,克隆作业持续时间也会增加倍数。

可能导致虚拟合成跟踪失败的原因包括:
  • NetWorker 针对作业之间的源或目标 Data Domain 设备解析的不同 IP 地址 — 对于虚拟合成的内部跟踪,这些地址必须保持一致
  • 为 vProxy 备份或克隆更改源或目标 Data Domain
  • vProxy 备份或克隆的多个源卷或目标卷,这可能导致链中的多个存储集同时克隆
  • 需要克隆给定虚拟机的多个 vProxy 存储集,这可能会导致链中的存储集克隆
  • 虚拟机磁盘会长时间运行而不进行任何更改(特别是超过存储集保留期的期间,例如 35 天而不更改,其中保留期为 30 天)
  • 如果使用 NetWorker 19.6 及更高版本,则无法使用 ChronologicalOrder Action 属性

解决方案

由于存在许多潜在原因,请查看 Data Domain 和 NetWorker 配置,并确保:
  • 为源(备份)和目标(克隆目标)Data Domain 正确设置 ifgroup
  • NetWorker 服务器、存储节点和 Data Domain 都具有使用每个 Data Domain 相应的 ifgroup IP 的主机文件条目,以及适用于客户端的可靠 DNS(使用需要的 NetWorker 客户端主机文件)。
  • 每个备份和克隆池的单个 Data Domain。
使用 NetWorker 19.5 或更低版本时:
  • 确保克隆作业按备份顺序顺序执行;请注意,当给定虚拟机的多个克隆位于同一作业列表(克隆操作或 nsrclone 存储集文件列表)中时,无法控制此功能。
  • 确保每个池具有单个备份和克隆卷,以避免在多个卷可用于源时进行并发克隆。
从 NetWorker 19.6 开始,您应始终为 vProxy 存储集克隆操作启用 ChronologicalOrder 功能,该功能可能隐藏在 UI 中:
  • 如果使用 nsrclone 命令,则使用 -O 交换机在给定客户端链中使用具有多个存储集的存储集列表时强制执行此新功能
  • 要在策略中启用,请使用以下两个命令之一:
    • nsrpolicy action update clone -p policyname -w workflowname -A actionname [--chronological_order | -l] 
    • 在 nsradmin 提示符中:
      • . type nsr protection policy action; policy name: policy; workflow: workflow: name: action
      • update Chronological order: Yes

         
  • 完成此操作后,之前提到的对单个源卷和目标卷的限制以及每个虚拟机客户端的多实例增量备份将被取消,并且可以正确处理。
重要提示:NetWorker 和 Data Domain 可能在某些情况下可以从中恢复,其中存储集是按顺序克隆的。这会导致一些用户无法使用 VSR 进行复制,但是一旦整个链恢复,VSR 克隆可能会继续,而不会出现问题。一般情况下,无序克隆、多卷和多存储集克隆可以赶上并恢复到常规操作。

但是,如果多个 Data Domain IP 地址已完全使用或更改 Data Domain 源或目标,则返回常规且一致的 VSR 优化的唯一方法是强制对受影响虚拟机执行新的完整备份,以重置更改的数据块跟踪和恢复 VSR 优化。当之前的步骤完成时,应考虑这一点,但 Data Domain 和/或 NetWorker 日志记录以及克隆速度表明性能问题仍然存在。

受影响的产品

Data Protection, NetWorker Family, Data Domain Replicator
文章属性
文章编号: 000205098
文章类型: Solution
上次修改时间: 09 10月 2024
版本:  6
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。