Data Domain:使用 Mtree 复制在 PowerProtect Data Domain 系统上进行数据迁移的最佳实践
Summary: 本文讨论如何使用 Mtree 复制 (MRepl) 从没有内部 QAT 卡支持的传统 PowerProtect Data Domain (PPDD) 系统迁移数据。例如,DD9500 和 DD9800。必须考虑当前的系统作工作负载,以避免可能对数据迁移结果产生负面影响的意外副作用。 本文帮助规划需要使用传统 PPDD 系统作为源的新 Mtree 复制 (MRepl) 上下文配置的迁移作。 ...
Instructions
随着第 16 代平台的推出,将特定 MTree 从传统 PPDD 迁移到较新的系统是一项常见要求。
迁移过程会创建新的 Mtree 复制上下文。请考虑以下事项,以确保尽可能减少中断。
- 备份作产生的当前系统工作负载
- 压缩功能差异(例如 QAT 卡支持)
- 突然合并新的 Mrepl 上下文配置
- 影响垃圾数据收集 (GC) 过程的硬件错误
为了维护数据完整性并满足服务级别协议,系统在某些作阈值时可能会崩溃。
死机机制会触发自我纠正措施,以确保系统始终可靠运行。
这将讨论这些注意事项,并指导如何防止可能干扰迁移计划的意外停机。
备份作的当前系统工作负载:
首先关注当前的系统作。在迁移之前,监视关键指标。其中包括持续工作负载、CPU 利用率、内存使用情况、网络状态和硬件警报。
目标是将系统的运行保持在正常参数范围内。
压缩功能差异:
在准备使用 Mtree 复制 (Mrepl) 进行迁移时,请考虑系统之间的压缩能力差异。
某些旧式系统缺少板载压缩卡来帮助执行与压缩相关的作。
DD9900、DD9400 或 DD6900 系统允许连接外部 QAT 卡以加速压缩作。
当不存在 QAT 卡(例如 DD9800、DD9500)时,它依靠 CPU 和内存资源执行压缩和解压缩任务。
在没有 QAT 支持的情况下配置新的复制上下文时,必须先解压缩数据。
这可能会导致在复制初始化阶段出现 CPU 使用率峰值。
源将检查目标以确定可用的压缩卡类型。
当第 16 代系统(DD9910、DD9410 或 DD6410)为目标时,源必须从传统的“gzfast”格式解压缩数据。然后,它必须将其压缩为 LZ 格式。
逐步整合新的 mrepl 上下文配置:
在灾难恢复 (DR) 期间,将数据从一个 Data Domain 复制到另一个 Data Domain 时,复制作业通常在数据接收完成后启动。
这可确保目标站点接收所有复制的数据。
为迁移定义新的复制上下文时,源必须在复制初始化期间处理重要数据。
这是因为目标缺少经过重复数据消除的数据,尚无法进行优化。这会导致源系统上的负载增加。
为了缓解这种情况,当系统继续处理备份工作负载 (I/O) 时,请逐渐整合与迁移关联的复制上下文。
定义低复制吞吐量以限制分配给这些与迁移相关的复制上下文的资源。
复制开始在目标上构建优化并且验证作参数后,添加更多复制(迁移)上下文。或者,修改现有 IOPS 上的复制吞吐量。
目的是避免触发系统的保护机制。这会导致系统崩溃,从而影响迁移。
请记住,系统性能参考是根据正在运行的工作负载计算的,而不是针对新工作负载计算的。
在迁移方案期间逐步配置限制。
“replication throttle add”命令可用于调度特定时间点,并为限制分配定义的带宽(以 Mbps 为单位)。
使用有限的可用带宽(较低的限制)启动新的复制作业。然后,评估对系统作的影响。
复制作业进行后,可以增加限制以提供额外的带宽。
此外,还建议监视 DDSM 上提供的系统分析,包括 CPU、内存和网络消耗。
影响垃圾数据收集 (GC) 进程的硬件错误:
可能导致备份或复制性能下降的另一个因素与硬件故障相关联,尤其是在默认垃圾收集作期间。在正常运行条件下,PPDD 系统上的垃圾收集机制完成空间回收活动,而不会影响接收、还原或复制作。在某些情况下,系统提供用于定义垃圾回收限制的选项,从而使系统管理员能够对系统清理过程发生的时间进行额外控制。
垃圾收集的默认限制配置不会影响备份和还原。观察到影响的大多数情况都与硬件故障有关。例如,当某些驱动器需要更换时,系统的持续 I/O 需求会减慢备份和还原的存储速度,从而影响总体 GC作。
Data Domain作系统为此类硬件问题提供了全面的警报机制,可在检测到这些情况时主动发出警报。这有助于备份作员及时解决与硬件相关的问题。
要考虑的另一个重要因素是,复制活动与备份和恢复同等重要。根据设计,每个平台为每个作业提供固定数量的流,并且可以在定义的限制下处理并发作,以满足服务水平协议 (SLA) 的要求。
结论:
使用 Mtree 复制成功进行数据迁移需要仔细考虑以下事项;
- 通过备份作监视当前系统工作负载
- 了解传统平台,如 DD9800 或 DD9500
- 使用不同的压缩算法 (gzfast)。
- 在正在运行的系统上创建新的 MTree 复制 (MRepl) 上下文时,请逐步整合新的 Mrepl 上下文配置
- 密切监视新工作负载对系统的影响。
- 监视潜在的硬件错误(这些错误会影响垃圾数据收集过程中的作)。
遵循这些最佳实践可更大限度地减少中断并保持系统稳定性。
实施这些建议有助于避免意外停机并促进数据迁移。