Avamar:NDMP 0 级备份性能问题、原因和最佳实践
摘要: 存在 >10M 个文件时,到 Avamar 的初始级别 0(完整)NDMP 备份可能会超过 24 小时;NAS 扫描所有目录并发送每个字节。启用超时,避免中止 L0,使用 max-streams(最多 8 个),并首选浅而宽的目录树。
本文适用于
本文不适用于
本文并非针对某种特定的产品。
本文并非包含所有产品版本。
症状
观察到的 NDMP 0 级备份问题。
与性能相关的症状
执行到 Avamar 的初始(0 级)NDMP 备份时,通常会报告以下情况:
- 备份持续时间延长到数小时或数天(例如,7 TB 需要 121 小时≈ 40 TB 需要 300 小时≈)。
- 后续的 1 级备份或增量备份在很短的时间内完成(通常为 45 分钟到几个小时)。
- Avamar 似乎仍处于 “完整备份” 状态,并且不会转换为增量备份。
- 未启用超时时,备份作业将在 24 小时后终止。
- 当文件计数超过大约 1000 万时,备份时间会显著增加。
- NAS 在备份窗口的大部分时间里扫描目录树,而不是传输数据。
- 在 Isilon 系统上,备份单个
/ifs
文件系统仅使用一个流,导致完成速度较慢。这不受支持。
原因
导致 0 级 NDMP 备份时间延长的因素
0 级(完整)NDMP 备份要求 NAS 枚举和传输受保护卷上的每个文件和目录。以下情况可能会导致备份运行数小时或数天:
- **文件计数超过最佳限制**— 超过 10,000,000 个文件的备份会显著增加 NAS 扫描目录树所花费的时间。
- **深层或高度嵌套的目录结构**— 深层树会强制 NAS 遍历许多级别,与宽而浅的层次结构相比,这会减慢扫描速度。
- **大量数据** - 非常大的数据量(例如,7 TB、40 TB)自然需要更多的时间进行初始完全扫描和数据传输。
- **高目录与文件比率** — 大量目录,每个目录都很少文件,这会增加元数据处理开销。
- **文件特征** - 文件大小小、文件类型多样、文件频繁更改会降低扫描效率。
- **NAS 磁盘活动**— 当 NAS 磁盘被其他工作负载大量使用时,备份扫描会争用 I/O 资源,从而延长运行时间。
- **NDMP 流不足**— 默认情况下,NDMP 备份最多可以运行八个并行流;使用较少的流可减少并行度并延长备份时间。
- **将卷重新分配给其他客户端** — 移动卷将触发新的 0 级备份,因为 NAS 必须重新发送每个字节以验证 Avamar 上是否已存在数据。
- **Isilon 单文件系统行为** — 备份鞋底
/ifs
文件系统仅使用一个流,从而限制了并行度并增加了扫描时间。Isilon 不支持此功能 - **无超时的计划限制** — 如果备份超过计划窗口且未启用超时,则作业可能会终止,从而导致重复执行完整备份。
这些情况共同导致 NAS 将大部分备份窗口用于扫描元数据,而不是传输数据,从而导致 0 级备份持续时间极长。
解决方案
NDMP 0 级备份的建议作
1.确保 0 级备份可以运行到完成。
严重警告:终止 0 级(完整)备份可防止 Avamar 移至增量备份,从而导致备份作业无限期重复。
- 除非绝对必要,否则请勿取消 0 级备份。
- 验证备份计划是否允许超时,以便在计划的窗口结束时作业不会终止。
2.为 NDMP 备份配置超时。
在 AvamarClient 策略中设置超时选项,以允许备份在计划窗口之外运行。
# Example: enable overtime for a client (replace [CLIENT] with the actual client name) avmaint setclientpolicy -c [CLIENT] --overtime true
如果启动手动备份,计划限制不适用,但除非启用加班,否则作业仍将在 24 小时后终止。
3.调整最大流数量。
通过允许同时处理多个目录树,增加并行流的数量可加快备份速度。
# Example: set max‑streams for a dataset (replace [DATASET] and [STREAM_COUNT]) avmaint setdataset -d [DATASET] --max-streams [STREAM_COUNT]
- 每个数据集最多使用 8 个流(NDMP 的默认最大值)。
- 首先从最大的音量开始;后续卷将自动跟进。
4.验证文件和目录计数限制。
最佳实践建议每次 0 级备份备份不超过 10 000 000 个文件。
- 在源 NAS 上运行文件计数,并考虑在超过限制时将备份拆分为多个数据集。
5.优化目录树结构。
- 更喜欢浅而宽的目录树,而不是深的嵌套结构;浅树可缩短扫描时间。
- 使用 Isilon 时,请勿在
/ifs根级别。这会将备份限制为单个流。 - 避免在不同路径之间移动大型目录子树;此类移动会导致 NAS 将数据视为新数据并执行完整扫描。
6.在备份期间监视 NAS 负载。
- 检查 NAS 磁盘 I/O 和 CPU 利用率;高负载可能表示 NAS 大部分时间都在扫描目录。
- 如果 NAS 成为瓶颈,请考虑减少流数量或将备份安排在非高峰时段。
7.使用 Avamar 工具进行验证。
- 打开 Avamar Administrator,然后导航到历史记录→备份作业,以确认 0 级作业成功完成。
- 在 0 级完成后,运行 1 级(增量)备份并验证它是否在预期时间内完成(对于给出的示例,通常 <为 1 小时)。
- 查看 NDMP 加速器日志中的条目,例如
"Backup completed successfully"并确保没有"killed due to overtime"消息会出现。
8.如果问题仍然存在,请联系戴尔支持。
如果应用上述步骤后,0 级备份仍超过合理的时间范围,请创建支持案例。提供以下信息:
- Avamar 版本和修补程序级别
- NAS 型号和固件版本
- 备份作业 ID 和时间戳
- 当前最大流数设置和文件计数
提醒:将卷移至其他客户端会触发该卷的新 0 级备份。后续备份可能会更快完成,因为大多数数据已存在于 Avamar 上,但 NAS 仍将重新发送每个字节进行验证。
注意:增加流数量可能会增加 NAS I/O 负载,从而可能会影响生产工作负载。监视性能并根据需要进行调整。
受影响的产品
Avamar产品
Avamar, Avamar Plug-in for NDMP文章属性
文章编号: 000054368
文章类型: Solution
上次修改时间: 15 1月 2026
版本: 6
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。